天工大模型:中国AI搜索巨头如何一骑绝尘?

科技创业在前线 2024-06-15 22:33:33

出品 | 创业最前线

作者 | 白华

编辑 | 闪电

美编 | 李雨霏

审核 | 颂文

5月,全球大模型领域的竞争,或可用“你方唱罢我方登场”来形容。

谷歌、腾讯、阿里、字节跳动等业界巨擘纷纷亮出大招。有的凭借技术底蕴实现全面升级,有的慷慨将大模型开源免费,更有甚者通过价格战掀起狂风巨浪,整个市场一片火热。

而在这硝烟弥漫的战场上,昆仑万维作为中国AI的先驱者,近日正式公布天工AI日活用户(DAU)突破100万,成为极少数进入“DAU百万俱乐部”的消费级AIGC应用。

另根据QuestMobile显示,天工AI月活量已经逼近千万,同时,李榜主AIGCweb端排行榜公布,天工AI4月web端用户增速榜第二名,一系列亮眼的数据,处处涌现着大量用户对天工AI的需求,赫赫战绩之下不难发现其实昆仑万维早已蓄势待发。

早在2023年8月,昆仑万维推出了国内第一个AI搜索引擎——天工AI搜索,成为国内AI搜索领域的领跑者。

随后百度、360、搜狗、秘塔等纷纷入局。此外,谷歌在2024年I/O开发者大会上展现的很多技术,诸如AI搜索、多模态搜索、图文并茂等功能,天工也早已具备。

一个月之前,在「天工」大模型发布一周年之际,昆仑万维果断推出「天工3.0」和「天工SkyMusic」公测,展现出其独特的战略眼光和坚定的决心。

那么,天工大模型在这一年里究竟经历了哪些蜕变?随着AI技术的飞速发展和市场的不断扩张,其战略布局又是如何谋划?更重要的是,其在大模型时代所秉持的先进理念和独特洞察,又将如何引领行业风向?这一切,都值得深入探究。

1、国内300+大模型激战正酣,天工AI如何独领风骚?

国内大模型市场激战正酣。

据相关报道统计,截至今年4月底,国内共推出了约305个大模型,在过去一年推动着语言理解、图像识别等多个领域的技术进步。

大模型的激烈竞争中,数据和算力成为决定胜负的关键要素。然而,这两者都是极其烧钱的投资。因此,国内众多大模型在尚未积累起可观的日活跃用户数(DAU)时,就不得不开始考虑收费,以维持其庞大的运营成本和持续的技术研发。

如今年5月份,kimi就开始向用户收取年费,最高可达399元/年。这样的收费策略无疑会在一定程度上影响用户体验和市场的进一步拓展。

大模型的这场角逐,不仅拼技术与价格,更是实力的巅峰对决!而相较于市面上的大模型,天工则选择了一条不同的道路。它坚持不向用户收费,而是通过其他方式来实现盈利和可持续发展。这种底气来源于天工对技术和市场的深刻洞察,以及对用户体验的极致追求。

目前,天工大模型已经迭代至3.0版本。

相较上一代,「天工3.0」在模型语义理解、逻辑推理,以及通用性、泛化性、不确定性知识、学习能力等领域有很大的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。

值得一提的是,「天工3.0」也是全球首个多模态“超级模型”(Super Model),其集成了多项能力,是大模型时代的“超级应用”。

而且5月27日,昆仑万维宣布天工AI每日活跃用户(DAU)超过100万,受到广大用户的热情追捧。

其中,内容创作能力一直是「天工」系列大模型的强项。不仅能实现AI音乐生成、AI语音、AI对话、AI二次元漫画生成等强大的内容创作,更是通过专项Agent训练实现了在对话中,结合文本需求实时生成图片、结合文本需求实时内容分析及图表构建等能力,成为真正能搜、能写、能读、能聊、能听、能说、能画、能看、能唱的超级模型,带来全新的颠覆式AI体验升级。

而搜索作为互联网用户获取信息的主要方式,其重要性不言而喻。搜索引擎如Google、百度等,每天响应数十亿次搜索请求,显示出其在信息检索中的不可或缺性。

为什么AI搜索能引爆市场?

传统搜索引擎的信息真实性和质量越来越让人难以判断,满屏的广告更是让人眼花缭乱,用户的隐私在这里似乎成了摆设。

更糟糕的是,由于信息壁垒,像小红书、知乎、微博、抖音这些当代UGC的主要信息源,竟然被某些搜索引擎拒之门外。

当然,即使是针对同一问题,如“目前国内大模型应用情况如何?”,在不同的大模型AI搜索工具中,所得到的回答质量和内容结构也可能存在显著差异。例如笔者在国内主流的三大模型中输入该问题后,发现第一个模型仅提供了基础的文字描述,侧重于概括性的信息;第二个模型提供了详尽的文字内容,还附加了相关的来源信息链接。

(图 / 国内其他两款大模型部分内容截图)

但最让笔者惊喜的是,在天工AI搜索中提问,领略到一种截然不同的体验。天工AI的多模态搜索功能在中国内独树一帜。

首先,它在收到指令后进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构化或思维导图的形式进行最终展示。

(图 / PC端天工AI搜索截图)

与此同时,天工大模型在多步骤推理能力方面展现出了较强的实力。在权威推理榜单Benchmark GSM8K的测试中,天工以80%的正确率脱颖而出,这标志着天工的推理能力达到全球领先水平。

以笔者搜索“北京暑假适合亲子游玩的地方”为例,天工AI理解了问题之后,给了三个选项:旅游景点推荐、亲子活动项目、亲子餐厅推荐。笔者点击“亲子活动项目”之后,天工AI展示了一份暑假亲子游的攻略,先是简单介绍了北京,再是推荐了一些景点,如故宫博物馆、天坛公园、北京动物园等,后又推荐了一些活动和亲子餐厅,并且最后还附有进一步深化追问的问题和相关视频,以便笔者更好的了解信息。

(图 / 天工AI多步骤推理部分截图)

此外,笔者在天工AI搜索的研究功能下,搜索“目前国内大模型应用情况如何?”,天工AI如一位贴心的助手,逐步为笔者呈现答案,内容详实、数据丰富,还有清晰的大纲、脑图、图表等辅助理解。所有信息都经过逻辑归纳整理,甚至页面的右侧还附带了可溯源的信息链接,一目了然。

(图 / PC端天工AI搜索部分内容截图)

通过笔者上述的体验来看,相较于其他大模型的AI搜索,天工AI除了提供文字内容外,还可以实现图文交织和图表生成,实现多模态的搜索体验。

(图 / 上两页是天工AI部分内容截图;下面两页是其他国内两大大模型部分内容截图)

其次,天工AI尤为引人注目的是,其在APP端展现出了卓越的时效性。

在数字化时代,用户对于搜索的需求已不再局限于基本信息的查询,他们更渴望能够实时掌握最新的动态信息。尽管市面上AI搜索平台层出不穷,但AI大模型的时效性问题却成了一个难以逾越的障碍,使得AI搜索在用户体验上略显滞后。但这又是AI搜索必须解决的关键问题。

目前,天工AI却成功攻克了这一难题,其是国内唯一能够支持实时搜股票、油价、彩票、金价、快递、天气、日落时间等很多实时性信息查询的AI产品。从天工AI的体验来看,我们完全可以彻底放弃传统搜索引擎。

(图 / APP端天工AI搜索天气、股市等内容截图)

最后,天工AI还新增了很多实用且有趣的功能。

一是AI PPT功能,可以根据用户提供的信息快速生成专业的PPT演示文稿。

当笔者输入“创建一份全球大模型成本与价格的研究报告PPT”;然后不到1分钟就生成一份文字报告,分为引言、大模型成本分析、大模型价格策略、案例研究、未来趋势与挑战、结论、问答共七大部分;最后点击“生成PPT”-选择模板-生成PPT即可。

笔者选择了深邃模板,不到1分钟就创建完成,共24页PPT。这份PPT不仅包含了详尽的文字描述,更巧妙地融入了多种与主题紧密相关的图表,通过直观的方式展示和强化观点。例如大模型训练阶段图、各大模型训练成本对比图表等等。

(图 / 天工AI的AI PPT部分内容截图)

二是AI视频转绘。拍摄或上传3S~10S内的小视频,就能帮助用户转成二次元风格,用户还可以制作动漫表情包,模仿名场面等。操作超级简单,总共分为三步:第一步点击“添加视频”,第二步上传视频,第三步选择喜欢的风格,然后等待几分钟即可生成。

例如笔者上传了一个3S摘桑葚的视频,选择动漫风格,虽然显示10分钟生成,但仅用3分钟就已生成。不得不说,这个功能对内容创作者或者AIGC创作者实在是太友好了,免费、不限次,且高效又高质。

靠这个功能可以实现在各个自媒体平台迅速涨粉,每天批量日更,批量做号,还不用付出大量精力。

如果你对「天工3.0」的全新AI功能升级感兴趣,不妨亲自体验一番。只需在PC端访问www.tiangong.cn,即可感受超级模型的强大AI魅力。

昆仑万维董事长兼CEO方汉曾指出,公司之所以发力AI搜索,源于用户的真实需求。在传统搜索引擎的PageRank范式下,用户需要自己从海量网页中提炼信息,这个过程耗时且繁琐。而大模型的出现,将这一时间从3—10分钟大幅压缩至5—10秒,效率显著提升。

2、天工AI:超越功能堆砌,底气来自模型能力

天工AI之所以能独领风骚,绝非一堆功能的简单堆砌,而是源自其深厚的技术积淀、独到的战略视野,以及一系列“人无我有、人有我优”的卓越优势。

尤其在AI搜索方面,昆仑万维开创了中国AI搜索先河。

据了解,2012年,“3SB大战”(360、搜狗、百度)之后,搜索引擎行业陷入僵局,没有硝烟,没有革命,也没有新故事。

2023年,随着AI的助推,沉寂11年的搜索赛道再次变得热闹起来。

2023年4月,昆仑万维的首个自研大语言模型“天工”上线。有了强大的基座,2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,成为中国AI搜索鼻祖。

在短短数月乃至半年后,百度、360等科技巨头也竞相涌入这一充满机遇的赛道。

在AI音乐方面,昆仑万维在今年4月17日正式发布,中国首个音乐SOTA模型——“天工SkyMusic”,首次实现中国自研大模型在AIGC垂直领域全球领跑。

“天工SkyMusic”由Large-scale Transformer负责谱曲,学习Music Patches的上下文关系,实现音乐可控性;并由Diffusion Transformer负责演唱,通过LDM将Music Patches还原为高质量音频。目前天工SkyMusic已能够支持生成80秒44,100Hz采样率双声道立体声歌曲。并且在4月17日开放公测之初就公开了自研AI音乐大模型技术架构,这是目前为止行业唯一公开可参考的AI生成音乐模型技术架构。

(图 / “天工SkyMusic”自研AI音乐大模型技术架构)

专业术语过于复杂和抽象,跟随笔者的体验,感受“天工SkyMusic”的神奇之处。

首先,将李白经典词作《将进酒·君不见》输入「天工SkyMusic」;其次选择曲风和情绪;最后,不到1分钟就生成了三首歌曲,歌曲时长最长为1分50秒。

(图 / 天工SkyMusic部分内容截图)

除了国内,与国际巨头相比,天工AI同样毫不逊色。

例如谷歌在2024年I/O开发者大会上展示的多项技术,如AI搜索、多模态搜索等,天工早已具备。

以AI识图场景为例,谷歌的AI识图功能,即“Ask Photos”功能,计划在2024年夏季上线。而早在一个月之前的4月17日,「天工3.0」大模型全面更新,体现至「天工」App上,其集成AI对话、搜索、音乐、社交于一体,支持AI识图、生成图片、数据分析及图表绘制等功能。

(图 / 上:谷歌2024年I/O开发者大会demo截图;下:APP端天工AI的截图)

除了技术上的优势,天工大模型抢先布局了MoE架构也是略胜一筹。

2024年2月,昆仑万维率先采用业内顶尖MoE(Mixture-of-Experts)专家混合模型架构的「天工2.0」大语言模型,相较此前版本,其应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。

天工秉持首创精神,不断突破自我,持续策略升级,永不止步。

于是,2024年4月17日,天工大模型迭代至3.0版本。

「天工3.0」采用4000亿参数MoE架构,在语义理解、逻辑推理等方面能力实现质的飞跃。同时,在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,多项评测指标达到全球领先水平。

目前,MoE路线已涌现出Mistral、Grok-1、DBRX等头部大模型。MoE混合专家模型是全球技术最领先、性能最强大的基座模型(Foundation Model)技术路径,相较于其他模型,MoE大模型应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。

而天工使用MoE架构后,在处理复杂任务、提高响应速度、降低成本以及增强可扩展性方面具有明显的优势。这些优势使得天工在AI领域具有较高的稀缺性和广泛的应用前景。

3、未来策略:大模型与应用落地层面齐头并进

如今,昆仑万维经席卷了AGI、AIGC、信息分发、元宇宙、社交娱乐等多个领域,手握搜索、广告、虚拟道具付费、会员订阅、API调用及定制化开发等多样化的变现利器。

昆仑万维在2023年年报中豪言,他们已站在国内人工智能的巅峰,业务版图横跨全球一百多个国家和地区,每月活跃用户逼近4亿。他们不仅前瞻性布局了人工智能全产业链,更是已经完成了从“算力基础设施”到“大模型算法”,再到“AI应用”的全产业链布局,占据了绝对的先发优势。

然而,站在巅峰的昆仑万维,既拥有享受成果的资本,也背负着成为行业巨头的沉重压力。作为一家中等体量的互联网公司,他们渴望寻找第二曲线,实现突破,将公司推向新的高度。AI既是挑战,也是他们翻盘的希望。

自2020年起,昆仑万维便对AI投入重兵,到2022年底更是下定决心All in AI。展望未来,天工AI将继续坚守“All in AGI与AIGC”战略,不仅要在大模型上精益求精,更要在应用落地层面火力全开。

(图 / 摄图网,基于VRF协议)

在大模型方面,昆仑万维誓言在2024年对天工大模型进行重大升级,持续优化算法,增强多模态处理能力,为用户带来更为复杂、自然的交互体验。

2022年,昆仑万维全年研发成本为7.36亿元。2023年前三季度,昆仑万维已投入6.2亿元研发费用。

方汉曾表示:“超过千亿级别的大模型,一年至少5000万美金到1亿美金成本。”或许,昆仑万维2024年对天工大模型的投入成本将高达数亿元。

在AI应用上,他们更是快马加鞭,加速AI搜索、AI音乐、AI视频、AI社交、AI游戏等产品的研发迭代,为内容创作者提供前所未有的AI工具,推动内容创作的革新,为用户带来前所未有的内容消费体验。

特别是在AI音乐领域,「天工SkyMusic」是行业第一个AI音乐SOTA。在行业没有任何公开可用的开源模型的情况下,全自研AI音乐生成大模型。

「天工SkyMusic」拥有巨大的潜力,让用户感受到了音乐创作的乐趣。未来,它有望成为全民音乐创作的专业平台,引领音乐产业的变革,其影响力远超商业范畴。作为中国首个音乐AIGC大模型,「天工SkyMusic」正引领着变革的浪潮。

此外,昆仑万维还致力于生态建设,深化与各行业合作伙伴的协作,提供高效、可定制的AI解决方案,共同推动AI技术在更广泛领域的应用和落地。

总之,昆仑万维在构建AI大模型、AI搜索、AI音乐等多元AI业务矩阵的背后,展现出了他们打造国内外完整AI生态的坚定决心和宏大野心。这是他们加速构建AI全产业链的实际行动,也是他们向全球AI行业发出的最强音。

*注:文中题图来自摄图网,基于VRF协议。

0 阅读:0