疯狂卷投流的大模型应用们,到底哪款最好用?

新识研究所 2024-11-07 19:31:46

豆包、文小言、元宝、星火、Kimi和天工,我们都试一试

最近几个月里,你有没有发现在刷抖音、B站的时候被突然插入的大模型应用广告打个措手不及的频率越来越高了?

近日,一篇有关大模型应用投流“买”用户的文章被不少人看到,大模型公司在二十天中动辄几千万甚至上亿的广告投放费用令人咋舌。也被媒体报道为“美国AI公司依然专注于前沿AI模型技术研究,中国AI大模型则踏上了‘卷’算力、‘卷’价格、‘卷’获客、‘卷’变现能力的道路。”

此后,虽然有大模型企业出面表示相关数据统计有所不实,但也未具体透露真实投放金额。而据钛媒体App独家获悉,截至10月29日,kimi智能助手、字节跳动豆包、腾讯元宝等所有AI应用10月全网广告投放(投流)支出超过3亿元人民币。

在日渐增加的投流费用的背后,其实是当前各家大模型在应用体验层面难以做出颠覆性创新的事实,那么,当前市面上最主要的和增速最快的大模型应用有哪些?在从烧钱扩大市场到用户心智教育的这一节点,这些主流的大模型应用做出差异化了吗?

而对于哪些是最主要的大模型应用、哪些是增速最快的大模型应用,新识研究所测评了《AI产品榜》统计的数据,9月份AMU前五或增速超过30%的大模型应用豆包、文小言、Kimi、讯飞星火、天工AI与最近异军突起的腾讯元宝。体验了这些火热的大模型应用的效果如何。

数据来源:公众号@AI产品榜

第一部分:字节“专宠”豆包月活真的高,好用吗?

作为当下最火热的AI产品,豆包10月的MAU达到了惊人的5000万+的月活,这一成绩也相当于榜单第二到第九的10月月活人数之和,其中虽然有据多方业内人士透露,抖音封杀了所有的大模型广告,只留下了豆包一家,让豆包拥有最大短视频社交平台的独家支持的功劳,但作为有如此大基数还在持续保持月活稳定增长的大模型应用,豆包在使用体验上也确实很好。

具体来看,不同于Kimi与天工AI这种在创始与发展过程中逐渐将搜索当作落地能力与获客招牌的大模型应用,在字节跳动手握国内最优质数据库的支持之下,豆包几乎涵盖了当前市面上所有已经上量使用的大模型应用,包括AI搜索、AI写作、图像生成、AI阅读、第三方创建的智能体以及其特有的语音通话。

在AI搜索功能中,豆包同市面上所有的大模型应用相同,提供了简便搜索与深入搜索两类搜索模式,深入搜索会根据更多的信源,来对问题进行更加全面和深度的总结,但同Kimi这样专打在思考中搜索、在搜索的过程中思考的对手来说,豆包的AI搜索更像一个更大号的的信息处理器,但相比起其他的AI应用也算是用的过去。

在接下来AI写作方面,豆包就展示出了远超平均水平的实力,在文章的体裁选择方面有着34种提前预设好的场景,覆盖了当前文字需求的绝大多数甚至全部的用途。

更好用的是,在选择写一篇文章的时候,除了主题之外,针对不同平台的写作特点,豆包也会使用不同的写作风格进行改变;同时,在直接生成文章之外,你还可以选择在其中增加书写大纲一步,在勾选后,豆包会给出将要生成文章的大纲,用户可以确认大纲是否正确、对大纲的参考来源进行更改与增减后之后再进行输出,这样就避免了用户坐在电脑前花上几十秒甚至一两分钟的时间,最后得到一篇根本不符合最初设想的文章。

这样的AI生成步骤,在月活最高的几个大模型应用中,只有豆包提供了这样的选择,说其绝对领先也没有什么问题。

图像生成方面,豆包的功能也是最齐全的那个,除了简单的文生图之外,一些去除背景、擦除、区域重绘和扩图功能也同样提供给了用户,相比于只有图像生成的友商,优点也一目了然,并且其中使用频率最高的擦除与去除背景功能,还真的意外地好用,并不会出现奇奇怪怪的填充。

而在AI阅读方面,在进行了多个文档的总结提炼后,或是由于字节的能力,又或者是由于该用途的天花板不高,在实际使用中没有看到明显优于其他大模型应用的地方。

在总结文档之外,豆包也提供了AI看视频的功能,用户可以去B站等提供字幕的视频网站,登录后即可使用,但在尝试过数个视频之后,只能说豆包的想法是好的,但把B站某位up主有关美国大选的视频,用AI总结成蔡徐坤被软封禁之后的二三事,也相差实在是太大太大了,这样的功能虽然有的时候效果还算不错,但面临稍微复杂一点的视频,只能说还是不用为上。

此外,豆包的语音通话也是比较特色的功能,英语口语陪练、心情树洞、模拟面试、成语接龙功能,虽然在使用中无法只有英语陪练和模拟面试有点作用,但还是无法很好地模拟真实场景,不过对于有对多模态沟通需求的人群来说,也是迈出了一大步,值得肯定。

在PC端下载豆包后,在框选相关文字后,豆包的助手也会以小浮窗形式出现,也起到了日常工作使用的助手插件功能,支持快速使用。

总结下来,就是作为一个经常有长板出现但没有短板的大模型应用,在友商竞品们都有的功能中,豆包都有着强于平均水平并且偶有高光表现。而在豆包特有的功能中,虽然在使用上经常出现奇奇怪怪的问题,但迈出一步也是值得肯定的。在字节的优质数据支持下,也希望可以快速完善。而作为月活绝对第一的大模型应用,豆包也确实“德可配位”。

第二部分:文小言、讯飞和腾讯元宝,蒙上logo差不多?

在豆包之后,月活排名第二的则是在最初领先的文小言(文心一言),当初文心一言刚刚面世之时的热度可以说红极一时,还需要去申请排队,但从先发到目前的月活仅有豆包的四分之一来看,文小言确实落后了不少。

其中的主要原因,同付费离不开干系,在友商们快速烧钱抢市场的时候,百度却率先推出了付费功能,也成为当前市面上主流的大模型应用唯一打开收费通道的一家。相比于竞对们快速迭代的新功能与畅通无阻使用的最新一代大模型,文心大模型4.0实在没有任何的不可替代性,再加上投放的不积极,这也成为了其逐渐落后的原因。

不过,虽然文小言在充值上被诟病,但作为起步最早的大模型应用,其中的某些功能还是有着一些亮点的。

譬如,在AI创作方面,文小言就提供了给出主题撰写成文之外的其他选择,由于给出了更多、更全提示词,文小言无论是文章优化、日常办公、专业文稿还是在其他一些用途的文章中表现都更好。

但是,文小言也并没有做到完美,就比如在体验过了豆包、元宝这些可以先生成大纲再根据更改后的大纲生成文章的大模型应用后,文小言在直接成文还是会出现成文后才发现方向错误而浪费时间的情况,也希望可以在相关方向进行跟进。

而在AI创作之外的文档分析(总结文档)、图像生成、AI修图这些竞对们都拥有的功能方面,文小言也确实没有明显的效果上的差距,它能提供的服务友商都能提供,它能达成的效果友商也没有差到哪里去。反倒是友商的一些新奇功能如文生视频等,文小言却只能望而兴叹。

综合体验下来,文小言当前的确算得上是一个合格的大模型产品,其中提供的各类服务也完全足够用户使用。但要说,文小言比竞品有哪些明显优势的地方也无从谈起,反倒是充值的价格着实不低。

在文小言之外,没有开通充值的那些主打大模型能力的讯飞星火与最近异军突起的腾讯元宝也几乎面临着同样的境况。AI搜索、图像生成、AI阅读、总结文档是大家共有的内容,用户想要获得更加优质、更专业的增量,只能从官方或他人创建的智能体库中寻找,但要说有什么实在不可替代的内容也确实没有。

这其实也是当前C端大模型应用竞争的真实情况。大模型早已不再局限于初期的性能较量,而是扩展到了多样化的应用领域。这些“拼爹”拼不过、流量处于第二梯队,还没有自身鲜明特点的综合性大模型应用,其实有些“无助”。

而对于市场来说,普通用户所需要的应用暂时已经满足,文小言、星火、元宝们也只能去完善一下末端能力、卷卷投流了,但面对头上用绝对月活压死大伙的豆包来说,实在有些进退两难。

第三部分:Kimi和天工,在AI搜索杀出一片天

除了体验了“综合”的大模型应用,榜单上的Kimi与天工AI我们也体验测评了一番。Kimi与天工AI,更倾向做出绝对的长板,成为用户们在这一方向上的“唯一指定合作伙伴”。

其中Kimi就以长文本与搜索见长。

除了Kimi+中提供的少数对话模板外,Kimi的页面显得实在是有些家徒四壁。AI音乐、图像生成什么的都无从使用,但这却一点不影响Kimi受到部分用户的追捧。

作为AI大模型的独角兽企业,月之暗面更加看重技术带来的体验升级。

据智小广,Kimi作为自研大模型,在基座模型领域独树一帜。在多数厂商遵循OpenAI路径,即增加参数规模与多模态功能的同时。Kimi认识到,当前阶段模型参数虽大,但真正决定效能的是其处理复杂问题的能力。其核心在于“注意力机制(Transformer)”,它如同鱼的记忆,专注于有限范围的上下文信息。

而结果则是Kimi凭借其独特的长上下文处理能力,赢得了用户的青睐,成为大模型领域的佼佼者。

此外,上个月Kimi推出的探索版,也着实让其又火了一把。

不同于搜集信息总结再输出,Kimi探索版和GPT-o1都采用了类人的思考,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助你更高效地完成分析调研等复杂任务。

更直接一点,就是Kimi探索版会自主规划策略,将一个复杂的问题分解为层次化的子问题,建立清晰的任务结构,然后分步来执行。之后再借助超大的容量优势,并行搜索几十个不同但相关的关键词,大大增加可参考的内容。此外,在生成答案的过程中,还可以主动进行回溯,检查最初的回答是否存在缺失和矛盾,再补充提供多方视角的信息供参考决策。

这样专精于搜索的打法,碰上了喜欢把大模型应用当作搜索软件的用户自然是一拍即合,也获得了以学生和白领为代表的重度和高要求使用者青睐。

天工AI,也走上了相似的道路。

天工AI虽然没有Kimi那么“极端”,提供了综合大模型应用都有的功能,并且相关效果还不错,但真正让其出圈的还是搜索。

作为国内第一个AI搜索产品,天工AI也算是吃上了AI搜索的红利。

在天工3.0大模型的支持下,天工AI和Kimi探索版相同,都采用了类人思考的方法,会把用户提出的问题自动规划和拆解,将其分解为多个简单的小任务并逐步解决。在解决过程中,天工AI在生成结果的过程中,同样会检查每一步的执行情况,确保最终结果的准确性。

此外,天工也在AI高级搜索上不断深入,将金融与科研作为进一步深化的方向。

譬如在财报阅读方面,天工AI给出的功能包括金融政策查询、指标查询、财务数据对比、财报分析、公司分析、研报解读、投资理财,虽然比起券商们的研报没有主观的方向与信息增量,但给出的相关分析相比于某些互联网交易软件的大模型来说还是优秀了太多。

在科研领域,天工AI接入了全球范围内的学术数据库,包括arXiv等权威论文网站,可以实时抓取最新的科研成果。其新增的文献分析功能,支持按研究背景、方法、实验设计等维度对论文进行全面解读。用户可以通过天工AI深入理解论文中的技术细节,甚至是数学公式和实验数据。

而天工的用户画像,则也与Kimi相似,同样是对搜索和对某些方向有高要求的用户。

不过,虽然Kimi和天工AI做出了差异化,作为独角兽企业与非大厂玩家,在当前这个时点也留存下了不少的优质用户,但AI搜索赛道中的优势需要长期的技术迭代与资金支持才能维系,那些传统大厂们,也已经突入这些差异化玩家的产品腹地。据Tech星球报道,截至目前,抖音、阿里、快手、百度都已推出了自己或独立或内置的AI搜索产品或服务。

而在大厂们入局后,不出意外地,只有那些对搜索有着高要求的用户才会留存在Kimi与天工AI之上,这两家也急需在AI搜索之外做出新的增量,摆在他们两个面前尤其是除AI搜索之外其他功能相对“匮乏”的Kimi来说,用户留存与商业化压力巨大。

作者:杨启隆

编辑:丁力

0 阅读:2