OpenAI和谷歌再掀模型大战；字节和腾讯大模型取得进展|图灵周报

图灵周报：精选AI行业一周大事件，从良莠不齐的行业资讯中挑选出最有价值的信息，配上专业点评，值得你细读、品味。

01OpenAI发布新款AI模型GPT-4o

图源：OpenAI官网截图

当地时间5月13日，OpenAI在线举行“春季更新”活动，正式推出新的旗舰人工智能模型GPT-4o，以及免费向用户提供更多ChatGPT功能。GPT-4o支持文本、音频和图像的任意组合输入，并能够生成文本、音频和图像的任意组合输出。

点评：GPT-4o的速度比现有的GPT-4 Turbo快了两倍，但成本仅为其一半。GPT-4o的“o”代表“omni”，一词意为“全能”，该模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。响应时间几乎达到人类水平。

02谷歌发布多模态大模型全家桶

图源：谷歌I/O主题演讲

当地时间5月14日，在谷歌I/O开发者大会上的主题演讲中，谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo，以及在硬件方面发布的第六代Tensor处理器单元（TPU）Trillium芯片。根据发布会最后的官方统计，完全聚焦于AI的这场主题演讲总共提到了121次AI。

点评：随着OpenAI和谷歌相继推出新一代大模型，生成式人工智能（AI）的竞赛又达到新的高潮。GPT-4o主要设计目标是解决迁移到苹果Siri平台的工程问题，为Siri全面适配做重要的工程性优化，包括提升反应速度、减少出错率等。而谷歌的优势在于用户基数大，且能够直接触达用户。目前来看，大模型之争“鹿死谁手”，还需要进一步观察。

03Hugging Face提供1000万美元免费共享GPU

图源：网站截图

全球最大的开源 AI 社区 Hugging Face 宣布，将提供 1000 万美元的免费共享 GPU 帮助开发者创造新的 AI 技术。

点评：Hugging Face的此举具有里程碑意义。在当前AI领域，大型科技公司凭借强大的经济实力和技术积累，往往能够拥有更多的资源和优势。这导致了许多小型企业和初创公司在AI技术的研发和应用上受到限制，难以与大企业竞争。而Hugging Face的共享GPU计划将打破大型科技公司在AI技术上的垄断地位，促进AI技术的普及和公平竞争。

04字节跳动发布“豆包大模型”家族

图源：字节跳动官网

5月15日，在2024 春季火山引擎Force原动力大会上，字节跳动宣布自家豆包大模型正式开启对外服务。豆包大模型包括豆包通用模型pro、豆包通用模型lite、豆包・角色扮演模型、豆包·语音识别模型、豆包・语音合成模型、豆包・声音复刻模型、豆包・文生图模型、豆包・Function Call 模型、豆包·向量化模型。

点评：豆包大模型原名“云雀”，是国内首批通过算法备案的大模型之一。本次大会上，比豆包大模型发布本身更吸引人的，是更低的使用价格。将大模型使用从以分计价推进到以厘计价，这也意味着，在逐渐白热化的大模型竞争市场里，字节跳动“卷”起了价格。

05腾讯混元大模型全面开放

图源：腾讯云截图

5月17日上午，腾讯集团高级执行副总裁汤道生在腾讯生成式AI产业应用峰会上表示，腾讯混元大模型pro、standard和lite版本将通过腾讯云向企业和个人开发者全面开放，其中pro版本是目前混元模型的效果最优版本，是万亿参数规模的32K长文模型。

点评：腾讯混元的通用基础能力和专业应用能力，都处于国内大模型领跑梯队，高于国际大模型均线。权威评测机构SuperCLUE的报告也显示，腾讯混元大模型位列国内大模型第一梯队，在基础和场景应用上均处于领先位置，位于卓越领导者象限。未来，大模型落地加速，“产业实用”成为发展共识。

06百度发布全球首个L4级自动驾驶大模型Apollo ADFM

图源:百度媒体库

5月15日上午，百度Apollo在武汉百度萝卜快跑汽车机器人智行谷重磅发布了全球首个支持L4级自动驾驶的大模型Apollo ADFM（Autonomous Driving Foundation Model），同步上新了搭载了百度第六代智能化系统解决方案的萝卜快跑无人车。

点评：Apollo ADFM基于大模型技术重构自动驾驶，可以兼顾技术的安全性和泛化性，做到安全性高于人类驾驶员10倍以上，实现城市级全域复杂场景覆盖。跨过自动驾驶安全门槛后，人人乐享其行的美好出行时代指日可待。

古典风资讯网

OpenAI和谷歌再掀模型大战；字节和腾讯大模型取得进展|图灵周报

未来图灵