图灵周报:精选AI行业一周大事件,从良莠不齐的行业资讯中挑选出最有价值的信息,配上专业点评,值得你细读、品味。
01开源大模型王座再易主
图源:Databricks官网
当地时间周三,数据人工智能公司Databricks开源了通用大模型DBRX,这是一款拥有1320亿参数的混合专家模型(MoE)。根据DBRX在MMLU、HumanEval和GSM8K等测试集上公布的数据,其性能表现不仅超越了LLaMA2-70B和最近由马斯克开源的Grok-1模型,而且在推理效率上比LLaMA2-70B快2倍。
点评:相比商用大模型,开源大模型具有广泛的参与性和开放性,其代码和算法可以公开获取和修改。这使得开源大模型在技术创新和适应性方面具有显著优势。未来高性能和低算力消耗将是开源大模型竞争的新领域。
02OpenAI团队与好莱坞高层会晤
图源:Pexels
据多家美国媒体报道,人工智能公司OpenAI近期正在好莱坞举办各种推广活动,希望能向电影制片厂、艺人经纪公司和媒体高管展示名为Sora的最新款人工智能文字生成视频大模型的巨大潜力。有媒体认为,这有可能是“好莱坞历史上意义最为重大的行业会议”,对全球电影工业的发展,或许会产生划时代的巨大影响。
点评:哪怕是Sora取代了特效、摄影、剪辑、配乐、编剧乃至演员,但电影想要赚钱,还是得进影院,还是需要宣传、发行人员和院线运营团队。由此可见,即便好莱坞将迎来Sora的冲击,总有些事情是人工智能无法完成的。
03亚马逊完成对AI独角兽Anthropic的40亿美元投资
图源:亚马逊官网
当地时间3月27日,亚马逊宣布再向AI(人工智能)初创公司Anthropic注资27.5亿美元,加上此前的12.5亿美元,完成了最多40亿美元的投资承诺,成为自AI热潮开始以来,对初创公司有明确记录的最大单笔投资。
点评:随着AI热潮在全球刮起猛烈大风暴,科技巨头们不是赶在研发AI的路上,就是赶在投资AI的路上。Anthropic是目前除了OpenAI之外,最炙手可热的明星初创公司,它的Claude是极少数可与OpenAI的ChatGPT一较高下的大模型。随着大型科技公司对人工智能初创公司的火热追捧,反垄断监管机构正在密切关注、审查这些投资。
04周鸿祎:将开源360智脑70亿参数模型
图源:周鸿祎发言截图
3月29日,360集团创始人周鸿祎在直播中透露,即将开源360智脑70亿参数模型,支持360k即50万字长文本输入。
点评:大模型无损上下文长度的数量级提升,将进一步打开对AI应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。所以,长文本从来都是一项综合性的能力,而非越长就越好。相反,过分追求长,可能引发算力匮乏的问题。
05苹果与百度尚未达成AI合作
图源:Pexels
近日有媒体报道称,百度将为苹果今年即将发布的 iPhone16、Mac 系统和 iOS 18 的国行版提供 AI 功能。现据中国日报报道,对此,接近苹果公司的知情人士向记者予以否认,表示双方尚未达成合作。
点评:大模型在被允许使用之前,必须得到监管机构的批准。而苹果此次在中国寻找本土生成式 AI 提供方,主要为了满足国行 iPhone 等设备的合规需求。截至目前,国内监管机构已经批准了40多种型号的大模型投入使用,其中包括百度的文心一言。
06阿里云携手联发科为手机芯片适配大模型
图源:MediaTek官网截图
3月28日,全球最大的智能手机芯片厂商MediaTek联发科,已成功在天玑9300等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。通义千问在离线情况下运行多轮AI对话。阿里云方面表示,将和联发科深度合作,向全球手机厂商提供端侧大模型解决方案。
点评:这是通义大模型首次完成芯片级的软硬适配,同时意味着Model-on-Chip的探索正式从验证走向商业化落地新阶段。在这背后,本身拥有计算能力的终端被认为是AI大模型落地的重要场景之一,特别是使用频率极高的手机。与此同时,外界也期待AI大模型能搅动疲软许久的手机市场。