文 | 王方玉
编辑 | 苏建勋
有“通用大模型国家队”之称的科大讯飞,再次升级大模型能力。
10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰发布了讯飞星火4.0 Turbo。
刘庆峰介绍称,讯飞星火4.0 Turbo全新升级,根据鲜活的真实数据背靠背测试,七大能力全面超过GPT-4 Turbo,数学能力、代码能力超过GPT-4o,国内外中英文14项主流测试集中实现9项第一。
发布会现场,科大讯飞还展示了大模型在多模态交互能力上的进展。据了解,在原有的远场高噪、全双工、多语种多方言能力上,此次升级了多模态能力,新增了超拟人和个性化能力,实现了语音、视频、图文全部联动的多模态交互。
算力方面,科大讯飞一直坚持基于国产算力打造自主可控通用大模型底座。去年10月,科大讯飞曾联合华为推出首个国产万卡规模大模型算力平台“飞星一号”。
本次发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”也正式启动。刘庆峰表示,此次启动升级版的“飞星二号”,将带来新模型新算法的持续适配和智算集群规模的再次跃迁,引领国产大模型底座的发展、给世界提供第二选择。
今年以来,有一批大模型公司停下了预训练的脚步。预训练模型是大模型公司的底层核心技术,停了通常意味着走下了牌桌。通过升级星火模型和启动新智算平台,科大讯飞传达了持续预训练的态度和信心。
科大讯飞研究院院长刘聪在接受36氪采访时表示,讯飞的大语言模型会坚持迭代,在类似于o1大模型、多模态交互、语音端到端等方面持续布局。
刘聪坦言,讯飞的算力规模不及头部大厂;使用国产算力平台,也需要花费不少额外精力进行适配等工作,但讯飞坚持基于国产算力打造和升级自主可控的通用底座大模型,在国内芯片和算力集群相较于国外领先水平有一定差距的情况下,做出了可观的效果。
据介绍,在过去一年多的实践中,星火大模型在“飞星一号”上的训练推理性能不断优化,部分测试集表现甚至超过国际领先的GPT-4 Turbo。
在大模型产业化应用方面,科大讯飞一直推进积极,致力于“用人工智能技术解决社会刚需”。公开信息显示,今年1-9月,科大讯飞成功中标38个项目,披露的中标金额为2.16亿元,项目数量和金额,均在行业内排名首位。
“未来AI技术的探索,必须大规模产业化,必须在场景中进入到真正的深水区,所有玩‘概念’的都不会有大未来。”刘庆峰在演讲中表示。
发布会上,基于讯飞星火底座能力,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。据悉,截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖了300+应用场景。