中秋刚过,三大反常现象已经出现,AI大模型领域的风向变了!

科技石头起涟漪 2024-09-21 04:07:44

第一,美联储4年来首次宣布降息,并且直接降息50个基点,大大出乎外界预料。此番降息将利好人工智能AI、机器人等成长性资产,原本就竞争激烈的AI领域势必更“卷”!第二,以“云启智跃 产业蝶变”为主题的2024云栖大会在杭州启幕,阿里云通义宣布一口气开源上百款大模型。值得注意的是,在通义开源的Qwen2.5系列模型中,旗舰模型Qwen2.5-72B性能超越Llama 405B,毫无悬念地成为世界最强开源模型。

第三,作为国内头部AI厂商,通义大模型迎来全线升级,助推国内基础模型再迈向新高度。据悉,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o,通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。

显而易见,这三个重磅消息都与AI紧密相关。粗略算下来,大模型已经火爆了两年多。纵观全世界,主动放弃或者被动淘汰的AI企业一抓一大把,只有头部几家科技大厂还在研究基础模型,而能够保持一年一个大版本更新的科技企业,更是凤毛麟角。庆幸的是,中国本土厂商阿里云就是其中之一。

全球AI竞争犹如爬刀山过火海,阿里云能走到能力,其技术能力和韧性都值得钦佩。作为中国大模型的代表性旗手,阿里云更是把大模型能力开源给行业使用。

过去一年多时间里,通义大模型屡次登顶国际权威评测,像阿里云此前发布的全球性能最强的开源模型Qwen2-72B,性能已经超过了美国最强开源模型Llama3-70B,以及众多国产闭源大模型。

当然,国产大模型的成长有目共睹,但我们与美国科技大厂的差距赫然在目!

说个扎心的事实:就在前几天,OpenAI发布了名为OpenAI o1的新模型。在处理物理、化学和生物问题时,o1的表现甚至和该领域的博士生水平不相上下。在国际数学奥林匹克的资格考试(AIME)中,o1的正确率为83%,成功进入了美国前500名学生的行列。而GPT-4o模型在这块的表现不如预期,正确率仅为13%。

还有更刺眼的消息,据美国CNBC预测,中国顶尖企业的大型语言模型大约落后美国6到9个月,而不太先进的中国模型可能落后美国大约15个月,堪比鸿沟天堑!

但也不必自暴自弃,认清现实和差距,才能更好地自我提升!自从ChatGPT横空出世,网上一些美吹把国产大模型贬的一文不值。实际上,国产大模型从未放弃追赶世界一流,是这些国内企业不懈攻坚克难,让我们避免重蹈芯片、光刻机的惨痛覆辙。

承认差距是勇气,缩小差距要靠能力。美国大模型这座大山堪比天险,但这次通义大模型升级表现振奋人心。任何技术都是有曲线的,只要我们不停止前进,国产大模型赶上一流、超越一流,不是不可能的!

0 阅读:0