5月9日,阿里云正式发布通义千问2.5,其性能全面赶超GPT-4 Turbo,成为目前最强大的中文大语言模型。与此同时,通义千问1100亿参数开源模型在多个基准测评中超越Llama-3-70B,跃居开源领域最强大模型之列。这标志着经过一年多的奋力追赶,国产大模型终于跻身全球顶尖水平,可与国外一流大模型一较高下。
通义千问2.5性能全面提升自2023年4月问世以来,通义千问始终专注于基础模型的技术研发,从初代模型升级至2.5版本。
与此前的2.1版相比,通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力等方面实现了9%至19%的提升,其中文能力更是持续领先业界。权威基准OpenCompass的测评结果显示,通义千问2.5得分已经追平GPT-4 Turbo。
开源模型频频霸榜,引领行业发展通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B,登上HuggingFace开源大模型排行榜Open LLM Leaderboard榜首。此外,通义多模态模型和专有能力模型也展现出业界顶尖的影响力。
里云CTO周靖人表示,开发者的反馈和开源社区的生态支持是通义大模型技术进步的重要助力,未来通义大模型还会持续开源。目前,通义开源模型下载量已经超过700万。
企业级应用落地,开启AI新时代通义正在成为最受中国企业欢迎的大模型。数据显示,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,已在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域实现落地应用。
小米、微博、众安保险、完美世界游戏等企业近期也宣布接入通义大模型,将其应用于人工智能助手、社交媒体、保险、游戏等领域。此前,通义大模型还支持了中国科学院国家天文台开发的新一代天文大模型"星语3.0",以及陕煤建新煤矿等矿山的重大风险识别处置系统。
阿里云一直强调要成为"AI时代最开放的云",通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,这一开源开放战略正为阿里云带来新的商业增长。
随着通义千问2.5的发布和开源模型的领先表现,国产大模型正在加速追赶国际先进水平。这不仅为中国AI产业注入了新的活力,也为全球AI技术的发展贡献了重要力量。在大模型的赋能下,各行各业有望迎来全新的智能化变革,开启AI应用的新时代。