Qwen2.5-0mni发布。 通义千问震撼发布新一代多模态旗舰模型Qwen2.5-0mni。2025年3月27日凌晨,阿里巴巴旗下的通义千问正式推出了其最新的旗舰模型Qwen2.5-0mni。 这款模型是专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。 Qwen2.5-0mni采用了创新的ThinkerTalker架构,其中Thinker模块负责处理多模态输入,生成高层语义表征,而Talker模块则以流式方式接收并合成语音。此外,该模型还引入了TMRoPE技术,实现视频与音频输入的精准同步。 在性能上,Qwen2.5-0mni在图像、音频、音视频等多种模态下均表现出优于类似大小的单模态模型及封闭源模型的能力,并在多模态任务0mniBench中达到了SOTA表现。目前,该模型已在ModelScope、DashScope和GitHub上开源开放。
打破世界封锁!中国光刻机重大突破!0.8纳米的中国芯,惊爆世界!上海新国际博览中
【8评论】【12点赞】