【Step-Audio:首个开源的智能语音交互框架,集成了语音理解与生成控制的先进语音对话系统,支持多语言、情感表达、方言和语音风格控制,让语音理解与生成无缝融合。亮点:1. 1300亿参数的多模态模型,支持多语言、多情感、多方言对话;2. 语音克隆、情感控制、语速调整,满足多样化语音生成需求;3. 高效实时推理,对话流畅无卡顿】
'Step-Audio: Unified Understanding and Generation in Intelligent Speech Interaction'
GitHub: github.com/stepfun-ai/Step-Audio