音乐界的Sora?AI音乐大模型Suno V3有什么魔力
Sora神话统治AI大模型界的当下,诸多大模型都显得黯淡无光,Claude 3惊鸿一瞥,并未能挑战ChatGPT-4的王者地位,于是有人另辟蹊径,开始在Open AI的强项之外,寻找新的突围机会。
近期,一款名为Suno 的AI音乐大模型突然冲上热搜,其刚刚发布的V3版本,因零门槛、易操作,且效果出众,引发不少人的关注。
相较于诸多文生图或文生视频大模型,欲生成满意的作品,必须苦练提示词,Suno则极大简化了创作门槛,仅需要少量的提示词,便可以生成最长达2分钟的完整音乐作品。而且不只是背景音乐,连歌名、歌词、演唱者、编曲等也一手包办。用户所要做的,不过是输入提示词,然后静静等待30秒左右,即可获得两首AI音乐作品;不满意,再重新输入即可。其便捷和轻松程度,仿佛刷短视频或切歌,毫无压力。
经实测体验,笔者也发现Suno的巨大优势和潜力。省去了从浩如烟海的曲库里寻找合适的音乐,也无须再有侵权的顾虑,Suno给人的冲击无疑是巨大且持久的。更为重要是,Suno还支持音乐分享和下载(MP3或MP4格式,MP4格式并不完美,本质上还是MP3格式的直接拷贝),这无疑提升了AI音乐的扩散和传播效率,也进一步提升了Suno的影响力。
不过就个人体验来看,Suno虽惊艳,但仍有优化和提升的空间。比如,一开始笔者选的是男生演唱,但AI给出的却是女生(提示词:一首吐槽上班的,流行,男声,幽怨A song of roast about going to work, popular, male voice, grumbling);第二次再试,男生没错了,但演唱不是中文(提示词:一首吐槽上班的,流行,男声,中文,幽怨A song of roast about going to work, popular, male voice, Chinese, grumbling)。从歌曲名称来看,9 to 5 Grind(朝九晚五)也显然是西方的语境,不过打工人的心境大抵是相通的。
后续通过调整提示词,改为中文演唱sung in Chinese,总算可以输出中文歌曲了,不过仍是女生演唱的。(提示词:一首歌唱洗澡的歌曲,男生演唱,中文演唱,流行音乐,欢快曲风A song about taking a shower, sung by boys, in Chinese, popular music, and cheerful music style)
坦白来说,面对较高难度的音乐创作,Suno确实前进了一大步,但远远谈不上完美。尽管其学习逻辑跟ChatGPT等大语言模型类似,都是通过将人类语言分解成称无数Token 独立片段,通过解析和吸收数以百万计的用法、风格和结构,并按需重新构建语言,但要想完美呈现萦绕在人们脑海中的旋律,或生成满足期望的乐曲,还是有很长的路要走。
人类音乐的历史很长,但跟文学、绘画一样,也是有规律可循的,AI通过大数据算法,融会贯通,实现类似人类音乐的再创造,一点都不算难,而难的是理解音符与音符之间,歌声与情绪之间的联系。
结语:AI生成的音乐究竟是垃圾还是作品,目前尚不好判断,不过人类利用AI创造音乐的动作已经不可逆了。除了Suno,国内的酷狗、网易云音乐也早已涉足AI音乐的创作了。据悉,大火的好莱坞电影《芭比》和《奥本海默》的电影原声带也有AI参与的身影。
AI会不会颠覆音乐家,目前还不好说,但可以预见的是,AI参与音乐创作的身影,会如AI创作图片或视频一样,越来越频繁的出现在世人面前。
当AI越来越多的融入人类音乐创作,AI音乐作品好与不好,其实也便不重要了。