从2023年的ChatGPT,到2024年的Sora横空出世,大模型技术在短短一年内,给整个世界带来了极强的震撼效应,但同时也带来了很多乱象。
刚刚在5月末,斯坦福大学的一个AI团队,在全球最大的AI开源社区HuggingFace上发布了一款名为Llama3-V的多模态大模型,被证实是抄袭清华系大模型创企面壁智能刚发布的开源大模型,引起轩然大波,也将大模型“套牌”问题引向了风口浪尖。
今年1月,国内大模型打假维权还出现了首例胜诉判决。飞游网络假冒“通义千问”的山寨APP、账号,还打着官方的旗号向用户收费,因此被阿里云、阿里巴巴起诉并胜诉。
相似的案例还有很多,自大模型时代到来之后,抄袭,山寨、套牌,假融资等等乱象纷至沓来,在大模型时代的AI创新要站稳脚跟,势必要加速自主创新,坚守本心,方能正道成功。
“百模大战”一年,市场乱象频出过去一年,“百模大战”让大模型技术站上了市场“风口”,和所有风口上的技术一样,不仅引来了资本和市场的追逐也引发了很多乱象。
首先,质量和数量的矛盾始终伴随着大模型的“井喷式”发展,一大批所谓AI创业公司,一味追逐热点,导致市场上的大模型多而不精,陈次不齐,同质化严重。
公开的数据显示:截至于今年4月底,国内共计推出了305个大模型;截至于5月16号,大概有140个大模型完成了生成式人工智能的服务备案。这种大模型数量的快速增长多为盲目跟风,对大模型本身的创新毫无助益。
其次,套牌、造假和虚假宣传事件萦绕不断。一些公司为了快速实现融资或市场化的目的,将开源大模型进行“改造”后就冠以自有产品之名,也导致了国内大模型原创性的缺失和知识产权等潜在问题的隐患。
更有一些企业,通过硬造技术术语、夸大价值等方式进行宣传,甚至将不是大模型技术的项目包装成大模型,让用户陷入选择困难。
第三,大模型同质化,缺乏多样性,导致应用端效果欠佳。不少大模型采用同样的数据集、训练方法等,导致输出雷同的问题答案,无法满足多样化的市场需求。同时,高质量数据的缺失,也严重制约着大模型的发展,这也是为什么大模型“幻觉”问题总是无法根除的原因之一。
第四,过度竞争,价格战让大模型创新陷入短视之局。经历长达一年多的“百模大战”,大模型行业迅速陷入价格乱战。一些企业接连调整旗下大模型产品的定价策略,采取“直降97%”的按厘计价甚至“全面免费”的策略,进一步抑制了行业用户对大模型的使用信心。
第五,刷分、打榜等无意义的“评测秀”充斥市场。有些大模型的开发只关注短期利益,如“打榜刷分型大模型”和“结项为主型大模型”,它们不考虑应用场景与后续更新,只追求短期的宣传效果或结项成功,对整个行业的长期发展造成伤害。
在风口之上,这些乱象尽管很容易被忽视,但却真实存在。我们相信,在风口过后,必然是去伪存真的时候,唯有坚持走自主创新的技术能够活下来,唯有原创的产品会获得持续的发展。
AI创新要如何走向成功?实际上,在大模型时代之前,AI的风口已经出现过好几轮。每一次风口的轮转,从波峰到波谷,都必然伴随着市场的洗牌,大量的跟风者和投机者被淘汰,真正创新的公司和技术才能穿越周期。
那么从AI创新的角度,要如何才能走向成功?
首先,要制定全面而长远的战略规划,明确的AI发展战略,包括短期、中期和长期目标。因为AI的技术变革速度极快,新的算法、框架、硬件和应用不断涌现,长期的规划能够坚守清晰的方向,确保资源投入与技术趋势相匹配。在面对大模型等技术风口时,更能站在自身发展策略的角度上,去调整技术方向和产品策略,不至于偏离目标。
其次,赛道的选择十分关键。以大模型为例,市场的机会是否属于每一家大模型技术的提供商呢?答案显然不会是肯定的。通用大模型的迭代速度飞快,GPT的演进速度快的令人咋舌,国内的通用大模型,仍旧保持传统的创新模式,要追上GPT的创新步伐是非常不现实的。
所以,选择垂直领域的大模型方向,这就是一个好的赛道选择。以华为云的盘古大模型为例,在政务、在矿山、在铁路和气象等领域的落地,证明了行业大模型比通用大模型,在现阶段有更强的实际价值。
第三,要加强核心技术的自主研发,打造更多原创性技术。因为拥有自主的核心技术,企业才可以自主决定技术发展的方向,而不受外部供应商或合作伙伴的限制,也可以避免技术依赖带来的潜在风险。另外,从AI创业的角度,原创性是技术创新和突破的重要驱动力,强调原创性是研发团队不断挑战现有技术边界的根本。
当然,加强原创性技术研发,也会面临成本和资源等问题,这就需要有好的创新平台来辅助开发者。
华为云其实已经在构建这种生态,比如以华为云昇腾AI云服务为算力底座,目前华为云已原生孵化自然语言、计算机视觉、多模态等5大基础大模型,并与伙伴联创多个行业大模型,已落地30多个行业,为开发者提供了强大的工具和资源;2023年,华为云也上线昇腾AI云服务百模千态专区和开发者模型社区,全面基于昇腾AI云服务进行适配和优化,精度和性能显著提升。
第四,迈向多元创新,而不是挤上大模型的独木桥。其实,不仅是大模型,中国人工智能产业要发展,从算力、算法,到大模型、应用都需要自主创新。这是有志于AI创新的中国企业的机会,也是中国AI创新整个体系能够做大做强的关键。
做中国AI创新的“沃土”所有天马行空的念头,回归到中国的AI创新,就一定要考虑到实际的落地场景,当然就要面对“最后一公里”的难题。每一个系统、每一处体验、每一段代码的背后,都有开发者的影子。
开发者就像是整个AI创新系统中的“毛细血管”,补齐了落地的最后一公里,让生态活起来。开发者也是深入基础研究、补齐产业链短板、走向核心技术创新的关键力量。
华为云一直有志于做开发者的“沃土”,并以最新的技术做AI创新的“灯塔”。比如华为云盘古大模型方面,华为云已推出矿山、药物分子、电力、气象、海浪、铁路、政务、金融、制造等多个行业的大模型,为业界贡献了先进的算法和解决方案。
据悉,华为开发者大会(HDC 2024)将于6月21日-23日在东莞松山湖举行,届时,华为云将发布盘古大模型5.0,仍然是本着“专为行业而生,致力于为行业客户服务,解决实际问题”的理念,赋能千行万业的开发者,做中国AI创新的“沃土”。
中国AI创新从“套牌”,走向正牌,其实需要的正是华为云这种力量,以原创的精神,务实的风格和对技术演进的远见,对行业场景的深刻理解,足以引领中国AI创新,更加贴近实用价值,更符合中国行业发展的需要。