潮新闻客户端记者张云山
百度创始人李彦宏在百度世界大会2024期间接受媒体采访时表示,过去一年整个行业都在焦虑,超级应用到底在哪里?在他看来,人工智能很像是一次新的工业革命,“这意味着它不是三五年就结束,不是一两年就出现超级应用。它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。”
百度创始人李彦宏
大模型技术进步速度在变快
李彦宏认为,从实现AGI的角度来看,可以说技术发展有所放缓。但从大模型技术产生应用的角度看,技术进步的速度有变快趋势。“我是希望通过百度的努力,包括我们开发的工具或者我们探索的各种各样场景,能够给大家探出来路径,什么样的应用是基于大模型能够产生实际价值的。”
他介绍,百度需要基于用户需求构建应用。例如百度文库,生成式AI技术出现后,用户的需求不再是找现成的文档,而是创作自己的内容。为了方便用户更好的创作,百度发布了“橙篇”,今年世界大会期间又推出了“自由画布”。
自由画布是由百度文库、百度网盘于2024年11月联合推出的“AI创作新物种”,通过大模型技术,打通公域与个人授权的私域内容,通过「一拖一圈」的极简操作,实现对多格式全模态文件的混合理解、生成、创作,并支持对富媒体文档的一键分享和存储。
iRAG技术是解决大模型幻觉的利器
为了更好的落地应用,百度发布了iRAG技术(检索增强文生图技术)。李彦宏介绍,百度在开发各种各样应用过程中遇到的一个障碍,就是大模型的幻觉。“必须把障碍搬走之后,我才能再往前走。”为了解决文生图的幻觉,百度研发了iRAG。其将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。
iRAG在市场营销行业有很好的应用场景。例如,汽车企业推出一款新的车型,就要拍摄非常漂亮的画面。而拍一张车的图片,需要几千块钱甚至上万块钱。花费大量的费用,还需要很长时间。如今,iRAG技术可以大显身手了。百度世界大会2024期间,李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。“在几乎所有的创作场景,iRAG都非常有价值。”
目前,百度将智能体作为落地大模型应用的主要形态。采访中李彦宏透露,自2023年四季度开始,百度就在研发具有反思、进化、使用工具能力的智能体,这与传统意义的大语言模型方向并不一样,却是OpenAI的o1模型努力的方向。此外,搜索和智能体的结合事实上拓展了搜索的边界,而不是替代或者分流。
文心大模型生成的大众揽巡汽车飞跃长城的图片
不是一两年就出现超级应用,这次是非常彻底的重构
百度在10多年前就投入了深度学习研发,广邀全球人才,积极投入研发。如今,风起云涌的大模型产业在李彦宏眼中像是“一次新的工业革命”,像是三五十年对于整个社会的方方面面一个非常彻底的重构。这意味着它不是三五年就结束,更不是一两年就出现“超级应用”的过程。
“在这个过程当中,我们既需要耐心,又需要大的投入,同时需要不断的传播这种火种,让越来越多的人,越来越多的组织和公司,能够理解这件事情对他们的意义,并且很好的利用这些新的技术能力,给自己的组织、自己的公司创造出来更多的价值。”李彦宏说。