中国版ChatGPT项目“文心一言”将于3月面世,百度能否趁势“狂飙”?

蓝鲸财经 2023-02-08 10:00:15

图片来源:图虫创意

2月7日,百度确认ChatGPT项目名字为“文心一言”,英文名“ERNIE Bot”,三月份完成内测,面向公众开放。

ChatGPT在2022年11月底免费测试后引发全球关注,作为AIGC领域的颠覆性产品,仅上线5天用户数量便突破100万。据了解,到今年1月,其在两个月时间内便吸引超1亿的活跃用户。

在外界看来,ChatGPT或成为下一代搜索产品的雏形。百度作为国内搜索引擎和人工智能的代表,自然不会错过这次机会。

业内普遍认为,ChatGPT是人工智能里程碑,更是分水岭,这意味着AI技术发展到临界点。在人工智能领域深耕数十年的百度能否乘其东风完成自我变革引发业界关注。

“文心一言” 或提前开放内测,百度股价涨超15%

记者从百度处获悉,目前,文心一言在做上线前的冲刺。去年9月,百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面,都有方向性改变”。据此推测,百度那时候就开始做文心一言。

百度相关人士指出,按照谷歌和微软节奏,文心一言开放内测还有可能提前。

消息一经曝光,百度集团港股股价一度大涨。截至2月7日收盘,涨幅15.33%,收盘价突破162港元,市值4492.16亿港元。

据天眼查显示,同日,北京百度网讯科技有限公司申请的“交互方法、模型的训练方法、装置、设备及介质”专利获授权。摘要显示,该公开涉及人工智能技术领域,尤其涉及深度学习、智能搜索、自然语言处理(NLP)等技术领域。

该发明提供了一种深度学习模型的训练方法,包括利用无标注样本语句,通过无监督的对比学习训练方式训练深度学习模型,得到第一级模型;以及利用样本语句对训练第一级模型,得到一级目标模型。

同时,提供交互方法包括接收来自用户的问题;将上述问题输入至特征提取模型中,得到语义向量;从多个语义索引向量中确定与上述语义向量相匹配的目标索引向量;基于上述目标索引向量,确定与上述问题相匹配的答案。

在ChatGPT项目名称公开之际,相关技术专利也获得授权,百度这步棋恐怕已思虑良久。

ChatGPT是美国“开放人工智能研究中心”OpenAI研发的聊天机器人程序,于2022年11月30日发布。作为人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。

据了解,有调查显示,89%的美国大学生承认使用ChatGPT做家庭作业,53%的学生用它写论文,48%的学生使用ChatGPT完成测试。

结合ChatGPT的底层技术逻辑,中信证券曾列出了中短期内ChatGPT的潜在产业化方向,即归纳性的文字类工作、代码开发相关工作、图像生成领域、智能客服类工作。

相比于部分科技股蹭热度,百度近两年在人工智能领域的存在感更显真实。

自动驾驶商业化难题待解,百度欲求新故事

1月10日,在第五届百度Create AI开发者大会上,李彦宏重申了他在2021年Create大会上的观点,“随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年”。

在BAT中逐渐落后的百度自然不会放过人工智能带来的新机遇。早在2019年3月,百度已经开发了文心ERNIE 1.0系统,其是一种与ChatGPT所基于技术类似的深度学习模型。

截止目前,文心大模型已经形成“模型层+工具与平台层+产品与社区层”的整体布局。2022年11月底,其发布11个大模型和基于文心大模型的2大产品,即AI作画产品“文心一格”和产业级搜索系统“文心百中”。

在百度首席技术官王海峰看来,以人工智能为重要驱动力的第四次工业革命,深度学习是其关键核心技术,具有很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征,推动人工智能进入工业大生产阶段。

纵观百度这几年的发展史,它也的确是这样做的。从技术层面,AI走向了自动生成内容,包括AIGC用于作画、图文、视频等多类型的内容创作,如基于飞桨文心大模型“补全”《富春山居图》、数字人度晓晓AI画作卖出17万元等。

从产业应用方面,百度AI已深入产业,赋能实体经济发展,如智能交通中的“智能调度系统”是深度学习+交通融合创新的智能应用,目前已经落地全国63个城市。

百度要抓住的不仅是人工智能的黄金十年,更是过去失去的十年。尽管这十年间百度并没有落下一个风口,外卖、团购、游戏、直播、智能驾驶、元宇宙等,但稳定实现商业化落地的产品却未形成公众认知。

即便是前景广阔的自动驾驶,仍面临商业化难点。实际上,百度从一年前开始,每个季度都发布自动驾驶平台萝卜快跑的订单量,2022年第三季度订单量已超过47.4万。但自动驾驶技术本身面临着较大的商业化压力,技术进展与社会对无人驾驶期望值的平衡需要长期努力,盈利问题短期内很难解决。

这意味着,习惯以技术作盾的百度必须转化更多生产力来应对时代变革。

艾媒咨询CEO张毅向记者表示,这款产品本身对于百度未来的商业化来讲是非常重要的,在搜索引擎领域20年以来没有更多的创新去挑战。ChatGPT这样的产品创新,对百度来说是一个极大的启发。

乘ChatGPT东风,百度能否“狂飙”?

ChatGPT东风起,或许会让百度早已酝酿的AI火苗燃烧更烈,不缺技术的百度能否借此重新定义国内搜索业务成外界关注的焦点。

从技术层面来看,进入人工智能时代,IT技术的技术栈发生了变化。过去基本分为三层,即芯片层,操作系统层和应用层。现在的技术栈可以分为四层,即芯片层、框架层、模型层和应用层。

据了解,百度在人工智能四层架构中都有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。此次推出的文心一言,便位于模型层。被称为“人工智能皇冠上的明珠”的NLP,则从百度处理用户的第一次搜索开始,便成为搜索技术的重要组成部分。百度在技术上的自信,让它对顺势而来的ChatGPT充满期待。

李彦宏曾表达自己对ChatGPT的看法,“ChatGPT是AI技术发展到一定阶段后的新机会。怎么把这么酷的技术,变成人人需要的产品,让每天有几亿人从中受益?怎么赋能千行百业,让他们的生产效率大幅度地提升?这一步才是最难的,也是最伟大、最能够产生影响力的。”

据中研产业研究院公布《2022-2026年中国搜索引擎行业竞争格局及发展趋势预测报告》(以下简称《报告》)显示,聚焦国内搜索引擎产品,百度搜索市场份额持续增长,至2022年第一季度达到84.21%,是国内第一大搜索引擎。搜狗搜索是我国第二大搜索引擎,但市场份额远低于百度。

ChatGPT目前最好的商业应用就是搜索,这刚好是百度一直以来的基本盘,为实现李彦宏“人人需要的产品”蓝图提供了天然优势。

实际上,在百度Create AI开发者大会前夕,百度搜索便宣布将基于百度自研的生成式模型,升级“生成式搜索”能力,并指出,生成式AI和搜索引擎是互补关系而不是替代,搜索底层技术和AI底层技术是相通的。

ChatGPT契合百度,百度也急需ChatGPT实现自我革新。ChatGPT算不上新应用,但此次却从核心技术层面扩展到大众层面。

在国内,百度尽管仍为国内第一大搜索引擎,但抖音、快手、微博、小红书、微信等社交平台带来的搜索压力却不容小觑。以抖音为例,据官方已公开数据,截至去年底,抖音月活跃用户超过5.5亿,而日均搜索用户已超过4亿。

在国外,《报告》显示,2019-2022年第一季谷歌与Bing引擎产品在我国的市场份额均仅有百分之几,不过Bing市场份额逐年递增,从2.34%增至5.65%。尽管谷歌在国内份额跌破5%;但在全球独占鳌头,近年来市场份额均高于90%。

ChatGPT+微软Bing势必会对谷歌造成冲击,而若抓住这次机会,或许会让百度找到新的增长曲线。

据红杉资本预测,2023年文本、代码生成有望得以成熟应用,图像、音视频生成尚处于生成基础初稿的阶段。

张毅指出,搜索引擎是大家虎视眈眈的产品,很多巨头会布局这个赛道,这是争夺下一代搜索引擎产品的窗口和契机,对所有要获取流量和占据用户心智的企业来讲,都是一个绝佳的机会。

在百度公布ChatGPT项目的同时,三六零在在互动平台表示,该公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入。公司也计划尽快推出类ChatGPT技术的demo版产品。

面对ChatGPT的新起点,传统搜索需要变革,百度能否借此一路“狂飙”,还需拭目以待。

0 阅读:75