从亚马逊到谷歌,从科大讯飞到百度,语音交互已成为巨头趋之若鹜的新战场。但是,创业一年半的戴帅湘还是觉得自己会走得比较远。
2016年5月,在百度待了9年,曾长期担任百度Query理解方向负责人,获得过百度语义技术最高奖的主任架构师戴帅湘离职,创立蓦然认知,并在7个月内完成两轮融资,推出了智能语音交互及决策引擎“小蓦机器人”。
2017年12月20日,蓦然认知发布新一代决策引擎MorUI 2.0,并透露2018年初将启动新一轮融资。
搜索是过去 ,决策是未来
“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”。不仅在名字上与百度承接,在戴帅湘看来,蓦然认知所做的事情也比百度更高一个级别。
他将其描述为“决策引擎”:搜索引擎只会提供结果给用户挑选,而决策引擎可以精确定位,直达需求。
至于“认知”,则不同于语音识别、图像识别等感知,是用自然语言理解技术得到信息后分析推理并作出决策。
人工智能市场一直在描绘一个美好愿景,但语音交互领域有个重大瓶颈:用数学的方式描述人说话的含义具有不确定性。在蓦然认知的技术库里,自然语言理解正是招牌武器。
合在一起的“蓦然认知”,对交互的精确性有着自己的理解:在全对话交互的时代,会有更精确的服务模式来满足需求,真正实现“千人千面”。
从这方面来看,以前所谓的“精准画像”都是伪概念。“听了一首摇滚乐就只推荐摇滚乐,看了篇娱乐新闻就铺天盖地地推送娱乐新闻”,正是对用户行为收集较为粗略的表现。
要解决这个问题,一是让人与设备的对话更像人与人之间的交互;二是统一各类服务的交互方式,覆盖人的各个方面。
现在不同的App进去的只是用户的不同“分身”——比如听音乐用音乐App,出去吃饭用生活类App。未来用户依靠语音控制就能进入不同应用,这些“分身”的碎片再次融合,就能出现真正精准的人物画像。”
决策引擎,语音是必争入口
蓦然认知的第一笔融资只谈了一个小时就决定了,戴帅湘的“入口说”起了不小的作用。
“每一个交互方式发生变化的时候,都有一个新的入口会出现,语音交互就是互联网新的入口。”交互方式发展的方向就是产业发展的方向,未来所有的应用程序都会进入幕后,语音交互的桥梁代替前端成为新入口。
语音交互的入口也分两个层级。一层是设备的硬件入口,另一层则是人和设备交互的入口。在戴帅湘提出的“对话即应用”概念中,第二层入口就是语音。用技术桥梁把市场上的服务进行重新索引,再用合适机制快速组织起来,是蓦然追求的一个方向。
目前的语音交互市场上,有的公司只提供单纯的技术服务,戴帅湘觉得这远远不够。“从技术到产品再到市场是一个连贯的过程,只提供技术便无法定义一个完整的产品形态,进而很难切入商业化的市场。”
“小蓦,我要喝咖啡。”
“已显示附近的星巴克。”
“星巴克咖啡有哪些选择?”
“拿铁,摩卡,焦糖玛奇朵。”
“第一个。”
“请确认是否下单一杯拿铁。”
“确认。”
“请确认是否付款。”
“取消,谢谢小蓦。”
在演示室里,蓦然认知联合创始人龚思颖向未来图灵展示了小蓦的一个应用场景。在对话中,小蓦已经从单轮交互进化到多轮交互——在戴帅湘看来,这是实现语音交互的前提。
多轮交互需要解决两个问题:一是首个意图识别的准确度,二是后续意图的连接度。相比单轮交互,多轮交互的难度会上升一个层次。
亚马逊Alexa的负责人Toni Reid曾声称坚持不做多轮对话,在戴帅湘看来,其实是他们的团队还没有这个能力。“亚马逊推出带屏幕的Echo设备,正说明增加交互才能让理解更容易。”
这个过程中间需要的复杂技术正在一步步被攻克,十年内语音为主、辅助图像的交互方式将会统一。
巨头入场语音,但音箱是Bad Idea ◆
为什么离开百度?戴帅湘不止一次被问到这个问题。似乎在巨头一起发力的市场,创业公司的最好结局可能就是未来被收购的价格高一点。
但作为一个专业的技术人员和工程师,他有一个纯粹的梦想:希望通过某种方式影响到世界上更多的人群。“新的变革需要一批有新思路的人,来做开创性的发展”。
巨头都有自己的基因,在享受其红利的同时也受到形态的束缚。在语义处理方面,目前没有公认的框架,巨头也不愿花费巨大精力资源去开拓不确定的路线。相比之下,创业公司反而能找到方案与现有问题结合,实现“先飞”。
如今在语音交互的战场中,各大巨头都瞄准了C端市场——尤其是智能音箱。中国互联网一直以来有追随硅谷的习惯,而亚马逊的成功无疑给他们打了针强心剂。
但是戴帅湘认为,亚马逊的成功具有偶然性:用户对有趣高效的新交互方式确有诉求,但音箱是不确定性的形态。在中国社会文化里,音箱并没有在美国那种主导性的地位。轰轰烈烈的智能音箱市场,除了“烧钱提高普通人对它的认识程度”这种象征性的意义外,几无回报。
不一样的创业“三级跳“,从电视开始
蓦然没有选择随大流,而是在接触调研后转向了存量的电视市场,“电视机才是中国天然的主流设备,创业公司只有做存量市场才能活下来”。
互联网时代传统企业的危机感越来越强:差价盈利模式不可持续且利润空间很薄。提高服务附加值,成为其转型的机会。
2017年5月,蓦然落地的暴风电视被冠为“中国第一个人工智能电视”。“能叫外卖、订机票的电视全世界独一无二,随着更多厂商引入技术和服务的尝试,这个设备的生命力有可能被激发出来。”目前,蓦然认知已经和四家电视厂商展开合作。
但总有一天,后来人也会盯上存量市场,先入者的优势还存在吗?对于这个问题,戴帅湘信心满满地提出了自己的创业“三级跳”理论。
“人工智能企业的核心竞争力体现在技术、产品和服务上。技术的领先是早于市场的某个时间优势,但一定要快速转变成产品优势,代表性产品要被用户所接受后成为市场优势。”
从技术到产品再到市场的“三级跳”这个一气呵成的过程,到头来也会回过去帮助改进技术模型,让这一基础再次升级,然后拓展更多市场、拿下更多设备、获得更多数据、再次升级技术……在这种循环方向下,连贯的迭代产生的壁垒是十分稳固的。不仅是创业公司,就是巨头想来啃一啃这块蛋糕也要做好被嗑到牙的准备。
除了电视,戴帅湘还选择了汽车行业:以前装方式用了半年时间落地了两台车厂。看似不相关的两个行业,他认为有很大的关联性。
在蓦然认知的产品逻辑中,电视代表了人在家里的时间,汽车则是在路上的时间。再下一步,他就要抢占公司等活动场所的时间,把三种场景连贯起来,形成整体的交互服务。
目前蓦然在电视与汽车设备商合作中采用不同的收费方式:前者主要收取服务器和带宽费用,后者则迎合汽车行业的商业机制走项目制。
除了技术研发和设备费用外,人才也是烧钱的大头。据《2017年中国准独角兽公司薪酬调研报告》,AI类毕业生起薪就达到了25—30万。“现在普通的学生就有这种薪酬,以前互联网行业有经验的算法工程师才能超过这个水平。”
创业之初,蓦然认知在7个月内就进行了两轮融资。但随着资本市场对于AI项目渐趋理性化,在看到某些场景成功落地且有用户量和商业模式之前都会观望。
戴帅湘希望快速提升市场占有率,不追求早期阶段的盈利。“说没有融资压力是假的。但不让用户在刚体验到新交互的乐趣时就被不成熟的商业模式打断,提升用户体验和设备量才符合一个前瞻性技术公司的定位,不顾体验只抓变现的方式本质上不可持续。
语音市场将会垄断,但竞价排名不是选择
如今的生活中,还很少有人用语音来解决问题,戴帅湘认为这正是这一领域企业“不专注”导致的后果。
频频露脸的各大机器人主持、歌手可以吸引普通用户的眼球,但完成具体任务、解决实际问题才更值得AI企业花费时间和精力。“普通人只会看到热闹的场景,但有清晰头脑的人能看到热闹背后的实际需求,这是很自然的现象,真正有益的事情就是市场会变得更成熟。”
戴帅湘推论,未来市场尘埃落定后,最终建立人与设备交互入口的将只有少数公司。
“试想一个房间有10个功能不同的设备,有的需要键盘、有的需要触摸,生活将多么不和谐。”互联网的最终形态是趋于垄断的,只有这样才能给用户提供一致高效的应用方式,而未来也一定会出现一个一统交互方式的颠覆者。
看起来,在未来的语音交互领域,蓦然认知所做的“决策引擎”要成为下一个百度。
但是作为搜索引擎的百度,曾经也凭借连接用户与网站几乎垄断了中国互联网的入口,最后却因在垄断地位下推出的“竞价排名”饱受诟病。在算法技术更进一步的未来,立志做各类服务应用与用户桥梁的蓦然认知又如何避免步其后尘?
在戴帅湘看来,算法技术理论上是公平的,但竞价排名掺入了太多人为因素,未来全对话交互的时代,更加精确的决策引擎可以解决这个问题。
“不过,也需要一定的商业模式把机制的效率和持续性变得更好。如果公司都无法存活,提升效率也是件虚无缥缈的事情。”在资本变现的压力与商业对手的追逐下,如何走出互联网时代遗留下来的野蛮竞争?算法需要思考,人同样不例外
作者:AI百人
本文为未来图灵独家文章,转载请申请授权并注明来源。