手机AI2.0时代,OriginOS5找到了哪些「成功密码」?

极客公园 2024-10-15 21:16:09

手机 AI 浪潮的 2.0 时代来了。

自去年安卓厂商纷纷接入大模型,推出第一批主打 AI 功能的手机之后,手机与 AI 的融合进程就切换到了快车道。上个月,苹果甚至在 AI 功能还未正式推出时,就将它作为 iPhone 16 的主打功能进行宣传,足见竞争形势的激烈。而现在,安卓阵营这边的第二代手机 AI 产品也纷纷蓄势待发。

必须承认,要将 AI 大模型能力融入手机,厂商所面临的问题依然严峻。这里并不完全是模型性能的问题,而更在于产品设计。当下「AI + 手机」产品的自动化、便捷化的程度不足,相关功能渗透率依然不高,远没有「出圈」。

想要打造真正好用的「手机 AI」,不只是要做出好的 AI 功能,而是要从系统层出发,对系统内整体的交互逻辑进行重构,使它变得更智能。

2024 vivo 开发者大会上,vivo 推出焕新升级的 OriginOS 5。这代新系统不只是 AI 功能更强大、更智慧,系统全局的各项能力也都再次迭代。vivo 的目标,是让 OriginOS 成为 AI 时代最好用的手机系统。

01 以「便捷」为核心的设计

过去一年,大部分手机厂商做 AI 功能的思路,都是先围绕「聊天」式的交互展开。

以「聊天」为起点很合理,因为「智能语音助手」已经是手机上存在了十年以上的功能,AI 大模型的应用落地也是从 ChatGPT 等「聊天机器人」开始的。

问题也正出在这里。对普通用户来说,要完整地组织语言发出一条指令,编写一条 prompt,是一个成本很高的行为。智能手机相比 ChatGPT 这种没有任何数据基础的 AI 应用,最大的优势在于,很多数据其实已经在手机上了,不应该再让用户手动输入。

但在这个过程中,也有两个问题要解决。一是要将 App 内各种各样的数据转化为 AI 能够理解的格式,其次则是在授权的层面要做出清晰界定,防止隐私泄漏和数据污染的问题。

这就是 OriginOS 5 最核心的 AI 功能升级,Jovi 语音助手与「蓝心小 V」深度融合,蓝心小 V 不再是一个单纯的语音助手,而是拥有了更全面的功能。用户现在可以长按导航条唤醒蓝心小 V,唤醒之后,不只是可以语音、文字输入指令,而是可以直接框选当前屏幕上的内容,输入给蓝心小 V,进行搜索等后续处理。

这一设计非常巧妙,因为大部分时候我们想要搜索、处理,就是我们眼前正在看到的内容,通过「圈搜」的方式,最大程度降低了输入的负担,也避免了 App 适配和兼容的问题,可以覆盖手机内一切场景,还保证了隐私的边界。

小 V 圈搜的用法覆盖了各种场景。比如看到一篇小红书笔记,可以圈搜图片上人物的相关资料、相关商品;圈出一段聊天记录、机票火车票订单来创建日程;截取一段电子书、文章、工作材料进行翻译、生成一篇备忘笔记……

更重要的是,用户在框选内容之后,依然可以主动输入指令,进行各种不同的处理,而如果这个「视觉识别」的逻辑拓宽到摄像头,用户可以拍摄现实中的任何内容输入给 AI,进一步将蓝心小 V 的可能性拓宽到无限大。这个功能在目前已在 OriginOS 5 里落地,是以「vivo 看见」的形式存在,主要聚焦于视障人群,帮助他们理解周围的环境。借助 AI 大模型的理解、检索、生成能力,这个功能的外沿还有被进一步拓宽的空间。

基于同样的「读屏」逻辑,vivo 还对输入法进行了优化,推出了小 V 写作功能。在各种聊天界面、电商评价、朋友圈发布界面,都可以基于当前手机屏上显示的内容,自动生成内容,辅助用户进行文字编写。

这一切都并不是模型层面的革命,而是单纯的产品创新。但它带来的体验优化显而易见。想通过 AI 助手 App 实现类似的「智能回复聊天」功能,用户需要在聊天界面截图、裁切,在 AI App 里编写 prompt,得到回应,再将回应的内容复制到聊天框,而现在则只需要点击按钮就可以实现。

除了读屏之外,OriginOS 5 还加强了各种场景下,多模态数据的「自动处理转换」能力。新的小 V 电话助手、小 V 帮记可以将电话、线上会议的音频实时转成文字,显示字幕,并进一步实现「智能生成摘要」、「同声传译」等功能。这个功能的用法已经很成熟,我们今天大部分电话会议都会有录音,以及转写的文字版。但在手机系统内植入这一功能的最大优势在于,它可以将不同协作平台、不同场景下的电话、会议记录集合到一起,更易于管理。

大模型 AI 是一个覆盖面极为广泛,但也因此很抽象的技术,难以进行具体的功能定义。大部分厂商,都把这个问题化作一个开放的输入框,丢给用户去思考。最终导致了 AI 产品的逻辑并不复杂,就是一个聊天界面,但用户实际依然不知道它有什么用,要怎么用。

可以说,OriginOS 5 开启了一次「便捷化」革命,将手机上的数据,送到离 AI 大模型接口更近的地方,方便用户更容易触达。这是 AI 2.0 时代最重要的主题。

02 帮AI建立「长期记忆」

除便捷化之外,当下所有大模型 AI 产品,面临的另一大难题是「记忆」:几乎所有大模型产品,都无法对用户进行深入了解。在和用户对话的过程中,之前内容的权重会被迅速稀释。也就是说,AI 特别「健忘」,很多时候用户要重复输入同一指令,来保证 AI 还记得之前的要求。

对手机来说,问题也是类似的。我们进入移动互联网时代已经超过十年了,很多人手机上、云端储存的,是十年跨度的数据,这些数据淤积在手机里,检索起来变得非常困难。

这里最典型的场景是相册。很多人相册里都储存了上万张照片,要从中迅速找到一张特定的老照片,变得非常困难。所以过去几年每个手机厂商都在做相册的自然语言检索,依据位置、人物等等标签进行分类……

但在相册之外,如何让手机真正成为我们的「人生数据库、回忆录」,依然是一个更大的问题,而这又恰好是大模型 AI 能够发挥作用的一个场景。

vivo 在 OriginOS 5 的相册里加入了「时光剪影」功能,不只是帮用户迅速找到想要的照片,而是对照片进行二次组织、加工。它可以自动筛选出一段时间里的照片,通过大模型理解这段回忆,进行智能剪辑、配文、配乐,其中还新增了支持生成 AI 人声音乐的功能。

这是全行业的大趋势。过去我们在计算机上处理的数据都是「文件」,是以「数据库」的逻辑进行组织的。但在智能手机时代,这些数据是我们自己拍的照片、写的笔记、与他人聊天的记录,是非常具体的经历和回忆,完全可以用一种更贴合人脑思维的方式,以富文本、视频的形式,进行多模态的组织。

在 OriginOS 5 上,最能体现这一思路的功能是「小 V 记忆」。功能上,目前小 V 记忆很像一个「日记本」,能够把不同模态的数据整合在一起,以类似手帐的方式呈现出来,其中包括图片、视频、文本、网页……

而在「小 V 记忆」的「图谱」功能里,它把用户本机的文件数据全部进行了标签化处理,按照语言逻辑,生成了一张图谱,借此将不同的文件串联在一起。而这些数据,明显有成为 AI 知识库的潜力。就是说,未来用户可能可以利用 AI 助手,来快速挖掘自己手机上的所有文件信息,以及信息之间的关系。

而更重要的是,AI 也可以借助这一套私人知识库,建立起对用户的深入、长期理解,来满足个性化的需求。也就是说,未来我们在和 AI 交互的时候,很多具体的需求,不需要在指令里详细说明,AI 就能「心领神会」。

在实现输入的便利化,建立起长期记忆和私密知识库之后,手机与 AI 结合的未来,还有巨大的想象空间等待着探索。

这次 vivo 放出的新功能中的「订座助手」,就能让我们稍微一睹这样的未来。它基于大模型的理解和生成能力,在用户输入用餐需求后,会自动查找餐厅、获取商家联系方式,拨打过去并代替用户与商家进行订座沟通,最后返回结果,临近预约时间,用户会收到提醒,之后可以一键导航到餐厅。

听起来可能有点太超前,甚至像科幻小说的情节。但它的确展示出,当 AI 充分利用了手机的各项功能之后,能便捷地实现多么复杂的任务。

03 智能手机系统的下一步是做「减法」

尽管 AI 是 OriginOS 5 最重要的迭代更新方向,但我们应当意识到,AI 只是手段,它背后隐含的更重要的时代背景,是智能手机的「减法革命」。

过去十年,智能手机迭代的大方向是做「加法」。屏幕越来越大,储存越来越高,伴随着通信技术和带宽的提升,可以说,智能手机终结了信息匮乏。

但现在,越来越多用户面临的问题是信息过载。我们生活中的设备越来越多,App 越来越多,为抢夺用户注意力的过度设计也越来越多。买一张机票有 4 个 App 推送通知,很多内容看完就忘了在哪看过,各种菜单的层级、选项,多到眼花缭乱。即便用了这么多年的智能手机,也常常找不到自己想要的功能在哪。

所以,智能手机下一步的发展方向,特别是软件层面的迭代,就是要解决这个问题。

OriginOS 5 上,另一个很重要的功能更新是「原子岛」。表面上,它的产品逻辑和 iPhone 的「灵动岛」非常相似,后者是为了适应 iPhone 硬件变化推出的功能。但「原子岛」不太一样,它不只是利用屏幕的一块区域显示点什么,更重要的是,它还具备「预测、建议、信息流转」的能力。

比如,「原子岛」会基于日程事件、用户习惯,主动提供 AI 服务建议。比如用户复制了一行地址,拖到「原子岛」区域,就能快速跳转到地图;复制图片,就会优先出现「发送到微信」等分享选项。复制航班代码,原子岛就会自动弹出查询航班信息的按钮。

过去,智能手机的功能都被封装在 App 里,不同 App 之间缺乏协调机制,导致了信息的重复问题。而「原子岛」、「小 V 建议」的出现,就是要利用更少的 UI 元素,实现更多的功能服务。过程中通过 AI 能力来预判用户的需求,从庞杂的信息中浓缩、总结出重要的部分,帮助用户「消化信息」。这也是 AI 大模型与手机结合的重要意义。

智能手机系统上一次类似的革命,是 UI 设计从拟物走向扁平化,凸显出信息,降低用户的视觉负担。这一点上 OriginOS 5 依然在持续优化,统一了很多视觉动效,增强了界面之间的空间关系效果,并强调「数字化设计」,增强关键信息的呈现。

最后,OriginOS 5 也对最基础的流畅性、续航、网络信号等性能进行了升级优化。通过「Ledger 储存账本」对内存进行底层统一调度,减少了 App 长时间前台使用时,过度占用内存的问题,减轻了 App 负载带来的卡顿。还对动画流畅度、能效续航、抗老化能力分别进行了针对性优化。

实际上,无论是基础的流畅性能优化,界面交互上的创新,还是最前沿的大模型 AI 功能,它们最终都指向了同一个目标,即如何在提供最丰富功能的同时,最大程度减少用户的负担,保持操作系统的高效。这是未来智能手机操作系统「好用」的关键。OriginOS 5 通过一系列的便捷化设计,AI 功能创新,性能优化,已经成为 AI 时代最好用的国产手机 OS 之一。

找到正确的方向路径,通过与 AI 能力更深入地结合,OriginOS 的未来也因此变得更值得期待。

*头图来源:vivo

0 阅读:1