从“蓝心智能”战略,拆解vivo打造AI手机的“术”与“道”

宿艺儿 2024-10-10 19:22:52

文丨壹观察 宿艺

身处信息时代,“连接”是一种看似无形却极具价值的能力。

迈克尔·施拉格曾在《思维共享》一书中提出:“我们不应总认为技术就是管理信息的方法,而要把它视作建立关系的中介。”当前,无论是芯片、无线通信还是人工智能,所有信息技术的更新迭代与指数级发展,都并非仅仅为了“在一秒钟之内处理更多信息”,其终极目标是更好地服务人和社会,尽可能拉近人与数字世界、物理世界之间的关系,让所有“连接”更自然、流畅、高效。

近日,vivo在2024 vivo开发者大会上发布的全新AI战略“蓝心智能”,以及全面升级的vivo自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2等最新科技探索成果,将这种“连接”再次推向了极致。

具体而言,蓝心智能将大模型技术与手机操作系统深度融合后的个人智能,目标为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。未来,vivo会沿着“重构人与设备的交互体验、重构人与数字世界的服务体验、重构人与物理世界的沟通体验“三大方向,全面推进蓝心智能的创新演进与趋势引领。

可以发现,vivo其实穿透了技术的“数字化外衣”,直达人与万物的“连接”本质,真正做到将AI作为“手段”,而不是“目的”:无论是硬件研发、软件升级还是生态基建优化,vivo所有技术的迭代和创新,最终都服务于人的体验,旨在推动三重“连接”能力更加简单、高效、智慧与有温度。

更简单:重构人与设备的交互体验

回顾智能手机发展早期,交互体验的革命性跃升其实并非由“物理按键”演变为“触摸屏”直接实现的,中间还存在一个微妙却又极其关键的变革:从电阻式触摸屏到电容式触摸屏的进化。

传统电阻式触摸屏需要用指甲盖进行压力操作,而电容式触摸屏不仅用指尖就可以完成手机上所有界面的交互,而且还支持多点触控,能够识别缩放、拖拽、旋转等直观手势。正是这种更符合人类自然习惯和直觉的“连接”动作,造就了智能手机实现体验变革的“关键一跃”。

面对即将到来的AI手机时代,vivo依然坚定将人与设备的交互体验放在首位,主动探索更符合直觉的、更自然的人机沟通方式。

首先,vivo将AI能力与 OS 交互深度融合,以AI技术赋能传统的产品功能。

在本次全新发布的OriginOS 5中,vivo将“Jovi语音”与“蓝心小V”深度融合,不仅让蓝心小V与用户的沟通更加自然灵动,还新增了划线、画圈等自然交互手势,让蓝心小V的响应和服务链路更精简有力。

例如,通过长按导航条,用户可以呼出全新的“小V圈搜”功能,直接将图片文件等拖拽给小V处理。在常规的语音和文字搜索之外,用户还能通过“随手画圈”这样更自然的手势圈定屏幕上的某一部分内容,直接发送给小V。接收到“任务”的小V,会主动识别用户意图并展开搜索,提供相关信息和服务。

融合AI让交互更智能的同时,vivo也继续利用设计与性能优化策略让交互更流畅:通过构建符合人眼直觉的光影、交互、形态切换、场景过渡效果,让每一帧画面变化都足够自然愉悦;引入安卓领域内首创的Ledger内存账本机制等方式,使OriginOS 5实现系统级的内存资源调度,即便在重载场景下依然能提供不卡顿、不延迟、无负担的感官和操作体验,做到“重载如轻载,长久使用亦流畅”。

为更彻底地推进交互体验重构,vivo还向下打通底层技术能力,用自研蓝心大模型矩阵为交互优化赋能。

此次大会上,除了全面升级的语言大模型和端侧大模型能力,vivo还带来了自研的语音大模型、图像大模型及多模态大模型,为人与设备的交互体验的再进阶注入“技术灵魂”。

其中,升级后的语言大模型具备千亿级蓝心大模型云端能力,在意图理解与分发、任务规划方面显著优化,整体能力在权威榜单CMMLU和SuperCLUE上均实现领跑;蓝心端侧大模型3B在对话写作等文字信息处理方面表现优异,可“越级比肩”行业7B甚至9B模型,在SuperCLUE 和南开大学端侧5B小模型综合能力评测中均排名第一。

为打造更生活化的自然语音交互体验,vivo自研的蓝心语音大模型不仅可以准确理解语义、感知情绪、模拟人声,展开节奏自然的超低时延对话,还能作为中英日韩泰同声传译,提供超过15种语言的互译支持。

图像方面,vivo还发布了以“中国特色与东方美学的融合生成能力”为特色的蓝心图像大模型,这也是当前国内最懂中文语境的图像模型之一;此外,蓝心多模态大模型强化升级了上下文理解和记忆能力,能够更深度地理解手机屏幕内容,并以此为基础推进提供相关服务。

从语言、语音、图像到多模态,从正确理解、自然对话到有效输出,正是这些“水面之下”的AI大模型能力支撑,构成了vivo重构人与设备的交互体验的技术基石。

就像vivo副总裁、OS产品副总裁周围在近期的采访中所表示:“手机它不是一个很神秘的东西,就是平常我们用来生活、工作的东西,vivo就是想它的体验做好,基础体验做好,把基于产品的那些功能增强。”

的确,当前手机行业仍然处于AI创新的量变阶段,手机厂商不一定需要迫切地颠覆什么,也不需要刻意追求“复杂”和“伟大”,仅仅是以AI为手段,把用户日常生活中的每一个“连接”动作和体验推向新的极致,就已经足够深刻和重要。

更高效主动:重构人与数字世界的服务体验

做好人和设备的连接之后,再往前打开一扇门,就来到人和数字世界的连接。对于手机厂商来说,这种“连接体验”不仅存在于人与无数个孤立的数字信息之间,更集中存在于人与数字服务之间。

按照全新“蓝心智能”战略,vivo将依托OriginOS 5以及蓝心大模型矩阵,以“三步走”重构人与数字世界的服务体验,让智能服务更加个人化。

第一步,依托 AI 技术对手机的基础功能进行全面升级。

简单而言,即融合AI能力,将输入法、电话、笔记、扫描等 15 项刚需服务功能“全部重做一遍”,同时以AI全面赋能系统基建,搭建出平台化的AI公共能力。

第二步,搭建连接服务的框架和平台,以及针对轻量化和原子化的服务构建的完整的意图框架体系——让“人更轻松地找到服务”,同时也让“服务更主动地匹配人的需求”。

为缩短人找到服务的路径,vivo将“原子通知”的灵动形态与小V的意图识别能力相结合,进化为更智能的“原子岛”。

在提供日常高效的信息管理体验之外,“原子岛”特别新增“拖拽直达”的服务交互能力,比如用户复制一项地址信息后,可以直接拖拽至“原子岛”选择直接跳转地图服务,省去手动切换软件界面的繁琐步骤,极大提升用户处理信息和获取服务的效率。

为实现“服务主动匹配需求”,vivo还将此前的Jovi建议、重要通知、智慧建议合并升级为“小V建议”,让蓝心小V的服务更系统化和集成化,同时能够综合预判用户意图并推荐服务。

OriginOS 5中新增了小V建议桌面组件,使小V的智慧服务形象具像化。基于用户时空和习惯等特征,小V建议可全天候提供如打车、登机、入住、游玩攻略等建议,为出行、生活、办公等全场景递送更贴心的数字服务。

第三步,还要构建个人智能系统框架,让手机成为专属个人助理。

为了让人与系统之间“更熟知”,OriginOS 5通过“小V记忆”构建了多模态私人记忆库,以“记忆碎片”“图谱”和“收藏”三种模式记录和智能整理用户数据内容,并据此提供更符合用户需求的个性化服务。

再继续进阶,vivo深化构建了实现链路更长、更复杂的自主服务能力。此次全新推出的手机智能体PhoneGPT是vivo对未来的一次技术探索,它是一位可以基于用户意图拆解需求,主动规划路径,并实时环境识别和动态反馈决策的“多模态助理”。

与以往被动、操作局限、功能散点化的“智能助手”不同,vivo手机智能体PhoneGPT更像是一个能够真正代替用户执行一连串复杂的应用操作的现实意义上的“助理”,既能对屏幕界面进行主动识别和操作,也可以利用语音大模型接管音频,代替用户进行对话。例如在“小V订餐助手”功能中,用户只需要告诉小V希望预定的餐厅需求,小V就能像一个“真人助理”那样打开相关APP寻找合适的餐厅、打电话沟通订座,全程自主处理用户提出的服务需求。

此外,vivo深知,打造出再强大的专属个人助理,也需要足够多的智能服务来配套辅助,才能全面重构人与数字世界的服务体验。

为此,vivo在OriginOS 5中全新上线了蓝心小V智能体广场,一面打造“小V作业助手”“小V运动教练”等具有样板性的智能体,一面将AI基建能力开放给行业第三方,向娱乐、健康、生活等第三方智能体敞开怀抱。

这种“不抢占第三方业务”的合作共赢心态,源自于vivo一贯的“利他之心”。为带动更多产业链伙伴加入进来,vivo也在本次大会中推出了一站式智能体开发、分发、运营平台“蓝心智能体开放平台”,助力更多开发者高效便捷地进行智能体开发及流量转化,推动各行各业的厂商共同构建全新的智能体生态,为用户提供全方位的智慧服务体验。

更温暖:重构人与物理世界的沟通体验

穿过数字世界的尽头,技术应用终究还是要回到现实,为人和物理世界的“连接”而服务。因此,vivo同样希望帮助人们解决一些生活中实际存在的痛点问题,延伸自我能力,连接社会生活。

在vivo眼中,AI手机不止是智慧的,同样应该是温暖的。依托AI多模态大模型融合理解能力,vivo希望AI手机可以“生长出”类似人类的视觉和听觉能力,以此作为人们“能力的延伸”,帮助视障、听障等人士更好地接触和探索世界,让人与物理世界的沟通更顺畅和温暖。

在全新上线的“vivo看见”蓝心升级版中,用户能够借助手机的摄像头拍摄的实时画面,与“vivo看见”进行流畅问答,通过问答来辨识眼前的高频视障场景,更好地与现实场景相处。

基于蓝心语音大模型的能力,“vivo听说”可以在线识别和播报多种方言内容,让普通用户和听障用户既能“听”懂方言,也能“使用方言”进行交流。离线模式下,用户同样能够将普通话语音转成文字、发送文字转成多种对话音色的语音播报,进行无网弱网的即时沟通。

此外,得益于手语识别及AI虚拟人的手语生成能力,“手语翻译官”还能够帮助用户进行词语手语跟练、学习完整词句的手语功能应用,增进社会与聋哑人士的日常沟通交流。

面向大模型时代,vivo表示将致力于建设个人化AI,深入探索AI在手机、Pad等终端设备上的用户使用场景,着力为用户提供“更懂你、更智能、更安全”的个人化AI体验。不难发现,这种以用户导向为驱动的AI研发思路,其实和vivo始终坚持的“本分文化”一脉相承。

正如《基业长青》一书中曾提出:“一些基业长青的公司之所以能存活50年以上,是因为他们保留了一小部分亘古不变的核心价值,在其他方面不断激发创新与发展。”一直以来,无论技术研发、产品创新,还是面对外部环境的变化,vivo都始终保持着“本分文化”:只需种下满足用户本质需求的“因”,“果”自然水到渠成。

譬如,vivo的创新理念要义是“重视智能手机的个人通信连接设备属性,形成对交流、对话和人机智能领域的前沿创新突破”,科技研究要义是“聚焦科技消费品本质需求,以普及应用和能力增强为目标深度投入科技研究”,正是这些从用户需求、从使用场景、从应用效果出发的“本原思维”,一步步指引、造就并重构了一系列智慧温暖的AI体验。

又如,在智能手机向AI手机演进的行业周期中,vivo之所以能够做到三年蝉联国产手机市场份额第一,并且在今年上半年实现持续领跑,也都是因为vivo旗下不同系列的产品精准响应了不同用户群体的偏好需求,为不同用户提供连接智慧生活的更好路径,于是一步步赢得口碑和市场。

做好用户需求与前沿科技创新之间的“连接”,早已成为vivo无需言说的创新与产品命题。

可以看到,在此次2024 vivo开发者大会上,vivo不仅展示了在手机在AI时代作为个人通信连接设备的诸多可能性,还通过发布自研蓝河内核、拥有更智慧的系统架构的蓝河操作系统2等一系列科技成果,推动AI手机产业不同层级的“连接”,包括人与设备,与数字世界,与物理世界的连接,以及手机厂商与服务商的连接、手机厂商与产业上游制造商的连接。

这些“连接”看似微小、常规、无处不在。

但正是这些“连接”的一次次强化,真切而有力地推动着AI手机时代到来。

0 阅读:0