关于即将到来的AI手机时代,我们应该期待什么?

鲁大师 2024-03-14 18:09:38

无可阻挡的AI大潮,正在以不可估量的速度席卷各行各业,手机行业面对这个全新的“蓝海”更是一呼百应,拾起全部资源,奋力推开进入AI新世界的大门。

不仅是华米OV荣这些主流大厂,甚至像魅族这种仍在恢复精气神的品牌,也为了AI做出大胆的决定。放眼海外,在大家看来有些懒惰的三星,也于S24系列的发布会上,公布了Galaxy AI的部署格局。

由此可见,智能手机AI时代的全面到来是大势所趋,那么我们消费者在面对这样堪称“划时代”的市场大跨越时,应该如何去梳理自身的需求,面对即将到来的AI手机时代,我们应该期待什么?

01五花八门的大模型,各自不同的发力点

首先我们应该明确,AI功能的实现,都离不开大模型的训练,可以说,大模型的数据类型以及数据量,决定了被训练AI的特长以及最终成果的精细程度。那么也就是说,各家手机品牌如果选择进驻AI,那么首先就是要拥有自己的大模型。

鲁sir上面提到的这些主流品牌目前都已经部署了自己的AI大模型,例如vivo的蓝心大模型、小米的MiLM大模型、华为的盘古大模型、OPPO的安第斯大模型、三星的高斯大模型以及魅族的Flyme AI/Aicy AI大模型。

而这些五花八门的大模型,目前实际落地终端的场景也不尽相同。

就比如OPPO的安第斯大模型(AndesGPT),它是OPPO自主训练的大语言模型,其庞大的参数规模使得该模型具有更强的理解和生成能力,能够更好地满足用户在不同场景下的智能交互需求。此外,AndesGPT还具备高度的灵活性,可以根据不同的应用场景进行参数调整,以实现最佳的性能表现。,

它在最新的OPPO Find X7系列旗舰上大放异彩,最令人印象深刻的就是AIGC消除功能。与传统的涂抹式消除不同,OPPO Find X7系列上的AIGC消除功能,是利用安第斯大模型+AI算法实现对照片多余杂物的消除且填补,填补的内容完全依靠手机AI判断后所实现。

相比以往简单的涂抹+同色修补,不会有那种画面涂抹带来的割裂感,和实景相比几乎看不出差别,可以说,这是手机摄影在后期处理方面革命性的功能。

同样将AI的先行着陆点选在影像上的还有小米。随着年度影像旗舰小米14 Ultra的发布,小米影像大脑 3.0(Xiaomi AISP)也终于和我们见面。

Xiaomi AISP基于Diffusion 模型(图像处理领域的基础 AI 大模型)开发,为了让基于AI大模型实现的手机影像系统更符合小米的“光学味”,在结合小米14 Ultra 的实际用户使用场景,小米选择有层次性地去释放大模型的能力,并且针对效果、算力、生成三个方面有了独家的见解和想法创新。

在实际的使用过程中,Xiaomi AISP所包含的融合光学大模型、影调大模型、色彩大模型及人像大模型,都经过了小型化、异构并行等加速处理,以符合手机端侧、拍照功能客观需求特点。

例如当小米14 Ultra进行30倍以上变焦的时候,就会获得UltraZoom beta AI算法的增强支持,利用超大参数量的新一代网络架构,对精心清洗的大量(超过200w)超高清数据进行学习,使得模型具备了对细节恢复任务的充分理解及知识迁移,实现对远摄场景自适应超清优化效果。

而像vivo的蓝心大模型、三星的Gauss大模型以及华为的盘古大模型就是相对综合的、触达面更广的应用大模型。

vivo的蓝心大模型是将通用大模型和自研操作系统高度融合在一起的产物,历时六年,覆盖了十亿、百亿、千亿三个参数量级。在这其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,在手机上进行推理的速度可达64字/秒,具备本地化的文本总结、摘要等能力。70 亿模型是面向手机打造的端云两用模型,具有优秀的语言理解、文本创作能力。

同时,上述两个量级的模型支持高通和联发科(MTK)最新的旗舰平台,也就是骁龙 8Gen3 和天玑 9300,的端侧化部署,在保证数据安全的同时,在token输出速度、响应时间、内存占用等方面也非常优秀。

除了面向端侧的模型,vivo在更大体量的模型上也做到了较好的效果。蓝心大模型70B是面向云端服务的主力模型,用于角色扮演、知识问答等任务,另外,vivo未来还将提供 1300亿、1750亿参数大模型将在更为复杂的场景,如逻辑推理、任务编排中为用户带来更专业的体验。

值得一提的是,蓝心大模型所包含的矩阵中,同时包含了开源模型和商业模型。基于开源的大模型和 API 工具,vivo 推出了蓝心大模型开发套件 Bluekit,中小开发者可以直接调用大模型的端侧推理能力,真正实现了大模型的开箱即用。

目前,蓝心大模型在 vivo 的生态中已经有了两种应用,首先是类似于 ChatGPT 应用的自然语言对话 APP「蓝心千询」,还有融合在 OriginOS 4 系统里的首款全局智能助理蓝心小 V,这些都在鲁sir此前的,这篇文章里深度体验过。感兴趣的朋友可以看看。

三星的Gauss大模型则由三个部分组成,分别是Samsung Gauss Language、Samsung Gauss Code和Samsung Gauss Image。这三大模块各具特色,分别针对文本生成、代码生成和图片生成等不同的应用场景。通过这三个模块的有机组合,Gauss能够实现多种复杂任务,满足用户多样化的需求。

Samsung Gauss Language模块的主要功能是文本生成。它基于深度学习技术,能够理解和模拟人类语言,从而自动生成高质量的文本内容。无论是新闻报道、广告文案,还是科技论文、小说创作,只要用户提供基本的关键词或主题,Gauss就能迅速生成符合要求的文本内容。这一功能无疑将大大提高内容创作的效率和品质。

Samsung Gauss Code模块则专注于代码生成。对于许多程序员来说,编写代码是一项既重要又耗时的任务。Gauss Code模块通过学习大量的代码样本,能够自动生成符合语法规则和特定功能的代码片段。这将极大地减少程序员的工作量,提高编程效率。

最后,Samsung Gauss Image模块则负责图片生成。这个模块基于生成对抗网络(GAN)技术,能够根据用户提供的文字描述或风格要求,自动生成具有高分辨率和逼真度的图片。无论是风景画、肖像画,还是抽象艺术作品,Gauss Image都能轻松应对。这一功能无疑将为设计师和艺术家带来巨大的创作灵感和便利。

而在三星最新的Galaxy S24 Ultra上,Gauss大模型的落地分别体现在了通话翻译、同传翻译、笔记生成摘要、图片处理以及AI即圈即搜等功能中,其中,AI即圈即搜的国内供应商为百度的“文心一言”。

华为的盘古大模型则是一套更加庞大复杂的大模型体系,它是一款基于深度学习和自然语言处理技术的中文AI模型,其目标是实现超级智能,并为华为在云计算、物联网、5G等领域的发展提供支持。

盘古大模型使用了华为自主研发的MindSpore深度学习框架,并使用了大量的中文语料库进行训练。据官方介绍,该模型拥有超过1.7万亿个参数,是目前世界上最大的中文AI模型。

目前,包括Mate 60系列及其之后的旗舰机型,其内部的“小艺”助手均接入了盘古大模型,后续还将有更多搭载了HarmonyOS 4系统的终端设备将享受到盘古大模型的便利。

最后就是像魅族这样已经步入开发正轨但仍未商用的大模型。

在魅族21 Pro的发布会上,魅族官方表示,Flyme10.5系统将依托AI大模型将逐步上线多项AI趣味实用功能,例如 Aicy 语音化身随叫随到贴身助理,可以实现高效撰写文案、语音生成多种风格画作;图库在 AI 加持下支持自然语言搜图。

同时魅族21 Pro本身将对所有的大模型团队开源开放,想必这些措施,都将加速魅族在AI方面的研发速度,假以时日,一定会有相当亮眼的成果,值得期待。

02算力限制,短期内还是要实事求是

提到AI,尤其是正在改变我们生产方式的生成式AI,除了需求大模型的训练外,本地运算端的算力问题甚至要更加重要。

简单来说,你可以将算力理解为脑容量,算力越高也就类比脑容量越高,神经越多,处理AI运算的速度越快,能够承载的AI数据量、复杂程度也就越高。

那么面对在PC上都需要专门的算力显卡来维持计算的局面下,手机上小小的一枚芯片又能提供多少AI算力呢?

别紧张,没转折,手机依靠芯片能够提供的算力和真正的本地化AI计算时所需要的算力相比,简直就是小巫见大巫。

目前,手机终端上主流的AI芯片方案有诸如苹果的神经网络引擎、骁龙8 Gen3天玑9300内置的独立NPU以及谷歌的Pixel Visual Core等。这种AI芯片都可以在手机端执行一些简单的AI任务,如人脸解锁、智能拍照、语音助手等。

但是正如我前面所说,体积决定容量,容量决定数据量,手机AI芯片受制于体积及晶体管数量的关系,算力天生有限。手机AI芯片虽然比传统的CPU或GPU更适合处理AI任务,但它们的算力仍然远远低于云端的AI服务器。

就拿目前最强的手机AI芯片骁龙8 Gen3来说,它和7年前英伟达发布的Tesla V100相比,前者的AI算力大约为73TOPS(每秒处理73万亿次运算),而后者其AI算力高达810TOPS,是手机AI芯片的近10倍。

并且,手机AI芯片由于各自的架构和设计不同,导致它们的兼容性很差,很难实现跨平台的通用性。例如,高通的骁龙8 Gen3只能支持高通自己的AI框架HiAI,而不能支持谷歌的TensorFlow Lite或Facebook的PyTorch Mobile等其他流行的AI框架。这就限制了手机AI芯片的应用范围和开发者的选择,也增加了开发和维护的成本和难度。

同时功耗问题也让手机的AI芯片算力陷入囫囵。

所以说,想让手机实现PC上那种完全本地化的关键词生成视频、图片、自然语言理解这些,显然是不现实的。

但是,为什么现在已经有厂商的系统,能够实现那些“理论上”不可能在手机本地端实现的AI功能呢?答案也很简单,因为这些功能实际上都是跑在云端,由厂商的云端AI处理器远程处理,并非是通过手机的“本地侧载”,所以自然也就不会涉及芯片的算力!

就比如图片的AI消除功能,华为、小米和魅族等品牌的手机,在无需联网的情况下,也能进行AI消除,算法全流程都在手机端运行,可以保护隐私。相比之下,三星、OPPO和vivo等品牌则选择了云端处理。

这也是为什么现在大部分手机的AI功能不联网就没法使用,AI助手对话卡顿答非所问、每次相同的关键词生成的图片不同以及图片有逻辑问题等的原因,并不是因为你没有把自己的手机AI“训练好”,而是它真正的大脑压根就不在手机上,知识储备都是各家的云AI处理器决定的。

现阶段手机的AI芯片,基本都只是提供基础的安全以及辅助功能。

03那么面对即将到来的AI手机时代,我们应该期待什么?

最后我们就可以回到文章所要探讨的问题:那么面对即将到来的AI手机时代,我们消费者应该期待什么?

首先应该期待的肯定是手机对于AI的“本地化侧载”能力,这是关乎效率、安全以及真正意义上“AI个性化”的问题。

其次就是在现有的“云端”操作为主环境下,继续强化语音助手的连续对话处理能力、中文语境理解、语音模糊语义解析、深层检索及知识储备,以及AI扩图、绘图、处理图、AI应用(智能生成摘要、翻译)的可用化、能用化程度,将这些真正实用的功能打磨好,才能让公众和消费者意识到AI的便捷性,并接受AI,理解AI。

并且要进一步扩展AI在实际使用场景中的“预知性”,真正了解每一位消费者不同的使用习惯,并根据这些习惯,提前为使用者铺设好之后的操作,成为真正意义上的“助手”。

从现在大部分旗舰机还并没有在产品名中正式添加“AI手机”的词缀,以及在手机的线下体验中AI功能的宣传物料、展示依然不是重点核心的情况下,智能手机的“AI”化依然有相当长的路要走。

只是希望AI不要和曾经的压感屏幕、升降式摄像头、独立音频芯片那样,红极一时之后就被丢入历史的垃圾堆中,也希望厂商在今后的AI升级中,要以消费者的「痛点」为主,而非将其当成一个用极低宣传成本换来的“亮点”来对待,毕竟如果不能将“噱头”转换为站得住脚的“卖点”,那销量,会反馈给厂商最真实的残酷。

0 阅读:36
评论列表
  • 2024-03-15 17:01

    [点赞][点赞][点赞]