字节的第一款AI硬件,只是一次悄悄试水?

极客公园 2024-10-12 23:20:24

头图来源:Ola Friend

几个月前刚收购开放式耳机品牌Oladance的字节跳动,这就发布了首款生成式 AI 硬件设备。

10日上午,字节跳动豆包发布了一款硬件产品—— AI 智能体耳机 Ola Friend。该产品是一款开放式耳机,单耳6.6克同类最轻;可接入豆包大模型,并与豆包 APP 深度结合;已在各大电商平台开启预售,将于10月17日正式发货,售价1199元,一个价格对比是,苹果最新款AirPods 4主动降噪款售价1399元。

用户戴上耳机后,无需打开手机,只需喊出关键词「豆包豆包」,便能唤起豆包进行对话,后者能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。

今年以来,随着大模型应用落地的加速,AI硬件也如雨后春笋般蓬勃发展,AI 手机、AI 耳机、AI 眼镜等新品纷纷涌现,就连苹果也忍不住下场,不仅在新iPhone和新版本iOS中加入AI功能,还传出要做AI眼镜。

谁能成为AI时代,用户与人工智能交互的第一个入口?今天看来智能眼镜和智能耳机,是最有可能的热门候选。很显然,收购了 Oladance 和 Pico 的字节两者都不会错过,而 Ola Friend 就是字节打出的第一张牌。

Ola Friend:字节版「Her」?

从发布页面信息来看, Ola Friend主打陪伴,「TA是一个随时陪伴在耳边的AI朋友,在你需要的时候,TA都在你耳边。」

图片来源:Ola Friend

Ola Friend是一款开放式耳机,单耳6.6克同类最轻,据称实现了几乎无感的佩戴感受。该款耳机接入豆包大模型,并与豆包 APP 深度结合。

用户戴上耳机后,无需打开手机,只需喊出关键词「豆包豆包」,便能唤起豆包进行对话,后者能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。

目前,Ola Friend已经在各大电商平台开启预售,将于10月17日正式发货,售价1199元。

作为首款基于豆包大模型的 AI 硬件产品,Ola Friend的推出意味着字节跳动从硬件到内容的AI生态系统进一步完善。

Ola Friend耳机的硬件部分由字节跳动不久前收购的原Oladance团队完成。该团队以其创新的OWS专利技术闻名。尽管该并购案完成时并未掀起特别大的波澜,但业界人士都在讨论字节跳动的意图非常明确——要将 AI 跟耳机产品深度结合。

所谓OWS,即Open Wearable Stereo,开放式可穿戴立体声系统,是Oladance全球性提出的一种全新的全开放不入耳的声音解决方案。

相比传统的骨传导耳机要通过骨骼将振动传递到内耳,绕过耳膜,OWS耳机则采用气导技术,通过空气将声音传递到耳朵,更自然 ;同时,骨传导耳机需要紧密贴合头部,可能不适合长时间佩戴,OWS耳机不入耳、无需紧贴,更舒适,更适合长时间佩戴 。

Oladance此前被字节跳动收购,后者对该品牌100%控股。Oladance成立于2019年,由前BOSE高管李浩乾与多名BOSE工程师共同创立,核心产品线包括OWS全开放真无线蓝牙耳机系列,主打佩戴轻盈舒适、续航超长以及独特的开放不入耳设计。

通过这次收购,字节跳动不仅获得了 Oladance 的核心技术,还吸纳了一支由前 Bose 工程师组成的经验丰富的团队,打好了其在音频技术领域的「基本功」。

Oladance 的技术应该能够帮字节跳动提升其 VR/AR 设备的音频表现,开放式耳机的设计不仅为更大容量的电池提供了空间,还为集成多种传感器创造了可能性。结合字节跳动此前收购的头显厂商 Pico,这些技术的融合为其在视听体验和可穿戴设备领域的扩展带来了更多潜力。

过去一年里有不少AI耳机产品已经陆续发布。目前看起来Ola Friend并没有特别的形态创新,跟Oladance之前的耳机大差不差,就是一款「耳机」,也没有想象中的摄像头,只是接入了大模型,唤起调用模型不用打开手机——这样的「AI耳机」,似乎没有想象中有那么多黑科技。

不过,在前两天极客公园的「今夜科技谈」中,灵宇宙创始人顾嘉唯谈到,字节此次推出Ola Friend,意在探求类似「Her」的personal AI 场景,尽管它在外观设计上跟传统的OWS 耳机没有明显区别,也没有把个性化的很多能力和边界无限的提高预期,但这正是拿捏用户预期的一种管理方式,「本质上,他们是让你知道这首先是一个普通的耳机,然后当它的软件端的能力和体现出来的时候,就会有一些超预期的可能性」。

在他看来,字节推出这款耳机,很重要的目的之一,其实是为了让豆包有更多的更快能触达的便捷方式,降低访问豆包的门槛。

豆包已经是国内用户最多的原生 AI 应用。同时,在AI大模型与应用方面,字节已经全面布局,开发了多个文本和多模态大模型,包括豆包大模型家族,涵盖通用模型、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图模型、Function Call模型和向量化模型。此外,字节也开发有多个基于豆包大模型的AI原生应用,除了豆包,还有AI应用开发平台“扣子”、互动娱乐应用“猫箱”等超10款 AI 产品。

而端到端的AI硬件,可能是字节补齐AI布局的最后一块拼图。

眼镜or耳机,大模型落地现实的第一个入口?

下半年以来,大模型软件的商业化似乎不及预期,大模型+硬件似乎成了新的出路,尤其是在Meta Ray-Ban智能眼镜大热之后。

早前国金证券发布研报称,估算Meta Ray-Ban在2024年Q2季度出货量或达50万台,年销量达200万台。

图片来源:雷朋官网

国外巨头里,苹果似乎同样有意加入战场。据彭博社报道,苹果旗下的Vision Products Group事业群正在研发的设备包括平价版Apple Vision、第二代Apple Vision Pro、以及一款类似于Ray Ban Meta的AI智能眼镜。

国内各家公司也纷纷推出产品。4月,小米米家智能音频眼镜悦享版正式发售;5月,华为推出了搭载盘古大模型的智能眼镜;8月,蜂巢科技推出了界环AI音频眼镜。

那为什么字节先推出的是耳机,而不是眼镜?

「字节肯定是有在做眼镜的」,在顾看嘉唯来,无论是头盔式 VR,还是其他轻量型设备,或者透过光机画幅技术实现透视效果的设备,字节都有在积极探索和做迭代。

对于像字节这样的互联网大厂来说,选择做硬件不仅是基于情怀,更是对构建入口的持续追求,探索和试错都是必经之路。

尽管目前还没看到字节发布类似 Ray-Ban Meta 这样的硬件产品,但可以预见,他们必然会沿着这条路径寻找机会并逐步推出相关设备。不要低估字节在布局硬件上的资金、动力以及决心。

当然AI耳机也不止字节在做,之前在7月,小米发布了新款耳机 Buds 5,虽然没有明确定位为 AI 硬件,但该产品支持语音快速转文字,并能一键生成会议摘要,展示了其越来越智能化的特性;5月,未来智能和科大讯飞就推出了讯飞 AI 会议耳机 Pro 2,具备录音速记、语音识别、同声传译等功能,还集成了 viaim AI 会议助理,能够智能分析会议内容,自动生成摘要和待办事项,并支持智能问答功能;3月,前魅族副总裁李楠创立的怒喵科技宣布正在与魅族合作研发一款AI耳机。

不过,如果从更长的时间周期来看,不论是AI+眼镜还是耳机,大模型要落地现实搭载硬件成为用户的个人助理,还有距离。这不仅涉及技术本身,还包括商业生态的打通。在新兴的技术入口之争中,首先入局的往往是手机厂商,紧随其后的是像微信这样的超级应用。也就是说,一旦AI助理技术发展到一个高度成熟的PMF阶段,手机厂商和这些超级应用巨头都会迅速涌入。

字节这时推出Ola Friend,只是率先行动,谋求占得先机。

0 阅读:10