据外媒最新消息,在苹果的年度WWDC之前,该公司内部正在测试各种新的与人工智能相关的功能,该公司的AI改进将着重于给最终用户带来更实际的功能。
在苹果的操作系统的预发布版本中,该公司一直在开发一种全新的通知摘要功能。这个功能与Siri相关联,这意味着用户将能够通过虚拟助手请求和接收他们最近通知的概述。
预计Siri将通过一种新的智能响应框架和苹果的设备上的LLM获得显著的响应生成能力更新。在生成回复和摘要时,Siri将能够考虑人物和公司、日历事件、位置、日期等实体信息。
这意味着Siri将能够在设备上回答查询、创建长文章的摘要,或在更新的Notes或Voice Memos应用中转录音频。所有这些都将通过使用Ajax LLM或云处理来完成更复杂的任务。
此外,据称苹果还一直在测试增强和“更自然”的语音,以及文本转语音的改进,这将最终带来显著更好的用户体验。
苹果还一直在研究Siri的跨设备媒体和电视控制功能。这个功能将允许用户例如使用他们的Apple Watch上的Siri来在另一个设备上播放音乐,尽管该功能预计要到2024年后期才能实现。
公司决定将人工智能嵌入到其核心系统应用程序中,以实现不同的用例和任务。其中一个值得注意的改进领域与照片编辑有关。
苹果开发了用于改进图像编辑的生成AI软件iOS 18和macOS 15预计将为Photos等应用程序带来支持人工智能的图像编辑选项。在内部,苹果已经开发了一种新的“移除”功能,允许用户通过使用生成AI软件从图像中移除物体。
在苹果的测试环境中,可以通过人工智能生成图像,然后通过iMessage发送出去。有迹象表明,公司计划将类似功能引入其操作系统的最终用户。
这一信息与另一份报告一致,该报告称用户将能够使用人工智能生成独特的表情符号,尽管还有其他关于图像生成功能的可能性。
据知情人士透露,在苹果的Notes应用程序的预发布版本中,还包含有关一个生成工具的引用,不过目前尚不清楚该工具是生成文本还是图像。
Notes将获得AI支持的转录和摘要功能,以及Math Notes苹果为其内置的Notes应用程序准备了重大改进,将首次亮相iOS 18和macOS 15。更新后的Notes将获得应用内音频录制、音频转录和LLM支持的摘要功能。
音频录制、转录和基于文本的摘要将全部在一个笔记中提供,以及用户选择添加的任何其他内容。这意味着一张单独的笔记可以包含一次整个讲座或会议的录音,完整的白板图片和文本。
这些功能将使Notes成为一个真正的强大工具,使其成为学生和商务专业人士的首选应用程序。添加音频转录和摘要功能还将使苹果的Notes应用程序能够更好地竞争微软的OneNote或Otter等竞争产品。
虽然应用级别的音频录制、基于AI的音频转录和摘要功能将极大改进Notes应用程序,但这些并不是苹果一直在努力改进的唯一方面。
Math Notes – 通过使用AI创建图表和解方程Notes应用将全新推出Math Notes,这将带来对正确数学符号的支持,并实现与苹果的新GreyParrot计算器应用的集成。
知情人士透露,Math Notes将允许该应用程序识别数学方程的文本并为其提供解决方案。目前还在开发支持绘制表达式的功能,这意味着我们可能会在Notes中看到类似于macOS上的Grapher应用程序的功能。
另外,在Notes中,用户将获得一个选项,以类似于苹果当前在iOS上提供的预测文本或行内完成的方式自动完成他们的数学方程——这也预计将在今年晚些时候传至visionOS。
Apple的visionOS还将与苹果的Transformer LM实现更好的集成,后者是一种提供用户输入时建议的预测文本模型。该操作系统还预计将获得重新设计的Voice Commands UI,这表明苹果非常重视与输入相关的改进。
该公司还试图通过使用所谓的“智能回复”来改善用户输入,这将在Messages、Mail和Siri中提供。这将允许用户使用苹果设备上的Ajax LLM即时生成基本的文本回复来回复消息或电子邮件。
苹果的AI与Google Gemini和其他第三方产品的竞争人工智能已经进入几乎每个应用程序和设备。开放AI的ChatGPT和Google的Gemini等以人工智能为重点的产品在总体上的受欢迎程度也大大增加。
在5月14日的年度Google I/O开发者大会上,谷歌展示了人工智能的一个有趣用例——用户可以以视频形式提出问题,并获得人工智能生成的回答或建议。
该公司还宣布了Google Veo——一种可以通过人工智能生成视频的软件,OpenAI也拥有自己的视频生成模型Sora。
苹果的Project Greymatter和Ajax LLM无法生成或处理视频,这意味着该公司的软件无法回答关于消费类产品的复杂视频问题。这很可能是苹果寻求与谷歌和OpenAI等公司合作达成许可协议并为其用户群体提供更多功能的原因所在。
相对于Humane AI Pin或Rabbit R1等实体AI产品,苹果的AI项目具有重要优势,因为它们在用户已经拥有的设备上运行。这意味着用户不需要购买特殊的AI设备即可享受人工智能的好处。
Humane的AI Pin和Rabbit R1也被普遍认为是未完成或部分功能的产品,后者甚至被证实不过是一个定制的Android应用程序。
苹果的AIGC相关重点更新将于北京时间6月11日凌晨一点的WWDC 2024上宣布,让我们拭目以待。