苹果发布ReALM人工智能模型,屏幕理解力超越GPT-4

未来新讯息 2024-08-08 04:22:06

苹果公司的研究团队最近又实现了人工智能领域的一个重要里程碑,他们公布了一种全新的人工智能模型——ReALM

ReALM 是专门设计用来实时理解用户在其设备屏幕上的各种交互行为,包括任务执行流程、对话情境以及后台正在进行的操作。这一突破性的技术使AI能够更深入地参与到用户的数字体验中,不仅不限于文本输入输出,而是能够切实感知和解析视觉界面中的复杂信息。

据研究人员透露,ReALM 在理解和响应屏幕内容的能力上表现卓越,甚至已证实其性能远超目前业界领先的GPT-4模型,在特定应用场景下提供了更为精准和全面的上下文感知服务。这意味着无论是在办公场景下处理多任务流程、参与社交应用中的对话交流,还是在游戏中根据实时画面提供辅助决策,ReALM都能够提供更为智能且无缝的用户体验。

苹果还进一步拓展了其在增强现实和虚拟共享空间方面的应用,Vision Pro用户现在可以享受到一项新的功能升级。借助最新的VisionOS 1.1操作系统版本,用户能够在支持SharePlay的应用程序中启用空间角色功能。

这一功能允许最多五名参与者在同一虚拟环境中共同观看电影、电视剧集,参与游戏互动,开展协作项目,甚至是闲暇时的虚拟社交活动。该功能深度集成到FaceTime应用程序中,为用户带来前所未有的沉浸式共享娱乐和协作体验。

0 阅读:0