OpenAI展示ChatGPT高级语音模式的实时视觉功能
2024年5月,OpenAI宣布了GPT-4,其中一项重要更新是为ChatGPT的高级语音模式引入了实时视觉功能。在演示中,新的高级语音模式能够轻松识别摄像头中的对象,如狗和球,并通过活动如接飞盘来关联这些对象。这一功能展示了AI在实时视频处理方面的强大能力,几乎像是与人类朋友进行视频通话。
Alpha版本用户反馈积极
一些用户在Alpha版本中体验了这一功能,并对其表现给予了高度评价。用户Manuel Sainsily在推特上分享了他的体验,称这一功能就像与一位非常有知识的朋友进行视频通话,能够实时回答问题并使用摄像头作为输入。这为用户提供了极大的便利,尤其是在处理日常事务时。
Beta版本即将推出
尽管OpenAI没有公布具体的发布时间表,但最新的ChatGPT v1.2024.317 beta版本中发现了与实时视觉功能相关的代码字符串。这些字符串表明,该功能可能被称为“实时摄像头”,并将在未来的beta版本中推出。代码中还包含了警告信息,提醒用户不要将此功能用于实时导航或可能影响健康和安全的决策。
未来展望
目前,OpenAI正在准备更广泛的beta测试,预计该功能将首先提供给ChatGPT Plus订阅用户和其他付费用户。我们已联系OpenAI以获取更多关于发布时间表的信息,一旦收到回复,我们将及时更新报道。
参考链接:
https://www.androidauthority.com/chatgpt-advanced-voice-mode-live-video-feature-beta-rollout-3500414