ChatGPT的高级语音模式或将很快具备视觉功能

OpenAI展示ChatGPT高级语音模式的实时视觉功能

2024年5月，OpenAI宣布了GPT-4，其中一项重要更新是为ChatGPT的高级语音模式引入了实时视觉功能。在演示中，新的高级语音模式能够轻松识别摄像头中的对象，如狗和球，并通过活动如接飞盘来关联这些对象。这一功能展示了AI在实时视频处理方面的强大能力，几乎像是与人类朋友进行视频通话。

Alpha版本用户反馈积极

一些用户在Alpha版本中体验了这一功能，并对其表现给予了高度评价。用户Manuel Sainsily在推特上分享了他的体验，称这一功能就像与一位非常有知识的朋友进行视频通话，能够实时回答问题并使用摄像头作为输入。这为用户提供了极大的便利，尤其是在处理日常事务时。

Beta版本即将推出

尽管OpenAI没有公布具体的发布时间表，但最新的ChatGPT v1.2024.317 beta版本中发现了与实时视觉功能相关的代码字符串。这些字符串表明，该功能可能被称为“实时摄像头”，并将在未来的beta版本中推出。代码中还包含了警告信息，提醒用户不要将此功能用于实时导航或可能影响健康和安全的决策。

未来展望

目前，OpenAI正在准备更广泛的beta测试，预计该功能将首先提供给ChatGPT Plus订阅用户和其他付费用户。我们已联系OpenAI以获取更多关于发布时间表的信息，一旦收到回复，我们将及时更新报道。

参考链接:

https://www.androidauthority.com/chatgpt-advanced-voice-mode-live-video-feature-beta-rollout-3500414

古典风资讯网

ChatGPT的高级语音模式或将很快具备视觉功能

龙剑秀南看科技