开启游戏新纪元?Roblox官宣仅用文本提示即可生成3D环境的AI工具

mgclouds蘑菇晕 2024-09-11 14:27:19

近日,据《麻省理工学院技术评论》(MIT Tech Review)报道,在线视频游戏平台公司Roblox宣布计划推出一款开源生成式AI工具,让创作者只需使用文本提示即可制作整个3D场景及对象。

据了解,该功能仍在开发中,通过它可以简化在线平台上创建游戏世界的过程,从而为那些没有广泛3D设计技能的人带来游戏创作的更多可能性。Roblox在一份声明中表示“我们看到了一个强大的未来,Roblox体验将具有广泛的生成式 AI 功能,以支持与游戏玩法集成的实时创作”;“我们将以资源高效的方式提供这些功能,以便平台上的每个人都可以使用它们”。Roblox尚未宣布新AI工具的具体发布日期,但分享了该工具的演示视频,当用户输入“创建赛道”,然后“让风景成为沙漠”,AI模型会在适当的环境中创建相应的模型。

展示Roblox生成式AI模型运行中的视频截图/Youtube官网截图据报道,该AI工具模型还将允许用户进行修改,例如更改一天中的时间或更换整个景观。Roblox表示,多模态AI模型最终将接受视频和3D提示,而不仅仅是文本。3D中的Next-token预测

Roblox的3D基础模型方法涉及自定义的下一个token预测模型与支持ChatGPT的大型语言模型(llm)类似。标记(token)是llm用来处理信息的文本数据片段。Roblox的系统通过将每个块视为数字单元来“标记”3D块,这允许AI模型预测序列中最有可能的下一个结构化3D元素。通过这种技术可以构建整个物体或风景。Roblox人工智能和增长工程副总裁阿努帕姆·辛格(Anupam Singh)向《麻省理工科技评论》透露了开发该技术的挑战。“很难找到高质量的3D信息”辛格表示,“即使你得到了你能想到的所有数据集,但要预测下一个立方体,它需要有三个维度,X、Y和z”。辛格表示,缺乏3D训练数据可能会在结果中产生奇怪的情况,即物体出现在不寻常的地方,例如“赛道中间长出一棵树”或“狗有超过4条腿”。为了解决这个问题,Roblox将使用第二个AI模型,该模型已经在更丰富的2D AI数据上进行了训练,这些数据来自开源和许可数据集,以检查第一个模型的工作。即,如果图像产生了不合乎常规之处,如“有一只长着12只手臂的猫在驾驶赛车”,那么3D AI会一次又一次地生成一个新的块,直到2D AI“确认”为止。

ROBLOX示范图/《麻省理工学院技术评论》官网3D环境生成器是Roblox更广泛的 AI模型集成战略的一部分。据报道,该公司在其平台上使用了大约250个AI模型,其中包括一个实时监控语音聊天以强制执行内容审核的AI模型,屏蔽不良语言,以及可能禁止重复违规。值得一提的是,Roblox计划开源其3D基础模型,允许开发人员甚至竞争对手使用和修改它。但这不仅仅是回报,开源是双向的。选择开源还可以让公司利用其他AI开发人员的知识,前提是他们能为项目做出贡献并逐渐地对其进行改进。文本生成3D模型的AI工具的市场前景及驱动因素

根据文本提示生成3D模型的能力代表了人工智能和计算机图形学领域的发展,是近年来最令人兴奋的科技发展之一。根据调研机构Wiseguyreport今年7月发布的报告,到 2023年,从文本生成3D AI模型的市场规模估计为15.1亿美元(约合人民币107.5亿元),预计将从 2024年的 21亿美元()增长到 2032 年的 300亿美元(约合人民币149.5亿元)。在预测期间(2024-2032年),该市场的复合年增长率预计将在 39.39%左右。

文本生成3D模型的AI工具的市场前景/Wiseguyreport报告截图由文本生成3D模型的AI工具的驱动因素主要有以下3个方面:1.对3D内容创作的需求不断增长包括娱乐、游戏和制造在内的各个行业对 3D 内容的需求不断增长,是全球 Ai 文本到 3D 生成器市场行业的主要驱动力。随着 3D 技术采用率的持续增长,企业正在寻求高效且具有成本效益的方法来创建高质量的 3D 模型。AI 驱动的文本到 3D生成器通过自动化将文本描述转换为逼真的 3D 模型的过程来提供解决方案,从而更快、更高效地创建内容。2.人工智能和机器学习的进步人工智能 (AI)和机器学习 (ML) 技术的快速发展极大地促进了全球 AI 文本到 3D 生成器市场行业的增长。AI 算法的使用使文本到 3D 生成器能够理解复杂的文本描述并生成准确表示预期对象的 3D 模型。此外,ML 算法的集成使这些生成器能够不断学习和提高其性能,从而产生更准确和详细的 3D 模型。3. 在电子商务和在线市场中越来越多地采用电子商务和在线市场的日益普及产生了对高质量产品可视化的强烈需求。在电子商务平台中运营的企业正在利用文本到 3D 生成器来创建其产品的逼真 3D 模型从而提高客户参与度和对产品的理解。通过提供交互式 3D 视图,这些模型允许客户从不同角度检查产品、放大细节并旋转它们,最终改善整体购物体验。市场受到对更经济、更高效的3D内容创建解决方案不断增长的需求的推动。AI驱动的工具简化了费力且技能密集型的传统3D建模流程,为更广泛的受众开放了 3D 设计。此外,增强现实(AR)和 VR等沉浸式技术的兴起推动了对动态和快速生成的3D内容的需求。

0 阅读:0