AI革命:从单张照片生成3D互动场景

AI头条2个月前发布 freeAI
0
AI革命:从单张照片生成3D互动场景

World Labs

由AI先驱李飞飞创立的初创公司World Labs,近日公布了其首个项目:一款能够从单一图像生成视频游戏风格的3D场景的AI系统。这款AI系统的独特之处在于,它生成的场景不仅具有互动性,而且可以进行修改。“我们的技术让你能够步入任何图像,并在3D中探索它,”World Labs在其博客文章中写道。“除了输入图像外,其余一切都是生成的。”

AI生成的场景可以通过键盘和鼠标在World Labs的网站上进行探索,看起来令人印象深刻,尽管有些卡通化。这些场景在浏览器中实时渲染,并具有可控的摄像机和可调的模拟景深(DoF)。DoF效果越强,背景物体看起来就越模糊。World Labs的系统属于新兴的AI类别,称为“world models”。这些模型能够模拟游戏和3D环境,但存在伪影和一致性问题。例如,初创公司Decart的Minecraft模拟世界模型Oasis,分辨率低且很快“忘记”关卡布局。相比之下,World Labs的方法确保一旦场景生成后保持不变,并且它们遵循基本的物理定律,意味着它们具有实体感和深度。

World Labs的系统还可以对场景应用互动效果和动画,比如改变物体的颜色和动态照明背景。“大多数生成性AI工具制作2D内容,如图像或视频,”World Labs写道。“在3D中生成则提高了控制和一致性。这将改变我们制作电影、游戏、模拟器以及其他数字表现我们物理世界的方式。”当然,还有改进的空间。World Labs的场景并非完全可探索——你的移动限制在一个小区域内。(尝试移动到外面,你就会碰到边界。)并且偶尔会有渲染错误——例如,物体以不自然的方式融合在一起。但World Labs表示,这只是一个“早期预览”。“我们正在努力提高我们生成的世界的大小和保真度,并尝试新的用户互动方式,”该公司在博客中写道。

World Labs,今年早些时候成立的公司,已从包括Andreessen Horowitz (a16z)、Ashton Kutcher、Intel Capital、AMD Ventures和Eric Schmidt在内的投资者那里筹集了2.3亿美元的风险资本。估值超过10亿美元的公司希望其首个产品能在2025年准备好。除了互动场景外,World Labs还计划构建可能对专业人士如艺术家、设计师、开发人员、电影制作人和工程师有用的工具。它针对的客户范围从视频游戏开发商到电影制片厂。“我们已经能够创建虚拟的互动世界,但这需要花费数亿美元和大量的开发时间,”World Labs联合创始人Justin Johnson在最近的a16z播客中说。“[world models]将让你不仅仅是得到一个图像或剪辑,而是一个完全模拟的、充满活力的、互动的3D世界。”

© 版权声明

相关文章

暂无评论

暂无评论...