分享好友 资讯首页 频道列表

谷歌Genie 3震撼发布:实时交互3D世界模型开启AI新纪元

2025-08-06 16:17130

2025年8月6日凌晨,谷歌DeepMind推出全球首款支持实时交互的通用世界模型Genie 3,以“一句话生成可操控3D场景”的突破性能力,重新定义AI在物理模拟、智能体训练及内容创作领域的应用边界。该模型仅需文本提示,即可生成长达数分钟、分辨率达720p的动态3D环境,并允许用户或AI智能体实时修改场景细节,被业界誉为“游戏引擎2.0”的雏形。

技术跃迁:从秒级到分钟级的连贯交互
相较于前代Genie 2仅能生成短暂片段的局限,Genie 3通过自回归架构与长期记忆机制,实现了数分钟级的连续环境模拟。其核心突破在于精准还原物理规律——例如演示中“摩托艇撞灯笼”的场景,水面反光、碎片飞溅与物体碰撞效果均接近真实;同时支持生态系统的动态演变,如森林从萌芽到繁茂、海底生物的群聚行为。更引人注目的是其“时空穿越”能力:用户可自由探索古代战场或未来都市,并通过文本指令实时调整天气、引入新角色(如棕熊、拖拉机),甚至改变场景的物理属性(如重力、摩擦力)。
谷歌强调,Genie 3的视觉记忆可追溯至一分钟前的细节,确保用户移开视线后返回时,黑板字迹、树木位置等环境特征保持不变,解决了自回归模型长期存在的“记忆断裂”问题。

应用场景:从机器人训练到沉浸式娱乐
Genie 3被定位为通往通用人工智能(AGI)的“训练场”。其潜力覆盖三大领域:

挑战与未来:迈向更真实的虚拟宇宙
尽管Genie 3在一致性与交互时长上取得突破,但仍存在局限:AI智能体的动作空间受限,多智能体交互的复杂性尚未完全解决,地理细节的还原精度不足,文本渲染需依赖明确提示,且暂不支持数小时级持续互动。目前,模型以有限研究预览版形式向学者和创作者开放,谷歌正通过反馈优化风险控制机制。
此次发布恰逢OpenAI开源推理模型、Anthropic升级智能体代理能力,三大巨头的竞争凸显AI从“生成内容”向“模拟世界”的范式转移。分析人士指出,Genie 3的实时交互能力或将颠覆游戏开发、机器人训练及元宇宙构建,甚至催生“世界模型即服务”(World Model as a Service)的新商业模式。

行业反响:AI模拟器的终极竞赛打响
OpenAI Sora联合负责人蒂姆·布鲁克斯的加入,以及英伟达Jim Fan“游戏引擎2.0”的高度评价,预示着世界模型领域将进入白热化阶段。谷歌DeepMind研究员Ali Eslami感慨:“这是自ChatGPT以来最令人印象深刻的演示。”随着Genie 3逐步开放测试,一个由AI动态生成的虚拟宇宙,正从想象加速走向现实。

免责声明:

本网转载并注明自其它来源(非智能装备网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。如涉及作品内容、版权等问题,请在发布之日起十五天内与本网联系,否则视为放弃相关权利。

反对 0
举报 0
收藏 0
打赏 0
评论 0

相关资讯