谷歌Genie世界模型升级:用街景模拟真实街道,开启AI新纪元!

【编者按】你有没有在Google地图上拉出街景,给朋友看你小时候住的房子?或者把那个小人图标扔到巴黎街头,确认自己订的酒店是不是在潮人区?这种场景我们都经历过。但想象一下,如果街景不仅能看,还能“玩”呢?你可以模拟整条街道的环境,甚至调整天气,体验“后天”那样的末日场景。现在,这个想法成真了!Google DeepMind把街景和通用世界模型Genie连在了一起,让静态的图像活了起来。这不仅对机器人训练和游戏开发意义重大,对我们普通人来说,也是一种全新的“云旅游”方式。下面,就来看看这个突破是怎么实现的。
我们都在Google地图上拉出过街景,给朋友看童年时的家,或者把那个小人图标拖到巴黎街头,确认自己订的酒店是不是在时尚街区。想象一下,如果能做到这些,但方式更沉浸、更互动,能真正模拟街道及其周边环境,甚至还能调节天气,或者看看它在“后天”场景下会是什么样——那该多好?
这正是Google最新整合的目标之一。从今天开始,Google DeepMind将街景连接到Project Genie——该公司的一个通用世界模型,它能生成多样化的交互式环境。这项新功能是在Google I/O 2026开发者大会上推出的。
DeepMind开放性问题团队的研究科学家Jack Parker-Holder告诉TechCrunch:“这对代理(和机器人)用例以及人类来说都太强了,这也是Genie一直以来的核心理念。”
他以在伦敦部署的一个新机器人为例。伦敦很少见到阳光。Parker-Holder说,Genie可以模拟那些罕见的时刻,比如阳光照射在维多利亚式房屋上的场景,这样当阳光真的出现时,就不会让机器人感到“震惊”。
加载播放器…
“同时,你可能会说,‘我要去纽约,但不是这个季节,’”他继续说道,“‘那里会下雪。我想看看那个街区在雪中是什么样子。’”
20年来,Google一直通过装有摄像头的汽车和背着“追踪背包”的个人来收集街景数据。这家科技巨头已在110个国家和七大洲收集了超过2800亿张图像。
Jack说:“通过街景,我们拥有世界上大量地区的图像。你可以想象,将这丰富的真实世界信息和数据与模拟世界的能力结合起来,会有多么强大。”
Google于去年8月发布了其最新的世界模型Genie 3用于研究预览,并于今年1月向美国地区的Google AI Ultra订阅用户开放了该工具的使用权限,允许客户通过文本提示或图像创建交互式游戏世界。目标是将Genie用于教育体验、游戏和机器人训练。
Genie 3已经在为Waymo的一个模拟器提供动力,用于训练其自动驾驶汽车应对“极其罕见的事件”,比如龙卷风或偶遇大象。将街景数据添加到其中,可以帮助Waymo准备在全球更多城市推出服务。
Waymo有自己的模拟器,它依靠该模拟器扩展到11个美国城市,并在更多城市测试其AI驾驶系统。Parker-Holder说,与Genie的区别在于,这些模拟器都来自汽车视角。而街景不仅可以模拟一个基于真实地点的世界,还可以将视角转移到其他类型的代理,比如人类或机器人。
从今天开始,Google将向部分美国Ultra用户推出街景版Genie,并逐步扩大访问范围。据该公司称,全球Ultra用户将在未来几周内获得访问权限。
DeepMind产品经理Diego Rivas表示,研究人员的目标是让尽可能多的人掌握这项新能力。但他也提醒说,尤其是街景版和整个Genie仍然是一个实验性项目,因此在准确性方面还有很大的改进空间。
在Google团队向我展示的示例中——其中包括我过去住过的一个街区的水下模拟——结果令人印象深刻且易于识别,但仍然只是电子游戏般的画质,而非照片般逼真。这些模型目前还没有物理感知能力,这意味着它们还不能理解因果关系。例如,在一个模拟中,一位女士在积雪的约书亚树公园里奔跑,她直接穿过了仙人掌和灌木丛。
相比之下,Google的图像生成器Nano Banana现在可以生成信息图中的完美文字,而其视频生成器Veo则了解纸船会随水流漂动、烟雾会散入空气中、布料会垂落覆盖形状。
物理规则并没有被硬编码到这些模型中;它们会像生物一样,通过被动观察直觉地学习这些规则。
Parker-Holder说:“我认为对于这类模型来说,在准确性和质量上,它可能比视频落后6到12个月,所以我认为这是一个我们将会解决的问题。”
12年前以实习生的身份加入街景团队、现任Google Maps总监的Jonathan Herbert表示,Genie目前还无法创建一条街道的精确重建。他认为,真正的突破在于AI的空间连续性。当你旋转360度时,AI能正确记住并模拟你身后的环境。从那时起,模型就可以在此基础上构建新的环境。
Herbert说:“我们一直在思考,如何利用街景数据构建出最好、最丰富的世界模型。长期以来,以全新的方式使用地图数据进行新类型的AI研究,一直是我们的一个想法。”
回顾Google IO 2026的其他重大新闻
你熟知的Google搜索已经成为过去式
Google更新Gemini应用,与ChatGPT和Claude竞争
Google推出Gemini Spark,一个整合Gmail的全天候代理助手
如何使用Google的新信息代理
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/49996.html