行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

代号“精灵” 谷歌首次开放世界模型 AI加速进入“凭空造世”时代

来源:财联社 2026-01-31 07:56
点赞
收藏

《科创板日报》1月31日讯(编辑 宋子乔) 如果人工智能领域的进步可以看作一部交响乐,那么过去几年,乐章的主题无疑是“生成”——生成文字、图像、声音乃至视频。然而,在2026年初,一段崭新的旋律被奏响:它不仅生成,更能构建。

北京时间1月30日凌晨,谷歌DeepMind向外部开放了Project Genie,它被认为是目前最先进的世界模型之一,可以算是世界模型Genie3的实验性研究原型,也是这套世界模型第一次以可交互形态对公众开放

“Genie”这个单词源于阿拉伯语 jinni(精灵),后经法语变形成 génie后成为一个英语词汇,最常见的含义是指阿拉伯和伊斯兰神话传说中,一个能实现召唤者愿望的“精灵”或“神怪”。谷歌DeepMind将其世界模型项目命名为“Project Genie”(精灵计划),正是在阐释该神话的内涵:这个AI模型能将你用文字描述的任何场景(召唤者的愿望),瞬间生成一个可以进入并交互的虚拟世界。

当AI不仅能够描绘梦境,更能让人走进梦境并与之互动时,我们所讨论的“虚拟”与“现实”的边界,或许已到了需要被重新思考的时刻。

目前,该原型率先向年满18岁的美国Google AI Ultra(3个月125美元)订阅用户开放。

Project Genie有何不同?

Project Genie的底层是世界模型Genie 3。与OpenAI的Sora等内容生成大模型不同,它的功能不局限于多模态内容生成(比如AI视频生成工具可为用户创作一段影片,模型可依据、参考的一切数据来自人类储存好的文字库、图像库及视频库),而是可以生成一个完整的空间,实现“凭空造世”

只需用文字描述一个场景或上传一张图片,例如“一座被巧克力河环绕的棉花糖城堡”,一个实时的、可交互的3D虚拟世界便会在几秒钟内生成。

用户能够像玩电子游戏一样,指挥角色在其中自由行走、飞行或驾驶,探索这个想象出来的世界。

周围的环境则根据视角和行为动态、连续地生成。这并非依赖传统的游戏引擎解码固定数据,而是对潜在物理规律与空间逻辑的一次即时推演与具现,能在用户移动时,实时生成前方的路径和环境。

从技术本质上看,世界模型的核心是模拟环境的动态变化,预测环境的演化和行为对环境的影响。

谷歌DeepMind在诸如国际象棋、围棋等特定环境的AI智能体研发上已有深厚积累,但要实现通用人工智能(AGI),系统必须能够理解和应对现实世界近乎无限的复杂性与多样性。

Genie 3正是在这一方向上迈出的关键一步。它提供了一种前所未有的模拟能力,能够生成任何现实或虚构场景的交互式环境。这为机器人技术、动画制作乃至历史场景的虚拟探索等领域提供了强大的工具。

对于AI的发展而言,Project Genie的深意远不止于炫酷的体验。它最核心的价值,在于为AI智能体(及未来的机器人)提供了一个无限、安全且成本可控的“模拟训练场”、“试错沙盒”。智能体可以在Genie创造的海量、多样化的模拟环境中进行学习和训练,理解现实世界的物理规则和因果逻辑,这正是迈向通用人工智能不可或缺的基石。

从这个角度看,世界模型并非一个内容端的创作工具,而是一座连接当前AI与未来“具身智能”的桥梁,是让AI学会“常识”与“因果”的关键基础设施。

AI学术大佬、科技巨头争相布局

人工智能先驱们几乎一致认为,世界模型对打造下一代人工智能至关重要。许多人表示,该技术终将助力创造超越人类的AGI。

斯坦福大学教授、人工智能“教母”李飞飞创立了世界模型初创公司World Labs,据知情人士本月透露,“AI教母”李飞飞正与投资者展开新一轮洽谈,该公司最新估值有望达到约50亿美元;早些时候的消息显示,“AI教父”杨立昆的世界模型初创公司AMI Labs在一轮融资中吸引了包括Cathay Innovation在内的潜在支持者,该轮融资可能使这位前Meta首席人工智能科学家的公司估值达到35亿美元;英伟达CEO黄仁勋早早表态,世界模型能助力实现“物理人工智能”,自主操控机器人、自动驾驶汽车等设备;Meta的超级智能AI实验室与机器人团队合作,正是为了构建世界模型,通过模拟现实世界物理规律,为机器人提供空间感知和精细操作能力,弥补现有机器人的不足……

当然,作为初期成果,Project Genie为代表的世界模型仍非常不成熟。以Project Genie为例,该模型每次生成和探索的时间被严格限定在60秒以内,生成的世界在物理效果上可能不够逼真,有时无法精确遵循提示词或现实世界的物理定律,角色的操控也时常出现延迟或响应不精确的问题。此外,一些在早期演示中提及的高级功能,如通过即时指令改变世界事件,尚未在此版本中实现。

这些限制部分源于世界模型巨大的计算消耗,这也是当前AI模型技术面临的核心矛盾。DeepMind的研究人员坦言,用户每使用一次,背后都有一块专用的计算芯片为其服务。每一次看似轻松的“造世”,背后都依赖专用计算芯片的全功率运转。这决定了它在现阶段,更像一扇仅供窥探未来的窄窗,而非可以随意出入的大门。

游戏或成世界模型的首个试水行业

谷歌DeepMind、World Labs等领先的AI团队都认为,世界模型可能会首先重塑游戏、影视行业。

传统的3D资产创建与场景搭建是人力与时间密集型的核心环节。Project Genie展示的可能性是,将部分前期概念设计、场景原型构建乃至动态分镜预览的过程,压缩至几分钟甚至几秒钟。这并非要取代专业的创作引擎,而是可能重塑创作流程的起点,极大地释放创意验证的速度。

DeepMind世界模型项目Genie 3的联合负责人Shlomi Fruchter此前表示:“软件开发,尤其是游戏开发,正在发生巨大变化,我预计在未来几年,这种变化甚至可能是彻底性的。”

去年年底,World Labs正式推出了其首款商业产品、由生成式AI驱动的三维世界生成系统Marble。李飞飞表示,这项技术将影响Unity和Epic旗下Unreal等游戏引擎,“这一切都将被颠覆,模拟类游戏引擎确实到了该升级的时候了。”

除了游戏领域,xAI、英伟达等公司,也希望将世界模型嵌入机器人和自动驾驶汽车中。

(来源:
财联社)

免责声明:本页所载内容来旨在分享更多信息,不代表九方智投观点,不构成投资建议。据此操作风险自担。投资有风险、入市需谨慎。

举报

写评论

声明:用户发表的所有言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。《九方智投用户互动发言管理规定》

发布
0条评论

暂无评论

赶快抢个沙发吧

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈