作者jerrychuang ()
看板Stock
标题[新闻] 李飞飞World Labs首款产品Marble登场!
时间Thu Nov 13 22:06:05 2025
原文标题:
※请勿删减原文标题
李飞飞World Labs首款产品Marble登场!给一句提示就可生成3D世界,空间运算有何商业
潜力?
原文连结:
※网址超过一行过长请用缩网址工具
https://www.bnext.com.tw/article/85088/marble-world-model
发布时间:
※请以原文网页/报纸之发布时间为准
2025.11.13
记者署名:
※原文无记载者得留空
陈建钧
原文内容:
由AI教母李飞飞共同创办、着眼空间运算的新创World Labs,如今推出了首款商业化产品
Marble,用户可输入文字、图片或影片,即可生成一个完整的立体空间。
根据《TechCrunch》报导,距离World Labs宣布完成2.3亿美元募资大约一年时间,这间
新创公司便发布了这款生成式世界模型产品。两个月前,该模型以Beta预览版的形式推出
,现在也正式推出服务。
一句话、一张图生成小小世界,世界模型「Marble」正式上线
Marble的核心能力是让使用者透过多模态输入,将文字提示、照片、影片、3D布局或全景
图,转换为可编辑和下载的3D环境。李飞飞向媒体表示,世界模型是生成式AI时代的重大
发展,「大型世界模型是释放AI潜能的重要一步。」
与其他生成式模型最大的差异在於,Marble是直接建立一个完整的3D环境,并且可供下载
,而不是在用户探索过程中即时生成的世界。World Labs 表示,这能减少画面变形或不
一致的问题,并让用户後续加工利用。
Marble的共同创办人贾斯汀.强森(Justin Johnson)表示,这是一个「生成 3D 世界的
一个全新类别的模型」。强森指出,Marble未来的一个方向是创意应用,声称该服务具备
完善的编辑工具让用户反覆调整场景,其成果预计可以运用在游戏、视觉特效和VR产品之
中。
不过,目前游戏产业对AI的看法仍然好坏参半,近期一次游戏开发者大会上的调查显示,
约有3分之1受访者对AI如何影响游戏产业抱持负面看法,较去年的调查高出12个百分点,
AI生成内容的低劣品质、侵权等问题是许多从业人员不满的原因。
目前在Marble网站上,用户可以浏览不同作者生成的大量3D世界,又或者透过输入提示词
、上传图像影片自行创造心目中的虚拟世界。
Marble现在提供四种分层付费方案:
免费方案:提供四次文字、图像或全景图生成。
标准方案:每月 20 美元,包含 12 次生成,并支援多图/影片输入和进阶编辑 。
专业方案:每月 35 美元,包含 25 次生成,提供场景扩展和商业权利 。
极致方案:每月 95 美元,包含所有功能和 75 次生成
看好空间智慧成AI新领域,李飞飞为「世界模型」写下定义
且在World Labs推出首款产品之前,李飞飞发表了一篇宣言,声称空间智慧会是AI技术发
展的下一个新领域。她首先点出了大型语言模型当前的限制,形容它们就像是身处黑暗中
的语言大师,「能言善道却缺乏经验,博学多闻但没有根基。」
她指出,空间智慧彻底改变创造及体验现实与虚拟世界的方式,颠覆叙事、创造、机器人
技术、科学发现等众多领域。尤其是机器人技术,她认为缺乏对物理世界的感知及理解能
力,是机器人技术发展的最大限制,赋予机器人空间智慧将对众多产业带来深远影响。
不过世界模型目前仍是个相对模糊的新兴概念。例如,Meta首席AI科学家杨立昆(Yann
LeCun)认为它是AI发展的未来,但更侧重於AI的自主学习与因果理解。而在她的宣言中
,李飞飞则以三种核心能力为基础,为世界模型下了明确定义。
生成能力(Generative):模型能生成多样且合理的世界。
世界模型能「自己生成」世界。
生成的世界要在感知、几何、物理上合理,并且多样化。
模型应该理解世界的过去状态,并保持与现在的一致性。
不论是虚拟空间还是真实场景,都能生成可观察、可使用的世界状态。
多模态(Multimodal):模型能从多种资讯理解世界
世界模型能接收各种形式的资讯:图片、影片、深度图、文字、手势或动作。
它能把这些部分讯息整合成完整的世界状态,像人类或动物一样理解世界。
也能用多种方式与人或代理互动,输入和输出不局限单一形式。
互动能力(Interactive):模型能根据动作或目标预测世界变化。
世界模型能根据动作或目标预测世界的下一步状态。
输出会符合物理规律、语义、动态行为,保持前後一致。
强大的模型甚至可以在目标驱动下,不只预测世界状态,还能预测下一步行动。
她在文章的最後写道,空间智慧能提昇人们最为重视的生活品质。在空间智慧能力诞生在
生物身上至今5亿年,人类终於有机会将这项能力赋予机器,并造福世界各地的人们,「
如果没有空间智慧,我们对真正智慧机器的梦想是不完整的。」
心得/评论:
※必需填写满30正体中文字,无意义者板规处分
理组的世界模型要上了
不过不知道效果如何?
但应该还是需要更大的算力
更大的记忆体吧?
重点是演算法还是transformer?
还是还在寻找更佳的演算法?
还是理组模型只要理解
不需要死背
所以算力记忆体需求大幅减少?
不可能吧......
等大神开示...
99NV
99MU
99BRCM
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.160.146.68 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1763042767.A.DAB.html
1F:推 odddriver : 挖感觉很猛 11/13 22:07
2F:推 DreamW : 看成李发发 11/13 22:17
3F:→ JoeyChen : 上去看了那些作品 它的用途是创建风格化的场景吗? 11/13 22:19
4F:推 gk1329 : 做游戏更简单惹 11/13 22:20
5F:推 northsoft : 是说生这个要干嘛? 11/13 22:22
7F:推 duriamon : 没什麽用的东西,这东西就只是个3D建模AI,跟她宣称 11/13 22:25
8F:→ duriamon : 的什麽大语言模型的未来没什麽半毛钱关系,就整天吹 11/13 22:25
9F:→ duriamon : 而已,笑死! 11/13 22:25
10F:→ yesonline : 先让投资者看到东西啦. 这样後续才能继续注资... 11/13 22:26
11F:推 joshddd : 技术细节 没有透漏吗? 11/13 22:40
12F:推 tanby : 3D世界建起来後 接着就是包含物理特性 後续延伸的 11/13 22:41
13F:→ tanby : 东西很多 11/13 22:41
14F:→ ActionII : 文字资料到头了,开始理解视觉资料很正常吧 11/13 22:48
15F:→ ActionII : 可以理解3d 物理世界,比大语言模型更有用惹 11/13 22:49
16F:→ truehero : 世界模型产生模拟资料训练机器人阿 11/13 22:56
17F:推 Obama19 : AI教母来了 11/13 22:59
18F:推 cphe : 看来AI泡沫就是笑话了 11/13 23:06
19F:→ mokumoku : 这说真的满猛的 11/13 23:09
20F:推 epephanylo : 感觉对游戏业是个好消息 11/13 23:09
21F:推 guanting886 : 目前看起来像是扩散模型3D版 後面的物理/物体结构 11/13 23:15
22F:→ guanting886 : Ai什麽的应该没有生成出来相关参数 看起来比较能 11/13 23:15
23F:→ guanting886 : 辅助AR/VR开发的快速建模 11/13 23:15
24F:→ guanting886 : 但整到游戏去开发者可能更痛苦 11/13 23:16
25F:→ guanting886 : 待教母补完後面那段 11/13 23:17
26F:推 epephanylo : 点了几个演示,他根本没建模 XD 11/13 23:19
27F:→ epephanylo : 就是搞了个蛋贴个图假3D这样 只能当作概念沟通用吧 11/13 23:19
28F:推 bj45566 : 还是希望多一点人才投入研发世界模型 11/13 23:22
29F:推 Lowpapa : Fake 11/13 23:30
30F:推 madeinheaven: 没啥用 11/13 23:53
31F:推 NCCUexpert : 没啥用,没看出价值我太肤浅了吗 11/14 00:11
32F:推 odddriver : 一个能做游戏,一个给机器人用 11/14 00:18
33F:→ odddriver : 马斯克做世界模型也是一样概念,就是游戏也能用 11/14 00:19
34F:推 nfsong : 教母 11/14 00:25
36F:→ nfsong : 一张图 生成3D 地图 11/14 00:29
37F:→ nfsong : 未来 游戏引擎越来越容易 11/14 00:29
38F:→ nfsong : 先生成2D 美术图 然後转3D图 11/14 00:29
39F:→ nfsong : 以前很多 美术渲染很困难 11/14 00:31
40F:→ nfsong : 现在 就是先生成 1万种艺术风格 11/14 00:31
41F:→ nfsong : 然後1万种风格 带入游戏引擎 产1万种地图 11/14 00:32
42F:→ nfsong : demo 快很多 11/14 00:32
43F:→ nfsong : 其实 现在AI产很多 细致的图 已经是美术设计办不到 11/14 00:33
44F:→ atari77 : 用文字与图片就可生成3D世界模型哪不厉害 超强好吗 11/14 00:33
45F:→ nfsong : 细节很多的 要再产3D 更难 11/14 00:34
46F:→ atari77 : 灯光贴图都弄好 对动画与游戏省多大的工夫人力成本 11/14 00:34
47F:→ atari77 : 再稍微做一些微调就能符合需求 超好用 11/14 00:35
48F:→ nfsong : 譬如Steampunk 建上万个齿轮 11/14 00:35
49F:→ nfsong : 建模还不建到死 11/14 00:35
50F:推 nfsong : 主要是想 桥接物理世界 11/14 00:39
51F:→ nfsong : 应用在机器人身上 就是视觉空间化 11/14 00:40
52F:→ nfsong : 很久以前采访她 就有说 主要是为机器人桥接物理 11/14 00:40
53F:→ nfsong : 世界 11/14 00:41
54F:→ DrTech : 怎麽那麽多人大开眼界,文字转3D技术,随便一个大学 11/14 01:16
55F:→ DrTech : 生都能做的技术,都开源一堆了也那麽惊讶 11/14 01:16
57F:→ DrTech : yuan3D-2.1 这都出来多久了。 11/14 01:17
58F:→ DrTech : 文字或图片产出3D场景根本没什麽技术。精确度能不能 11/14 01:19
59F:→ DrTech : 达到工业级才是重点。给机器人学又更好笑了,物理精 11/14 01:19
60F:→ DrTech : 度或视觉真实那麽差的环境,机器人学了也不能用。 11/14 01:19
61F:推 nfsong : 不一样的东西吧 11/14 01:30
62F:→ nfsong : 混元3D 是一般的3D 建模 没有建空间 11/14 01:31
63F:推 nfsong : HunyuanWorld-1.0 11/14 01:33
64F:→ nfsong : 就是李飞飞在做的东西 11/14 01:33
66F:→ nfsong : world-labs-speeds-up-the-world-model-race- 11/14 01:38
67F:→ nfsong : with-marble-its-first-commercial-product/ 11/14 01:39
68F:→ nfsong : 比较的好像是 Google’s Genie 11/14 01:40
69F:→ nfsong : 能够很好的生成一个空间 就能生成更多 11/14 01:41
70F:→ nfsong : 譬如迷宫生成 11/14 01:42
71F:→ nfsong : 主要还是描述真实物理世界 11/14 01:43
72F:推 tanby : 混元模型跟这个技术效果差很多 要不要先去用用看再 11/14 01:46
73F:→ tanby : 来讲啊 11/14 01:46
74F:推 nfsong : 应该是 混元世界模型 11/14 01:47
75F:→ nfsong : B站 有人在实测marble 了 好像蛮烂的 haha 11/14 01:47
76F:→ nfsong : 刚开始 11/14 01:48
77F:推 nfsong : 就是 拿混元世界 比marble ...两个一样烂 11/14 01:50
78F:→ nfsong : 刚开始叠代吧 11/14 01:51
79F:推 nfsong : 和leaderboard LLM 好像也有 3D场景的指标数值 11/14 01:53
80F:→ nfsong : 慢慢会变强吧 11/14 01:53
81F:推 tanby : 要拿混元世界-mirror 模型来比才是,生成的东西差 11/14 01:54
82F:→ tanby : 不多 11/14 01:54
83F:推 nfsong : 和前两天 FAIR 田渊栋说的 11/14 01:55
84F:→ nfsong : 这东西要变成framework给人用 应该会走开源路线 11/14 01:56
85F:→ nfsong : 现在是 domain 模型 产业模型大爆炸时代 11/14 01:57
86F:→ nfsong : 人人都在做模型 11/14 01:58
87F:推 nfsong : 撇除 细节 这东西 拿来DEMO给甲方 蛮适合的 11/14 02:02
88F:→ nfsong : 是不是 甲方要的 一个眼缘 送甲方1000个世界渲染 11/14 02:03
89F:→ nfsong : 包含 室内设计喔 11/14 02:03
90F:推 ggirls : 教母漂亮吗 11/14 03:56
91F:推 qwe78971 : 懒得看 Ai要做3D游戏还太勉强了 光生出几千面的模 11/14 04:49
92F:→ qwe78971 : 型 问题就大到不行 不是人人拿顶尖显卡在玩耶 11/14 04:49
93F:推 chienk : 哇。产品落地。 滤镜拿掉了。 11/14 07:42
※ 编辑: jerrychuang (118.160.146.68 台湾), 11/14/2025 07:50:51
94F:→ a9564208 : 这对传媒娱乐产业很有帮助 11/14 07:59
95F:→ csyang : 真的很讨厌名字有叠字耶~ 11/14 08:30
96F:推 smallkop : 阿靠北这不就元宇宙 11/14 08:30
97F:→ pov : ANN都要大量训练资料 跟生物神经运作方式本质不同 11/14 11:05
98F:→ loking : 以後搭配vr 可以一直发现新世界 不会地图玩腻 11/14 11:46
99F:推 decorum : 有什麽运用可能要後续开发者去拓展 原创团队未必能 11/14 12:45
100F:→ decorum : 预先设想到其潜力 11/14 12:45
101F:嘘 quartics : 世界模型也达不到AGI 11/14 14:30
102F:推 bnd0327 : 空间智能方向是必要的,但输入输出还有待定义 11/14 15:41
103F:→ bnd0327 : 要像ChatGPT那样给公众玩就是变这种玩具样 11/14 15:42