作者Nance (5566)
看板Stock
标题Re: [新闻] 马斯克:特斯拉人形机器人Optimus今年试
时间Sat Mar 22 21:55:29 2025
※ 引述《dream1124 ()》之铭言:
: ※ 引述《Bisu (P)》之铭言:
: : 这是两天前波士顿动力公司释出的影片
: : https://youtu.be/I44_zbEwz_w?si=b0kHaDok815A1V_2
: : 人类可以开始问一些假设性的问题
: : 五至十年内
: : 机器人是否能够执行大部份人类的实际劳动力
: : 「机器人是否能够在电厂生产电力」
: : 「机器人是否能够在农场生产人类所需要的食物」
: : 人类科技的转折点
: : 不会是能够移民外星
: : 而是从资源的限制性跳脱出来
: : 也就是摆脱时间跟劳动力的限制
: 做人要实际一点,梦不要吹太大
: 我们就来看近期一个使用类人形机器去做原本手动的例子好了
: 这是北捷失物招领中心的取物机器人影片
: https://www.youtube.com/watch?v=MFTlF6O_7kY
: 以前柜台取失物给旅客得先走进仓库到架上拿失物,
: 现在可以用机器手臂去架上拿,然後再转交到柜台。
: 这完全取代人的手臂和脚,感觉很炫炮,对吧?
: 问题是从好几个角度来看,这套系统真的很低效。
: 大部分失物明明可能连 5kg 都不到,
: 结果却为了挑选并移动失物而趋动和搬运显着超过失物重量的手臂,
: 这样既不节能,也不怎麽省时,甚至还有可能更花钱,
: 从一个工具的角度来看实在鸟鸟的。
: 如果系统知道失物放在哪格,为什麽不用自动化仓储系统将东西送到指定位置,
: 然後再用简单的输送带将失物送到接收窗口就好?
: 由此可见机器人也不是外形、动作跟人一样就会成功,重点还是在於事情的效益与效
率?
: 工厂是很追求效率的地方。
: 如果预算很够,为什麽不采购特定用途的自动化设备,
: 然後重新设计生产线以追求成本、效率等多方面的最佳化,反而要搞这些半调子?
: 如果预算不够,或是只想找过渡阶段的人力,
: 为什麽不雇用移工,不到低度开发国家生产,或是直接外包生产零件?
: 地球上的人类还是很多,50 年内顶多成长趋近於零,不是什麽地方都在高龄少子呀~
: 与其一直画大饼要大家想像未来可以多美好,
: 还不如分析现状,看看到底哪些情况很需要类似人的机器人,
: 或是想想哪些暨有产品可以智慧化,例如研究要怎麽让充气娃娃更像人,
: 这种人形机器人应该有些发展潜力。
: 反之要是自己也想不到当下很棒的应用,那还是别再跟着网红或名嘴瞎吹了吧~
你觉得很低效,首富不觉得
就跟2010年 马斯克刚做电动车时
也是铺天盖地嘲讽 :
油车比电车生产便宜、
要盖海量充电站不可能、
巨型废铁、
造价高昂的有钱人玩具…等
有些走的太先进的东西就是要让有钱人去搞
光是美国要搞制造业,降低人力成本,就非常需要机器人去做一些无脑的低阶工作,随着
量产长期下来会比人工便宜
而且也不是开发人型机器人
就不开发非人型机器人
网路上很常有网友硬是要二分法 质疑人型机器人
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.72.41.13 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1742651731.A.825.html
1F:推 leefengynh : 人类可操纵的机具 或 人类自己 都可以ai化 03/22 21:56
2F:→ leefengynh : 所以不一定要人形 但可选择到形体也是有限的 03/22 21:57
3F:→ leefengynh : 人类可操纵的机具ai化(汽车 飞机) 03/22 21:57
4F:→ leefengynh : ai化 本质也是在学人类如何操作 03/22 21:57
5F:→ leefengynh : 非以上的形体 基本上你取得不到海量的运动数据 03/22 21:58
6F:→ leefengynh : 比方说机器狗吧 你很难ai化 03/22 21:58
7F:→ leefengynh : 你当然可以去取上万只流浪狗的动作数据 03/22 21:59
8F:→ leefengynh : 丢入模型 去训练你的机器狗如何反应的「更像一只狗 03/22 21:59
9F:→ leefengynh : 」 03/22 21:59
10F:→ leefengynh : 但这就不是人工智慧 03/22 22:00
11F:→ leefengynh : 因为狗本身就没智慧 你叫ai去学一只狗要干麻 03/22 22:00
12F:→ leefengynh : 自动驾驶本质也就是用人类开车的数据去训练模型 03/22 22:02
13F:→ leefengynh : 本质就是在学人类如何开车 03/22 22:02
14F:推 AGODC : 狗才好AI化吧,让他多看些狗狗的影片模仿就好了。以 03/22 22:04
15F:→ AGODC : 前机械手臂什麽的都要写好程式编上对应位置,现在直 03/22 22:04
16F:→ AGODC : 接训练AI照着做就好了,完全跳脱以前的应用框架 03/22 22:04
17F:推 leefengynh : 看狗的影片 他就变一只狗而已啊XDDD 03/22 22:04
18F:→ leefengynh : 变成狗能叫做ai吗 你家的狗能够做什麽复杂工作 03/22 22:05
19F:→ AGODC : 不要忘了,AI真的落地发展才2年时间而已,各种应用 03/22 22:05
20F:→ AGODC : 已经飞速发展,真的用不了10年,人类连当电池的价值 03/22 22:05
21F:→ AGODC : 可能都没有了 03/22 22:05
22F:→ leefengynh : 而且不是看狗的影片 而是你要把动作感测器安装在真 03/22 22:05
23F:→ leefengynh : 狗的每个关节上 03/22 22:06
24F:→ leefengynh : 把这些运动数据取出来 手脚转弯几度 等等 03/22 22:06
25F:→ leefengynh : 然後再喂进去ai 03/22 22:06
26F:→ leefengynh : 然後几万几千万只狗 数据大概才够 03/22 22:07
27F:→ leefengynh : 然後他就能变一只动作很像狗的机械狗 03/22 22:08
28F:→ AGODC : 你把AI训练成狗然後要叫它做工作? 03/22 22:08
29F:→ leefengynh : 所以根本的原因是干嘛要用狗形 不用人形? 03/22 22:08
30F:→ leefengynh : 那些说为什麽一定要人形的人 不就是在搞笑吗 03/22 22:09
31F:→ leefengynh : 因为狗形你就只能用狗去训练 那要怎麽工作 03/22 22:09
32F:→ leefengynh : 难不成要用 汽车形 飞机形? 03/22 22:09
33F:→ leefengynh : 人形用人类去训练 刚好可以做人类的工作 03/22 22:10
34F:→ leefengynh : 为什麽不用异形 因为无法取得海量异形的动作data 03/22 22:11
35F:推 aegis43210 : 是的,深度学习是在训练出直觉,也就是所谓的习惯性 03/22 22:20
36F:→ aegis43210 : 动作 03/22 22:21
37F:推 leefengynh : 不就一堆根本不知道现在ai怎麽玩的杂鱼 03/22 22:24
38F:→ leefengynh : 用大量的数据 找出规则 建立模型 03/22 22:25
39F:→ leefengynh : 你用 机器异形体 你是要去哪里找数据 03/22 22:25
40F:→ leefengynh : 光「大量数据」这关 你就遇到问题了 03/22 22:25
41F:→ dongdong0405: 到底在说啥,那叫四足机器人,怎麽拿真的狗来对标= 03/22 22:26
42F:→ dongdong0405: = 而且谁说人工智慧不能放在四足机器人里面,早就有 03/22 22:26
43F:→ dongdong0405: 一堆强化式学习了,就好比特斯拉的FSD可以放在电动 03/22 22:26
44F:→ dongdong0405: 车也能放在机器人一样 03/22 22:26
45F:→ leefengynh : 以为随便自己可以发明一个机器外型就ai化XDDDDD 03/22 22:26
46F:→ leefengynh : fsd是学人类如何开车 他把大量的人类开车数据喂养给 03/22 22:26
47F:→ leefengynh : 模型 03/22 22:27
48F:→ leefengynh : fsd把行车纪录画面+煞车+电门+方向盘的作动数据 03/22 22:27
49F:→ leefengynh : 都喂进去模型 03/22 22:28
50F:→ leefengynh : 就是在学习人类如何转方向盘 踩电门 踩刹车 03/22 22:28
51F:→ leefengynh : 你用四足机器人 要怎麽学人类工作 03/22 22:29
52F:→ leefengynh : 关节根本不对应 03/22 22:29
53F:推 dongdong0405: 你以为真的直接用喔 当然要微调啊= = 而且之前的采 03/22 22:30
54F:→ dongdong0405: 访早就说Optimus 有采用FSD了 到底谁在不懂装懂 03/22 22:30
55F:推 aegis43210 : 其实也是有方法,叫几百个演员演出狗是怎麽做事的, 03/22 22:30
56F:→ aegis43210 : 再用那些巨量资料去训练出会做事的机器狗 03/22 22:30
57F:推 leefengynh : 很难 因为人跟狗的身体构造不一样 03/22 22:31
58F:→ leefengynh : 人类做一个手轴旋转的动作 狗形根本做不出来 03/22 22:32
59F:→ aegis43210 : 另一种则是老黄希望大家做的,用巨量的GPGPU做出数 03/22 22:32
60F:→ aegis43210 : 位孪生模型,模拟出巨量会做事的狗,以此来训练 03/22 22:32
61F:→ leefengynh : optimus没有用fsd optimus的走路是另外训练的 03/22 22:33
62F:→ leefengynh : fsd是模拟人类转方向盘 踩油门 踩刹车 03/22 22:34
63F:→ leefengynh : 在生成式ai架构下 双足平衡已经很容易了 03/22 22:35
64F:→ leefengynh : 双足平衡早期难是因为早期都用敲代码 03/22 22:36
65F:→ leefengynh : 现在有生成式ai 就是直接模拟人类怎麽平衡 03/22 22:36
66F:→ leefengynh : 根本不困难 03/22 22:36
67F:→ leefengynh : 这种「直觉模拟」 是你用写程式很难写出来的 03/22 22:36
68F:→ leefengynh : 把人类身上都加上动作感测器 数据全部取出来 03/22 22:38
69F:→ leefengynh : 喂养进去机器人 机器人自然知道哪些关节要如何做动 03/22 22:38
70F:→ leefengynh : 去产生双足平衡 03/22 22:38
71F:推 dongdong0405: 内核明明是用差不多的东西,我这边讲FSD当然不是说 03/22 22:42
72F:→ dongdong0405: 车子用的整个搬到机器人里,FSD他是纯视觉资料训练 03/22 22:42
73F:→ dongdong0405: ,你说的那些车控是网路决策後才行动的,所以视觉网 03/22 22:42
74F:→ dongdong0405: 路你可以用机器人那块的资料重新pre train ,或者拿 03/22 22:42
75F:→ dongdong0405: 前者微调(效果不一定好)然後生成式AI模拟平衡?? 03/22 22:42
76F:→ dongdong0405: ? 你叫LLM模拟平衡看看 03/22 22:42
77F:推 leefengynh : 机器人走路不是用fsd 是用人类装上动作感测器走路 03/22 22:44
78F:→ leefengynh : 同时人类眼睛位置也有使用摄影机 03/22 22:44
79F:→ leefengynh : 把摄影机画面和走路时动作感测收集到数据喂进去ai 03/22 22:45
80F:→ leefengynh : 基本上跟fsd是两个系统 03/22 22:46
81F:→ leefengynh : LLM就是喂养大量人类文章进去 模仿人类说话啊 03/22 22:46
82F:→ leefengynh : 机器人 就是喂养大量人类动作数据和人类视觉进去 03/22 22:46
83F:→ leefengynh : 模拟人类行为啊 03/22 22:46
84F:→ leefengynh : 原理一模一样 03/22 22:47
85F:→ leefengynh : fsd是模拟方向盘 煞车 电门被人类的操作後的数据 03/22 22:47
86F:推 dongdong0405: FSD的VRU为什麽不能用在Optimus ,明明就已经有工厂 03/22 22:49
87F:→ dongdong0405: 实例影片了,他们都是差不多的网路套不同训练资料而 03/22 22:49
88F:→ dongdong0405: 已,我的意思一直都是放在机器人自己导航这块,你一 03/22 22:49
89F:→ dongdong0405: 直扯到动作平衡干嘛,我是看起来那种拿导航做动作的 03/22 22:49
90F:→ dongdong0405: 机器人吗 03/22 22:49
92F:→ dongdong0405: 这都五个月前的东西了 03/22 22:50
93F:→ leefengynh : 不是牵扯到视觉就跟fsd有关 你加油吧XDDD 03/22 22:51
94F:→ leefengynh : fsd是fsd 他就是开车用的 03/22 22:52
95F:→ leefengynh : 机器人用的就要另外训练 03/22 22:52
96F:→ dongdong0405: 他们基本上一定都是类似的技术,当然不可能直接搬, 03/22 22:52
97F:→ dongdong0405: 但是一定会有一些类似的网路设计 03/22 22:52
98F:→ dongdong0405: LLM你那边根本瞎鸡巴乱讲 你才要加油吧 Transformer 03/22 22:53
99F:→ dongdong0405: 先了解一下吧 03/22 22:53
100F:→ leefengynh : 同样都是汽车纯视觉 但不同家车厂的自驾 模型就差很 03/22 22:53
101F:→ leefengynh : 多了 更何况是机器人跟四轮 03/22 22:54
102F:→ dongdong0405: 而且你为啥一直在说FSD吃方向盘电门那些数据,VRU明 03/22 23:01
103F:→ dongdong0405: 明就不吃这些,他这些都是网路决策後的行动 03/22 23:01
105F:→ dongdong0405: 这篇很详细,你自己读吧 03/22 23:05
106F:→ dongdong0405: 我想表达的意思很多网路设计和技术其实都是可以沿用 03/22 23:05
107F:→ dongdong0405: 的,甚至综合起来,只是说可能需要因应不同情境调整 03/22 23:05
108F:→ dongdong0405: 部分网路架构和数据资料,所以你一定可以看到类似的 03/22 23:05
109F:→ dongdong0405: 东西出现不同的Bot上面,干嘛一直拘泥分开来 03/22 23:05
110F:→ leefengynh : 楼上已经过时了 v12的技术和v13基本上有很大差异 03/23 00:14
111F:推 leefengynh : V12用的决策调用的是8个摄影机影像逐个像素分析 03/23 00:16
112F:→ leefengynh : V13已经开始取得摄影机的HDR光子数进行决策 03/23 00:16
113F:→ leefengynh : 视觉欺骗在V13版本根本不可能存在 03/23 00:16
114F:推 fantasyscure: 问为何设计人形真的蛮蠢的 取代人类的劳力 不设计 03/23 01:59
115F:→ fantasyscure: 成人形 不然要设计成鱼形犬形吗? 03/23 01:59
116F:推 fantasyscure: 人形就是基本 应用各种环境还可以用外挂装备支援 以 03/23 02:01
117F:→ fantasyscure: 後消防镇暴反恐都能够派上用场 03/23 02:01