Tech_Job 板


LINE

标题:Google DeepMind推出Gemini Robotics 1.5,让机器人能够思考後再行动 来源:iknow科技产业资讯室 原文网址:https://pse.is/86wr55 原文: 基本上,能够创建文字、影像、音讯甚至视讯的生成式AI系统正变得日益普及。AI模型能 够输出这些资料类型,它们也可以用来输出机器人的动作。这正是Google DeepMind之 Gemini Robotics的基础。 如今该计画宣布了两个新模型,它们可以协同工作,创造出首批在行动前「思考」的机器 人。 Google DeepMind所推出了两款全新AI模型:Gemini Robotics 1.5 和 Gemini Robotics-ER 1.5,旨在让机器人能够自行规划、理解和执行复杂任务。这两款模型都将 多模态感知、语言处理、运动控制与内部决策系统结合。 DeepMind 目前的机器人技术依赖两种模型:一种是「思考」模型,另一种是「行动」。 Gemini Robotics 1.5是视觉-语言-动作(VLA)模型,这意味着它使用视觉和文字资料来 产生机器人动作。另一个模型中的「ER」代表具身推理 (embodied reasoning)。这是一 个视觉-语言模型 (VLM),它接受视觉和文字输入来产生完成复杂任务所需的步骤。 第一个模型Gemini Robotics 1.5将这些规划转化为实际行动。与先前的VLA不同,此模型 先推理後行动:它会建立内部逻辑链,规划中间步骤,分解复杂任务,并解释其决策。例 如,在将衣物分类时,模型会识别目标(例如「将浅色衣物放入白色垃圾桶」),然後规 划抓取动作并执行。 至於Gemini Robotics-ER 1.5 是机器人的高阶「大脑」。它负责任务规划,使用谷歌搜 寻等数位工具,以自然语言进行交流,并监控进度和成功率。根据Google DeepMind 称, 该模型在 15 项具身推理基准测试上取得了最佳结果。 这两种模型都可以将其能力推广到不同类型的机器人。谷歌表示,ALOHA 2 机器人学习到 的运动模式也可以在Apptronik 的 Apollo 或双臂 Franka 机器人等平台上运行,无需额 外微调。 这些模型包含内建安全检查功能。在执行操作之前,Gemini Robotics 1.5 会检查移动是 否安全,并在需要时触发防撞等功能。 这两种型号都基於更广泛的 Gemini 多模态系列,并针对机器人技术进行了专门调整。 Gemini Robotics-ER 1.5 现已透过 Google AI Studio 中的 Gemini API 提供,目前仅 限部分合作夥伴使用。 总之,有别於传统依赖单一资料和特定平台的训练方式,Gemini Robotics 1.5系列模型 使机器人能够跨平台迁移技能,并在复杂环境中展现出类人适应性,拓展了机器人模型的 通用性。这也成为众多厂商建构机器人模型的目标之一。 过去机器人往往只能依循固定程式,在既定框架下完成单调任务,如今藉由具身推理与跨 平台学习,它们不仅能理解环境、规划多步骤任务,甚至能把一种硬体的经验快速转移到 另一种机器人身上,这意味着未来的机器学习将不再是耗时的重复过程,而是一种「即学 即用」的演化模式。心得: --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 203.145.192.245 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1759211752.A.DBF.html
1F:推 dakkk: 还有几集可逃101.138.175.187 09/30 14:10
2F:推 darot: 试试看 不知道是不是真的有这麽厉害 49.217.198.228 09/30 15:35
3F:推 jiansu: 工厂的简单繁琐工作流程自动化 才是ai被 36.226.218.227 09/30 16:35
4F:→ jiansu: 设想的目标便利应用 现在把程式/视觉/音 36.226.218.227 09/30 16:35
5F:→ jiansu: 乐 搞成这麽强大 简直就是意外 36.226.218.227 09/30 16:35
6F:推 michellehot: ALOHA滑蛋虾仁喂你吃 49.214.1.218 09/30 16:56
7F:推 DonnyDon: 光靠实验室数据 是能练个鬼114.136.186.252 09/30 19:39
8F:推 DrFord: 未来AR普及了可能有助於具身智能的发展 27.52.2.50 09/30 19:40
9F:→ DrFord: 反倒是锁螺丝的工人最後被AI取代 27.52.2.50 09/30 19:41
10F:→ DrFord: 也是蛮讽刺的 27.52.2.50 09/30 19:41
11F:嘘 pig2014: 我猜用nv omniverse train出来的 223.23.255.68 10/01 13:19







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP