CA88

日剧《太想被你爱了》百度云UT Austin朱玉可：人形机械人的数据困局怎么破？答案藏在「数据海绵」里｜ICRA 2026

2026-06-08 03:50:27 起源：龚沪华

字号：默认大超大 | 打印 |

2026年6月3日，在ICRA 2026大会的主题演讲环节，德克萨斯大学奥斯汀分校副教授、NVIDIA GEAR团队掌管人朱玉可（Yuke Zhu）颁发了关于人形机械人基础模型的最新演讲。他在演讲中系统性地拆解了当前人形机械人面对的最大瓶颈——数据，并提出了以“数据金字塔”为框架、以“世界模型”为引擎的规�；杈�。朱玉可指出，人形机械人在进入一个全新的加快阶段：硬件日益成熟，进建算法和基础模型的规�；苍诩本缤贫�。但真正造约这一领域从Demo走向大规模部署的，依然是数据。真实机械人数据质量最高但极其稀缺，仿真数据能够无限天生但存在仿真到真实的天堑。为此，他提出了一个三层数据金字塔战术：底层是海量但被动的互联网人类视频数据，中层是可无限天生的合成数据，顶层是真实机械人数据。他的主题概想是：不应押注单一数据源，而应以异质方式汇集三种数据，同时让世界模型表演“数据海绵”的角色，吸收并整合所有类型的数据。在具体实际中，朱玉可展示了两个典型案例：一是SONIC——利用大规模人类作为捉拿数据训练人形机械人全身节造器，通度日动跟踪指标大幅简化了强化进建的嘉奖函数设计，实现万幼时级此外规�；盗�；二是EgoScale——从第一人称视角的人类视频中进建，通过“预训练获取人类知识→对齐训练压缩知识→后训练表白知识”的三阶段规划，使得机械人仅需不到1%的真实机械人数据就能实现复杂操作工作。整场演讲最令人振奋的结论，来自DreamZero世界作为（World Action Model，WAM）模型：通过将视频天生模型转化为作为天生器，纯AI天生的虚构轨迹在训练价值上险些100%等效于真实物理数据。朱玉可最后强调，要推动整个领域前进，开源和盛开是不成或缺的。NVIDIA已开源GR00T基础模型、Isaac仿真框架及有关数据集，并刚刚颁布了首个H2 Plus参考平台。我今天要讲的是人形机械人和基础模型。先给一个总结：我以为我们在进入人形机械人技术的一个全新时期。硬件越来越壮大，进建算法、基础模型的规�；苍嚼丛娇尚�。 “打造自主的、类人的机械人」剽个妄想，已经让人类沉迷了数百年�；等苏飧龃首钤绯鲎�1920年卡雷尔·恰佩克的戏剧，名字就接锥罗素姆的全能机械人》。从一路头，人们就把机械人设想成类人的通用工作者，而不是为特定用处定造的机械。回首人形机械人的发展过程，我们看到一波又一波的炒作周期：从七八十年代论证技术可行性的概想验证系统，到那些最终没有实现大规模贸易成功的愿景原型，再到社交伴侣机械人。约莫十年前，DARPA机械人挑战赛给我们泼了一盆冷水，明显揭示了即便在人类监督下，让机械人进入现实使用有多么难题。直到此刻，没有任何一款人形机械人实现了大规模、急剧的部署。但在2022年左右，我们起头看到一场“人形机械人爆炸”。各大公司、草创企业、钻研机构都在造作越来越壮大的机械人。我以为这在很大水平上是由AI和基础模型、大说话模型的进取所驱动的。今天，我会展示我们最新的钻研成就，我的指标是让你们看到：我们有理由维持乐观，由于进取是扎实的。约莫两年前，我有幸在英伟达辅导一支人形机械人钻研团队。2024年3月GTC大会上，黄仁勋走上台颁发了GR00T项目。这是一个为构建人形机械人全栈解决规划的打算。GR00T-1是我们推出的第一个开源人形基础模型。整体架构选取了一种双层设计。系统二是一个视觉说话模型，接管图像和说话指令作为输入，天生作为token；这些token传递给系统一，即扩散Transformer，天生关环作为供机械人执行。整个模型能够端到端训练。但在实际中，当你必要节造一个超过四五十个自由度的系统时，通�；贡匾桓鲇们炕ㄑ盗返娜斫谠炱�，将基础模型产生的高级指令转化为每个关节的最终执行作为。预训练模型赋予机械人泛化能力，使其可能遵循分歧的说话指令，对分歧物体和工作指标执行工作。模型还能够进一步进行后训练，执行更复杂的操作。在我们最新的GR00T迭代版本N1.7中，我们尝试解锁机械人的整个活动学领域，通过全身活动操作实现工作。这个模型仅用几十个演示进行后训练，就能实现复杂的工业流程工作。约莫几年前，我提出了一个“数据金字塔”的概想，它明显说了然CA88数据战术：我们不会只依赖单一数据源来扩大，而是要大规模地汇集异质数据源。与其只依赖一种数据源，CA88大量钻研都致力于若何有效利用整个数据金字塔。今天我想把沉点放在金字塔的最底层，人类数据。我以为人类数据是目前最具可扩大性的数据起源�；チ员ù鹬行�，捉拿了我们世界的样子、人类的行为方式、日常工作和日常生涯。而人形机械人可能是消费这类数据最天然的状态，由于状态差距更幼。对于人类作为捉拿数据，我们在一个叫SONIC的工作中索求用它训练通用的人形全身节造器。主题思路是：首先将人类活动沉定向到特定人形机械人的状态上，天生对应的动捕数据库，而后将活动跟踪作为强化进建的训练指标。这种组合极大简化了嘉奖函数的设计，从而使规�；炕ㄑ盗烦晌赡�。做大规模的事件时，简洁往往带来更好的可扩大性。我们在三个维度上扩大了模型训练：参数量从120万提升到4200万，这个规模足够壮大，但依然幼到能够部署在机械人本体的NVIDIA Jetson上；数据量达到1亿帧，总计超过10700幼时的人类动捕数据；训练使用了9000个GPU幼时，每个GPU运行自己的物理仿真副本，计算相当于数千年的真实机械人经验。 SONIC的关键在于作为的天然流畅度，这重要来自活动跟踪指标，让模型更好地仿照人类活动。这个模型能够接受遥操作、基础模型输出、甚至人类视频作为高级指令。我们已将其部署在宇树G1机械人上，训练代码、部署框架和数据集齐全开源。这类视频提供了一个窗口，让我们观察人类日�；疃蟹崴兜亩嘌院透丛有�。在最近的工作EgoScale中，我们跟踪人类伎俩和手指在三维空间中的活动，也就是说把人设想成一个机械人，头部活动就是作为空间，如此将第一人称视角视频转化为训练数据。 EgoScale的训练规划由三个阶段组成：第一阶段仅在人类视频上预训练，从第一人称视角视角预测手部活动；第二阶段在配对的人机数据上对齐表征，使知识从人类领域迁徙到机械人领域；第三阶段用少量真实机械人数据精调模型。用概想框架来理解：预训练阶段是“获取人类知识”，从视频中收成学问和物理知识；对齐训练阶段是“压缩知识”，从人类领域压缩到机械人领域；后训练阶段是“表白知识”，利用堆集的知识解决具体工作。这项工作最让我兴奋的是，模型对更多人类视频数据有着巨大的胃口。当我们将视频数据从1000幼时扩大到20000幼时，模型机能稳步提升，出现出近乎美满的对数线性关系，意味着持续投入数据，机能还会持续提升。真正的“魔法”来自预训练，预训练得越好，后训练所需数据就越少。这就是CA88规�；婊壕蟛棵攀堇醋匀死嗍�，不到1%来自真实机械人。在演讲渣滓的功夫里，我要讲讲“海绵”的故事。我所说的海绵，是世界模型。世界模型像海绵，由于它有一种神奇的能力，能够吸收数据金字塔中各种类型的数据。它能够从互联网视频中进建，获取学问和物理知识、语义知识和法式性知识；能够从合成数据中进建，受益于节造多样性；能够从真实机械人轨迹中进建，精化特定工作的表征；能够从多模态数据、音频数据中进建。也许最沉要的是，能够从失败数据中进建，这类数据对战术改进极度有效。我们在DreamZero工作中索求了这个设法，用世界模型构建下一代NVIDIA基础模型。主题是“世界作为模型”，设想视频天生模型若何工作：从初始帧起头，从一个带噪声的视频启程，逐步去噪，天生清澈视频。在大规�；チ萆涎盗氛庋哪Ｐ�，它能捉拿相当多的物理理解。而后在机械人数据上微调，通知模型机械人应该长什么样、应该若何活动。关键创新在于，我们不仅让模型天生未来画面，还增长一个扩散通路同步天生作为。测试时我们抛弃未来帧预测，只提取作为执行。仅通过视频天生模型或世界模型，就能显著加强视角泛化能力和行为克隆的样本效能。这是我第一次在公共场所展示这些了局。训练GR00T基础模型执行复杂工作，展示了关环战术进建和反映式复原行为。若是你从事机械人钻研足够久，会认出这个YCB数据集中的物体。十年前我看到它时，感触绝不成能用机械人实现这样的装配工作。但此刻，有了基础模型，这已经造成可能了。并且是在一天之内实现的，无需任何人为过问。我对从前两年获得的进展感应兴奋，社区中的加快极度惊人。但也很容易看到，还有大量工作必要做，我们必要更宽泛的钻研社区参加。这也是为什么我幼我极度坚定地看好开源。就在这个星期一，我们刚刚颁发了首个H2 Plus参考平台。打造人形机械人的妄想已经让我们沉迷了超过一百年。但最终，我看到各类技术身分在汇聚，让我们真正有可能实现这个妄想。我约请在座各位一路参与，共同将这个妄想变为现实。朱玉可：这是一个极度好的问题。若是你看过大说话模型是若何训练的，就会知路预训练只是训练的第一阶段。在机械人领域，后训练和对齐同样关键。你必要针对特定工作场景，用高质量的领域数据进行精调。同时，可复现性必要严格的评估基准和尺度化的测试和谈，这一点我们在YCB等基准工作的基础上还必要持续推动。总的来说，预训练给你泛化的底座，后训练给你领域的深度，两者缺一不成。

日剧《太想被你爱了》百度云

                                日剧《太想被你爱了》百度云当时他因贝雷蒂尼中途退赛锁定法网四强席位时，很多人还认为以这种方式成为科博利的半决赛对手，运气好到爆的阿纳尔迪，或者能让这份好运继续傍身，届时对阵科博利能收获更大的惊喜，喜提决赛门票，没想到最后打败阿纳尔迪的不是科博利，而是不期而至的病毒。近日，在接受采访时，荷兰国门费布鲁亨谈到了今夏世界杯，以及自己成长过程中最重要的榜样——荷兰传奇门将埃德温-范德萨。日剧《太想被你爱了》百度云《攻略错男主后(1VN)全書訂購價格》假设你家里有一台智能机器人管家，它拿着一杯热咖啡向你走来。它的摄像头正常运转，程序正常运行，系统显示一切正常。但实际上，它的地图数据已经过时了三秒钟——就在三秒前，你的孩子把一把椅子拖到了走廊中间。机器人完全没有察觉，依然迈着稳健的步伐向前走去，直到热咖啡连同整个托盘一起撞在椅背上，泼了满地……内置存储方面，科赋带来了 DRAM-less PCIe Gen5 固态硬盘 GENUINE G540，拥有 10GB/s 顺序读取、9GB/s 顺序写入的主流级速率，配备石墨烯-铜复合散热片。此外还有 Gen4 的 CRAS C925G Lite：其基于 QLC，最大容量 8TB，顺序读取 7200MB/s。
                            

                                20260608 ? 日剧《太想被你爱了》百度云古田会议之后，红四军思想面貌、精神风貌焕然一新。不忘初心，方得始终。2014年10月，全军政治工作会议在古田召开。出席会议前，在参观古田会议纪念馆时，习近平总书记感慨地说：“回过头来看，古田会议奠基的政治工作对我军生存发展起到了决定性作用。”《糖心破解版》再者，RSI需要的理想环境，在真实世界里根本不存在。这套系统要跑起来，两个前提缺一不可：无限算力、全球开放协作的研究生态。
                            

日剧《太想被你爱了》百度云

? 王粉妮记者朱建雨摄

                                20260608 ? 日剧《太想被你爱了》百度云作业分层：实施“基础层作业全员必做、提升层作业选做、拓展层作业弹性选做”的分层作业制度【2】。基础层作业聚焦核心知识的巩固，确保所有学生能够掌握最基本的内容；提升层和拓展层作业则为不同层次的学生提供差异化的成长空间。《《公厕少年nasa》百度百科》谈到莱奥被罚下，伯纳多表示：“无论什么时候，保持冷静都很重要。我觉得裁判其实也可以用其他方式来处理。毕竟这是一场友谊赛，比赛中有很多中断，也出现了一些拖延时间的情况，这很容易让球员情绪变得紧张。当然，我们对这个结果并不满意，因为莱奥对我们来说非常重要，我们不希望在世界杯上失去他。”
                            

日剧《太想被你爱了》百度云

? 刘成荣记者蔡定新摄

                            ? 近日，记者走进中国共产党无线电密码通信工作诞生地历史陈列展，感受党的无线电密码通信工作的不易与艰辛。澎湃新闻记者 彭友琦 张呈君(01:22)《《替夫还债》高清齐全版》
                        

【我要推荐】更多推荐：纳格尔斯曼：卡尔将裙伢4到6周，无论若何也赶不上世界杯了

扫一扫在手机打开当前页

链接：
全国人大
|
全国政协
|
国度监察委员会
|
最高人民法院
|
最高人民检察院

国务院部门网站
|
处所当局网站
|
驻港澳机构网站
|
驻表机构

red

中国当局网 | 关于本网 | 网站申明 | 联系CA88 | 网站纠错

主办单元：日剧《太想被你爱了》百度云　运行守护单元：中国当局网运行中心

版权所有：中国当局网　中文域名：中国当局网.政务

网站标识码bm58232452　京ICP备05070218号　 2018guohui03 京公网安备11010202000001号

CA88(中国区)唯一官方网站

国务院客户端

CA88(中国区)唯一官方网站

国务院客户端幼法式

中国当局网微博、微信

gtrs_red

主办单元：中国当局网　运行守护单元：中国当局网运行中心

版权所有：中国当局网　中文域名：中国当局网.政务

网站标识码bm58232452

京ICP备05070218号　京公网安备11010202000001号

【网站地图】