来自中国的“无界世界模型”(Boundless World Model,BWM)一鸣惊人——开源版本BLM得分64.54,在13个参评模型中斩获全球第一;关源版本BWM-Fast得分67.87,在总计86个参评模型中位列全球第二,距离榜首仅差0.39分。
这份榜单从视觉质量、活动质量、物理遵循性、内容一致性、三维空间正确性及可控性六大维度、16项细分指标进行综合评估。参赛阵容堪称豪华:Google、NVIDIA、高德、智元机械人、生数科技、极佳视界、流形空间、北京人形机械人创新中心……国内表顶尖团队悉数参与。
值妥贴心的是,BWM并非出自算力堆叠的大厂之手,而是由欧洲科学院表籍院士、同济大学推算机科学与技术学院院长申恒涛教授牵头,国度级青年人才朱磊及其团队,结合考拉悠然、上海码极客共同研发。团队基于阿里巴巴开源的Wan2.2-TI2V-5B视频天生模型,以50亿参数的幼体量,跑赢了诸多规模远超自己的敌手。
若是你看过波士顿动力的机械人视频,可能会有一个疑难:那些流畅的作为、精准的抓取,到底是提前编好的法式,还是机械人真的“理解”了物理世界?这个问题的答案,指向AI领域最前沿也最辣手的方向之一——世界模型。
世界模型的野心很大:让AI不只“看见”画面,还能“预赣妆接下来会产生什么。给它一张初始照片,再通知它“机械人要把杯子放到桌上”,它就能推演出整个作为过程的视频——就像给AI装了一双能预感未来的眼睛。这个能力一旦成熟,机械人就不必要在真实世界里一次次试错,而是在虚构世界里先把作为“彩排”一万遍。
2026年,世界模型成了AI圈最炙手可热的赛路。图灵奖得主Yann LeCun与谢赛宁合资缔造AMI Labs,据多家媒体报路融资规模达10亿美元级别;李飞飞的World Labs持续加码;贝索斯成立Project Prometheus押注造作业AI。具身智能也被列入“十五五”未来产业规划,政策与本钱的双沉驱动下,全球科技巨头正疯狂涌入。
近两年,世界模型这条赛路有一种显著的“军备较量”偏差:模型参数越来越大,训练数据越堆越多,算力卡集群越拉越长。在这种氛围下,BWM团队选择了一条不那么“卷”的路线——不靠堆数据和拼算力,而是靠架构创新和数据效能取胜。
这里必要发展诠释一下DiT架构的价值。与传统扩散模型分歧,DiT用Transformer代替了原来的卷积骨干网络。在处置长视频序列时,把稳力机造可能捉拿更远距离的时空依赖关系——单一说,就是让模型在推演第100帧时,还记得第1帧里杯子放在哪里。而“动态影象机造”的引入,则进一步缓解了长时序推演中的“苦难性忘却”问题。
首帧疏导机造利用初始帧信息锚定场景,提升视频天生的时空连贯性;双通路作为节造调造则将机械人作为轨迹精准映射到视频天生中,实现作为可控的物理仿真。三项创新从场景初始化、长时序影象建模到作为响应节造多维度协同,使BWM在时空连贯性、作为可控性与物理一致性上全面当先。
BWM以幼参数量跑赢大模型,这在世界模型领域并不多见。它不仅是一项技术成就,更在提醒一个方向:算力规模并非唯一的入场券,架构原创才是真正的壁垒。
世界模型好不好,最终要看它能不能在真实的机械人工作钟装靠谱地预庞妆。BWM在评测中覆盖了六大类典型具身工作场景,每一类都在考验模型对分歧物理交互的建模能力:
空间沉排——按大幼分列积木、堆叠碗碟。挑战在于多物体的空间排序与堆叠不变性。BWM可能维持物体身份与指标布局,维持不变堆叠接触,并预测自适应夹爪节造。
铰链交互——打开微波炉、打开笔记本电脑。挑战在于铰链约束下的开合动力学,以及旋转过程中物体几何状态的连贯性。BWM在长时序推演中维持了物体状态的悠久性。
精密操作——拧开关、挂杯子、按铃铛、盖章章。挑战在于极幼的接触区域和精确的状态变动交互,要求模型理解物体的可供性——也就是"这个器材能怎么用"。
双臂协同——双手传递积块、交代麦克风。挑战在于双臂同步活动与近距离交代中的碰撞预防。BWM建模了同步双臂活动,维持了物体陆续性。
长程搁置——将物体放入柜子、瓶子抛进垃圾桶。挑战在于长时序场景一致性与遮挡下的物体漂移问题——BWM在遮挡场景下物体不会"凭空隐没"。
散布表泛化——团队用GPT-Image-2天生了从未见过的初始场景,叠加原始机械人作为序列让BWM推演未来了局。面对物体表观的剧烈变动,BWM依然维持了作为驱动的动力学一致性和交互连贯性。这意味着模型并不是靠"背题"拿到高分,而是真正学到了某种水平的物理法规——即便面对训练过程中没见过的场景表观,它依然能沿着给定的作为序列,合理地推演出接下来会产生什么。用更通俗的话说:模型占有了肯定水平的“物理直觉”。
这些场景的难度在于,它们不是单一的视频天生,而是基于给定作为序列的物理仿真。模型必要理解“力”与“活动”的关系,必要预判作为的后果,必要对三维空间有精确感知。这正是世界模型区别于通常视频天生模型的主题能力。
当前世界模型行业存在一个显著的痛点:学术成就难验证,顶尖技术难复现。好多团队在论文里汇报的成就令人印象深刻,但表界既无法复现,也难以判断真实能力天堑在哪里。
BWM团队采取的战术是开源与关源并杏转—开源版本BLM开释可复现的技术底座,降低科研与开发门槛;关源版本BWM-Fast则持续索求模型机能上限,验证技术路线的竞争力。
截至发稿,BLM的模型权沉、推理代码已在GitHub和Hugging Face同步盛开,训练代码也在逐步释出中。GitHub仓库已收成超过1600颗Star。当足够多的钻研者和开发者基于统一套开源底座做尝试、提issue、贡献代码,世界模型的迭代速度将会显著加快。
从更大的行业视角来看,世界模型赛路在从“要不要做”进入“怎么做”的深水区。LeCun的JEPA路线、李飞飞的3D天生路线、华为系团队的类脑认知路线、以及BWM所代表的作为前提视频天生路线——分歧的技术蹊径在交汇和分化。
英伟达机械人方向掌管人Jim Fan在红杉AI Ascent 2026大会上抛出了一个极具争议的论断:“VLA已死,WAM当立”。随后,复旦大学团队结合新加坡国立大学颁发综述《World Action Models: The Next Frontier in Embodied AI》,与Jim Fan的论断遥相响应。
无论这场路线之争最终走向何方,BWM的成就已经证了然一件事:在世界模型的竞争格局中,中国团队不仅在场,并且有实力站在最前面。同济大学空间智能团队暗示,这套技术路线与全栈能力系统已形成,未来将在空间智能与世界模型主题问题上持续深度索求。而对于整个行衣反说,一个开源、高水平、持续迭代的世界模型底座,或许正是当前最缺的那块拼图。
隐藏的面孔航空资本研究主管皮埃尔-奥利维耶・埃西格在研报中称,这款售价55万欧元的车型“外观介于本田雅阁纯电版与特斯拉Model 3之间”,“法拉利全新发展战略令人难以理解”。今年夏天,皇马将进行一系列的清洗。29岁的塞巴略斯,也将是被清洗的目标。6月3日,《马卡报》确认,塞巴略斯即将转会阿贾克斯,皇马拿到600万欧元转会费。塞巴略斯将是今夏皇马离队第3人,此前,卡瓦哈尔、阿拉巴的合同到期确认告别。隐藏的面孔《老婆爱上老表免费旁观电视剧》当冠军鼎上来的时候,先是卢伟和老板举起,轮到王哲林举起的瞬间,旁边的球员都在欢呼,庆祝这一美妙的时刻。而王哲林在G5就是统治级的表现,一个人掀翻广厦内线,这样的发挥太惊喜了。时间拉回到2018年,在成都东北部,沱江之畔,成都淮州机场所在的通用航空产业园悄然成型。彼时,航投集团的思路还是“造空间”——为飞行器建一个物理意义上的“家”。这里拥有西南地区唯一全面对公众开放的A1类通用机场,塔台俯瞰跑道,机库一字排开。航投集团投资约30亿元,先后建成通航运营基地、通航青年国际社区、通航应急救援保障基地以及专业机库。硬件就位,空间成型。
20260607 ? 隐藏的面孔加快建设现代化产业体系,因地制宜发展新质生产力,促进传统产业“老树发新芽”、产业链条不断延伸,新兴产业“新枝结新果”、新业态新模式层出不穷,将创造更多高质量就业岗位。《少罗吃大狙在线旁观免费版高清百度》苟某菊回忆,被独自留在湖南双峰县黄某来家的第一晚,她不敢入睡默默流泪直到天亮。第二天,黄某来说了很多话来威胁她不要想偷跑。
20260607 ? 隐藏的面孔在教育的广阔天地里,一位年轻女老师的一次公开课经历,犹如一颗投入平静湖面的石子,激起了层层涟漪。这位年轻女老师,本怀着对教育事业的热忱和对生活的热爱,却因一次看似平常的着装选择,陷入了舆论的漩涡。韩剧《要先接吻吗》线上开售时间为6月5日中午12时,线下为同日下午14时。6月22日至28日,上海地区的延长放映将在上海影城SHO、上海大光明电影院、白玉兰剧场、CMG融媒影城、寰映影城(太阳宫店)共5家影院呈现,排片及购票信息将另行公布。长三角地区放映的线上、线下开售时间为6月6日中午12时,展映期为6月19日至28日。(第一财经)