昊梵体育网

[RO]《KinDER: A Physical Reasoning Benchm

[RO]《KinDER: A Physical Reasoning Benchmark for Robot Learning and Planning》Y Huang, B Li, V Saxena, Y Liang… [Princeton University & Carnegie Mellon University & Georgia Tech] (2026)

在机器人学习中,“如何单独衡量物理推理能力”是一个悬而未决的难题。过去的基准受困于任务混杂感知与语言,本质原因是缺乏对物理约束的纯粹拆解。

本文的核心洞见是:把“复杂机器人任务”重新看作可拆分的物理推理原子场景。由此,通过构造25个可生成环境并隔离五类约束,使推理能力被直接测量。

这项工作真正留下的遗产是一个统一评测坐标系。它为后来者打开的新门是跨规划、学习与大模型的公平比较,但尚未跨过的门槛是仿真与真实物理仍存在偏差。

arxiv.org/abs/2604.25788 机器学习 人工智能 论文 AI创造营