昊梵体育网

[LG]《Optimized Deferral for Imbalanced S

[LG]《Optimized Deferral for Imbalanced Settings》C Cortes, A Mao, M Mohri, Y Zhong [Google Research & Courant Institute of Mathematical Science] (2026)

在多专家决策中,如何把输入分配给合适专家是一个悬而未决的难题。过去的方法受困于专家使用极度不均,本质原因是训练只对标签平衡建模,却忽略“专家分布”失衡。

本文的核心洞见是:把“选择专家”重新看作“带成本的分类问题”。由此,引入面向输入-专家对的代价敏感学习,关键操作使模型直接优化“选谁更划算”。

这项工作真正留下的遗产是将路由问题纳入统一学习框架。它为后来者打开的新门是低成本调用多模型系统,但尚未跨过的门槛是成本建模与真实分布匹配。

arxiv.org/abs/2604.27723 机器学习 人工智能 论文 AI创造营