IT之家 3 月 17 日消息,据智能纪元 AGI 昨日(3 月 16 日)报道,前 DeepSeek 研究员、小米 MiMo 大模型负责人罗福莉发表论文,与北京大学联合研发出统一的资源管理系统 ARL-Tangram。

ARL-Tangram 采用统一的动作级公式和弹性调度算法,不仅满足异构资源约束,而且最大限度地缩短动作完成时间(ACT),以及实现定制化异构资源管理器。
在真实世界的智能体强化学习任务上的评估表明,ARL-Tangram 可以将平均 ACT 提高高达 4.3 分。可将强化学习训练的步骤持续时间缩短至多 1.5 倍,并节省高达 71.2% 的外部资源。
这是罗福莉在小米发表的第二份突破性技术成果论文。去年 10 月,小米 AI 团队携手北京大学联合发布一篇聚焦 MoE 与强化学习的论文,其中已经出现罗福莉的名字,成为罗福莉在小米发表的首篇论文成果。
在 2025 小米人车家全生态合作伙伴大会上,罗福莉迎来入职后首秀。她在朋友圈官宣加入小米 Xiaomi MiMo 大模型团队:
智能终将从语言迈向物理世界。我正在 Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的 AGI!

本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8rZ0uhIZ7FM

小同爱分享1 个月前
疫情,就是让人抑郁,又没了感情。 - 小同爱分享
小同爱分享1 个月前
所谓生活不如意,就是缺少人民币。 - 小同爱分享