首页 > 快讯 > 快讯详情

阿里通义实验室智能计算团队推出新算法FIPO

2026-04-07

格隆汇4月7日｜阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL机制，奖励关键Token，解决纯强化学习（Pure RL）训练中“推理长度停滞”难题。据该团队介绍，在32B规模的纯RL设定下，率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。

事件播报

时代电气(03898.HK)6月18日耗资6463.93万港元回购162.15万股

港股公告摘要刚刚

信利国际(00732.HK)6月18日耗资92万港元回购100万股

港股公告摘要 2分钟前

斯瑞新材(688102.SH)：拟投资9.19亿元建设“电热功能材料研发制造基地建设项目”

A股公告摘要 2分钟前

阿里通义实验室智能计算团队推出新算法FIPO

时代电气(03898.HK)6月18日耗资6463.93万港元回购162.15万股

信利国际(00732.HK)6月18日耗资92万港元回购100万股

斯瑞新材(688102.SH)：拟投资9.19亿元建设“电热功能材料研发制造基地建设项目”