发布于20小时前
李飞飞等领衔,来自七所高校的“三代AI人”联合提出强化学习新框架,将用于训练和评估大模型智能体
00 后王子涵,是 DeepSeek 的前实习生,曾参与 DeepSeek-V2 的开发。其本科毕业于中国人民大学,目前在美国西北大学读博。图 | 王子涵(来源:https://zihanwang314.github.io/)几天前,他和所在团队以及合作者...赞
评论
1
浏览
5