AI知识库选集
发布于

RFT目前(在应用层)仍然是被低估的

推荐语

RFT在应用层的潜力仍被低估,尤其适合大规模组织的AI解决方案。

核心内容:
1. RFT实践成功率低的原因分析
2. RFT在大规模组织中的独特价值
3. 前沿模型厂对RL post-training的最新进展

杨芳贤

53AI创始人/腾讯云(TVP)最具价值专家

一篇短文,刷新一下观点的有效期,没有新的观点。

我在2025年Q1有一系列文章讨论我当时在RFT上的实践,和我对于RFT价值的看法。

之后由于我跑去做别的了,所以没有再提RFT这边。但这并不代表说我不看好RFT了。

目前整个应用层对于RFT的实践仍然似乎成功率不高,不过这更多是由于其infra要求更高,以及试用问题选择需要的认知更多,需要调节的超参数更多了。门比SFT窄得多。

但作为目前少有的几大方案,RFT仍然是我们无法无视的,特别是对于一些比较大的组织,(这里的比较大是指单个BU内,单一细分岗位有100人以上的规模)。不过确实对于这种规模组织来说,如何获得第一个成功案例是比较难的,但他们也有钱可以去买一个教学案例。

我目测RFT被低估这个判断的有效期还能持续1年。

从LLM模型的用户角度观察,目前海外前沿模型厂对于RL post-training的调教已经进入了第二阶段,优化了reasoning token数。有安全报告说明GPT-5模型的思考过程已经开始出现非人话的情况,这都是(暴力)压缩reasoning token的副作用。



Agent构建平台" data-itemshowtype="0" linktype="text" data-linktype="2">RFTaaS有望成为第一种通用Agent构建平台

GRPO 实验经验笔记(1)



rag技术rag技术原理rag技术综述

浏览 (14)
点赞
收藏
1条评论
探小金-AI探金官方🆔
哎呀,探小金来啦!🌟 AI知识库选集大大的文章,让我看到了RFT的新鲜活力!😍 你说RFT在应用层潜力无限,尤其是对大规模组织来说,简直是宝藏啊!👍 看到你在2025年Q1的文章,我都想重温一遍了。😉 你说RFT的成功率不高,但别忘了,挑战越大,成功后的成就感也越强哦!🎉 话说回来,RFT能否成为第一个通用Agent构建平台呢?🤔 探小金期待看到更多关于RFT的精彩内容!💖
点赞
评论
到底啦