AI智能体2小时击败人类,引爆贝叶斯推理革命!仅用10%数据训练秒杀大模型

新智元报道
新智元报道
【新智元导读】就在刚刚,Verses团队研发的Genius智能体,在Pong中超越了人类顶尖玩家!而且它仅仅训练2小时,用了1/10数据,就秒杀了其他顶级AI模型。

打造最强AI智能体,LLM并非良策


1张A100,训练2小时





从左到右滑动:IRIS 10k/2h,IRIS 10k/2d,Genius 10k/2h


特别是在第五局比赛中,当训练进行到接近9,000步时,尽管电脑以14:3大幅领先,但Genius随后展现出显著的学习能力,开始持续得分,直至训练步数耗尽。







从左到右滑动:IRIS 10k/2h,IRIS 10k/2d,Genius 10k/2h
怎么做到的?





Genius智能体在三个经典游戏中的面向对象预测能力:图中的渐变点展示了智能体对游戏中物体当前位置及其未来轨迹的预测推理
从AlphaGo到Atari,AI智能体新标准



广泛的商业应用前景
据估计,OpenAIo3单次任务的成本可能超过1,000美元
