- 学习OpenAI和DeepSeek,开始引入思维链
下面,我将详细讲解每一段内容!感兴趣的可以继续阅读!Grok 3由搭载10万颗英伟达H100 GPU的“Colossus超级计算机”训练完成,计算量较前代Grok 2提升十倍。(这符合老马一贯思路,从特斯拉的电池,再到spaceX的发动机,最后到如今的xAI都是如此)xAI仅用122天建成首个10万GPU集群,后续扩展至20万GPU仅耗时92天,训练效率显著提高。数据中心建设
xAI在孟菲斯利用闲置工厂快速部署数据中心,采用液冷系统解决散热问题,并通过Tesla Megapack电池和移动发电机优化电力供应(供电规模达250兆瓦)。团队通过定制化网络配置和实时调试,确保10万GPU的高效协同。
学习OpenAI和DeepSeek,Grok3引入思维链
Grok 3首次引入类人类的分步推理机制(思维链),能拆解复杂任务(如数学定理证明、火箭轨道优化)并展示推导过程。现场演示中,用将《俄罗斯方块》与《消消乐》融合成新游戏并生成可运行代码。这段代码运行流畅,但是运行到最后有一个行没消除,还是有bug。马斯克要求 Grok-3 生成代码,绘制飞船在地球和火星间往返的动画。(黄色是太阳,蓝色地球,红色火星,绿色是飞行器)这个过程相对还是很复杂,需要考虑很多因素。整体生成效果也是不错的,但是对比OpenAI生成的效果,其实差距不明显。但是直播展示时候,每次生成都要输入3次问题。其实这个再演示过程不常见。OpenAI等演示时候不会连续输入,因为都是预设好的问题,模型回答会比较稳定。xAI这么做,可以看出其稳定性还是有点问题,需要通过3次回答选择最优解。在数学推理、科学逻辑推理、代码生成等多项测试中,Grok 3及精简版Grok 3 mini均超越GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro。Chatbot Arena(LLM竞技场)得分1400分,全类别排名第一,推理能力被评价为“世界第一”这个评分大家看法也是各种各样,有的觉得这就是当之无愧的第一。也有的认为10w块GPU训练出来的就领先20分?就领先几千块训练出来的Deepseek 40分?是不是有点太少了?评分肯定是第一了,但是这个成绩是成功还是失败,欢迎大家评论!DeepSearch搜索引擎
定位为“下一代搜索引擎”,可自主理解用户意图、交叉对比信源并生成推测性结。例如,搜索时不仅返回现有资料,还能推测用户深层需求
语音交互与订阅服务
语音模式计划一周内推出早期版本,支持自然对话体验;
优先向X Premium+用户开放,SuperGrok订阅提供额外权限(如无限图像生成、DeepSearch查询)。
开源计划
xAI将在Grok 3完全成熟后开源前代模型Grok 2,Grok 3的开源需等待数月。
好了,今天的内容就分享到这里希望你们喜欢!欢迎关注、点赞和分享!