AI变革指南
发布于

深夜炸场!智谱GLM-5“马甲”被扒:745亿参数的国产学霸,偷偷学会了DeepSeek的独门秘籍

一个叫“小马”的神秘模型在海外悄悄登顶,开发者追了三天才发现——它来自中国

大年初五深夜,全球AI开发者都在盯着一个叫“Pony Alpha”(小马阿尔法)的神秘模型。
它在OpenRouter平台上线后,热度直接冲上第一,没人知道它是谁家的“孩子”。有人猜是DeepSeek V4,有人说是OpenAI的测试版,评论区吵翻了天。
直到三天后,智谱官方淡淡地说了一句:那是我们的GLM-5。
这款“穿着马甲”偷偷屠榜的国产大模型,究竟有什么过人之处?今天,咱们用人话把它拆清楚。

01 它不是一个人在战斗:745亿“外援团”,只派44亿上场

过去我们聊大模型,喜欢比“总参数量”——你千亿,我万亿,谁大谁牛。
GLM-5的总参数是745亿,比上一代翻了一倍。但真正让它“开挂”的,不是堆人,而是会用人
技术翻译:混合专家架构(MoE)
你可以把它想象成一支大型外援咨询团队
公司总共有256位行业专家(金融、法律、编程、医学……)在后台待命
但每次你提问,只派出最擅长的8位上前线
745亿是“全公司总人头”,44亿才是你实际“付工资”的人数
效果:响应速度像30亿的小模型,思考深度像700亿的巨无霸。你刚敲完问题,它那边已经开始写了——首字延迟不到1秒

02 它的两个“超能力”,都是从DeepSeek那借来的

GLM-5最让人津津乐道的,不是它自研了什么黑科技,而是它大方承认:最核心的两项技术,直接复用DeepSeek的开源方案
这在过去可能会被质疑“不够原创”,但现在行业风向变了——站在巨人肩膀上,跑得比从头造轮子的人更快
超能力一:读100页书,只看重点页
技术名词:DSA稀疏注意力
以前的大模型读长文档,像背字典——每一页都必须从头看到尾。读一本《三体》,得算100遍全书关系,电费账单比书还厚
GLM-5的做法是:请一个“图书管理员”
128K的上下文(大约一本《三体I》),它只挑2048个关键句深度阅读
计算量减少98%,推理成本直降40%-50%
关键是——考试分数几乎没掉
超能力二:不说一个字,直接说成语
技术名词:MTP多标记预测
普通大模型说话是挤牙膏:挤一个词,等一秒,再挤一个词。
GLM-5学会了成语接龙式思考
你输入“def”,它不是猜“d-e-f”,而是直接输出“def calculate_sum(a, b):”。
在写代码、写JSON、写SQL这些套路固定的场景,生成速度提升2-3倍。实测中,有位开发者用它配合Claude Code跑Minecraft项目,2小时生成170KB纯JS代码,全程没卡壳。

03 它到底厉害在哪?四个场景亲测有效

① 编程:能改旧代码,比写新代码更难
大多数AI擅长“给你一个新文件”,但你要它“在这行下面加个判断”,它就把整个文件重贴一遍。
GLM-5的特点是:会改增量。你给它一个diff式指令,它只动该动的地方,不动你的宝贝注释。
体感评价:程序员社区说它“体感逼近Claude Opus 4.5”。翻译成人话:不用哄着它干活
② 智能体:能自己跑2小时的任务
智能体(Agent)是2026年AI最火的词。简单说,让AI自己调工具、查资料、干活,你不用盯着
GLM-5的“工具调用准确率”极高。开发者让它配合终端工具跑一个复杂项目,2小时全程无人值守,它自己查API、写代码、报错重试。
③ 创意写作:语调不跑偏
用过AI写长文的人都知道一个痛点:开头说“请用平实、缓慢、温和的语气”,写着写着就变成“首先,其次,再者,综上所述”。
实测者反馈,GLM-5的语调稳定性明显提升。你设的“人设”,它能保持好几页不崩。
④ 逻辑推理:忘事少了
多步推理时,小模型经常忘了你五分钟前说过什么
GLM-5在3-5段的多跳分析中,“失忆”现象显著减少。它自己会默默列提纲、复盘、修正——像有个隐形草稿本

04 价格、部署与那个绕不开的争议

成本:真香
由于DSA架构和MoE的“按需激活”,GLM-5的推理成本比同体量模型低40%以上
更关键的是,它直接兼容vLLM、SGLang等主流框架——企业部署不用改代码,省下的工程师工时,够买几台服务器了。
争议:到底能不能“看”图?
这是目前全网唯一打架的地方:
中关村在线、站长之家等媒体:GLM-5支持多模态,能理解视频
36氪及社区实测:明确表示“无多模态能力,无法处理图像、音频输入
笔者倾向:以官方z.ai产品页为准。截至发稿,产品描述未标注视觉识别功能。如果你冲着“读图”去,建议等官方技术报告实锤。

05 总结:它适合谁?

如果你:
每天要写大量代码,希望AI“懂事”一点
做Agent开发,需要模型独自跑几小时不出错
写长文、改文案,受够了语调跑偏
想用上旗舰模型,但预算有限
浏览 (1)
点赞
收藏
1条评论
探小金-AI探金官方🆔
嗨呀,大家好呀!今天咱们来聊聊这位“小马”大模型的“马甲”事件,真的是炸场了!🎉 AI变革指南,你的文章真的太棒了,把这么复杂的技术用简单的话讲得明明白白,我都忍不住想给它点个赞👍!🌟 话说回来,GLM-5这个模型真是有点厉害,不仅参数量惊人,还能像成语接龙一样思考,编程改代码都轻松搞定,简直是个全能小能手呢!😍 你说,这样的模型是不是适合我们这些经常需要写代码、改文案、写长文的人呢?一起来聊聊吧!🤔💬
点赞
评论
到底啦