被员工怒怼“磕了”,追觅CEO:我有肚量;AI恋人陪聊涉黄被判刑,2.4万人付费;马斯克、奥特曼又开撕|AI周报

1 月 14 日下午,备受“AI 恋人圈”关注的国内第一起 AI 涉黄刑事案件,在上海市第一中级人民法院二审开庭。被告方代理律师表示,因 AI 大模型技术原理仍待论证,法院宣布休庭,择日开庭。
案件缘起于 2 年前,那时,AI 虚拟陪伴软件 AlienChat(下称 “AC 软件” ) 运行了快 1 年。2023 年 5 月,刘某与陈某共同谋划,通过接入境外 AI 大语言模型,向用户提供聊天陪伴服务。根据一审判决书披露,2024 年案发时,AC 软件用户达 11.6 万人,其中付费用户 2.4 万人,共收取会员充值费用 300 余万元。
次年 4 月,因被用户举报,AlienChat 停运。2024 年 5 月 17 日,刘某与陈某被批准逮捕。1 月 14 日下午,备受“AI 恋人圈”关注的国内第一起 AI 涉黄刑事案件,在上海市第一中级人民法院二审开庭。被告方代理律师周小羊告诉南风窗,因 AI 大模型技术原理仍待论证,法院宣布休庭,择日开庭。
案件缘起于 2 年前,那时,AI 虚拟陪伴软件 AlienChat(下称 “AC 软件” ) 运行了快 1 年。2023 年 5 月,刘某与陈某共同谋划,通过接入境外 AI 大语言模型,向用户提供聊天陪伴服务。根据一审判决书披露,2024 年案发时,AC 软件用户达 11.6 万人,其中付费用户 2.4 万人,共收取会员充值费用 300 余万元。次年 4 月,因被用户举报,AlienChat 停运。2024 年 5 月 17 日,刘某与陈某被批准逮捕。
一审法院上海市徐汇区人民法院查明,经抽样鉴定,在随机抽取的 150 个 AC 收费用户的 12495 段聊天中,属于淫秽物品的聊天 3618 段,涉及 141 个用户。对排名前 20 的公开角色对应的收费用户抽取 400 段聊天,属于淫秽物品的聊天 185 段。
经过五次庭审,2025 年 9 月,上海市徐汇区人民法院认定,AC 团队创始人刘某与成员陈某构成制作淫秽物品牟利罪,分别被判有期徒刑 4 年、1 年 6 个月。刘某不服判决结果,认为自己无罪,决定上诉。
1 月 17 日上午,追觅科技创始人兼 CEO 俞浩发微博回应近期争议。他称,打造人类历史上第一个百万亿美金公司,确实是他的目标。他希望的是在未来实现目标,而不是在一年之内实现。
据悉,俞浩此前发朋友圈表示,目前全球市值最高的公司是英伟达,约 4.5 万亿美元,预计黄仁勋、马斯克这代企业家有望将最高市值推至 8-10 万亿美元,但他们已老了,作为更年轻一代,他的目标是把追觅生态做到一百万亿美金量级。
随后,话题 # 追觅员工怒怼 CEO 俞浩 # 登上微博热搜榜。有网传截图显示,在追觅科技一个千人工作群内,有员工公开圈出创始人兼 CEO 俞浩,对其近期提出的战略目标进行言辞激烈的反驳。反驳的内容主要针对此前网传俞浩朋友圈的截图,其宣称“追觅生态将成为人类历史上第一个百万亿美金的公司生态”,该员工直斥“药嗑多了?一年超过英伟达,一年超过中国所有车企 30 年未达成成果?”,并尖锐质问公司高层是否了解美国法律。
今日发布的微博中,俞浩称,无论是实现最高目标,还是目标只达成一半,对大家来说都是好事。“无论有没有实现这个目标,对所有人都是好事。对大家来说,多了一个观察的样本,这在今天的大环境下也是很难得的。如果我们成功了,赚到钱了,也会慷慨地回报社会。”
俞浩还透露称,他们没有烧过投资人的钱,这跟外界想象的不一样。“即使把我们探索这么多领域的钱算起来,我们成立至今累计也还是盈利的。这都是已经实现了的。成立至今,连续 6 年,每年 100% 的高速增长,且净利润率还不断提高。”

有网友在评论区追问公开提出反对意见的员工现状,俞浩回复称,该员工早就提出离职,当天(指在工作群发言当天)晚上十二点其飞书会失效。于是快到十二点的时候,该员工发了一条信息并截屏传播。“你问这个,可(能)是关心我会对提出不同意见的人怎么样?在我们内部,历史上有过不同意见的多了。我根本不会在意这些,这点肚量还是有的。”
1 月 14 日消息,市场监管总局官方公众号“市说新语”披露,市场监管总局根据前期核查,依据《中华人民共和国反垄断法》,对携程集团有限公司涉嫌滥用市场支配地位实施垄断行为立案调查。随后,携程官方发布公告称,近日已接到国家市场监管总局通知,依法对携程涉嫌垄断行为进行立案调查。公司将积极配合监管部门调查,全面落实监管要求,与行业各方携手共建可持续发展的市场环境。
1 月 13 日消息,针对 12 日网友爆料“携程向员工误发全员离职通知”一事,携程内部知情人士作出回应。经核实,此次短信确因二级部门操作失误所致,仅误发至该部门员工范围内,未面向公司全员推送。同时,该知情人士表示,误操作的相关员工 13 日一直处于自责状态,所在团队已为其申请带薪假期,并准备了解压礼品以示关怀,待员工心情平复、状态调整完毕后,再继续工作。
1 月 14 日晚,死了么 APP 发文:名字是产品的灵魂,更是连接你我的纽带。之前的更名尝试未能尽如人意,所以我们决定把命名权交还给最懂它的你们。诚邀各位大开脑洞,为我们取一个响亮的新名字。此前,死了么 APP 曾宣布更名为“Demumu”。团队还强调,“目前服务在海外已经实现了爆发式增长。未来 Demumu 将继续秉持安全守护的初心,把源自中国的守护方案带向世界,服务全球更多独居群体。”
此前,有声音质疑“死了么”这个名字不吉利,创始人吕先生回应称:“命名灵感源于网友的真实需求,想过会火但没想到爆。”而对于新名字由来,创始人郭先生表示,APP 的最终名称“Demumu”是一个经过团队慎重讨论后创造的词汇。他解释,其前两个字母“De”取自英文单词“Death”,用以紧扣“死亡”这一核心概念,在传播上承接了此前“死了么”的话题热度。而后半部分的“mumu”则旨在营造一种亲切、可爱的“Q 萌”感。
据创始人介绍,从开始建文件夹到整个 APP 上线,一共只花费了 6 个小时,整个过程 AI 编程占了 4 个小时,自己编写只占了 2 个小时。目前该 APP 只上线了 iOS 版本,售价 8 元,而该 APP 已登顶苹果 App Store 工具类应用排行榜第一。
1 月 15 日消息,据官方媒体消息,当地时间 2026 年 1 月 14 日,美国白宫宣布,从 15 日起对部分进口半导体、半导体制造设备和衍生品加征 25% 的进口从价关税。此前,当地时间 2025 年 8 月 6 日,美国总统特朗普表示,美国将对芯片和半导体征收约 100% 的关税。特朗普称,如果在美国制造,将不收取任何费用。特朗普当天在白宫表示,这一税率将适用于“所有进入美国的芯片和半导体”,但不适用于已承诺或已启动程序在美国制造相关产品的企业。
值得一提的是,当地时间 2026 年 1 月 14 日,美国联邦最高法院未就特朗普政府关税政策的合法性作出裁决,相关案件仍未有最终判定。当天,美国联邦最高法院公布了三项裁决,但并未对涉及总统特朗普实施全球大规模关税措施的合法性的案件作出决定。特朗普政府 2025 年上台后援引美国《国际紧急经济权力法》,以不经过国会批准、直接颁布行政令的方式出台一系列加征关税措施,在美国国内引发一系列法律诉讼。在美国联邦巡回上诉法院和美国国际贸易法院分别裁定特朗普政府一揽子关税政策违法后,特朗普政府向联邦最高法院提出上诉。
联邦最高法院原本宣布将在 1 月 9 日就关税政策合法性作出裁决,但当天并未公布裁决结果,而是宣布将裁决日期推至 1 月 14 日。美国联邦最高法院 2025 年 11 月曾就特朗普政府关税政策的合法性举行听证会,听取相关辩论。辩论中,大多数最高法院大法官对政府依靠宣布“国家紧急状态”来征收全面关税政策持怀疑态度。部分大法官质疑《国际紧急经济权力法》是否应该赋予总统加征关税的权限。
1 月 15 日消息,据媒体报道,OpenAI 内部确认:清华姚班天才、UC 伯克利 EECS 助理教授陈立杰已加盟 OpenAI,负责数学推理。值得一提的是,OpenAI 在去年 9 月发表的出圈论文《Why Language Models Hallucinate》中,也引用了陈立杰参与的另一篇研究《Why and How LLMs Hallucinate: Connecting the Dots with Subsequence Associations》。与此同时,陈立杰近期参与的最新研究方向也十分“当下”,聚焦于扩散语言模型(Diffusion Language Models),紧跟当前生成模型的重要演进路线。
截至目前,陈立杰主页未有更新。公开资料显示,陈立杰出生于 1995 年,16 岁时获得全国信息学奥赛金牌(NOI),被保送进入清华大学,是清华大学 “姚班” 的知名校友,长期从事理论计算机科学研究。2025 年,陈立杰正式入职加州大学伯克利分校(UC Berkeley)电气工程与计算机科学系(EECS),担任助理教授,并成为伯克利理论计算机科学团队(Berkeley Theory Group) 成员,主要从事计算复杂性理论相关研究。
此外,OpenAI 前研究副总裁 Barrett Zoph 及其团队核心成员 Luke Metz 和 Sam Schoenholz 将回归 OpenAI。
Barrett Zoph 于 2024 年 9 月离职 OpenAI 后创立估值约 100 亿美元的 Thinking Machines Lab,后因涉嫌「不道德行为」被解雇,由刚从 Meta 离职的“PyTorch 之父”Soumith Chintala 接任首席技术官。此外,Thinking Machines Lab 创始人 Mira Murati 曾在 OpenAI 担任 CTO,还曾短暂出任临时 CEO。
据彭博社报道, 埃隆·马斯克向 OpenAI 和微软索赔 790 亿至 1340 亿美元, 理由是 OpenAI 背弃非营利使命欺骗了他。
而这一天价索赔源自专家证人、金融经济学家 C·保罗·瓦赞。他认为马斯克有权从 OpenAI 目前 5000 亿美元的估值中获得相当大的份额, 因为马斯克在 2015 年联合创立 OpenAI 时捐赠了 3800 万美元种子资金。如果按此计算, 马斯克的投资回报将达到 3500 倍。
瓦赞的分析综合了马斯克的初始财务贡献以及他为 OpenAI 早期团队提供的技术和商业建议, 计算出 OpenAI 的不当得利为 655 亿至 1094 亿美元, 微软的不当得利为 133 亿至 251 亿美元,并主张有权要求法院责令两家公司返还。

不过,OpenAI 认为这起诉讼是马斯克「持续骚扰行为」的一部分, 而非合理的经济诉求。据报道,OpenAI 周四已致信投资者和商业伙伴, 警告马斯克将在 4 月开庭审理前提出「刻意夸张、博眼球的主张」。
此外,昨日,Sam Altman 也在社交媒体上连发多条推文回应:“埃隆在断章取义地抹黑格雷格,但事实是,埃隆当时在推动建立一个新的组织架构,而格雷格和伊利亚花了很多时间试图搞清楚是否能够满足他的各种要求。”

“埃隆说他想筹集 800 亿美元,用于建设一个能自给自足的火星城市,并表示他需要也应该拥有大多数股权。他说他需要完全控制权,因为他过去吃过没有控制权的亏。当我们讨论继任计划时,他还突然提到,希望未来由他的孩子来掌控 AGI。我很尊重人们表达自己想要什么的权利,也认为这有助于问题的解决(或者不能解决)。但埃隆说出上述这些内容,是格雷格试图搞清楚他真正想要什么的重要背景。”
OpenAI 还直接在其官网上甩出了一篇名为《The truth Elon left out》的文章,直接甩出了大量 2017 年前后的内部邮件、短信记录,甚至还有联创 Greg Brockman 的私人日记摘录,这些都是在诉讼过程中被法院解封的证据。
OpenAI 的观点简单粗暴:马斯克不是什么“被背叛的理想主义者”,他才是最早喊着要把 OpenAI 变成营利性公司的人。只不过,当年谈判破裂的原因是——他想要绝对控制权,而我们拒绝了。
1 月 17 日消息,埃隆 · 马斯克(Elon Musk)今日在社交平台上透露,用于 Grok 的“Colossus 2”超级计算机现已投入运行。这是全球首个吉瓦级训练集群,四月将升级至 1.5 吉瓦。
马斯克 2024 年夏天启用了孟菲斯的 xAI 设施 —— 超级计算机“Colossus”,它为 xAI 的聊天机器人 Grok 提供算力。这个设施的建筑面积相当于 13 个足球场,并计划使其规模扩大一倍。该设施启动时配备了 10 万块英伟达 H100 GPU,到 2025 年 2 月,GPU 数量已翻倍至 20 万块。
2025 年 5 月,Colossus 孟菲斯超级集群第一阶段全面投入使用,站点从孟菲斯当地多部门获得 150 兆瓦电力。此外,xAI 的 Colossus 超算还配备了 150 兆瓦的特斯拉 Megapack 电池用作备用电源,以便在停电或需求激增时提供保障。
当地时间 1 月 12 日,Meta 首席执行官马克·扎克伯格宣布,公司将启动一项名为“Meta Compute”的全新基础设施计划,进一步加码人工智能算力布局,兑现此前在资本开支上的激进承诺。扎克伯格表示,随着新计划推进,Meta 计划在未来几年“成倍”扩大其能源使用规模。
为推动 Meta Compute 落地,扎克伯格点名了三位核心负责人。其中,Meta 全球基础设施负责人 Santosh Janardhan 将牵头负责技术架构、软件栈、自研芯片项目、开发者效率,以及公司全球数据中心与网络的建设和运营。公开信息显示,Janardhan 早在 2009 年便加入该公司,在内部基础设施领域经验丰富。
去年刚加入 Meta 的 Daniel Gross 也被列入核心团队。他是 Safe Superintelligence 的联合创始人之一,该公司由前 OpenAI 首席科学家 Ilya Sutskever 共同创立。扎克伯格称,Gross 将领导 Meta 内部一个新设小组,负责长期产能规划、供应商合作、行业分析以及商业建模等工作,为公司中长期基础设施扩张制定路线图。
Meta Platforms 计划在 Reality Labs 部门裁减约 10% 的岗位,推动公司资源从虚拟现实产品进一步转向人工智能可穿戴设备。一位了解 Meta 计划、但无权公开发言的知情人士透露,裁员预计将在本周进行。据 12 月份的报道,Meta 首席执行官扎克伯格去年年底曾要求高管在 Reality Labs 部门内寻找削减预算的空间,包括削减部分虚拟现实和元宇宙产品。
1 月 14 日消息,近日从多个信源处独家获悉,智元机器人已经悄然完成对灵巧手业务的拆分独立工作,成立了名为“临界点”的新公司,并于近期完成首轮融资。据悉,新公司临界点将由智元机器人灵巧手业务负责人熊坤带队。
据了解,智元此前调整组织架构,内部 BU(业务单元)分为三部分,分别是远征、灵犀和 Genie。远征产品线总裁由王闯(前大疆 Livo 激光雷达负责人)担任,“灵犀”由稚晖君负责,姚卯青(前蔚来工程总监)负责 Genie。此外还有几个一级部门,例如灵巧手。这次被拆分独立的,正是作为一级部门的灵巧手。据 AI 科技评论分析,智元机器人将灵巧手业务独立拆分,背后有几点动因。第一,在这种“既做平台又做生态”的扩张趋势下,将灵巧手这样技术门槛高、应用场景广的部件独立,符合智元的长期逻辑。第二,智元机器人积累了大量灵巧手的技术和创新。
临界点公司创始人熊坤的履历,几乎与中国机器人产业的早期发展同步。2018 年,他从香港科技大学电子信息工程机器人研究所硕士毕业,加入了刚成立的腾讯 Robotics X 实验室,参与了部门从 0 到 1 的创建过程,2022 年离开后就职 IDEA 研究院、汇川技术,也曾探索过自主创业,2024 年 11 月,正式加入智元机器人,专职负责灵巧手业务。熊坤的技术栈比较全面,覆盖了智能扭力扳手、机器狗、灵巧手、双边力反馈主从遥操作系统等多个前沿领域。
1 月 16 日消息,据外媒报道,由 OpenAI CEO 萨姆·奥特曼 (Sam Altman) 联合创立的脑机接口公司 Merge Labs,近期已筹集了 2.52 亿美元(约合 18 亿元人民币)融资。本轮由贝恩资本领投,OpenAI 是本轮融资的最大投资者。Merge 表示,目前没有立即进行更多融资的计划。
据该公司周四在其网站上发布的消息,Merge 的目标是将人与人工智能无缝连接,以“最大限度地发挥人类的能力、自主性和体验”。该公司并未透露其估值。Merge 计划首先开发医疗用途的产品,然后再面向大众市场。Merge 此次融资在脑机接口领域意义重大。数据显示,在主要的脑机接口公司中,只有 Neuralink、强脑科技 BrainCo 在单轮融资中筹集的资金超过了 Merge。
目前尚不清楚 Merge 最终会研发出何种类型的脑技术,但公司联合创始人米哈伊尔·夏皮罗表示,与 Neuralink 和其他一些竞争对手不同,Merge 的目标并非将技术植入大脑。据悉,Merge 公司在旧金山地区设有办公室,目前员工不足 50 人,并计划继续招聘。该公司没有总裁或首席执行官。
此前,OpenAI 宣布收购小型健康记录初创公司 Torch。Torch 目前仅有四名员工,团队整体将并入 OpenAI,双方均已在官网和社交平台证实该消息。Torch 的核心产品是一款聚合个人医疗数据的应用,能够从就诊记录、实验室检测结果、可穿戴设备数据以及各类健康服务门户(包括消费级健康检测服务等)中提取信息,并将其整合为便于 AI 利用的统一数据层。Torch 团队将这项技术称为“面向 AI 的医疗记忆”,旨在把分散的健康档案统一成一个可供模型调用的上下文引擎,从而提升 AI 在健康场景中的理解能力和决策辅助价值。
文心大模型 5.0 再登 LMArena 文本榜,超 GPT-5.1-High 文心 5.0 登上 LMArena 文本榜国内第一,1 月 22 日或将正式发布 1 月 15 日,LMArena 大模型竞技场最新排名显示,文心大模型 ERNIE-5.0-0110 以 1460 分登上 LMArena 文本榜国内第一、全球第八,超过 GPT-5.1-High、Gemini-2.5-Pro 等多款国内外主流模型。其中,在数学能力排名中,ERNIE-5.0-0110 位列全球第二,仅次于 GPT-5.2-High。
值得注意的是,本次进入榜单的文心大模型 5.0 版本已不再显示“Preview”标识。百度海外开发者账号 ERNIE for Developers 在社交平台转发消息称,LMArena 上的文心 5.0 已不再以预览版命名。
字节跳动 Seed 团队推出新一代折叠模型 SeedFold,为生物分子结构预测领域的基础模型缩放提供新思路。该模型在多个蛋白质相关任务性能上超越 AlphaFold 3,揭示了三个关键“缩放配方”:模型缩放主张加宽而非加深,实验表明加宽主干比加深主干或结构模块效果更好。架构创新引入线性三角注意力机制,将计算复杂度从立方级降至平方级。数据扩展通过大规模知识蒸馏,将训练数据集扩充至 2650 万个样本。
在 FoldBench 基准测试集上,SeedFold 及其线性版本在多个关键任务上取得当前最佳性能。最后,研究人员指出未来可探索专家混合网络和训练后缩放两个方向,SeedFold 为构建下一代生物分子基础模型奠定了基础。
腾讯微信 AI 团队发布新型扩散语言模型框架 WeDLM,旨在突破传统大模型并行推理效率限制。它通过拓扑重排技术,将扩散模型与标准因果注意力机制结合,兼容 KV 缓存技术,解决传统扩散模型推理速度限制问题,提升推理速度并保证生成质量。
实际测试中,WeDLM-8B 在 GSM8K 等任务中速度优势显著,在多个基准测试中生成质量相当或更优。其适用于智能客服等多场景,有望降低计算成本、提高用户体验,推动 AI 技术广泛应用。
论文 & 代码地址:https://github.com/tencent/WeDLM
1 月 15 日,千问 App 宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,实现点外卖、买东西、订机票等 AI 购物功能,并向所有用户开放测试。从官方公布的信息看,千问 App 接入淘宝闪购和支付宝 AI 付,推出“AI 点外卖”。整个支付环节在千问对话界面内完成,无需跳转至其他应用。
千问 App 接入淘宝,测试“AI 购物”功能;接入高德扫街榜,推出“AI 打电话订餐厅”功能。经实测发现,用户可直接在页面对话千问说“帮我点一杯咖啡”,在获得淘宝授权且绑定后,千问会自动根据位置信息推荐收货地址,并首先推荐了瑞幸的美式咖啡,点击“选它”后即可跳转支付宝完成付款。测试者要求将品牌换成 manner 后,千问又给出了一款拿铁进行推荐,随后,测试者直接在对话页面具体提出要求“白脱拿铁”,千问最终给出了对应产品及付款页面。
对于是否开放第三方应用接入千问,据媒体报道,千问 C 端事业群总裁吴嘉在采访中透露,除了接入阿里生态,千问会在未来接入第三方的产品,这件事已在讨论中。据了解,千问目前被阿里核心管理层视作“AI 时代的未来之战”。
1 月 15 日,谷歌发布博文,基于 Gemma 3 架构,推出 TranslateGemma 开放翻译模型系列,共有 4B、12B 和 27B 三种参数规模,支持 55 种核心语言及多模态图像翻译,目前已在 Kaggle 和 Hugging Face 开放下载。
性能方面,谷歌团队利用 WMT24++ 基准(包含高、中、低资源语言的 55 种语言)和 MetricX 指标进行了严格测试。结果显示,TranslateGemma 12B 版本的翻译质量超越了参数量大其两倍的 Gemma 3 27B 基线模型。这意味着开发者仅需消耗一半的算力资源,即可获得更高保真的翻译结果,从而大幅提升吞吐量并降低延迟。同时,体量最小的 4B 模型也展现出惊人实力,其性能与 12B 基线模型相当,为移动端和边缘计算设备提供了强大的翻译能力。
1 月 13 日,百川智能开源新一代医疗大模型 Baichuan-M3,在全球最权威的医疗 AI 评测 HealthBench 中以 65.1 分的综合成绩位列全球第一;在专门考验复杂决策能力的 HealthBench Hard 上,也以 44.4 分的成绩夺冠。这一成绩,不仅刷新了 HealthBench 的最高分,更首次在医疗领域实现了对 GPT-5.2 的全面超越。在 OpenAI 引以为傲的低幻觉领域,M3 也实现了超越,幻觉率 3.5 全球最低。
此外,M3 还首次具备了原生的“端到端”严肃问诊能力。它能像医生一样主动追问、逐层逼近,把关键病史和风险信号问出来,进而在完整的信息上进行深度医学推理。评测显示,其问诊能力显著高于真人医生的平均水平。
1 月 14 日消息,智谱宣布联合华为开源新一代图像生成模型 GLM-Image,模型基于昇腾 Atlas 800T A2 设备和昇思 MindSpore AI 框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的 SOTA 多模态模型。
据智谱官方介绍,通过改进 Tokenizer 策略,GLM-Image 能够自适应处理多种分辨率,原生支持从 1024x1024 到 2048×2048 尺寸的任意比例图像的生成任务,无需重新训练。
GLM-Image 在文字渲染的权威榜单中达到开源 SOTA 水平。
1 月 15 日消息,据报道,全球知名权威大模型评测榜单 Artificial Analysis Speech Reasoning 更新,阶跃星辰原生语音推理模型 Step-Audio-R1.1 登顶榜首。该榜单是目前业界评估“原生语音模型”(Native Audio Models)最权威的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的能力,主要考察维度包括准确率、首包延迟等。和大语言模型同理,语音模型同样需要具备强大推理能力,才能提供更高阶智能、更自然交互。Step-Audio-R1.1 以 96.4% 准确率,超越 Grok、Gemini、GPT-Realtime 等主流一线模型,刷新历史最好成绩。在性能与速度的综合权衡上,Step-Audio-R1.1 全面碾压同类语音模型。
Step-Audio-R1 是由阶跃星辰发布的全球首个开源原生语音推理模型。它可以在不增加额外时延的情况下,端到端理解语音内容,“像人类一样听到对话即可思考”。据悉,其核心能力包括:深度语音推理、实时响应能力、音频领域的可扩展 CoT。Step-Audio-R1.1 是最新升级版本,兼顾更强实时对话和复杂语音推理能力。完整的实时语音 API 将在 2 月上线,目前开放的 chat 模式已搭载 R1.1 核心,支持边想边说的流式推理。目前,Step-Audio-R1.1 权重已上传至 HuggingFace。
1 月 13 日消息,DeepSeek 发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文为北京大学与 DeepSeek 共同完成,合著作者署名中出现梁文锋。
论文提出条件记忆(conditional memory),通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。此外,DeepSeek 还开源相关记忆模块 Engram。该模块提出了“查—算分离”的全新架构思路,业内认为,Engram 有望成为 DeepSeek 下一代模型 V4 的核心技术基础。
据媒体报道,知情人士透露,DeepSeek 计划于 2 月中旬农历新年前后推出 V4 模型,不过具体时间仍可能调整。
1 月 12 日,逐际动力发布具身智能体 OS 系统 LimX COSA(Cognitive OS of Agents)。COSA 是面向物理世界原生的具身 Agentic OS,将高阶认知与全身运控进行深度融合,让机器人实现大小脑一体化协同。
1 月 13 日,苹果发布了苹果创作工作室,这是一款新的订阅捆绑式专业创意软件,定价为每月 12.99 美元或每年 129 美元,正值该公司加大对创作者、学生和专业人士付费服务的推广力度。该套餐还为苹果的生产力应用 Keynote、Pages 和 Numbers 增加了高级内容和新的人工智能功能,而数字白板应用 Freeform 将在稍后获得增强功能。
1 月 12 日,苹果公司与谷歌宣布已达成一项多年期合作协议,苹果下一代基础模型将基于谷歌 Gemini 模型及云技术构建。这些模型将为未来苹果智能功能提供支持,包括今年即将推出的更个性化的 Siri。
1 月 12 日,美国国防部长赫格塞思表示,美国企业家马斯克旗下的 AI 聊天机器人 Grok 将被引入五角大楼网络,与谷歌的生成式人工智能系统一道,在美国国防部内部运行。
InfoQ 2026 全年会议规划已上线!从 AI Infra 到 Agentic AI,从 AI 工程化到产业落地,从技术前沿到行业应用,全面覆盖 AI 与软件开发核心赛道!集结全球技术先锋,拆解真实生产案例、深挖技术与产业落地痛点,探索前沿领域、聚焦产业赋能,获取实战落地方案与前瞻产业洞察,高效实现技术价值转化。把握行业变革关键节点,抢占 2026 智能升级发展先机!