DeepSeek 发布 Prover-V2 模型;小米首个推理大模型开源;饿了么宣布超百亿补贴加入外卖战局 | 极客早知道

DeepSeek 发布 Prover-V2 模型,参数量达 6710 亿


小米开源「Xiaomi MiMo」大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

预训练:核心是让模型见过更多推理模式
数据:着重挖掘富推理语料,并合成约 200B tokens 推理数据。
训练:进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。

后训练:核心是高效稳定的强化学习算法和框架
算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。
框架:设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。(来源:IT 之家)

可生成 AI 播客:谷歌 NotebookLM 音频概览功能新增 76 种语言支持,包含中文

Meta 公布 2025 财年第 1 财季财报:营收 423.14 美元,同比增长 16%

微软第三季度营收 700.7 亿美元,高于市场预期


苹果加速印度布局,塔塔 / 富士康新工厂被曝组装生产 iPhone 16e 等机型
消息称宁德时代拟下月在港上市,或成四年来最大规模新股发行
饿了么宣布超百亿补贴加入外卖战局

英伟达新工具开放使用,可根据 3D 场景创建 AI 图像,配置要求 RTX 4080


消息称 Meta 第三代雷朋联名智能眼镜将于 10 月发售,配单色显示屏及手环控制器
荣耀手表全新系列官宣,两款新品将至

