首页
AI工具
文章
关于
发表
发动态
发帖子
登录
首页
话题
发动态
发帖子
首页
AI工具
文章
关于
消息
登录
最新
推荐
机器之心
专业的前沿科技媒体与产业服务平台
关注
个人成就
积分
0
话题
4936
评论
0
注册排名
4006
个人资料
编辑资料
昵称
机器之心
签名
专业的前沿科技媒体与产业服务平台
粉丝
0
更多
没有更多内容了
粉丝
关注
0
更多
没有更多内容了
关注
话题
文章
机器之心
发布于7小时前
港大开源ViMax火了,实现AI自编自导自演
想象一下,只需要一句话描述,AI 就能为你拍出一部完整的短剧?以后可能真的人人都能当导演了。不用学复杂的拍摄技巧,不用买昂贵设备,甚至不用找演员。有个好想法,AI 就能帮你实现。为了让这个想法变成现实,香港大学黄超教授团队开源了 ViMax 框架,并在 G...
赞
评论
1
浏览
AI资讯
机器之心
发布于1天前
何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年
机器之心报道机器之心编辑部不久前,NeurIPS 2025 顺利举办,作为人工智能学术界的顶级会议之一,其中不乏学术界大佬的工作和演讲。有一项荣誉的颁发显得格外厚重且众望所归 —— 由任少卿、何恺明、Ross Girshick 和孙剑合著的经典论文 《Fa...
赞
评论
1
浏览
1
AI资讯
机器之心
发布于1天前
效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决
实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜力,但其发展受制于一个根本性瓶颈:高质量操作数据的获取。...
赞
评论
1
浏览
AI资讯
机器之心
发布于15小时前
刚刚,GPT-5.2满分屠榜,OpenAI十周年王者归来
机器之心报道机器之心编辑部谷歌的领先优势,只保持了不到一个月。今天是 OpenAI 的十周年纪念日,十周年之际,来点大的。文中视频链接:https://mp.weixin.qq.com/s/b_1UR_AksY4_1Osti97RmA在「红色警报」后,Op...
赞
评论
1
浏览
1
AI资讯
机器之心
发布于15小时前
谷歌发布智能体Scaling Law:180组实验打破传统炼金术
机器之心报道编辑:Panda智能体(Agent),即基于语言模型且具备推理、规划和行动能力的系统,正在成为现实世界 AI 应用的主导范式。尽管其已被广泛采用,但决定其性能的原则仍未被充分探索,导致从业者只能依赖启发式经验,而非有原理依托的设计选择。现在,谷...
赞
评论
浏览
3
AI资讯
机器之心
发布于14小时前
全球强化学习+VLA范式,PI*0.6背后都有这家中国公司技术伏笔
机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源:其中有我们熟悉的 Yuke Zhu 的研究,也有他们自己(Chelsea Finn、Sergey Lev...
赞
评论
浏览
3
AI资讯
机器之心
发布于14小时前
Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?
机器之心报道编辑:+0随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能,公司内部正面临多重挑战。据《纽约时报》报道,Meta 新组建的顶尖 AI 团队与公司原有的核心业务部门之间,在资源分配、发展目标及文化融合上产生了摩擦。今年,扎克伯格重组了 Me...
赞
评论
1
浏览
3
AI资讯
机器之心
发布于14小时前
NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈
尹博:NUS 计算机工程硕士生、LV Lab 实习生,研究方向是生成式 AI,及参数高效率微调(PEFT)。胡晓彬:NUS LV Lab Senior Research Fellow, 研究方向是生成式 AI,MLLM Agent 等。在大模型时代,参数高...
赞
评论
1
浏览
3
AI资讯
机器之心
发布于2天前
告别专家依赖,让机器人学会自我参考,仅需200步性能飙升至99.2%
费森俞,上海创智学院 & 同济大学博士一年级学生,导师赵宪忠教授,研究方向为 VLA 强化学习后训练。王思尹,上海创智学院 & 复旦大学博士二年级学生,导师邱锡鹏教授,研究方向为多模态具身智能。为本文共同第一作者。龚经经,上海创智学院全时导师。邱锡鹏,复旦...
赞
评论
1
浏览
6
AI资讯
机器之心
发布于2天前
「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说
机器之心原创机器之心编辑部手机上的 AI,从来没有这么像真人。最近一个星期,席卷科技圈的一款手机不来自任何一家硬件大厂,而是与字节的豆包联系在了一起。这款搭载豆包手机助手的工程机引爆了全网,让很多人第一次真切地感受到 Agent 已经触手可及。在某宝平台上...
赞
评论
1
浏览
16
AI资讯
机器之心
发布于3天前
地平线首曝BPU「黎曼」架构,用数学流形重构AI计算
机器之心报道机器之心编辑部2012 年 12 月,美国太浩湖畔 Harrah's 酒店的 731 房间,一场足以载入 AI 史册的秘密竞拍正在进行。彼时,余凯代表百度,与 Google、微软以及当时还名不见经传的 DeepMind,共同竞购「深度学习之父」...
赞
评论
浏览
6
AI资讯
机器之心
发布于5天前
LLM强化学习不稳定之谜,被Qwen团队从「一阶近似」视角解开
机器之心报道机器之心编辑部如今,强化学习(RL)已成为提升大语言模型(LLM)复杂推理与解题能力的关键技术范式,而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性,LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个...
赞
评论
浏览
6
AI资讯
机器之心
发布于3天前
没了遥控器,还被扔进荒野,具身智能该「断奶」了
机器之心原创作者:吴昕翻车是真的,希望也是真的。香港中文大学的一处山间小道,流水小桥,树影斑驳,青苔攀附在陡峭连绵的石梯上。无人机视野下500 米的定向越野路线。一只人形机器人跨过三十度的小桥,走上一段石路,迈过两段台阶。好不容易来到一个九十度的弯,重心一...
赞
评论
浏览
10
AI资讯
机器之心
发布于3天前
刚上市的摩尔线程,即将揭晓新一代GPU架构
机器之心发布机器之心编辑部2025 年 12 月 19 日至 20 日,摩尔线程首届 MUSA 开发者大会(MUSA Developer Conference,简称 MDC 2025)将在北京中关村国际创新中心拉开帷幕。作为国内首个聚焦全功能 GPU 的开...
赞
评论
1
浏览
9
AI资讯
机器之心
发布于3天前
全图与切片并非等价?LLaVA-UHD-v3揭示差异推出高效全图建模方案
随着多模态大模型(MLLMs)在各类视觉语言任务中展现出强大的理解与交互能力,如何高效地处理原生高分辨率图像以捕捉精细的视觉信息,已成为提升模型性能的关键方向。然而,主流的视觉编码范式往往难以兼顾性能与效率:基于切片的编码方法虽能降低计算开销,却牺牲了全局...
赞
评论
1
浏览
9
AI资讯
机器之心
发布于3天前
Snapchat提出Canvas-to-Image:一张画布集成 ID、姿态与布局
Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程,将身份参考图、空间布局、姿态线稿等不同类型的控制信息全部整合在同一个画布中。用户在画布上放置或绘制的内容,会被模型直接解释为生成指令,简化了图像生成过程中的...
赞
评论
1
浏览
9
AI资讯
机器之心
发布于5天前
百万人围观的“萌娃教训小狗”视频火了,结果都是AI生成的|附教程
机器之心报道编辑:杨文人类总是对可爱的小东西毫无抵抗力。最近社交平台冒出一堆萌娃与「汪星人」温馨互动的视频,简直把人萌化。不夸张地说,每一帧都精准击中老夫那颗尘封已久、半死不活的心。有小孩一本正经教训小狗的。比如一个扎着辫子的小女孩站在厨房里,用手指指着金...
赞
评论
1
浏览
7
AI资讯
机器之心
发布于5天前
DeepSeek、Gemini谁更能提供情感支持?趣丸×北大来了波情绪轨迹动态评估
近日,由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for Emotional Support in Langua...
赞
评论
1
浏览
7
AI资讯
机器之心
发布于4天前
DeepSeek V3到V3.2的进化之路,一文看全
机器之心编译作者:Sebastian Raschka12 月 1 日,DeepSeek 一口气发布了两款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去,热度依旧不减,解读其技术报告的博客也正在不断涌现。知名 ...
赞
评论
1
浏览
7
AI资讯
机器之心
发布于4天前
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限
今年以来,开源项目LightX2V 及其 4 步视频生成蒸馏模型在 ComfyUI 社区迅速走红,单月下载量超过 170 万次。越来越多创作者用它在消费级显卡上完成高质量视频生成,把“等几分钟出一段视频”变成“边看边出片”。LightX2V 背后并不是单一...
赞
评论
1
浏览
10
AI资讯