机器之心 AI NEWS DIGEST
2026 06 02
STORY 01 / 11

英伟达一通发布,物理AI全都智能体化了

01-01
英伟达物理 AI 发布主题
01-02
英伟达物理 AI 工具链
01-03
Cosmos 3 模型能力说明
物理 AI 连续动作画面
01-05
Agent Toolkit 相关开发组件
01-06
Alpamayo 与视觉语言行动模型
机器人操作演示画面
01-08
物理 AI 平台化路径
01-09
物理 AI 落地仍需验证
STORY 02 / 11

明略科技开源 Cider 与 Mano-P,押注端侧 AI 智能体

02-01
Cider 与 Mano-P 开源封面
02-02
Mano-P 端侧 GUI 智能体
02-03
Cider 端侧推理加速框架
02-04
Cider 量化与算子优化
02-05
Cider 性能与内存效果
02-06
端侧 AI 智能体方案
02-07
端侧 GUI agent 仍需实测
STORY 03 / 11

不靠数据,靠本能:清华博士团队押注具身本能

03-01
Acorn Robot 具身本能主题
机器人真实操作画面
机器人连续抓取动作
机器人抗干扰保持物体
03-05
具身本能系统路线
03-06
团队与系统背景
工业操作连续演示
03-08
具身操作硬件底座
03-09
工业落地仍需验证
STORY 04 / 11

Mind Lab 连发 LoRA 进展,持续学习新范式浮现

04-01
Mind Lab LoRA 持续学习主题
04-02
δ-mem 在线记忆机制
04-03
δ-mem 记忆任务结果
04-04
长期记忆与上下文压力
04-05
MinT 多 adapter 训练结构
04-06
MinT 训练效率结果
04-07
PEFT scaling 研究结果
04-08
基座规模与 adapter 容量关系
04-09
Macaron-A2UI 界面智能体任务
04-10
LoRA 持续学习研究概览
04-11
持续学习部署风险
04-12
PEFT 与长期智能体基础设施
STORY 05 / 11

Anthropic 提交招股书,冲击万亿美元市值

05-01
Anthropic IPO 主题封面
05-02
Anthropic 秘密提交招股书
05-03
Anthropic 估值讨论
05-04
Claude Code 与产品增长
05-05
前沿模型商业化压力
05-06
公开市场重新定价 AI 模型公司
05-07
前沿模型公司估值参照
05-08
IPO 时间表仍不确定
05-09
基础模型经济性进入公开检验
STORY 06 / 11

MIRA 自主打造材料基座模型,40 项实验刷新 SOTA

06-01
MIRA 材料基座模型主题
06-02
MPA 材料性质预测框架
06-03
MPA 40 项实验结果
06-04
材料预测误差显著下降
06-05
MIRA 自主研发流程
06-06
AI 参与模型结构改造
06-07
递归式 AI Scientist
06-08
AI Scientist 系统趋势
06-09
材料性质预测任务多样
06-10
通用材料模型的应用价值
06-11
SOTA 结果仍需复现
06-12
AI Scientist 贡献边界
06-13
AI 自主科研进入硬任务
STORY 07 / 11

DataMaster:当 AI 开始成为自己的数据工程师

07-01
DataMaster 论文封面
07-02
DataMaster 自主数据流程
07-03
数据树、数据池与全局记忆
07-04
自动寻找与清洗数据
07-05
AI 成为数据工程师
STORY 08 / 11

训练时让模型学会压缩 KV Cache

08-01
KV Cache 压缩研究封面
08-02
KV-CAT 训练时压缩目标
08-03
模型学习可压缩记忆
08-04
词频任务中的结构化记忆
08-05
缓存压缩与推理质量平衡
STORY 09 / 11

Sutton 新作:AI 的下一步是生成认知

09-01
Sutton 生成认知主题
09-02
被动表征与生成认知对比
09-03
世界作为最好的模型
09-04
生成认知面向自主智能体
STORY 10 / 11

ChemReason-Bench 暴露大模型化学实验推理短板

10-01
ChemReason-Bench 研究封面
10-02
有机反应与校验任务规模
10-03
模型在化学推理上的分数
10-04
AI 化学实验助手仍需验证
STORY 11 / 11

顾全全离开字节 Seed,AI4S 人才流动继续升温

11-01
顾全全离职与 AI4S
11-02
顾全全研究背景
11-03
Seed AI4S 项目成果
11-04
AI4S 成为核心赛道
11-05
后续方向仍待确认
11-06
AI4S 人才流动继续升温
11-07
AI4S 是基础模型商业化试验场
英伟达这次把物理 AI 讲成了一整套智能体基础设施,而不是某一个机器人模型。
报道说,Cosmos、Omniverse、Isaac、Metropolis 和 Jetson 被串到同一条链路里,覆盖感知、仿真、推理和边缘部署。
Cosmos 3 被描述为全开放的世界基础模型,既做视觉推理,也支持文本、图像、视频、环境音和动作生成。
这让物理 AI 的模型不只是看图识别,还要理解真实环境中下一步该如何行动。
Agent Toolkit 则把 NemoClaw、Nemotron、OpenShell 和 CUDA-X 这类工具包装成可调用任务。
自动驾驶侧,Alpamayo 2 Super 被写成一个 32B 开放推理 VLA,目标是把视觉、语言和行动结合起来。
机器人侧,Isaac GR00T 和 Sharpa Wave 这类参考流程,指向的是更快地把仿真和真机调试接起来。
所以这条新闻真正的信号,是英伟达想把物理世界任务也纳入 agent 平台竞争。
但开放工具能否降低部署门槛,还要看真实项目里的数据、硬件、调试成本和安全边界。
明略科技这次是双线开源:一个是端侧推理加速框架 Cider,一个是端侧 GUI 智能体 Mano-P。
Mano-P 是 4B GUI-VLA 模型,重点是直接看屏幕、理解界面,再在本地执行操作。
这种路线和只调用云端 API 不同,它把隐私、延迟和成本问题一起拉回到用户设备上。
Cider 解决的是另一侧问题:Apple Silicon 上,多模态模型怎样在 MLX 里更快、更省内存地跑起来。
报道给出的路径包括 W8A8、W4A8、在线激活量化,以及 INT8 TensorOps。
性能上,W8A8 算子相对原生 MLX 加速 1.4 到 1.9 倍,W4A8 则把权重内存减半。
在 Qwen3-VL 上,4B 模型 prefill 提升 17% 到 22%,8B 模型提升 34% 到 40%。
把 Cider 和 Mano-P 放在一起看,明略想讲的是端侧智能体从模型到工程优化的一整套方案。
下一步关键是复测:不同 Mac、不同界面、不同权限环境下,GUI agent 是否还能稳定完成任务。
Acorn Robot 这篇报道把问题说得很直接:机器人不能只靠看视频学动作,还要有物理世界里的本能。
它批评的对象是单纯 VLA 路线:模型能理解语言和画面,但遇到摩擦、力和干扰时,动作未必稳。
Acorn 的解法是从底层操作原语、触觉和力控开始,先让机器手学会稳定接触。
报道中特别强调,一个物体被人干扰时,机器人仍然能保持住,而不是立刻掉线。
这就是具身本能的含义:不是先堆更多示范数据,而是让软硬件协同形成可泛化的动作能力。
团队背景也很工程化,文章说 9 位清华博士参与,并经历了多年硬件和算法探索。
工业产线是它瞄准的第一类场景,因为那里物体变化多,动作容错又非常低。
不过这还不是对 VLA 的替代结论,更像是给 VLA 补上真实接触控制的一层底座。
后续要看的,是这套本能能否扩展到复杂长任务,并和语言规划稳定结合。
Mind Lab 这篇报道不是单讲一个 LoRA 技巧,而是把 LoRA 变成持续学习的一条主线。
第一块是 δ-mem:它把 LoRA 形态的线性注意力模块,用作模型的在线记忆。
报道说,8x8 的 memory state 只增加约 0.12% 参数,却能在长期记忆任务上带来明显提升。
在 Memory Agent Bench 上,δ-mem 提升 1.31 倍;在 LoCoMo 上,提升 1.20 倍。
它的意义在于,模型不必每次把所有历史都塞进上下文,而是学习怎样保存可复用的信息。
第二块是 MinT,重点从算法转到系统:怎样并行训练很多 adapter,而不是一个个慢慢跑。
报道称 MinT 最高能做到约 4 倍训练加速,这对企业批量适配任务非常关键。
第三块是 PEFT scaling:它讨论基座模型规模和适配器规模不是孤立变量,而是会共同影响性能。
这意味着,低成本适配不是越小越好,而是要找到基座、任务和 adapter 容量之间的平衡。
第四块 Macaron-A2UI 则把视角推到 agent 和界面任务,让模型不只学文本,还学怎样生成和使用界面。
四块放在一起看,LoRA 从微调插件变成了记忆、训练、扩展规律和界面行动的共同接口。
但持续学习也有风险:记忆会污染,旧知识会遗忘,用户数据还必须可控、可审计。
所以这篇报道真正值得看的,是 PEFT 是否会从省钱工具,变成长期 agent 的核心基础设施。
Anthropic 的 IPO 消息,重点不只是又一家 AI 公司要上市,而是前沿模型公司可能进入硬披露阶段。
报道称,它已经向美国 SEC 秘密提交 S-1 草案,为未来上市保留选择。
市场最关注的是估值:文章把 Anthropic 放进接近万亿美元市值的讨论里。
支撑这个叙事的,是 Claude 模型热度、Claude Code 的开发者使用,以及收入增长预期。
但 IPO 会把行业最难回答的问题摆出来:训练花多少钱,推理亏不亏,客户是不是足够分散。
如果 Anthropic 真的上市,投资人第一次能系统看到前沿模型业务的收入质量和资本开支。
这也会反向影响 OpenAI、xAI、Mistral 等公司的融资逻辑和估值参照。
不过秘密提交不等于马上挂牌,时间表、估值和发行结构都可能继续变化。
所以这条新闻真正开启的,是资本市场对基础模型经济性的公开审题。
深度原理这篇报道讲的是一个更激进的 AI4S 方向:让智能体自己打造材料基座模型。
新模型叫 Materials Property Axiom,简称 MPA,目标是做通用的材料性质预测。
文章称,MPA 在 40 项实验性质预测任务中全面刷新 SOTA,平均 MAE 降低 10%。
最强的单项结果中,误差降幅达到 51%,这让它不只是一个小幅调参成果。
真正特殊的是研发流程:报道说 MIRA 参与预研、模型结构适配、代码编写、数据构造和迭代搜索。
也就是说,AI 不只是帮科学家跑脚本,而是进入了提出方案和修改模型的环节。
这正是报道里所谓递归智能体的含义:AI 系统生成和优化下一代科学模型。
文章也把 MIRA 放进更大的趋势里,对比 Google Co-Scientist、FutureHouse Robin 和 Google ERA。
材料领域适合这种路线,因为候选结构多、实验成本高,单任务模型又很难覆盖所有性质。
如果 MPA 成立,研究者可以少做很多从零开始的数据清理和模型选择。
不过这类 SOTA 新闻一定要看复现:数据、代码、划分方式和跨实验室评测都很关键。
还要区分,哪些设计来自人类,哪些来自自动搜索,哪些只是数据整理带来的收益。
所以这条新闻的价值,是把 AI 自主科研从概念展示,推到材料基座模型这个硬任务上。
DataMaster 关注的是一个很现实的问题:如果数据决定模型上限,AI 能不能自己做数据工程。
它让系统主动找外部数据源,再过滤、清洗、变换,最后构造训练输入。
框架里有数据树、数据池和全局记忆,用来记录来源、操作步骤和实验反馈。
红色节点负责找新来源,黑色节点负责清洗和组合数据,下游模型表现再反过来指导搜索。
这让 AI research agent 不只是写代码,也开始接管实验里最耗时的数据部分。
这篇论文讨论长上下文模型的一个硬成本:序列越长,KV Cache 占用越大。
过去很多方法是在推理后压缩缓存,KV-CAT 则把压缩友好性放进训练目标。
换句话说,模型提前学会生成更容易被保留和裁剪的中间记忆。
文章用词频任务说明,自然实现未必压缩友好,结构化实现才更适合长程缓存。
核心问题是,压缩省显存的同时,不能牺牲模型真正需要的推理信息。
Sutton 相关这篇新作,讨论的不是更大的模型,而是 AI 应该怎样理解世界。
它批评被动表征路线:模型只把世界编码进内部表示,并不等于真正参与世界。
生成认知强调,感知、行动和环境互动是一起发生的,不能拆成孤立模块。
文章里的关键思想是,世界本身就是最好的模型,智能体要通过行动不断校正认知。
这对机器人和 agent 很重要,因为真实自主性最终要在环境反馈里被检验。
ChemReason-Bench 问的是,大模型能不能真的理解化学合成步骤,而不只是背化学知识。
这个基准覆盖 500 个有机反应和 7306 个手工校验任务。
任务包括步骤排序、步骤验证、条件验证、步骤补全、对比选择和原理解释。
评测里,GPT-5.2 总分 70.30,DeepSeek-v3.2 为 65.21,但步骤补全仍然最难。
这说明 AI 化学助手离真实做实验还有距离,因为实验流程需要程序逻辑和安全约束。
顾全全从字节 Seed 离职,表面是人事新闻,背后其实是 AI4S 方向的竞争升温。
报道回顾,他曾任 UCLA 终身副教授,研究覆盖 AI 药物发现、蛋白质设计和大模型训练。
在字节 Seed,他参与的方向包括 SeedFold、SeedProteo、DPLM,以及 LLM 优化和 scaling。
文章称 SeedFold 在多项能力上超过 AlphaFold 3,SeedProteo 则面向 binding protein 设计。
这些项目说明,AI4S 已经不是大模型公司的边缘研究,而是能连接药物、蛋白和基础模型的核心赛道。
报道还提到团队调整和可能创业,但这部分仍需要等待本人或新公司的正式确认。
真正值得跟踪的是,AI4S 人才会继续留在大厂,还是转向更聚焦的新公司。
无论哪种结果,蛋白质、材料和药物发现都会继续成为基础模型商业化的重要实验场。
机器之心 AI News Digest

机器之心 · 2026.06.02 · 11 stories · 12:19

机器之心 AI News Digest

机器之心 2026.06.02 digest with 11 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 1:19
    01. 英伟达一通发布,物理AI全都智能体化了 Source
    英伟达在 GTC Taipei 把机器人、工业数字孪生、视觉 AI、智能汽车和边缘部署串成一条物理 AI 智能体工具链,核心是让开发者把现实世界任务拆成可执行、可验证、可部署的 agent 工作流。
  2. 1:20 - 2:42
    02. 明略科技开源 Cider 与 Mano-P,押注端侧 AI 智能体 Source
    明略科技同时开源 Cider 端侧推理加速框架和 Mano-P 端侧 GUI 智能体模型,把本地视觉理解、界面操作、隐私和 Apple Silicon 推理优化放在同一个端侧 AI 方案里。
  3. 2:43 - 3:55
    03. 不靠数据,靠本能:清华博士团队押注具身本能 Source
    Acorn Robot 提出具身本能路线,试图绕开完全依赖 VLA 模仿学习的数据瓶颈,用触觉、力控、操作原语和软硬件协同,让机器人在真实工业场景中获得更稳定的抓取和操作能力。
  4. 3:56 - 5:46
    04. Mind Lab 连发 LoRA 进展,持续学习新范式浮现 Source
    Mind Lab 把近期 LoRA 与 PEFT 研究串成一条持续学习路线:δ-mem 用 LoRA 形态做在线记忆,MinT 提供并行训练基础设施,PEFT scaling 讨论适配器规模规律,Macaron-A2UI 则把适配思想延伸到智能体界面
  5. 5:47 - 6:56
    05. Anthropic 提交招股书,冲击万亿美元市值 Source
    报道称 Anthropic 已向 SEC 秘密提交 IPO 招股书草案,估值讨论被推到接近万亿美元级别,同时把 Claude、Claude Code、收入增速和前沿模型商业化成本放到公开市场检验前夜。
  6. 6:57 - 8:42
    06. MIRA 自主打造材料基座模型,40 项实验刷新 SOTA Source
    深度原理团队发布 Materials Property Axiom 模型,称其由 AI Scientist 平台 MIRA 递归式自主研发,在 40 项材料性质预测实验中刷新平均表现,把 AI 自主做研究的叙事推进到材料基座模型。
  7. 8:42 - 9:21
    07. DataMaster:当 AI 开始成为自己的数据工程师 Source
    DataMaster 提出数据中心自主 AI 研究框架,让 AI 系统主动寻找外部数据源、过滤清洗、构造训练数据,并用下游模型反馈继续优化数据流程。
  8. 9:21 - 9:56
    08. 训练时让模型学会压缩 KV Cache Source
    牛津、NVIDIA 等提出 KV-CAT,把 KV Cache 压缩从推理后的补丁,提前到训练目标中,让 Transformer 生成更适合压缩的中间记忆。
  9. 9:57 - 10:33
    09. Sutton 新作:AI 的下一步是生成认知 Source
    Richard Sutton 相关新作 Toward Enactive Artificial Intelligence 批评被动表征路线,主张智能来自经验、行动、环境互动、自主性和具身性共同构成的生
  10. 10:34 - 11:11
    10. ChemReason-Bench 暴露大模型化学实验推理短板 Source
    上海交大 AI4S 团队提出 ChemReason-Bench,用 500 个有机反应和 7306 个校验任务评估大模型是否真正理解化学合成实验流程,结果显示步骤补全等任务仍明显困难。
  11. 11:11 - 12:19
    11. 顾全全离开字节 Seed,AI4S 人才流动继续升温 Source
    字节 Seed AI4S 方向重要成员顾全全宣布离职,报道回顾了他在蛋白质、药物发现、前沿大模型训练和 scaling 方面的经历,也折射 AI4S 团队与创业方向的持续变化。