STORY 04 / 11
STORY 05 / 11
STORY 06 / 11
STORY 09 / 11
英伟达这次把物理 AI 讲成了一整套智能体基础设施,而不是某一个机器人模型。
报道说,Cosmos、Omniverse、Isaac、Metropolis 和 Jetson 被串到同一条链路里,覆盖感知、仿真、推理和边缘部署。
Cosmos 3 被描述为全开放的世界基础模型,既做视觉推理,也支持文本、图像、视频、环境音和动作生成。
这让物理 AI 的模型不只是看图识别,还要理解真实环境中下一步该如何行动。
Agent Toolkit 则把 NemoClaw、Nemotron、OpenShell 和 CUDA-X 这类工具包装成可调用任务。
自动驾驶侧,Alpamayo 2 Super 被写成一个 32B 开放推理 VLA,目标是把视觉、语言和行动结合起来。
机器人侧,Isaac GR00T 和 Sharpa Wave 这类参考流程,指向的是更快地把仿真和真机调试接起来。
所以这条新闻真正的信号,是英伟达想把物理世界任务也纳入 agent 平台竞争。
但开放工具能否降低部署门槛,还要看真实项目里的数据、硬件、调试成本和安全边界。
明略科技这次是双线开源:一个是端侧推理加速框架 Cider,一个是端侧 GUI 智能体 Mano-P。
Mano-P 是 4B GUI-VLA 模型,重点是直接看屏幕、理解界面,再在本地执行操作。
这种路线和只调用云端 API 不同,它把隐私、延迟和成本问题一起拉回到用户设备上。
Cider 解决的是另一侧问题:Apple Silicon 上,多模态模型怎样在 MLX 里更快、更省内存地跑起来。
报道给出的路径包括 W8A8、W4A8、在线激活量化,以及 INT8 TensorOps。
性能上,W8A8 算子相对原生 MLX 加速 1.4 到 1.9 倍,W4A8 则把权重内存减半。
在 Qwen3-VL 上,4B 模型 prefill 提升 17% 到 22%,8B 模型提升 34% 到 40%。
把 Cider 和 Mano-P 放在一起看,明略想讲的是端侧智能体从模型到工程优化的一整套方案。
下一步关键是复测:不同 Mac、不同界面、不同权限环境下,GUI agent 是否还能稳定完成任务。
Acorn Robot 这篇报道把问题说得很直接:机器人不能只靠看视频学动作,还要有物理世界里的本能。
它批评的对象是单纯 VLA 路线:模型能理解语言和画面,但遇到摩擦、力和干扰时,动作未必稳。
Acorn 的解法是从底层操作原语、触觉和力控开始,先让机器手学会稳定接触。
报道中特别强调,一个物体被人干扰时,机器人仍然能保持住,而不是立刻掉线。
这就是具身本能的含义:不是先堆更多示范数据,而是让软硬件协同形成可泛化的动作能力。
团队背景也很工程化,文章说 9 位清华博士参与,并经历了多年硬件和算法探索。
工业产线是它瞄准的第一类场景,因为那里物体变化多,动作容错又非常低。
不过这还不是对 VLA 的替代结论,更像是给 VLA 补上真实接触控制的一层底座。
后续要看的,是这套本能能否扩展到复杂长任务,并和语言规划稳定结合。
Mind Lab 这篇报道不是单讲一个 LoRA 技巧,而是把 LoRA 变成持续学习的一条主线。
第一块是 δ-mem:它把 LoRA 形态的线性注意力模块,用作模型的在线记忆。
报道说,8x8 的 memory state 只增加约 0.12% 参数,却能在长期记忆任务上带来明显提升。
在 Memory Agent Bench 上,δ-mem 提升 1.31 倍;在 LoCoMo 上,提升 1.20 倍。
它的意义在于,模型不必每次把所有历史都塞进上下文,而是学习怎样保存可复用的信息。
第二块是 MinT,重点从算法转到系统:怎样并行训练很多 adapter,而不是一个个慢慢跑。
报道称 MinT 最高能做到约 4 倍训练加速,这对企业批量适配任务非常关键。
第三块是 PEFT scaling:它讨论基座模型规模和适配器规模不是孤立变量,而是会共同影响性能。
这意味着,低成本适配不是越小越好,而是要找到基座、任务和 adapter 容量之间的平衡。
第四块 Macaron-A2UI 则把视角推到 agent 和界面任务,让模型不只学文本,还学怎样生成和使用界面。
四块放在一起看,LoRA 从微调插件变成了记忆、训练、扩展规律和界面行动的共同接口。
但持续学习也有风险:记忆会污染,旧知识会遗忘,用户数据还必须可控、可审计。
所以这篇报道真正值得看的,是 PEFT 是否会从省钱工具,变成长期 agent 的核心基础设施。
Anthropic 的 IPO 消息,重点不只是又一家 AI 公司要上市,而是前沿模型公司可能进入硬披露阶段。
报道称,它已经向美国 SEC 秘密提交 S-1 草案,为未来上市保留选择。
市场最关注的是估值:文章把 Anthropic 放进接近万亿美元市值的讨论里。
支撑这个叙事的,是 Claude 模型热度、Claude Code 的开发者使用,以及收入增长预期。
但 IPO 会把行业最难回答的问题摆出来:训练花多少钱,推理亏不亏,客户是不是足够分散。
如果 Anthropic 真的上市,投资人第一次能系统看到前沿模型业务的收入质量和资本开支。
这也会反向影响 OpenAI、xAI、Mistral 等公司的融资逻辑和估值参照。
不过秘密提交不等于马上挂牌,时间表、估值和发行结构都可能继续变化。
所以这条新闻真正开启的,是资本市场对基础模型经济性的公开审题。
深度原理这篇报道讲的是一个更激进的 AI4S 方向:让智能体自己打造材料基座模型。
新模型叫 Materials Property Axiom,简称 MPA,目标是做通用的材料性质预测。
文章称,MPA 在 40 项实验性质预测任务中全面刷新 SOTA,平均 MAE 降低 10%。
最强的单项结果中,误差降幅达到 51%,这让它不只是一个小幅调参成果。
真正特殊的是研发流程:报道说 MIRA 参与预研、模型结构适配、代码编写、数据构造和迭代搜索。
也就是说,AI 不只是帮科学家跑脚本,而是进入了提出方案和修改模型的环节。
这正是报道里所谓递归智能体的含义:AI 系统生成和优化下一代科学模型。
文章也把 MIRA 放进更大的趋势里,对比 Google Co-Scientist、FutureHouse Robin 和 Google ERA。
材料领域适合这种路线,因为候选结构多、实验成本高,单任务模型又很难覆盖所有性质。
如果 MPA 成立,研究者可以少做很多从零开始的数据清理和模型选择。
不过这类 SOTA 新闻一定要看复现:数据、代码、划分方式和跨实验室评测都很关键。
还要区分,哪些设计来自人类,哪些来自自动搜索,哪些只是数据整理带来的收益。
所以这条新闻的价值,是把 AI 自主科研从概念展示,推到材料基座模型这个硬任务上。
DataMaster 关注的是一个很现实的问题:如果数据决定模型上限,AI 能不能自己做数据工程。
它让系统主动找外部数据源,再过滤、清洗、变换,最后构造训练输入。
框架里有数据树、数据池和全局记忆,用来记录来源、操作步骤和实验反馈。
红色节点负责找新来源,黑色节点负责清洗和组合数据,下游模型表现再反过来指导搜索。
这让 AI research agent 不只是写代码,也开始接管实验里最耗时的数据部分。
这篇论文讨论长上下文模型的一个硬成本:序列越长,KV Cache 占用越大。
过去很多方法是在推理后压缩缓存,KV-CAT 则把压缩友好性放进训练目标。
换句话说,模型提前学会生成更容易被保留和裁剪的中间记忆。
文章用词频任务说明,自然实现未必压缩友好,结构化实现才更适合长程缓存。
核心问题是,压缩省显存的同时,不能牺牲模型真正需要的推理信息。
Sutton 相关这篇新作,讨论的不是更大的模型,而是 AI 应该怎样理解世界。
它批评被动表征路线:模型只把世界编码进内部表示,并不等于真正参与世界。
生成认知强调,感知、行动和环境互动是一起发生的,不能拆成孤立模块。
文章里的关键思想是,世界本身就是最好的模型,智能体要通过行动不断校正认知。
这对机器人和 agent 很重要,因为真实自主性最终要在环境反馈里被检验。
ChemReason-Bench 问的是,大模型能不能真的理解化学合成步骤,而不只是背化学知识。
这个基准覆盖 500 个有机反应和 7306 个手工校验任务。
任务包括步骤排序、步骤验证、条件验证、步骤补全、对比选择和原理解释。
评测里,GPT-5.2 总分 70.30,DeepSeek-v3.2 为 65.21,但步骤补全仍然最难。
这说明 AI 化学助手离真实做实验还有距离,因为实验流程需要程序逻辑和安全约束。
顾全全从字节 Seed 离职,表面是人事新闻,背后其实是 AI4S 方向的竞争升温。
报道回顾,他曾任 UCLA 终身副教授,研究覆盖 AI 药物发现、蛋白质设计和大模型训练。
在字节 Seed,他参与的方向包括 SeedFold、SeedProteo、DPLM,以及 LLM 优化和 scaling。
文章称 SeedFold 在多项能力上超过 AlphaFold 3,SeedProteo 则面向 binding protein 设计。
这些项目说明,AI4S 已经不是大模型公司的边缘研究,而是能连接药物、蛋白和基础模型的核心赛道。
报道还提到团队调整和可能创业,但这部分仍需要等待本人或新公司的正式确认。
真正值得跟踪的是,AI4S 人才会继续留在大厂,还是转向更聚焦的新公司。
无论哪种结果,蛋白质、材料和药物发现都会继续成为基础模型商业化的重要实验场。