机器之心 AI NEWS DIGEST
2026 06 26
STORY 01 / 12

Anthropic员工离职创业,估值10亿美元,也做「递归自我改进」

01-01
TechCrunch 报道截图展示 Mirendil 创始团队和融资信息。
01-02
Mirendil 社交长文介绍 AI for AI for Science 方向。
01-03
Mirendil 四位团队成员合影。
01-04
社交长文截图展示公司对科学 AI 平台的说明。
01-05
报道截图展示 Mirendil 作为高估值 AI 初创公司的信息。
01-06
Mirendil 团队合影。
STORY 02 / 12

第一个用物理做计算原语的大规模生成模型Un-0来了,或将AI能耗降低1000倍?

02-01
Naveen Rao 社交截图展示 Un-0 样本。
02-02
振子系统随时间演化的示意曲线。
02-03
Un-0 图像生成过程的时间轨迹和类别样本。
02-04
多条振子轨迹形成的状态演化可视化。
02-05
振子池到解码器的模型结构图。
02-06
Un-0 与生成模型的 FID 和参数量散点对比图。
02-07
AI 能耗降低 1000 倍的封面图。
02-08
Naveen Rao 关于动力系统和能耗的社交讨论截图。
02-09
Un-0 在 FID 与模型规模坐标中的对比图。
02-10
振子池到解码器的模型结构图。
STORY 03 / 12

国产AI高考708分,这款模型靠什么成为「屏蔽生」?

03-01
8 款大模型 2026 年高考全科成绩 PK 表。
03-02
6 款大模型新高考 I 卷数学成绩表。
03-03
9 款大模型上海卷语文作文成绩表。
03-04
教室场景里展示 AI 学习机和打印设备。
03-05
全科成绩表作为媒体测试证据。
STORY 04 / 12

两个月连获两轮数亿元融资 深度机智以全栈自主路线加速国产物理AI基座模型落地

04-01
讲解人在机器人旁介绍具身智能相关内容。
04-02
DeepActive 人形机器人在厨房场景执行操作。
04-03
深度机智讲解现场和机器人设备。
04-04
人形机器人在厨房操作场景。
04-05
讲解现场和机器人设备。
STORY 05 / 12

LabVLA:当AI走进科学实验室,浙大x上海 AI Lab联合探索科学具身智能

05-01
LabVLA 总览图。
05-02
LabEmbodied-Data 和 RoboGenesis 数据生成/仿真流程图。
05-03
Franka 机械臂操作试管和液体的多帧演示。
05-04
科学实验具身任务多场景机器人演示拼图。
05-05
机械臂在实验台上接近透明杯和试管。
STORY 06 / 12

单目3DGS迎来突破:影石开源UniSHARP实现全相机适配

06-01
UniSHARP 论文标题页与多相机示例。
06-02
UniSHARP 方法框架图。
06-03
UniSHARP 封面图展示单图预测 3D 高斯点云。
室内 360 度全景输入的新视角合成演示。
06-05
多相机全景/广角输入样例与重建结果拼图。
山地动物、室内和车辆等多种输入样例。
连续室内 360 度场景重建与新视角漫游。
06-08
多相机全景/广角输入样例与重建结果拼图。
室内全景重建视频继续展示新视角漫游。
06-10
UniSHARP 方法框架图。
STORY 07 / 12

SIGCOMM 2026 | 从「人眼看视频」到「AI理解视频」:北大提出面向AI的实时通信框架Artic

07-01
AI 视频助手实时通信范式示意图。
07-02
Artic 论文标题页。
07-03
Artic 系统总览图。
07-04
车牌识别示例展示 baseline 错误和 Artic 正确。
07-05
平均延迟和延迟分布对比图。
07-06
准确率随码率变化曲线。
07-07
准确率-延迟二维分布图。
STORY 08 / 12

刚刚,翁荔博客上新:谨慎对待Scaling Law

08-01
Lilian Weng 发布 Scaling Law 博客的社交截图。
08-02
Lilian Weng 关于 AI 总结博客的评论截图。
08-03
Scaling Law 符号表。
08-04
早期 scaling 曲线图。
08-05
小数据、幂律区域和不可约误差区域示意图。
08-06
计算量、数据集规模和参数量的 scaling 曲线图。
08-07
IsoFLOP 相关曲线和散点拟合图。
08-08
数据受限重复训练的验证损失曲线图。
08-09
固定训练长度与可变训练长度的损失预测图。
08-10
过拟合系数和损失分解对比图。
08-11
Scaling Law fitting example 界面截图。
08-12
Lilian Weng 肖像式封面图。
STORY 09 / 12

AI Agent上岗也要有\"安全证\",钉钉悟空通过全球首个AI管理体系国际认证

09-01
中国质量认证中心人工智能管理体系认证书。
09-02
钉钉悟空人工智能管理体系认证书封面图。
09-03
人工智能管理体系认证书。
09-04
认证书封面图。
09-05
中国质量认证中心认证书。
09-06
人工智能管理体系认证书封面。
STORY 10 / 12

国内首张防爆资质、全球首个加油大脑方案,他们凭什么拿下两个「第一」

10-01
防爆合格证和相关资质文件展示图。
10-02
两台机器人在加油站油枪旁执行加注任务。
10-03
若黑“独月 01”智能加注机器人视频封面。
机器人在展台上操作加油枪。
10-05
加油大脑方案框架图。
10-06
H-GAR 与目标观测合成/动作预测方法示意图。
10-07
若黑科技加油机器人实物展示图。
10-08
若黑加油机器人拿油枪的封面图。
STORY 11 / 12

计算机安全第一人宋晓冬,加入Meta

11-01
Dawn Song 宣布加入 Meta Superintelligence Labs 的社交截图。
11-02
Dawn Song 访谈/人物画面截图。
11-03
Dawn Song Google Scholar 主页截图。
11-04
社交截图提到多位 AI 人才加入 Meta。
11-05
Dawn Song 人物肖像封面。
11-06
Dawn Song 加入 Meta 的社交截图。
STORY 12 / 12

脑机接口学会顺着大脑的路走:训练效率与真实落地的双重突破正在同时发生

12-01
脑机接口概念封面图。
12-02
Nature Neuroscience 论文页面截图。
12-03
流形学习与验证的多面板实验图。
12-04
不同流形成分下 BCI 学习表现图。
12-05
脑机接口临床或实验室环境照片。
12-06
植入式 BCI 与语言/光标控制相关研究图示。
Anthropic 离职员工创立 Mirendil,起步就是 2 亿美元种子轮融资,估值约 10 亿美元。
这家公司想做的不是普通 AI for Science,而是让 AI 帮助科学家训练自己的 AI。
两位创始人来自 Anthropic,此前也在 Google 和前沿模型机构做过底层研究。
他们押注的关键词是递归自我改进,也就是让 AI 参与优化自身能力和科研工具链。
这条新闻的信号是,前沿 AI 创业正在从聊天产品,继续深入科学建模和模型自动化。
但目前还没有公开产品和基准,估值更多反映团队、赛道和资本预期。
Unconventional AI 发布 Un-0,称它是第一个用物理作为计算原语的大规模生成模型。
它不是只用 GPU 做矩阵运算,而是让模拟耦合振子系统随时间演化来承担一部分计算。
文章中的轨迹图,把不同类别图像的生成过程画成了时间路径。
更细的状态图显示,多条振子轨迹共同形成系统内部表示。
结构图里,振子池接收条件信号,再由解码器生成图像。
在 ImageNet 64×64 上,文章称 Un-0 达到 FID 6.74,已经接近一些传统生成方法早期水平。
但它真正押注的是能耗:团队希望未来把 AI 推理能耗降到当前系统的千分之一。
Naveen Rao 的讨论也强调,关键是把物理系统映射成可训练的动力系统。
所以这不是图像生成模型的终局,而是物理计算路线的一次 Hello World。
接下来要验证的是规模化、可编程性,以及它能否真的替代主流推理计算的一部分。
多家媒体让大模型参加 2026 年高考题,讯飞星火 X2 成为这轮中文考试评测里的高分选手。
在物理类全科总分中,Claude Opus 4.8 和讯飞星火 X2 都达到 708 分。
数学专项里,讯飞星火拿到 148 分,领先 Kimi、DeepSeek、智谱、MiniMax 和 ChatGPT。
作文测试也显示,头部模型之间差距不大,但中文表达和审题稳定性会影响排名。
文章把星火的优势归因于语言理解、数理推理和综合分析之间的均衡。
但高考不是完整基准;它能说明考试能力,却不能直接说明真实世界任务能力。
深度机智完成新一轮数亿元融资,把物理 AI 基座模型作为这轮故事的核心。
文章称,公司走的是人类学习路线,从第一视角数据开始训练具身智能系统。
它强调 DeepAct 多模态数据集、动作建模、机器人本体和真实场景落地。
融资方包括国寿长三角科创基金和多家产业资本,说明资本仍在押注具身智能基础设施。
如果第一视角数据和场景订单能持续扩大,它可能成为国产物理 AI 的重要样本。
但这是公司口径报道,模型泛化、订单质量和真实领先性还需要更多外部证据。
LabVLA 想解决的问题是,让 AI 不只读懂实验步骤,还能在实验台上动手。
团队把视觉、语言和动作预训练引入科学实验场景,目标是跨任务、跨环境泛化。
演示图里,Franka 机械臂在试管和透明容器之间执行实验动作。
文章称,LabVLA 在 LabUtopia 基准上 ID 和 OOD 平均成功率分别为 71.1% 和 70.0%。
真正的难点是安全、透明液体和严格流程,所以这仍是从实验演示走向实验室助手的一步。
UniSHARP 的目标,是让单目 3DGS 不再只适配普通透视相机,而是覆盖真实世界里混杂存在的多种成像系统。
它把透视、广角、鱼眼和 360 度全景相机放进同一个模型框架,避免为每种相机单独设计一套重建流程。
单张输入图像就能预测 3D 高斯点云,并生成新的观察视角,这对运动相机、全景相机和手机照片都更实用。
演示一展示室内 360 度输入。
演示二对应室内多视角对比。
演示三,多样例输入。
最长的演示展示了连续室内 360 度漫游。
团队还构建了 OmniRooms 数据集,包含 30 万张全景图和深度,用来支撑混合相机训练。
这类方法的价值在于,一张手机图、运动相机图或全景图,都可能进入同一套 3D 内容管线,降低 3D 内容生产门槛。
但跨相机统一不等于没有伪影,复杂几何、反光表面和真实拍摄条件仍然需要更多验证。
Artic 的出发点是,视频通话另一端可能是多模态大模型。
传统 RTC 让人看得舒服;AI 助手要回答更准、延迟更低。
系统会根据模型反馈调整码率、区域和编码策略。
车牌示例显示,看起来清晰,不一定让模型答对关键内容。
文章报告,Artic 提升 15.12% 准确率,并降低 135.31 毫秒延迟。
准确率-码率曲线说明,同样带宽下,要服务模型理解。
它给智能眼镜和实时视频助手提供了新的网络优化目标。
Lilian Weng 更新博客,主题是谨慎对待 Scaling Law。
她提醒大家,很多人可能会让 AI 总结这篇长文,而不是认真读完。
Scaling Law 的基本变量,是模型规模、数据量、计算量和训练损失。
最吸引人的地方,是小规模实验能外推大模型训练需求。
但外推只在特定区域可靠,小数据区域和不可约误差区域都会让曲线失真。
Kaplan 和 Chinchilla 的分歧,本质上和算力、数据、参数如何分配有关。
IsoFLOP 分析试图在固定算力下寻找更优的模型和数据配比。
文章还强调,重复数据和数据受限训练会改变损失曲线。
固定训练长度和可变训练长度,也会给预测结果带来不同偏差。
过拟合项则提醒我们,更多数据和更多训练并不总是线性换来收益。
所以这篇博客的实用结论是,Scaling Law 很有用,但拟合、数据和边界条件必须一起看。
它不是水晶球,而是一套需要持续校准的工程估算工具。
钉钉悟空通过 ISO/IEC 42001 人工智能管理体系认证,把企业 Agent 的安全问题摆到台前。
文章强调,智能体不只是能生成内容,还会进入文件、订单、运营和数据分析流程。
因此安全重点变成权限交集、操作审计、快照回退和数据隔离。
悟空还把提示词注入、模型污染和运行时违规操作列为需要主动防范的风险。
这条新闻的行业意义是,Agent 上岗以后,合规会从加分项变成基础设施。
但认证不等于没有风险,真实场景仍需要持续红队测试、日志审计和权限治理。
若黑科技这条新闻,关键不是又一台机器人,而是它拿到了面向加油站的防爆资质。
加油站是高风险环境,机器人必须从电路、结构和连接点上控制点火风险。
文章展示的“独月 01”,是一套面向智能加注的机器人方案。
GIF 里可以看到机器人在展台上操作油枪,这对应加注动作的具体执行。
技术图里,加油大脑把环境观测、目标生成和动作细化放进同一套闭环。
H-GAR 图则说明,系统要在单目观测里预测可执行的下一步动作。
这条新闻的意义,是具身智能开始面对认证、危险环境和真实工业责任。
但能否大规模铺开,还要看真实加油站里的故障率、维护成本和监管接受度。
Dawn Song 加入 Meta 超级智能实验室,担任 AI 研究副总裁。
她是计算机安全和 AI 安全领域的重要学者,研究覆盖软件安全、对抗机器学习和智能体安全。
Google Scholar 截图显示,她在安全领域有长期高影响论文。
文章还提到 Virtue AI 团队成员加入 Meta,强化红队测试和运行时护栏能力。
对 Meta 来说,安全不是附属问题;它要把 AI 放进社交产品和开源生态,就必须证明模型可控。
但高水平人才加入只是开始,真正要看的还是产品级评测、审计和风险处置。
这篇脑机接口报道关注两个问题:用户能不能更快学会,系统能不能更久稳定使用。
耶鲁团队的论文从个体大脑活动的流形几何入手,训练非侵入式 BCI。
实验图显示,系统先学习每个人脑活动里的低维结构,再把反馈映射到这个结构上。
当映射顺着大脑自然流形时,参与者能更快学会控制;偏离流形时,学习明显困难。
另一组素材提醒我们,BCI 真正落地还要面对临床环境、长期训练和稳定使用。
所以这不是单纯提高解码准确率,而是让机器接口学会顺着人的大脑工作。
机器之心 AI News Digest

机器之心 · 2026.06.26 · 12 stories · 10:32

机器之心 AI News Digest

机器之心 2026.06.26 digest with 12 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 0:44
    01. Anthropic员工离职创业,估值10亿美元,也做「递归自我改进」 Source
    文章报道,两位 Anthropic 离职员工 Behnam Neyshabur 和 Harsh Mehta 创立 Mirendil,种子轮融资 2 亿美元,估值约 10 亿美元。
  2. 0:45 - 1:57
    02. 第一个用物理做计算原语的大规模生成模型Un-0来了,或将AI能耗降低1000倍? Source
    文章介绍 Unconventional AI 发布 Un-0,一个由模拟耦合振子系统驱动的图像生成模型,称其为以物理作为计算原语的大规模生成模型。
  3. 1:57 - 2:47
    03. 国产AI高考708分,这款模型靠什么成为「屏蔽生」? Source
    文章汇总多家媒体对大模型参加 2026 年高考题的测试结果,讯飞星火 X2 在全科、数学和作文等项目中表现突出。
  4. 2:47 - 3:32
    04. 两个月连获两轮数亿元融资 深度机智以全栈自主路线加速国产物理AI基座模型落地 Source
    文章报道深度机智完成新一轮数亿元融资,由国寿长三角科创基金领投,多家老股东和产业资本参与。
  5. 3:32 - 4:13
    05. LabVLA:当AI走进科学实验室,浙大x上海 AI Lab联合探索科学具身智能 Source
    浙江大学和上海人工智能实验室提出 LabVLA,把视觉-语言-动作预训练引入科学实验室场景。
  6. 4:13 - 5:26
    06. 单目3DGS迎来突破:影石开源UniSHARP实现全相机适配 Source
    影石研究院发布 UniSHARP,面向异构成像系统的单目新视角合成模型,统一透视、广角、鱼眼和 360° 全景相机。
  7. 5:27 - 6:06
    07. SIGCOMM 2026 | 从「人眼看视频」到「AI理解视频」:北大提出面向AI的实时通信框架Artic Source
    北京大学团队提出 Artic,一套面向多模态大模型视频助手的实时通信框架。
  8. 6:07 - 7:20
    08. 刚刚,翁荔博客上新:谨慎对待Scaling Law Source
    文章整理 Lilian Weng 新博客《谨慎对待 Scaling Law》,讨论模型规模、数据量、计算量和损失之间的幂律关系。
  9. 7:20 - 8:07
    09. AI Agent上岗也要有\"安全证\",钉钉悟空通过全球首个AI管理体系国际认证 Source
    文章报道钉钉悟空通过中国质量认证中心 ISO/IEC 42001:2023 人工智能管理体系认证。
  10. 8:08 - 9:03
    10. 国内首张防爆资质、全球首个加油大脑方案,他们凭什么拿下两个「第一」 Source
    文章报道若黑科技取得国内首张机器人加油站防爆资质,并推出全球首个“加油大脑”方案。
  11. 9:03 - 9:47
    11. 计算机安全第一人宋晓冬,加入Meta Source
    文章报道 UC Berkeley 教授 Dawn Song 加入 Meta Superintelligence Labs,担任 AI 研究副总裁,并向 Nat Friedman 汇报。
  12. 9:47 - 10:32
    12. 脑机接口学会顺着大脑的路走:训练效率与真实落地的双重突破正在同时发生 Source
    文章串联两项脑机接口进展:一项来自耶鲁团队,关注非侵入式 BCI 如何顺着个体大脑流形提高学习效率;另一项关注真实落地和长期使用。