机器之心 AI NEWS DIGEST
2026 06 23
STORY 01 / 12

刚刚,豆包大模型2.1发布,又一次跨越生产级质变点

01-01
深蓝发布会屏幕写有豆包大模型 2.1 Pro 正式发布。
01-02
发布会表格对比豆包 2.1 Pro 与多款模型的基准表现。
01-03
深蓝发布会表格展示多模型在不同能力项上的数字对比。
01-04
白底流程图展示端到端模型产品化方案和多环节能力连接。
01-05
图像质量对比图展示 4K 与 720P 人脸细节差异。
01-06
发布会屏幕列出影像质感、长时自洽一致性和样本多模态价值等能力点。
发布会动图画面展示 RTL 长图像生成或编辑能力曲线与控制面板。
动图显示移动端页面里一段关于 CapEx 和 AI 数据中心支出的回答。
动图显示移动端问答界面正在输出关于 CV 领域关键论文和重要性的回答。
01-10
发布会舞台中央显示豆包大模型 2.1 Pro 字样,演讲者站在屏幕前。
STORY 02 / 12

战胜Mythos 5,OpenAI安全专用GPT-5.5-Cyber完全体来了

02-01
OpenAI 社交截图介绍 CyberGym beta 和网络安全推理模型。
02-02
Sam Altman 社交截图内嵌 CyberGym 柱状图,展示多模型分数。
02-03
CyberGym 柱状图比较 GPT-5.5-Cyber-pro、Verity-R1、GPT-5.5 和 Claude Opus 4.1。
02-04
SEC Bench Pro 柱状图显示 GPT-5.5-Cyber 69.8%,GPT-5 为 63.1%。可提取数据:GPT-5.5-Cyber 69.8%;GPT-5 63.1%。
02-05
Greg Brockman 社交截图说明模型正在发现并生成关键漏洞补丁。
02-06
橙粉背景大字列出 30K repos assessed、30M+ commits scanned、500K+ fixed findings。
02-07
橙粉背景中间显示 OpenAI Cybergym 的网页或工具界面截图。
02-08
橙粉背景上排列 Accenture、Cisco、Fortinet、Okta、Wiz 等合作伙伴标识。
STORY 03 / 12

百度开源无限OCR,跑通长程解析,核心作者YY疑是来自DeepSeek

03-01
白底论文首页展示 Unlimited OCR Works 和长程解析示意图。
03-02
百度标识页写有 Unlimited OCR Works 和 Baidu Inc.。
03-03
模型架构图说明人类复制书本的启发、KV cache 和长上下文解析流程。
03-04
R-SWA 注意力图对比 Vanilla Attention 与 R-SWA 的 KV cache 占用。
03-05
折线图展示 Flash Attention v3 kernel latency 随 decoding length 增加。
03-06
大表格比较 OmniDocBench 中 Unlimited OCR 与 DeepSeek-OCR、Gemini 等模型表现。可提取数据:表内列出 end-to-end 与 text-only
03-07
表格展示 Unlimited OCR 与 DeepSeek-OCR 在不同文档类型上的子类对比。可提取数据:行包含 DS-OCR、DS-OCR + Reroder 和 UOW。
深色工具界面展示论文页面解析成右侧文本输出。
STORY 04 / 12

LeCun、谢赛宁转发的世界模型与VLA共融方案:中关村学院ECCV2026—VLA-JEPA

04-01
论文标题页显示 VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model。
04-02
两阶段训练框架图展示人类视频预训练和机器人数据微调,以及 latent action 和 loss。
04-03
多宫格图展示 LIBERO、LIBERO-Plus、Google Robot、WindowX Robot 等机器人操作样例。
04-04
LIBERO benchmark 表格比较 LAPA、UniVLA、OpenVLA、GR00T、VLA-JEPA 等方法。可提取数据:VLA-JEPA Avg 97.2,w/o human v
04-05
LIBERO-Plus 表格展示 camera、robot language、lighting、background、layout 等扰动下成功率。可提取数据:VLA-JEPA Avg 78.
04-06
SimplerEnv 表格比较 Google Robot 与 WidowX Robot 多任务成功率。
04-07
柱状图展示 in-distribution、out-of-distribution task 和 object layouts 下成功率对比。
04-08
折线图展示 human video 比例变化时 background、language、layout、noise 等条件下成功率变化。
机器人手臂在桌面上操作彩色物体的多方法对比画面。
04-10
封面图是一台胸前带问号的机器人站在城市背景前,用于概括机器人世界模型主题。
STORY 05 / 12

生物学的EDA时刻来了!

05-01
黑底发布会屏幕用箭头展示 perception AI、generative AI、agentic AI 到 physical AI 的发展路径。
05-02
红色柱状图展示不同学科中科学家未能复现实验的比例。
05-03
论文标题页显示 autonomous biology 和 compiler-verified protocols 主题。
05-04
端到端流程图展示从 SOP input 到 BPL compiler oracle 再到 output artifacts。
05-05
BPL Compiler Architecture 图分层展示 source code、grammar、typed AST、semantic analysis 和 plan。
05-06
诊断类别柱状图列出 dimension mismatch、capacity violation、undeclared identifier、state conflict 和 trust vio
05-07
修复尝试柱状图显示累计编译成功率,attempt 1 为 82.3%。
05-08
SAION 平台架构图展示认知、控制和执行三层。
动图展示高通量自动化质粒构建设备或实验平台画面。
05-10
半导体行业与生物行业对比表,把 EDA 与 BDA 的研发、验证和生产流程并列。
STORY 06 / 12

英伟达讲了三年的故事,Momenta准备在港交所兑现

06-01
英伟达发布会截图显示 NVIDIA full-stack physical AI partners。
06-02
Momenta R7 发布会现场屏幕写有物理 AI 序章。
06-03
Momenta R7 世界模型三层架构图展示世界模型、世界认知和强化学习等层级。
06-04
Momenta 创始人或高管人物照片,黑色上衣胸前有标识。
06-05
华为与 Momenta 自动驾驶相关对比或合作结构图。
06-06
招股书表格截图展示财务数据。可提取数据:表中列出 2023、2024 和 2025 年相关收入项目。
06-07
柱状图展示未来年份收入或业务规模增长预测。
06-08
黑底信息图比较 Momenta 与 Tesla 的技术路线和商业化方式。
STORY 07 / 12

成立不到90天的超级创企昆仑行,刷新具身最快独角兽

07-01
会议现场照片中人物坐在签约背景前,桌牌显示任庚。
07-02
黑衣人物半身照,灰色背景,双手自然放在身前。
07-03
会议现场照片中人物坐在签约背景前,桌牌显示任庚。
07-04
黑衣人物半身照,灰色背景,双手自然放在身前。
07-05
会议现场照片中人物坐在签约背景前,桌牌显示任庚。
07-06
黑衣人物半身照,灰色背景,双手自然放在身前。
STORY 08 / 12

首个高考志愿AI测评发布:千问多项表现超过人类志愿咨询师

08-01
白底雷达图标题为千问 VS 人类咨询师六维能力对比,图中有粉色与蓝色多边形。
STORY 09 / 12

连续创业者姚颂、正大集团、清华知名青年学者于超联合发起,正行创新完成近亿美元天使轮融资

09-01
灰白背景图显示 Striding.AI 正行创新标识和多台白色机器人形象。
STORY 10 / 12

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

10-01
论文标题页显示 The Personalization Trap: How User Memories Alter Emotional Reasoning in LLMs。
10-02
实验框架图展示用户信息、advantaged 与 disadvantaged 记忆条件,以及情绪理解、情绪管理等任务。
10-03
结果表比较 Claude、DeepSeek、Llama、Qwen、GPT 等模型在 No Mem、Adv.、Disadv. 设置下得分。可提取数据:Claude 3.7 Sonnet No M
10-04
中文势弱用户画像卡片显示人物头像,并列出教育资源匮乏、低收入工作、社会支持有限和经济压力大。
10-05
箱线图或分布图展示不同模型和设置下情绪推理分数变化。
STORY 11 / 12

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

11-01
蓝色发光路径穿过暗色环境,周围有红色风险区域,用于表现机器人安全探索。
STORY 12 / 12

Science子刊丨从分子生成到验证,AI与药用化学家的双轨优化策略

12-01
期刊网页截图显示论文标题 Discovery of TYR inhibitors from de novo molecular generation to dual-track lead op
12-02
研究总图展示 AI-based lead mining、medicinal chemist optimization 和 biological activity evaluation 等模块。
12-03
大图展示多组化合物结构式和 lead optimization 路线。
12-04
竖版图展示模型预测、化合物筛选、活性曲线和多个候选分子结构。
12-05
结果集合图包含柱状图、显微或动物实验图片、分子图和数据表格。
今天最重要的模型发布,是豆包大模型 2.1 Pro。发布会直接把它定位成一次生产级能力跃迁。
原文给出的第一层证据,是多模型榜单。豆包被放到 GPT、Claude、Gemini 和 DeepSeek 等模型旁边比较。
另一个榜单继续强调通用任务、推理和应用能力,而不是只展示单一场景的跑分。
产品路线图里,视觉、语音、推理和应用开发被串成一条链路,这说明发布重点不是单个模型,而是一套生产系统。
图像能力部分,原文用 4K 和 720P 人脸细节对比来展示高分辨率生成或增强的效果。
发布会还把影像质感、长时自洽一致性和样本多模态价值放在同一页,强调生成内容的可控性和连贯性。
动图演示中,系统展示了长图像或 RTL 相关能力的曲线与控制面板,说明图像生成已经进入可调参的工作流。
在问答动图里,模型能围绕资本支出和 AI 数据中心给出分步骤回答,这是长上下文与知识组织能力的应用入口。
另一段动图展示 CV 论文梳理问题,说明发布方希望把模型能力落到研究、办公和信息检索场景。
这条新闻的关键不只是新模型上线,而是豆包在努力把基准、成本、多模态和应用体验合并成可交付的生产平台。
OpenAI 今天把安全专用模型 GPT-5.5-Cyber 和 CyberGym 放到台前,核心目标是让模型参与真实漏洞修补。
Sam Altman 的截图里,CyberGym 柱状图把 GPT-5.5-Cyber-pro 放在第一位。
单独的 CyberGym 图显示,GPT-5.5-Cyber-pro 得分 85.6,高于 Verity-R1 和 GPT 系列对照。
在 SEC Bench Pro 图里,GPT-5.5-Cyber 是 69.8%,GPT-5 是 63.1%,差距被标得很直接。
Greg Brockman 的截图进一步把方向说清楚:模型不只找漏洞,还要生成和应用补丁。
原文还展示了 3 万个仓库、3000 多万次提交和 50 多万个修复发现这样的规模指标。
工具界面图说明 CyberGym 并不是单纯论文评测,而是在向可操作的安全工作台靠近。
合作伙伴标识也说明,这条线最终要面对企业安全和生态集成,而不是只做实验室展示。
百度这条新闻的关键词是无限 OCR,也就是把长文档解析从分段处理推进到更长程的一次性理解。
论文标题页和百度标识页说明,这是百度团队围绕长程解析开源的新工作。
架构图把人类抄书的过程类比成模型解析流程,重点是让上下文和 KV cache 更可控。
R-SWA 注意力图展示它如何减少长期解码时的缓存压力,避免注意力成本持续膨胀。
延迟曲线进一步说明,解码长度增加时,不同注意力实现的调用耗时会迅速拉开。
在多文档类型表格里,Unlimited OCR 被拿来和 DeepSeek-OCR、Gemini 等系统比较。
更细的子类表格显示,阅读顺序、文本重排和不同文档类型都是评价重点。
演示视频中,左侧论文页面被送入工具,右侧生成结构化文本,这才是长程 OCR 最实际的使用场景。
VLA-JEPA 这篇论文试图把世界模型和视觉语言动作模型接在一起,让机器人更懂动作后果。
框架图把训练分成两段:先用人类视频学习潜在世界模型,再用机器人数据微调动作头。
这背后的判断是,人类视频里有大量物理交互线索,可以帮助机器人减少只靠示教数据学习的压力。
在 LIBERO 表格中,VLA-JEPA 的平均成功率标到 97.2,去掉 human video 后是 96.1。
LIBERO-Plus 进一步加入相机、语言、光照、背景和布局扰动,VLA-JEPA 仍被放在最高一行。
SimplerEnv 表格则把 Google Robot 和 WidowX Robot 分开比较,覆盖 pick、move、drawer 和 spoon 等任务。
柱状图说明,在分布内任务和分布外对象布局中,VLA-JEPA 都比两个对照方法更高。
折线图还显示,人类视频比例升高时,多种扰动条件下的成功率整体上行。
视频演示里,机器人在桌面上处理彩色物体,多帧对比展示了不同方法的动作结果。
这条新闻的意义在于,VLA 研究正在从单纯模仿动作,转向学习可预测的物理世界表示。
这篇文章把生物学的自动化时刻类比成芯片行业的 EDA 时刻。
问题背景是实验复现困难。红色柱状图显示,不同学科都有大量科学家遇到过复现实验失败。
论文标题页给出核心方向:用编译器验证协议,为真实世界 AI 执行打基础。
端到端流程图显示,实验 SOP 会被规范化、解析、编译,并输出可执行的诊断和工件。
BPL 编译器架构把语法、类型树、语义分析和意图下沉分开处理,像软件工程一样检查实验协议。
诊断类别图说明,它能发现维度不匹配、容量违规、未声明标识符、状态冲突和信任违规。
修复循环图显示,第一次尝试已经能让 82.3% 的协议通过编译,后续尝试继续补齐。
SAION 平台图把认知、控制和执行分成三层,试图把协议理解和闭环实验连起来。
动图中的自动化设备展示了这类系统最终要连接的真实实验硬件。
半导体与生物行业对比表说明,BDA 想复刻 EDA 的价值:把复杂研发变成可验证流程。
Momenta 这条新闻的主线,是把自动驾驶公司放进英伟达讲了多年的 physical AI 故事里。
R7 发布会现场把物理 AI 序章作为关键词,说明 Momenta 正在重塑自己的资本市场叙事。
三层架构图把世界模型、世界认知和强化学习串起来,强调不只是感知模块,而是闭环驾驶系统。
人物照片提供了产业故事的创业者主体,也让这条新闻从技术路线转向公司兑现能力。
华为与 Momenta 图显示,智能驾驶供应链已经进入多方协同和平台化竞争阶段。
招股书表格和收入图表是这条新闻的另一半:资本市场最终要看收入和增长预期。
收入柱状图把未来年份画成陡峭上行曲线,这也是市场需要验证的核心假设。
与 Tesla 和 Anthropic 的对比图说明,Momenta 希望同时讲清技术平台和商业化模式。
昆仑行这条新闻首先是速度:成立不到 90 天,就被原文称为具身智能最快独角兽。
具身智能正在吸引密集资本押注,因为它连接大模型、机器人硬件和真实场景执行。
融资故事本身说明,市场相信机器人基础能力会从实验室进入产业应用。
但这类新闻不能只看估值,关键还要看机器人平台、客户场景和可复制部署能力。
所以它更像是具身智能赛道热度的信号,而不是技术胜负已经确定。
接下来真正要验证的,是这家公司能否把资金和团队优势转化成可运行的机器人系统。
这条新闻把高考志愿填报变成了一个 AI 与人类咨询师的对照测试。
雷达图中,千问和人类咨询师被放在六个能力维度上比较。
它的意义在于,志愿填报并不只是查分数线,还要整合专业、城市、家庭偏好和风险。
AI 的优势是覆盖面和一致性,人类咨询师的优势则是经验、沟通和个性化判断。
因此这类测评更适合提醒我们:AI 可以参与决策,但不能替代最终复核。
正行创新这条新闻的重点,是近亿美元天使轮融资和强发起人组合。
标题里出现连续创业者、正大集团和清华青年学者,说明市场首先押注团队背景。
品牌图中的机器人形象,也把公司叙事放到了智能系统和实体交互方向。
但早期融资不能替代产品验证,真正关键是后续能否披露明确客户和技术路线。
这条新闻更像是 AI 创业资金继续涌向高壁垒团队的一个信号。
Amazon 这篇 ACL 论文研究一个很具体的问题:用户记忆会不会改变大模型的情绪推理。
实验框架把用户画像分成优势和劣势条件,再观察模型如何处理情绪理解、管理和支持任务。
结果表显示,多款模型在加入 advantaged 或 disadvantaged 记忆后,得分都会变化。
中文画像卡片说明,所谓劣势用户包含教育、收入、社会支持和经济压力等维度。
这条研究的警示是,长期记忆可以个性化服务,也可能把社会偏差带进情绪判断。
清华团队这篇研究关注真机强化学习里的安全探索问题。
真机学习和仿真不同,机器人不能靠大量危险试错来换取策略改进。
标题中的安全探索均衡机制,核心是让学习效率和安全边界同时被考虑。
这条研究的价值在于提醒我们,机器人智能的下一步不只是更会动,还要更会安全地学。
最后一条研究来自 Science 子刊,主题是 AI 和药用化学家的双轨优化。
总图把流程拆成 AI 先导发现、化学家优化和生物活性验证几个环节。
化合物结构图说明,AI 生成并不是终点,后续还要围绕候选分子做结构优化。
竖版图把筛选、预测、活性曲线和候选分子放在一起,体现双轨协作。
结果集合图提醒我们,AI 药物发现的关键仍是实验验证,而不只是生成漂亮分子。
机器之心 AI News Digest

机器之心 · 2026.06.23 · 12 stories · 11:19

机器之心 AI News Digest

机器之心 2026.06.23 digest with 12 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 1:37
    01. 刚刚,豆包大模型2.1发布,又一次跨越生产级质变点 Source
    豆包大模型 2.1 Pro 发布,原文重点展示了模型在多项通用能力、长上下文、图像生成和生产级应用上的更新。
  2. 1:38 - 2:45
    02. 战胜Mythos 5,OpenAI安全专用GPT-5.5-Cyber完全体来了 Source
    原文报道 OpenAI 扩展网络安全方向的模型与工具,重点是 GPT-5.
  3. 2:46 - 3:51
    03. 百度开源无限OCR,跑通长程解析,核心作者YY疑是来自DeepSeek Source
    百度开源 Unlimited OCR,原文强调它面向超长文档解析,并在 DeepSeek-OCR 之后继续推进端到端长程 OCR。
  4. 3:51 - 5:15
    04. LeCun、谢赛宁转发的世界模型与VLA共融方案:中关村学院ECCV2026—VLA-JEPA Source
    VLA-JEPA 把世界模型和视觉语言动作模型结合起来,原文强调用潜在世界模型改进机器人动作预测。
  5. 5:16 - 6:37
    05. 生物学的EDA时刻来了! Source
    原文把自动化生物学描述成从感知 AI、生成式 AI、智能体 AI 走向 physical AI 的过程,并聚焦 BPL 与 SAION 平台。
  6. 6:38 - 7:41
    06. 英伟达讲了三年的故事,Momenta准备在港交所兑现 Source
    原文围绕 Momenta 准备在港交所兑现自动驾驶和物理 AI 叙事,连接英伟达、R7 物理 AI 序章、数据增长和车企合作。
  7. 7:42 - 8:26
    07. 成立不到90天的超级创企昆仑行,刷新具身最快独角兽 Source
    原文报道昆仑行成立不到 90 天即刷新具身智能最快独角兽纪录,重点是创业团队、融资速度和具身智能赛道热度。
  8. 8:26 - 9:00
    08. 首个高考志愿AI测评发布:千问多项表现超过人类志愿咨询师 Source
    原文发布高考志愿 AI 测评,核心素材是千问与人类咨询师在六个维度上的雷达图对比。
  9. 9:01 - 9:36
    09. 连续创业者姚颂、正大集团、清华知名青年学者于超联合发起,正行创新完成近亿美元天使轮融资 Source
    原文报道正行创新完成近亿美元天使轮融资,标题强调连续创业者、正大集团与清华青年学者联合发起。
  10. 9:37 - 10:16
    10. 你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商 Source
    Amazon ACL 论文研究用户记忆如何影响大模型情绪推理,主题是个性化记忆可能让模型对不同用户画像产生偏差。
  11. 10:17 - 10:43
    11. 真机强化学习如何保证安全性?清华团队提出安全探索均衡机制 Source
    清华团队提出面向真机强化学习的安全探索均衡机制,原文关注机器人在探索时如何避免危险行为。
  12. 10:43 - 11:19
    12. Science子刊丨从分子生成到验证,AI与药用化学家的双轨优化策略 Source
    Science 子刊文章关注 AI 与药用化学家的双轨优化策略,用于从分子生成到验证地发现 TYR 抑制剂。