机器之心 AI NEWS DIGEST
2026 06 30
STORY 01 / 10

Pavo 平台把 AI 视频和短剧创作做成免费 Agent Native 工作流

01-01
Pavo 与 AURA 字样的 AI 创作平台封面图。
01-02
多组时尚模特造型排列图。
01-03
AURA 香水瓶广告风格图。
自由女神像风格生成视频片段。
地球与太空视角生成视频片段。
儿童和动物围坐篝火的生成视频片段。
奇幻人物与暗色场景生成视频片段。
户外景区与古建筑生成视频片段。
渔港与船只生成视频片段。
渔民整理网具的生成视频片段。
水下生物与岸边画面组合的生成视频片段。
暗光香水产品广告生成视频片段。
明亮香水产品广告生成视频片段。
模特走秀动图展示图像到视频效果。
STORY 02 / 10

JetSpec 从草稿生成侧提升大模型投机解码效率

02-01
蓝色数据网络风格封面图。
02-02
DeepSeek V4 Flash 和 Pro 的推理吞吐曲线图。
02-03
Token 数和 Speedup 的公式图。
02-04
JetSpec、DFlash 和 DDTree 在多基准上的柱状加速对比图。
02-05
不同 draft length 下接受率变化曲线图。
02-06
JetSpec demo 页面截图。
02-07
AIME25 depth-wise acceptance rate 曲线图。
02-08
JetSpec 论文首页截图。
STORY 03 / 10

Meta Brain2Qwerty v2 把非侵入式脑信号解码推进到整句级别

03-01
Brain2Qwerty v2 蓝色大脑封面图。
03-02
非侵入式脑信号采集设备佩戴示意图。
03-03
从字符级到句子级脑信号解码示意图。
03-04
训练数据、字符准确率和词准确率柱状图。
03-05
Meta 官方帖文介绍 Brain2Qwerty v2。
03-06
Nature Neuroscience 文章页面截图。
03-07
Brain2Qwerty v2 论文首页截图。
Introducing Brain2Qwerty v2 动图封面。
STORY 04 / 10

Meta 因蒸馏风险限制 Claude Code 和 Codex 进入模型研发流程

04-01
Meta 蓝色标志封面图。
04-02
The Information 相关文章截图。
04-03
Meta 公司标志照片。
04-04
扎克伯格在 Meta 标志前的资料照片。
04-05
The Information 报道截图。
04-06
Meta 公司标志照片。
04-07
扎克伯格在 Meta 标志前的资料照片。
04-08
Meta 标志封面图。
STORY 05 / 10

Claude Code 团队负责人称 AI 时代团队角色正在被重写

05-01
AI 招聘和团队成员插画封面。
05-02
Boris Cherny 长帖截图。
05-03
Kun Chen 与 Boris Cherny 的 X 讨论截图。
05-04
AI 团队主题插画封面。
05-05
Boris Cherny 长帖截图。
STORY 06 / 10

Loop Engineering 把智能体研发从 Prompt 转向闭环工作流

06-01
AI Loop Engineering 与人类闭环系统对比图。
06-02
NeuroMatrix 设备结构图。
06-03
Ego-NeuroLoop 脑机和机器人主题封面图。
06-04
Looped World Model Architecture 架构图。
06-05
Ego-NeuroLoop 系统图。
06-06
AI 与人类闭环系统对比图。
06-07
Ego-NeuroLoop 系统图。
STORY 07 / 10

LiveWorld 让视频世界模型在视野之外继续演化

07-01
LiveWorld 论文首页截图。
07-02
世界状态、渲染器和监视器示意图。
07-03
视野外动态问题的房间场景示意图。
07-04
LiveWorld 训练和环境构建流程图。
07-05
三组场景结果拼图。
STORY 08 / 10

机制可解释性研究质疑同一能力只有唯一电路

08-01
罗马斗兽场和电路网络风格封面图。
08-02
论文标题页截图。
08-03
不同电路到达同一输出的示意图。
08-04
Sheaf A 与 B 的 IOI 结果截图。
08-05
IOI per-layer intersection counts 曲线图。
STORY 09 / 10

AI-CURA 用大语言模型重构 ACMG 变异判读流程

09-01
DNA 双螺旋和医学遗传主题封面图。
09-02
AI-CURA 工作流和证据整合流程图。
09-03
AI-CURA 变异分类界面和证据整合结果图。
STORY 10 / 10

普朗克被撤稿误判暴露算法化学术记录风险

10-01
马克斯·普朗克黑白肖像封面。
10-02
关于普朗克论文被撤稿的网页截图。
10-03
Retracted Nobel Prize winners 页面截图。
10-04
早期学术文献页面扫描截图。
10-05
撤稿名单页面截图。
10-06
撤稿新闻页面截图。
10-07
马克斯·普朗克肖像封面。
10-08
早期学术文献页面扫描截图。
Pavo 这条报道的重点,是把 AI 视频和短剧从单次生成,推向可以连续修改的创作平台。
文章说,创作者真正痛的不是没有素材,而是角色一致、分镜衔接和多轮试错都会持续消耗成本。
Agnes AI 的做法,是先把文本、图像和视频模型 API 长期免费开放,再把能力封装进 Pavo PC 端。
第一个演示片段呈现自由女神像风格的动态镜头,说明平台不只停留在静态图。
第二个片段切到宇宙和地球视角,展示它对大场景和电影感镜头的处理。
第三个片段是童话场景,画面里角色、动物和光源共同组成短剧式叙事。
第四个片段更长,连续展示人物奇幻场景,适合观察角色和氛围能否维持。
平台还给出户外景区和古建筑镜头,显示它面向的不只是人物,也包括旅行和场景视频。
渔港与作业镜头则更接近纪录片素材,强调真实世界动作和环境细节。
另一个渔业片段把动作推到近景,能看到手部、网具和水面互动。
第八个片段把水下和岸边镜头拼接在一起,更像多镜头短视频草稿。
最后两个香水片段展示商品广告风格,从暗光戏剧化转向明亮产品图。
明亮版本则说明同一商品可以被快速改成不同调性,用于广告素材试错。
所以这条新闻真正值得看的是工作流:免费模型只是入口,连续创作才是 Pavo 想占的位置。
JetSpec 这条新闻说的是,大模型进入 Agent 高频调用后,推理速度开始和模型分数一样重要。
文章把 JetSpec 和 DeepSeek 的 DSpark 放在一起看:两者都在解决投机解码中的无效计算。
JetSpec 的切入点是草稿生成,用因果并行树让一次验证能接受更多候选 Token。
报道称,在 Qwen3-8B 上,JetSpec 最高实现 9.64 倍端到端解码加速。
在 MATH-500 上,它一次验证平均可接受 10.76 个 Token,这正是投机解码能省时间的来源。
文章强调,这种提速不只服务数学题,也会影响代码、对话和多轮工具调用。
原因很直接:Agent 一次任务背后可能有几十次甚至上百次模型调用,延迟会被连续放大。
所以这条技术新闻的信号是,Agent 规模化不只靠更强模型,也要靠更快、更便宜的解码路径。
Meta 这条脑机接口新闻的关键,是 Brain2Qwerty v2 把非侵入式脑信号解码推进到整句级别。
文章对比了两条路线:侵入式脑机接口信号强,但需要手术;非侵入式安全,却长期难以稳定解码。
Meta 称 v2 能从原始脑信号中实时解码自然句子,不再只是逐字符拼接。
公开数据里,九名被试平均词准确率达到百分之六十一,最佳被试达到百分之七十八。
Meta 还说,超过一半句子的解码偏差被控制在一个单词以内。
相关论文页和 Nature Neuroscience 页面说明,这项工作仍处在研究发表和实验验证阶段。
它的意义不是马上商用,而是让非侵入式脑到文本沟通从字符级演示走向语义级系统。
下一步仍要看样本量、患者场景、设备可用性和长期稳定性,能否支撑真正的辅助沟通。
Meta 这条新闻显示,AI 编程工具已经强到让模型公司开始担心蒸馏边界。
文章援引 The Information 称,Meta 正限制员工在模型构建中使用 Claude Code 和 Codex。
原因是第三方模型输出如果进入训练数据、评测任务或代码挑战题,就可能引发蒸馏争议。
MetaCode 团队需要构建编程数据集和测试任务,这正是外部 AI 输出最敏感的入口。
指南允许 AI 做常规辅助,但禁止让外部模型决定应该测试自家模型什么问题。
文章还说,Meta 限制 AI 分析源代码找漏洞,或据此生成测试创意。
更深层的问题是,AI 编程助手既能提升效率,也可能污染训练和评测链路。
未来模型公司需要更明确的工具使用审计,否则研发效率和合规风险会持续拉扯。
Claude Code 负责人这条观点,说 AI 时代被重写的不只是工程师,而是整个团队分工。
Boris Cherny 把未来团队拆成五类行为角色:原型师、构建者、清理师、增长师和维护者。
原型师负责提出大量想法,构建者把粗糙原型变成能进生产的产品或基础设施。
清理师做减法,处理 AI 时代更容易出现的功能膨胀、代码混乱和系统冗余。
增长师让产品更接近市场,维护者则守住成熟系统的安全、可靠性和效率。
文章强调,这些角色不是岗位名称;设计师、工程师和产品经理都可能跨越两三类角色。
这意味着管理问题会从你是什么职位,变成你能推进产品生命周期里的哪一段。
这还只是观点,但它抓住了 Agent Coding 对组织结构的真实压力。
Loop Engineering 这条新闻的核心,是 AI 工程重心正在从单次 Prompt 转向持续闭环。
一个系统接任务、调工具、看结果、发现问题,再修正,直到目标被推进完成。
放到机器人里,问题更复杂,因为闭环要面对视觉误差、动作控制和真实世界反馈。
文章介绍的 Facemind 先做端侧全模态模型,后来把重心转向世界模型研究。
它的 Looped World Model 试图让智能系统在反馈里不断修正状态,而不是一次性预测。
Ego-NeuroLoop 则把第一视角、人类动作和神经信号放到同一个闭环数据框架里。
文章的判断是,具身智能真正缺的不是更多静态视频,而是为什么这样做、做到哪一步、如何修正。
这仍是早期路线,但它解释了为什么人类闭环数据正在成为具身智能的新竞争点。
LiveWorld 这篇论文问了一个很具体的问题:镜头移开后,世界模型里的世界还会继续变化吗?
文章说,很多视频世界模型其实只会生成当前相机看到的内容。
一旦物体离开视野,模型容易把它停在最后一次出现的状态。
LiveWorld 的做法,是把世界自身的演化和相机观察的渲染拆成两个步骤。
结果拼图显示,它尝试在不同场景里保持离屏对象和动态实体的持续状态。
这篇机制可解释性研究质疑一个默认前提:同一种能力未必只有一条唯一电路。
论文标题 All Circuits Lead to Rome,本身就在说多条电路可能通向同一输出。
示意图里,电路 A 和电路 B 都能把同一个任务提示带到同一个答案。
结果截图显示,两个 sheaf 在 IOI 任务上都能达到百分之百准确率,但内部边重叠并不高。
如果这个现象普遍存在,可解释性研究就需要描述一组等价机制,而不是只找唯一答案。
AI-CURA 这条研究新闻,把大语言模型放进 ACMG 临床遗传变异判读流程。
文章说,变异分类不是简单查数据库,而是要检索文献、解释证据并套用规则。
AI-CURA 的目标,是把变异输入、证据检索、规则判断和分类建议连成一个自动化流程。
结果界面把证据条目、规则匹配和最终分类放在一起,便于专家审查。
但医学场景不能只看模型输出,真正关键是证据链透明、专家复核和真实病例验证。
普朗克这条新闻不是说量子之父真的出了新论文问题,而是讲算法化学术记录出了错。
文章展示的页面把普朗克放进撤稿语境里,乍看像一个离谱的历史反转。
撤稿名单截图里,Max Planck 的条目被标出,问题出在数据库和元数据处理方式。
历史文献页面则提醒我们,老论文、转载、作者身份和撤稿语境很容易被自动系统混在一起。
这类错误的风险在于,科研评价和文献检索越来越依赖自动化数据管线。
如果算法没有处理好元数据,错误会被统计、引用和搜索系统继续传播。
所以这条新闻的 AI 相关性,不在模型炫技,而在自动化信息系统如何改变学术事实的呈现。
最终仍要回到原始文献和人工校验,不能只信数据库给出的自动标签。
机器之心 AI News Digest

机器之心 · 2026.06.30 · 10 stories · 8:26

机器之心 AI News Digest

机器之心 2026.06.30 digest with 10 source-grounded stories, Chinese captions, synchronized narration, and source media panels.

Stories

  1. 0:00 - 1:31
    01. Pavo 平台把 AI 视频和短剧创作做成免费 Agent Native 工作流 Source
    文章称 Agnes AI 推出 Pavo PC 端 AI 创作平台,把图片、视频和短剧创作放进一个免费产品环境,并把多模态模型 API 免费开放作为底层能力。
  2. 1:31 - 2:28
    02. JetSpec 从草稿生成侧提升大模型投机解码效率 Source
    文章称阶跃星辰等提出 JetSpec,通过因果并行树生成提高一次验证可接受的 Token 数,与 DeepSeek DSpark 同期把注意力推向 Agent 场景下的推理效率。
  3. 2:28 - 3:22
    03. Meta Brain2Qwerty v2 把非侵入式脑信号解码推进到整句级别 Source
    文章称 Meta 发布 Brain2Qwerty v2,可从非侵入式脑记录中实时解码自然句子,并从字符级输出推进到单词和语义层面。
  4. 3:22 - 4:14
    04. Meta 因蒸馏风险限制 Claude Code 和 Codex 进入模型研发流程 Source
    文章援引 The Information 报道称,Meta 正限制员工在 AI 模型构建中使用 Claude Code 和 Codex,原因是担心第三方模型输出进入自家训练或评测体系。
  5. 4:15 - 5:07
    05. Claude Code 团队负责人称 AI 时代团队角色正在被重写 Source
    文章介绍 Claude Code 团队负责人 Boris Cherny 的观点:AI Agent 编程火爆后,工程、产品、设计、数据科学等岗位边界正在被重新组织成五类行为角色。
  6. 5:07 - 6:00
    06. Loop Engineering 把智能体研发从 Prompt 转向闭环工作流 Source
    文章介绍 Loop Engineering 的概念,并把它延伸到具身智能和人类第一视角闭环数据,重点关注 Facemind 围绕世界模型与 Ego-NeuroLoop 的研究布局。
  7. 6:00 - 6:29
    07. LiveWorld 让视频世界模型在视野之外继续演化 Source
    文章介绍 LiveWorld,指出现有视频世界模型常把世界演化和相机观察耦合在一起,导致离开镜头的物体状态停止更新。
  8. 6:30 - 7:00
    08. 机制可解释性研究质疑同一能力只有唯一电路 Source
    文章介绍 All Circuits Lead to Rome 一文,讨论大模型中同一任务表现是否真的对应唯一底层机制,并提出功能各向异性和电路重叠相关证据。
  9. 7:01 - 7:34
    09. AI-CURA 用大语言模型重构 ACMG 变异判读流程 Source
    文章介绍 AI-CURA 如何用大语言模型自动完成临床遗传变异分类和证据整合,目标是减少人工检索、解读文献和套用 ACMG 规则的负担。
  10. 7:34 - 8:26
    10. 普朗克被撤稿误判暴露算法化学术记录风险 Source
    文章围绕马克斯·普朗克名字出现在撤稿名单一事,讨论文献数据库和撤稿统计系统如何因算法匹配、元数据误读或自动化流程导致学术记录错误。