AI 日报：2026-06-02

1. OpenAI Codex 接入 Amazon Bedrock，本地 Agent 可用 AWS 侧模型与账单体系

OpenAI Developers 的 Codex changelog 在 6 月 1 日更新称，Codex 现在可以使用 Amazon Bedrock 上支持的 OpenAI 模型，并可通过 AWS 托管认证、账户控制和计费在本地运行 Codex。

💡 这把编码 Agent 的模型供应、权限和账单进一步带进企业云账户，是 Agent 企业化落地的关键基础设施变化。

2. Anthropic 发布 Claude Opus 4.8，强调编码、Agent 与专业工作

Anthropic 官方介绍 Claude Opus 4.8 是 Opus 系列最新升级，在 coding、agentic tasks 和 professional work 上增强，并强调可处理 long-running work。

💡 头部模型继续围绕长周期任务和软件工程能力迭代，说明“能否稳定交付工作”比单轮对话分数更重要。

3. GitHub Copilot 从 6 月 1 日起切换到 AI Credits 用量计费并加入预算控制

GitHub Changelog 称，6 月 1 日起所有 Copilot plans 按 GitHub AI Credits 消耗计费，并推出 user-level budget controls 与 Copilot Max 升级能力。

💡 AI 编程工具从“订阅功能”转向“可治理的用量成本”，工程团队需要重新设计预算、权限和使用策略。

4. Google DeepMind 发布 Gemini Omni / Gemini 3.5 相关模型卡，强化模型透明度

Google DeepMind 模型页显示 2026 年 5 月发布 Gemini Omni，并同步提供 Gemini Omni Flash、Gemini 3.5 Flash 等模型卡，用于说明模型设计、限制和安全评估信息。

💡 多模态与行动能力模型越强，模型卡和限制说明越成为开发者评估风险、合规和应用边界的必要材料。

5. Hugging Face 发布 NVIDIA Cosmos 3，定位 Physical AI 推理与行动的开放 Omni-model

Hugging Face Blog 6 月 1 日发布“Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action”，聚焦物理 AI 的推理与行动能力。

💡 物理世界理解、机器人和仿真正在成为多模态模型的重要战场，开放模型会加速具身智能应用实验。

6. JetBrains 在 Hugging Face 发布 Mellum2：12B MoE 编程相关模型

Hugging Face Blog 6 月 1 日发布“Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains”，介绍 JetBrains 的 12B MoE 模型。

💡 IDE 厂商自研模型说明 AI 编程竞争正在深入开发工具链本身，模型会更贴近真实编码上下文和产品工作流。

7. Mistral 推出 Workflows 公测并继续强化 Vibe 远程 Agent

Mistral 新闻页显示，Mistral AI Workflows for work that runs the business 于 5 月 22 日进入 public preview；同时 Vibe 远程 Agent 与 Work Mode 面向复杂办公和编码任务。

💡 欧洲模型厂商正在把 Agent 做成企业流程产品，竞争焦点从模型参数转向可审计、可交付的业务工作流。

8. Qwen3.7-Plus 发布为统一视觉和语言的多模态 Agent 模型

Qwen 官方博客介绍 Qwen3.7-Plus 是 multimodal agent model，把 vision 与 language 统一到单一、通用的 agent foundation 中。

💡 国内模型路线继续向多模态 Agent 推进，未来产品会更关注看图、读文档、调用工具和完成任务的一体化能力。

🔗 Qwen

9. arXiv 论文 AgentAtlas 提出超越结果排行榜的 LLM Agent 评测视角

arXiv 论文 AgentAtlas: Beyond Outcome Leaderboards for LLM Agents 于 5 月提交并在 5 月 26 日修订，关注 LLM Agents 不应只用最终结果排行榜评价。

💡 Agent 失败常发生在规划、工具调用和恢复过程，新的评测框架有助于看清“为什么失败”而不是只看成功率。

10. OpenClaw 2026.6.1 beta 外置 GitHub Copilot Agent runtime 插件

GitHub Releases 显示 openclaw/openclaw 发布 2026.6.1-beta.1，其中将 GitHub Copilot agent runtime 外置为官方 @openclaw/copilot 插件并加入 npm 与 ClawHub 发布元数据。

💡 开源 Agent 平台正在模块化接入主流编码 Agent 运行时，插件生态可能成为开发者选择工具的重要标准。