← 返回 AI 日报归档 · ← 返回首页
AI 日报:2026-06-02
采集于 2026-06-02 18:00 CST · 共 10 条
1. OpenAI Codex 接入 Amazon Bedrock,本地 Agent 可用 AWS 侧模型与账单体系
OpenAI Developers 的 Codex changelog 在 6 月 1 日更新称,Codex 现在可以使用 Amazon Bedrock 上支持的 OpenAI 模型,并可通过 AWS 托管认证、账户控制和计费在本地运行 Codex。
💡 这把编码 Agent 的模型供应、权限和账单进一步带进企业云账户,是 Agent 企业化落地的关键基础设施变化。
2. Anthropic 发布 Claude Opus 4.8,强调编码、Agent 与专业工作
Anthropic 官方介绍 Claude Opus 4.8 是 Opus 系列最新升级,在 coding、agentic tasks 和 professional work 上增强,并强调可处理 long-running work。
💡 头部模型继续围绕长周期任务和软件工程能力迭代,说明“能否稳定交付工作”比单轮对话分数更重要。
3. GitHub Copilot 从 6 月 1 日起切换到 AI Credits 用量计费并加入预算控制
GitHub Changelog 称,6 月 1 日起所有 Copilot plans 按 GitHub AI Credits 消耗计费,并推出 user-level budget controls 与 Copilot Max 升级能力。
💡 AI 编程工具从“订阅功能”转向“可治理的用量成本”,工程团队需要重新设计预算、权限和使用策略。
4. Google DeepMind 发布 Gemini Omni / Gemini 3.5 相关模型卡,强化模型透明度
Google DeepMind 模型页显示 2026 年 5 月发布 Gemini Omni,并同步提供 Gemini Omni Flash、Gemini 3.5 Flash 等模型卡,用于说明模型设计、限制和安全评估信息。
💡 多模态与行动能力模型越强,模型卡和限制说明越成为开发者评估风险、合规和应用边界的必要材料。
5. Hugging Face 发布 NVIDIA Cosmos 3,定位 Physical AI 推理与行动的开放 Omni-model
Hugging Face Blog 6 月 1 日发布“Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action”,聚焦物理 AI 的推理与行动能力。
💡 物理世界理解、机器人和仿真正在成为多模态模型的重要战场,开放模型会加速具身智能应用实验。
6. JetBrains 在 Hugging Face 发布 Mellum2:12B MoE 编程相关模型
Hugging Face Blog 6 月 1 日发布“Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains”,介绍 JetBrains 的 12B MoE 模型。
💡 IDE 厂商自研模型说明 AI 编程竞争正在深入开发工具链本身,模型会更贴近真实编码上下文和产品工作流。
7. Mistral 推出 Workflows 公测并继续强化 Vibe 远程 Agent
Mistral 新闻页显示,Mistral AI Workflows for work that runs the business 于 5 月 22 日进入 public preview;同时 Vibe 远程 Agent 与 Work Mode 面向复杂办公和编码任务。
💡 欧洲模型厂商正在把 Agent 做成企业流程产品,竞争焦点从模型参数转向可审计、可交付的业务工作流。
8. Qwen3.7-Plus 发布为统一视觉和语言的多模态 Agent 模型
Qwen 官方博客介绍 Qwen3.7-Plus 是 multimodal agent model,把 vision 与 language 统一到单一、通用的 agent foundation 中。
💡 国内模型路线继续向多模态 Agent 推进,未来产品会更关注看图、读文档、调用工具和完成任务的一体化能力。
9. arXiv 论文 AgentAtlas 提出超越结果排行榜的 LLM Agent 评测视角
arXiv 论文 AgentAtlas: Beyond Outcome Leaderboards for LLM Agents 于 5 月提交并在 5 月 26 日修订,关注 LLM Agents 不应只用最终结果排行榜评价。
💡 Agent 失败常发生在规划、工具调用和恢复过程,新的评测框架有助于看清“为什么失败”而不是只看成功率。
10. OpenClaw 2026.6.1 beta 外置 GitHub Copilot Agent runtime 插件
GitHub Releases 显示 openclaw/openclaw 发布 2026.6.1-beta.1,其中将 GitHub Copilot agent runtime 外置为官方 @openclaw/copilot 插件并加入 npm 与 ClawHub 发布元数据。
💡 开源 Agent 平台正在模块化接入主流编码 Agent 运行时,插件生态可能成为开发者选择工具的重要标准。