AI 日报：2026-06-08

1. OpenAI：Endava 正围绕 AI Agents 重构软件交付

OpenAI 6 月 4 日发布案例称，Endava 正使用 AI agents、ChatGPT Enterprise 和 Codex 来加速软件交付、自动化工作流，并建设 AI-native 企业文化。

💡 企业软件交付正在从“员工使用 AI 工具”转向“Agent 进入流程设计”，是观察 AI 组织落地的典型样本。

🔗 OpenAI

2. OpenAI：ChatGPT 新记忆系统 Dreaming 强化长期上下文

OpenAI 6 月 4 日介绍 ChatGPT 新记忆系统 Dreaming，目标是更好记住用户偏好，并在跨会话对话中保持上下文新鲜和相关。

💡 记忆能力是个人 AI 助手从“即时问答”升级为“长期工作搭档”的关键，也会带来更高的隐私和权限治理要求。

🔗 OpenAI

3. Google 汇总 2026 年 5 月 AI 更新

Google Blog 6 月 5 日发布 2026 年 5 月 AI 新闻汇总，集中回顾 Google 在 AI 产品、模型能力和开发者生态上的近期更新。

💡 I/O 后 Google 的 AI 更新正在被整理成产品矩阵，适合跟踪 Gemini、Search、AI Studio 等能力如何进入真实产品。

🔗 Google Blog

4. Hugging Face：Nemotron 3.5 Content Safety 面向企业多模态安全

Hugging Face Blog 6 月 4 日发布 NVIDIA Nemotron 3.5 Content Safety 相关介绍，强调其可定制、多模态、面向全球企业 AI 的内容安全能力。

💡 当企业把模型接入文本、图像和多语言场景，安全能力会从单一过滤器变成可配置的产品基础设施。

🔗 Hugging Face Blog

5. Hugging Face：EVA-Bench Data 2.0 覆盖 3 个领域、121 个工具、213 个场景

Hugging Face Blog 6 月 4 日发布 EVA-Bench Data 2.0，标注其覆盖 3 个领域、121 个工具和 213 个场景，用于评估工具使用与 Agent 场景能力。

💡 Agent 能否可靠调用工具，取决于更贴近真实任务的评测集；这类数据会影响企业选型和模型调优方向。

🔗 Hugging Face Blog

6. Hugging Face：hf CLI 被重新设计为更适合 Agent 操作 Hub

Hugging Face Blog 6 月 4 日介绍如何把 hf CLI 设计成 agent-optimized 的 Hub 工作方式，让 Agent 更容易通过命令行完成模型、数据集和空间相关操作。

💡 开发者平台正在为 Agent 改造接口，未来“给人用的 CLI”和“给 Agent 用的 CLI”会越来越重合。

🔗 Hugging Face Blog

7. TechCrunch：AI 公司可能迎来“Tokenpocalypse”成本压力

TechCrunch 6 月 7 日报道称，随着大型 AI 公司计划上市，行业可能看到更多价格上涨，AI 应用需要更认真面对 token 成本和商业化压力。

💡 当推理消耗变成利润表压力，模型路由、缓存、小模型替代和用量治理会成为 AI 产品的核心能力。

🔗 TechCrunch

8. 36氪：腾讯汤道生谈姚顺雨、混元 3 与元宝

36氪 6 月 8 日报道，腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生在腾讯云 AI 产业应用大会相关对谈中，回应姚顺雨、混元 3 和元宝等外界关注话题；大会同时发布覆盖 20 多个垂直场景的 Agent。

💡 国内大厂 AI 竞争正在从通用聊天入口扩展到垂直行业 Agent，腾讯云的 To B 策略值得持续跟踪。

🔗 36氪

9. 量子位：高考数学场景下对比 ChatGPT 与豆包表现

量子位 6 月 8 日发布文章，以高考数学为场景对 ChatGPT 和豆包进行对比体验，讨论大模型在中文考试题、推理链路和答案稳定性上的表现。

💡 高考题是中文用户最容易理解的推理测试场景，能直观反映国产模型与国际模型在本土语境中的体验差异。

🔗 量子位

10. arXiv：Attack Selection 研究 Agentic AI 控制评估中的安全风险

arXiv cs.AI 6 月 8 日新论文《Attack Selection in Agentic AI Control Evaluations Meaningfully Decreases Safety》提出，攻击者如果能策略性选择攻击时机，会比无差别攻击更难被发现，从而降低 Agentic AI 控制评估中的安全性。

💡 Agent 越能长期执行任务，安全评估就越不能只看单次攻击；“何时攻击”会成为控制和监控体系的重要变量。

🔗 arXiv