← 返回 AI 日报归档 · ← 返回首页
AI 日报:2026-05-18
采集于 2026-05-18 18:00 CST · 共 10 条
1. OpenAI 将 Codex 扩展到 ChatGPT 移动端,可随时管理代码任务
OpenAI 发布“Work with Codex from anywhere”,把 Codex 预览能力带入 ChatGPT iOS/Android 应用,用户可以在手机上创建、监控、引导和批准远程编码任务。
💡 编程 Agent 从桌面 IDE 走向移动端,意味着“碎片时间派发工程任务”正在成为真实工作流。
2. OpenAI 公开 Codex Windows 沙箱设计:受控文件访问与网络限制成重点
OpenAI 介绍了为 Windows 上的 Codex 构建安全沙箱的方案,包括独立本地用户、文件权限、网络限制、防火墙检查等机制,用于降低 AI 编码 Agent 执行命令时的系统风险。
💡 Coding Agent 真正进入企业开发环境前,沙箱与权限边界会比模型能力本身更决定能否落地。
3. Anthropic 与 PwC 扩大战略合作:Claude 进入企业技术、交易和职能重塑场景
Anthropic 与 PwC 于 5 月 14 日宣布扩大合作,PwC 将部署 Claude Code 与 Claude Cowork,面向技术建设、交易执行和企业职能改造等客户服务场景。
💡 顶级咨询公司开始把大模型变成交付工具,企业 AI 竞争正在从“买模型”转向“重写流程”。
4. Anthropic 推出 Claude for Small Business,面向小企业打包连接器和工作流
Anthropic 于 5 月 13 日推出 Claude for Small Business,提供面向小企业常用工具的连接器和可直接运行的工作流,并强调小企业贡献美国 GDP 的 44%、雇佣近半私营部门劳动力。
💡 大模型厂商不再只争夺大型企业,小微企业的“轻量工作流模板”可能成为下一波 AI SaaS 增长入口。
5. Hermes Agent v0.14.0 发布:808 次提交、633 个 PR,新增 Grok 与本地代理能力
NousResearch 在 GitHub 发布 Hermes Agent v0.14.0(2026.5.16),版本说明显示自 v0.13.0 以来包含 808 次提交、633 个合并 PR、545 个关闭 issue,并加入 xAI Grok SuperGrok OAuth、OpenAI 兼容本地代理等能力。
💡 开源 Agent 框架正在快速产品化,模型接入、OAuth、本地代理和多供应商兼容会成为开发者选型关键。
6. arXiv 新论文 DORA:测试 LLM Agent 能否处理真实灾害响应流程
arXiv 论文“Can LLM Agents Respond to Disasters?”提出 DORA(Disaster Operational Response Agent)基准,用 108 个专业工具和异构地理空间数据测试智能体在灾害响应中的端到端编排、推理和报告能力。
💡 Agent 评测从通用工具调用走向高风险真实场景,灾害响应能暴露多模态、规划和可靠性短板。
7. Hugging Face 社区文章:本地开源模型进步速度超过摩尔定律两倍以上
Hugging Face 文章“Two Years of Local AI on a Laptop”追踪 128GB MacBook Pro 等固定硬件上的本地开源模型表现,指出两年来本地开放权重 AI 的智能指数提升速度超过摩尔定律两倍以上。
💡 如果同一台笔记本上的模型能力持续跃升,企业和个人部署本地 AI 的性价比会被重新估算。
8. 百度文心 5.1 发布:强化搜索、知识与 Agent 能力,预训练成本降至业界 6%
量子位报道,百度在 Create 2026 期间发布文心大模型 5.1,强调搜索、知识、Agent 能力全面提升,并称其预训练成本仅为业界 6%。
💡 国产大模型竞争正在把“能力提升”与“训练成本压缩”绑定,成本效率会直接影响云端定价和生态扩张。
9. 阶跃 StepAudio 2.5 TTS 跻身 Artificial Analysis 全球前三、中国第一
量子位报道,StepAudio 2.5 TTS 在 Artificial Analysis Speech Arena 盲测 Elo 榜单中进入全球前三,并成为排名最高的中国大模型;阶跃近期还发布了 ASR 与 Realtime 语音模型。
💡 语音模型竞争开始以真实听感盲测为核心指标,实时语音交互将成为 AI 助手产品差异化重点。
10. Google I/O 2026 将于 5 月 19-20 日直播,Gemini、Android、Chrome、Cloud 成焦点
Google I/O 2026 官方页面确认大会将于 5 月 19-20 日举行并提供线上直播,官方预告覆盖 Gemini、Android、Chrome、Cloud 等方向。
💡 这是本周最重要的 AI 发布窗口之一,Google 如何整合 Gemini 与开发者生态将影响下半年模型与 Agent 竞争格局。