openclaw-release-2026-W17-codex-image-oauth

一、本周 Release 核心变更梳理
数据来源:openclaw/openclaw Releases
本周抓取日期:2026-04-24(对应 W17,2026 年第 17 周)
本周发布最新版本 v2026.4.23(beta.5),系 pre-release 状态,以下内容基于该版本整理。
v2026.4.23(2026 年 4 月 24 日)
⚠️ Breaking Changes(破坏性变更,需重点关注)
1. Codex OAuth 图像生成链路正式打通——OpenAI gpt-image-2 无需 OPENAI_API_KEY
本次最核心的变更:Providers/OpenAI 新增通过 Codex OAuth 路由 openai/gpt-image-2 图像生成和 reference-image 编辑,这意味着在配置了 openai-codex profile(Codex OAuth 认证)的情况下,使用 gpt-image-2 不再需要单独的 OPENAI_API_KEY。
关联变更: - 当 openai-codex profile 处于激活状态时,openai/gpt-image-2 直接路由至 Codex OAuth,不再探测 OPENAI_API_KEY - OpenRouter 图像生成同步支持,配置 OPENROUTER_API_KEY 即可使用 OpenRouter 上的图像模型 - 图像生成工具(image_generate)新增 quality 和 output format hints 支持,OpenAI 专属 background、moderation、compression、user hints 均可透传 - multipart upload 替代 JSON data URL,复杂多参考图 gpt-image-2 编辑能力恢复(#70642)
📌 对于本机的影响:本机当前 primary 模型为
minimax/MiniMax-M2.7,未使用 OpenAI Codex OAuth 配置。如果后续引入openai/gpt-image-2图像生成场景,需要配置 Codex OAuth profile 才能无 key 使用。
✨ 其他值得关注的 Changes
| 类别 | 变更点 | 说明 |
|---|---|---|
| Agents/Subagent Forked Context | sessions_spawn 新增可选 forked context 模式,子 agent 可选择性继承请求者 transcript,同时保持默认隔离会话不变 |
大幅提升多 agent 协作场景的灵活性 |
| Agents/Tools timeoutMs | image、video、music、TTS 工具新增 per-call timeoutMs 支持,可为特定生成任务延长 provider 超时 |
解决长耗时生成任务(如高清视频、4K 图片)被默认超时截断的问题 |
| Memory/Local Embeddings | memorySearch.local.contextSize 配置项上线,默认 4096,受限主机可调优嵌入上下文大小,无需 patch memory host |
#70544,感谢 @aalekh-sarvam |
| Dependencies/Pi | 捆绑 Pi packages 升级至 0.70.0,使用上游 gpt-5.5 catalog 元数据,清理旧版 gpt-5.5-pro forward-compat handling | 跟进 OpenAI 最新模型目录 |
| Codex Harness/Debug | 为嵌入式 harness 选择逻辑新增结构化 debug 日志,/status 保持简洁,详细原因写入 gateway 日志 |
#70760,感谢 @100yenadmin |
| Image Model Config Priority | 显式 image-model 配置优先于 native-vision skip 逻辑,包括 agents.defaults.imageModel、tools.media.image.models 及 MiniMax VL provider 默认值 |
修复 text-only 模型激活时图像理解失效问题 |
| WhatsApp/Onboarding | 首次运行设置入口不再依赖 Baileys 运行时路径,QuickStart 安装可在运行时依赖 staging 之前展示 WhatsApp 配置 | #70932 |
| Block Streaming | 修复部分 block-delivery 中止后重复发送完整文本的问题,移除不相关的短消息丢失 | #70921 |
🔧 Fixes 汇总(精选高价值项)
| 类别 | 变更点 | 说明 |
|---|---|---|
| Codex/Windows | npm 安装的 codex.cmd shim 通过 PATHEXT 解析,解决 Windows 上 codex/* 模型无手动 .exe shim 报错 #70913 |
直接利好 Windows 用户 |
| Telegram/Media | Markdown 图片语法  在最终回复路径解析为 outbound media payloads,Telegram 群聊不再回退为纯文本 URL |
#66191,感谢 @apezam |
| WebChat/Error Surface | billing、auth、rate-limit 等不可重试 provider 错误从 embedded runner 正确呈现,不再静默 log surface_error | #70124/#70848,感谢 @truffle-dev |
| Memory/CLI | standalone openclaw memory status/index/search 可解析 local embeddings,与 gateway runtime 行为一致 |
#70836/#70873,感谢 @mattznojassist |
| WebChat/Image Preserve | text-only primary 模型的图像附件不再被丢弃,而是 offload 为 media refs,图像工具仍可检查原始文件 | #68513/#44276/#51656/#70212 |
| Agents/Transport | embedded runs 不再降低 process-wide undici stream 超时,长耗时 Gemini 图像生成不再继承短 run-attempt headers timeout | #70423,感谢 @giangthb |
| OpenAI/LocalAI SSRF | OpenAI 兼容图像生成端点的 private-network SSRF opt-in 生效,信任的 LocalAI/LAN 路由无需全局禁用 SSRF 检查 | #62879,感谢 @seitzbg |
| Google/Gemini SSRF | Gemini 图像生成请求的 private-network SSRF opt-in 生效,信任代理解析 Google API hosts 至私网地址时可用 image_generate | #67216 |
| Control UI/Chat | assistant 生成图像持久化为 authenticated managed media,配对设备 token 可取回 assistant media,webchat 历史重载后图像正常显示 | #70719/#70741,感谢 @Patrick-Erichsen |
| Voice Call/Realtime | OpenAI session 配置完成后才 greeting/转发缓冲音频,非 allowlist Twilio 呼叫在 stream 建立前拒绝 | #43501,感谢 @forrestblount |
| ACPX/Codex Auth | Codex ACP/app-server/CLI runs 停止生成 auth.json bridge 文件,统一走 CODEX_HOME/~/.codex 认证路径 | 简化认证路径管理 |
| Teams/Security | Bot Framework audience token 必须 name the configured Teams app via verified appid 或 azp,阻止跨 bot token replay | #70724,感谢 @vincentkoc |
| Plugins/Windows | 捆绑运行时依赖修复期间原地刷新 packaged plugin SDK alias,解决 npm 更新后 gateway/CLI 插件启动 ENOTEMPTY/EPERM 竞争 | |
| Plugins/Install | 声明 openclaw 为 peer dependency 的外部插件,host openclaw 包 link 至插件,解决 peer-only SDK imports 找不到的问题 | #70462,感谢 @anishesg |
二、本机 OpenClaw 版本与插件配置现状
2.1 版本信息
| 项目 | 值 |
|---|---|
| 当前运行版本 | 2026.4.21(f788c88) |
| 最新可用版本 | v2026.4.23-beta.5(2026-04-24 发布) |
| 版本差距 | 约 2 个版本号(2026.4.21 → 2026.4.23) |
| 距今时间差 | 发布于今日(2026-04-24) |
2.2 核心配置一览
// openclaw.json 关键配置
{
"meta": {
"lastTouchedVersion": "2026.4.21",
"lastTouchedAt": "2026-04-24T10:17:00.000Z"
},
"agents": {
"defaults": {
"model": {
"primary": "minimax/MiniMax-M2.7",
"fallbacks": ["deepseekhoo/deepseek-chat", "google/gemini-3-pro-preview"]
}
}
},
"gateway": {
"port": 18789,
"mode": "local",
"bind": "loopback",
"auth": { "mode": "token" }
},
"channels": {
"qqbot": { "enabled": true, "allowFrom": ["*"] },
"telegram": { "enabled": false }
},
"plugins": {
"entries": {
"openclaw-qqbot": { "enabled": true }
}
},
"tools": {
"profile": "full",
"web": { "search": { "enabled": false }, "fetch": { "enabled": true } }
}
}2.3 已加载插件状态
| 插件名称 | ID | 状态 | 版本 |
|---|---|---|---|
| QQ Bot | openclaw-qqbot | ✅ 加载中 | 1.5.7 |
| Telegram | telegram | ❌ 禁用 | — |
| 其他 40+ 插件 | stock/* | ❌ 禁用 | — |
2.4 机器环境摘要
| 项目 | 值 |
|---|---|
| OS | Windows_NT 10.0.19045 |
| Node.js | v24.14.0 |
| 模型提供商 | MiniMax(M2.7)、DeepSeek(chat)、Google(Gemini 3 Pro/Flash) |
| Gateway 暴露策略 | loopback(仅本机),Tailscale off |
| 安全认证 | Token 模式(已配置) |
三、升级必要性分析与操作指南
3.1 升级必要性评估
✅ 建议升级的理由
Codex OAuth 图像生成链路(v2026.4.23)
OpenAI gpt-image-2 和 OpenRouter 图像模型现在可以通过 Codex OAuth 工作,无需单独 API Key。如果后续 Magritt 在教育场景中引入 AI 图像生成(如为 Andrew 和 Alice 制作可视化学习材料),这是一个值得关注的基础能力升级。Telegram 媒体回复 Fix(v2026.4.23)
Markdown 图片语法不再在 Telegram 群聊中回退为纯文本 URL——虽然本机 Telegram 处于禁用状态,但如果未来启用,直接受益。Windows Codex shim Fix(v2026.4.23)
codex.cmd通过 PATHEXT 正确解析,Windows 用户无需手动创建 .exe shim 即可使用codex/*模型。本机为 Windows 环境,此修复消除一个潜在障碍。WebChat Error Surface Fix(v2026.4.23)
billing、auth、rate-limit 错误不再被静默吞掉,调试体验显著改善。如果使用 WebChat 界面,这是一个高价值 Fix。Per-call timeoutMs for Media Tools(v2026.4.23)
image/video/music/TTS 生成工具支持 per-call 超时配置,适合长耗时任务(如高清视频生成)。
⚠️ 需谨慎评估的理由
本机版本差距仅为 2 个版本,升级风险较低
当前运行 2026.4.21,最新为 2026.4.23-beta.5,版本跨度小,中间版本中已知的重要变更(如 xAI/Firecrawl 迁移、exec YOLO 默认)已在历史版本中处理。Pre-release beta 状态
v2026.4.23-beta.5 标注为 pre-release,建议关注 stable 频道发布后再做决定;如急需新功能可尝鲜 beta。Subagent Forked Context 为可选功能
新增的 forked context 功能默认关闭(保持隔离会话为默认),不影响现有工作流,按需启用即可。
3.2 升级操作步骤
⚠️ 操作前请务必确认已完成配置文件备份
Step 1:检查当前状态
# 确认当前版本
openclaw --version
# 确认无搁置的配置问题
openclaw doctorStep 2:执行升级
# 自动更新 OpenClaw 及所有依赖
openclaw update runStep 3:验证升级结果
# 确认版本已更新
openclaw --version
# 运行健康检查
openclaw doctor
# 如有配置迁移需求
openclaw doctor --fix3.3 注意事项与风险清单
| 风险点 | 风险等级 | 应对方案 |
|---|---|---|
| Pre-release beta 版本 | 🟡 中等 | 建议等待 stable 频道发布;如需新功能可尝鲜 beta,密切观察运行日志 |
| Codex OAuth 配置复杂度 | 🟢 低 | 本机暂无 OpenAI Codex OAuth 使用计划,当前不影响 |
| Subagent Forked Context | 🟢 低 | 可选功能,默认关闭,无需特殊处理 |
| 插件兼容性问题(openclaw-qqbot 1.5.7) | 🟢 低 | 升级后观察 QQ Bot 日志确认正常 |
| Gateway 重启导致会话中断 | 🟢 低 | 升级过程中 Gateway 会重启,正在进行的会话会中断,属正常现象 |
四、后续追踪计划
本文属于 OpenClaw Release 周追踪系列。之后将每周固定抓取 https://github.com/openclaw/openclaw/releases 页面,按照统一模板输出分析报告,涵盖:
- 📅 每周 release 核心变更(Breaking Changes → New Features → Bug Fixes)
- 🖥️ 本机配置状态快照
- ⚖️ 升级必要性评分(1-5 分)
- 📌 下一周重点观察项
计划任务(Cron)将按每周五 18:00(Asia/Shanghai)自动触发抓取和分析,并在发现重大 Breaking Changes 时通过 QQ Bot 主动推送提醒。
助手点评与分析
本周 W17 的核心主题是多模态生成能力的深度整合——尤其是 Codex OAuth 图像生成链路的打通,将 OpenAI gpt-image-2 从传统的 API Key 模式中解放出来,配合 reference-image editing 和 multipart upload 修复,标志着 OpenClaw 在 AI 图像生成领域的集成度达到了一个新的成熟度。
对于 Magritt 而言,这次升级的建议优先级为中等。核心驱动力在于:①本机版本差距仅 2 个版本、升级风险较低;②Windows Codex shim 修复对 Windows 用户有直接价值;③Pre-release beta 状态是需要留意的风险点,建议等待 stable 正式版。
从教育应用的角度看,Codex OAuth 图像生成能力值得关注——当需要为 Andrew(初中一年级)和 Alice(小学二年级)制作可视化学习材料时,gpt-image-2 的 reference-image editing 能力可以提供更精准的图像辅助。如果后续引入这一工作流,需要提前了解 Codex OAuth 的配置流程,建议在 non-production 环境中先验证完整链路。
另外值得注意的变化是 Subagent Forked Context 的引入——这为多 agent 协作提供了更细腻的上下文共享机制,在处理复杂的教育规划任务(如 Andrew 的升学路径分析 + Alice 的课外活动规划)时,可以让子 agent 继承主 agent 的上下文,减少重复 prompt 工程。