一文看懂本次 DevDay 的新能力:
- 在 ChatGPT 里做“应用”
- 更容易把“智能体”送上生产
- 工程团队的全栈 AI 助手 Codex 走向 GA
- 以及模型与媒体创作的新进展。
TL;DR
- Apps SDK(预览) :第三方可以把真应用做进 ChatGPT,会话内即可登录、交互、渲染 UI,获得平台级分发。
- Agent Kit(正式上线) :从原型到生产的智能体/工作流一揽子工具:可视化 Agent Builder 、可嵌入的 ChatKit 、评测/追踪/Guardrails、安全接入 Connector Registry 。
- Codex(GA) :基于 GPT-5 Codex 的工程助手全面可用,新增 Slack 集成 、 Codex SDK 、 企业级管理与报表 。
- 模型更新 :GPT-5 Pro 上线 API; GPT Realtime Mini (更便宜的语音实时模型)发布。
- Sora 2(预览 API) :更可控的视频生成,并 与声音同步 ;面向产品工作流开放。
一、Apps SDK:把应用带进 ChatGPT
- 在对话中调用应用 :用户可“@应用名”或由系统智能推荐合适应用,应用以内嵌 UI 回复。
- 能力边界 :
- 连接开发者后端与数据、触发动作、渲染网页级交互组件(支持画中画/全屏)。
- 构建在 MCP(Model Context Protocol) 之上,开发者可完全掌控前后端逻辑与界面。
- 分发与登录 :会话内即可与现有账号体系 打通登录 ;后续会提供会话内结算能力与 应用目录 。
- 舞台 Demo :
- Coursera :边看课程,边让 ChatGPT 解释当前片段(应用将播放进度等上下文暴露给模型)。
- Canva / FigJam :把头脑风暴结果一键变成 海报/路演 PPT ,在会话内预览与迭代。
- Zillow :在会话里打开交互地图、筛选房源,全屏浏览并追问细节。
对开发者的意义:ChatGPT 成为“超级容器”,既给你 原生分发 ,又提供会话上下文和 交互外壳 。适合教育、电商内容生成、知识服务、数据看板、轻工具等场景。
二、Agent Kit:智能体从原型到生产
- Agent Builder(可视化) :拖拽式搭建智能体/工作流,常用节点(工具调用、文件检索、Guardrails、Human-in-the-loop、If-Else 等)开箱即用;支持多智能体组合与分流。
- ChatKit(嵌入组件) :把“会聊天的工作流”直接 嵌入你的网站/产品 ,可自定义品牌与交互。
- 评测与可观测性 :Trace、自动打分/对比、数据集回放、提示词自动优化;可对节点级能力做评估。
- 连接企业数据 :通过 Connector Registry 安全接入内部/三方系统,带管理员控制台。
- 案例 :
- Albertsons :门店同事直接向智能体询问“为何冰淇淋销售下滑”,系统汇总季节/历史/外部因素并给出陈列/促销建议。
- HubSpot :Breeze 助手整合知识库与本地政策,为客户问题构建多方案回答。
- 现场 8 分钟实战 :把 DevDay 官网变成“会导航的会场助理”,全流程:搭建工作流 → 接文件与 Guardrails → 预览 → 发布 → 用 ChatKit 嵌入站点并上线。
对开发者的意义:从“拼轮子”变成“拼乐高”。更快做出可观测、可评测、可治理的智能体,并直接进入业务界面。
三、Codex(GA):工程团队的全栈 AI 助手
- 底座模型 : GPT-5 Codex ,针对编码/代理任务优化,可按任务复杂度 动态延长思考 。
- 团队新特性 :
- Slack 集成 :在团队对话中直接让 Codex 写代码/答疑。
- Codex SDK :把 Codex 接到你们的内部工程流与工具链。
- 企业管控 :环境与权限控制、监控与分析看板、审计等。
- 工程效能 (发布会口径):OpenAI 内部 代码产出与评审显著提升 (示例为 PR 完成度与评审深度)。
- 舞台 Demo(硬核) :
- 让 Codex 从零搭出 相机控制台 ,用 VISCA 协议控制 Sony FR7 ,模型自行查明 UDP 报文与头部细节;
- 即席接入 Xbox 无线手柄 做云台控制;
- 接上 Realtime API + MCP Server 控场馆灯光,用语音下指令(实时联动视觉与设备);
- 通过 Codex SDK 在“说话”的同时 重写前端代码 ,热加载呈现“片尾字幕”特效并合影倒计时。
对开发者的意义:Codex 不只是“补全插件”,而是可自主分解任务、长时运行、跨端协作的工程队友;从 IDE、终端、云到协作沟通一体化。
四、模型与媒体:GPT-5 Pro、Realtime Mini、Sora 2
- GPT-5 Pro(API) :针对需要高准确性与深度推理的任务(如金融/法律/医疗等)开放给开发者。
- GPT Realtime Mini :更小更便宜的 语音实时模型 ,保持自然表达与音色表现力,适合语音交互场景大规模落地。
- Sora 2(预览 API) :
- 更可控的镜头与风格、支持 镜头扩展 (如把手机竖屏扩成电影级广角);
- 声音与画面同步 (不止语音,包含环境声与拟音效果);
- 可引入真实素材进行重混(如把你家狗狗“带进剧情”);
- 面向电商/广告/设计打样的工作流示例(与 Mattel 等伙伴合作验证)。
对开发者的意义:视频生产更“工程化”——可控、可编排、可集成到产品链路里,而不是单点玩具。
五、我对本次发布的四点解读
- 入口之争进入“会话即应用”阶段 :Apps SDK 把 ChatGPT 变成“超级操作系统”,内嵌 UI 与上下文桥接将改写获客与激活路径。
- 智能体从“能跑”到“可运营” :Agent Kit 用评测、可观测、Guardrails 与数据连接把“演示级代理”推向“生产级系统”。
- 工程生产方式重构 :Codex 把“上下文 + 工具 + 长时任务”做成团队默认工作流,未来代码库、设备与 CI/CD 都会被“会话化”。AI 对传统软件开发行业工作流有吞噬效应。
- 别再期待ChatGPT6:模型能力进展已达瓶颈,未来是生态集成、工作流重塑的时代。
