Featured image of post OpenAI DevDay 2025:发布会要点总结

OpenAI DevDay 2025:发布会要点总结

Bullet points of OpenAI Dev Day 2025

一文看懂本次 DevDay 的新能力:

  • 在 ChatGPT 里做“应用”
  • 更容易把“智能体”送上生产
  • 工程团队的全栈 AI 助手 Codex 走向 GA
  • 以及模型与媒体创作的新进展。

TL;DR

  • Apps SDK(预览) :第三方可以把真应用做进 ChatGPT,会话内即可登录、交互、渲染 UI,获得平台级分发。
  • Agent Kit(正式上线) :从原型到生产的智能体/工作流一揽子工具:可视化 Agent Builder 、可嵌入的 ChatKit 、评测/追踪/Guardrails、安全接入 Connector Registry
  • Codex(GA) :基于 GPT-5 Codex 的工程助手全面可用,新增 Slack 集成Codex SDK企业级管理与报表
  • 模型更新GPT-5 Pro 上线 API; GPT Realtime Mini (更便宜的语音实时模型)发布。
  • Sora 2(预览 API) :更可控的视频生成,并 与声音同步 ;面向产品工作流开放。

一、Apps SDK:把应用带进 ChatGPT

  • 在对话中调用应用 :用户可“@应用名”或由系统智能推荐合适应用,应用以内嵌 UI 回复。
  • 能力边界
    • 连接开发者后端与数据、触发动作、渲染网页级交互组件(支持画中画/全屏)。
    • 构建在 MCP(Model Context Protocol) 之上,开发者可完全掌控前后端逻辑与界面。
    • 分发与登录 :会话内即可与现有账号体系 打通登录 ;后续会提供会话内结算能力与 应用目录
  • 舞台 Demo
    • Coursera :边看课程,边让 ChatGPT 解释当前片段(应用将播放进度等上下文暴露给模型)。
    • Canva / FigJam :把头脑风暴结果一键变成 海报/路演 PPT ,在会话内预览与迭代。
    • Zillow :在会话里打开交互地图、筛选房源,全屏浏览并追问细节。

对开发者的意义:ChatGPT 成为“超级容器”,既给你 原生分发 ,又提供会话上下文交互外壳 。适合教育、电商内容生成、知识服务、数据看板、轻工具等场景。


二、Agent Kit:智能体从原型到生产

  • Agent Builder(可视化) :拖拽式搭建智能体/工作流,常用节点(工具调用、文件检索、Guardrails、Human-in-the-loop、If-Else 等)开箱即用;支持多智能体组合与分流。
  • ChatKit(嵌入组件) :把“会聊天的工作流”直接 嵌入你的网站/产品 ,可自定义品牌与交互。
    • 评测与可观测性 :Trace、自动打分/对比、数据集回放、提示词自动优化;可对节点级能力做评估。
    • 连接企业数据 :通过 Connector Registry 安全接入内部/三方系统,带管理员控制台。
  • 案例
    • Albertsons :门店同事直接向智能体询问“为何冰淇淋销售下滑”,系统汇总季节/历史/外部因素并给出陈列/促销建议。
    • HubSpot :Breeze 助手整合知识库与本地政策,为客户问题构建多方案回答。
  • 现场 8 分钟实战 :把 DevDay 官网变成“会导航的会场助理”,全流程:搭建工作流 → 接文件与 Guardrails → 预览 → 发布 → 用 ChatKit 嵌入站点并上线。

对开发者的意义:从“拼轮子”变成“拼乐高”。更快做出可观测、可评测、可治理的智能体,并直接进入业务界面。


三、Codex(GA):工程团队的全栈 AI 助手

  • 底座模型GPT-5 Codex ,针对编码/代理任务优化,可按任务复杂度 动态延长思考
  • 团队新特性
    • Slack 集成 :在团队对话中直接让 Codex 写代码/答疑。
    • Codex SDK :把 Codex 接到你们的内部工程流与工具链。
    • 企业管控 :环境与权限控制、监控与分析看板、审计等。
    • 工程效能 (发布会口径):OpenAI 内部 代码产出与评审显著提升 (示例为 PR 完成度与评审深度)。
  • 舞台 Demo(硬核)
    • 让 Codex 从零搭出 相机控制台 ,用 VISCA 协议控制 Sony FR7 ,模型自行查明 UDP 报文与头部细节;
    • 即席接入 Xbox 无线手柄 做云台控制;
    • 接上 Realtime API + MCP Server 控场馆灯光,用语音下指令(实时联动视觉与设备);
    • 通过 Codex SDK 在“说话”的同时 重写前端代码 ,热加载呈现“片尾字幕”特效并合影倒计时。

对开发者的意义:Codex 不只是“补全插件”,而是可自主分解任务、长时运行、跨端协作的工程队友;从 IDE、终端、云到协作沟通一体化。


四、模型与媒体:GPT-5 Pro、Realtime Mini、Sora 2

  • GPT-5 Pro(API) :针对需要高准确性与深度推理的任务(如金融/法律/医疗等)开放给开发者。
  • GPT Realtime Mini :更小更便宜的 语音实时模型 ,保持自然表达与音色表现力,适合语音交互场景大规模落地。
  • Sora 2(预览 API)
    • 可控的镜头与风格、支持 镜头扩展 (如把手机竖屏扩成电影级广角);
    • 声音与画面同步 (不止语音,包含环境声与拟音效果);
    • 引入真实素材进行重混(如把你家狗狗“带进剧情”);
    • 面向电商/广告/设计打样的工作流示例(与 Mattel 等伙伴合作验证)。

对开发者的意义:视频生产更“工程化”——可控、可编排、可集成到产品链路里,而不是单点玩具。


五、我对本次发布的四点解读

  1. 入口之争进入“会话即应用”阶段 :Apps SDK 把 ChatGPT 变成“超级操作系统”,内嵌 UI 与上下文桥接将改写获客与激活路径。
  2. 智能体从“能跑”到“可运营” :Agent Kit 用评测、可观测、Guardrails 与数据连接把“演示级代理”推向“生产级系统”。
  3. 工程生产方式重构 :Codex 把“上下文 + 工具 + 长时任务”做成团队默认工作流,未来代码库、设备与 CI/CD 都会被“会话化”。AI 对传统软件开发行业工作流有吞噬效应。
  4. 别再期待ChatGPT6:模型能力进展已达瓶颈,未来是生态集成、工作流重塑的时代。

彩蛋

Sora2 限时免费试用

Licensed under CC BY-NC-SA 4.0
Made with ❤️ by Brian Chiu
Built with Hugo
Theme Stack designed by Jimmy