OpenAI的“操作系统”野心:ChatGPT不再只是聊天机器人

2025年10月07日 20:19 次阅读 稿源:蓝鲸新闻 条评论

2025年10月6日,OpenAI在旧金山举行其第三届 DevDay 年度大会。宣布了四大重磅的更新,同时公布了关键的一些产品数据值得关注。



OpenAI官方公布数据显示,目前累计已有 4 百万开发者利用 OpenAI 平台进行开发;ChatGPT 的每周活跃用户已超过 8 亿;其中API 平台峰值吞吐量达到 每分钟 60 亿 tokens(tokens per minute)。

OpenAI新目标:把ChatGPT打造成未来的操作系统

本届 DevDay 上,OpenAI 正式推出 "Apps in ChatGPT" 框架——开发者可以通过 SDK 将自己的服务嵌入到 ChatGPT 中,用户无需离开聊天界面即可触发、交互、购买。


看上去 OpenAI的目标是把ChatGPT打造成未来的操作系统,挑战传统安卓和苹果的生态地位。目前,首批支持的应用包括 Booking.com、Canva、Coursera、Expedia、Spotify、Zillow 等。比如只需要输入Coursera,ChatGPT就能自动识别并调用Coursera的功能,也可以直接要求在ChatGPT调用Canva作图。奥特曼预告称接下来还会上线更多应用。

这一动作其实是对 OpenAI 之前推出的 "GPT Store" 的延伸和升级。过去,开发者可以创建自己的 GPT 模型,但现在,他们能把这些服务直接"装进"ChatGPT,让用户在聊天时就能完成搜索、订票、学习或设计,无需跳出界面。更重要的是,这样的模式让 OpenAI 不再只是一个聊天入口,而开始变成一个能连接应用、交易和支付的平台。未来,用户可能在 ChatGPT 内就能看到推荐内容、完成购买、开发者也能从中获得分成——整个过程都在一个窗口里完成。

现在,苹果、谷歌、Meta、微软等科技巨头都在搭建自己的 AI 平台,希望把用户牢牢留在自家生态里。OpenAI 如果不能尽快建立自己的应用体系和赚钱通道,就可能被这些"生态巨头"挤压。这次让应用直接嵌入 ChatGPT 的做法,可以看作是一次"反击"——OpenAI 想用一个更开放、好用的平台,把用户重新吸引回来,让开发者和服务也能在它的系统里运转起来。

OpenAI发布AgentKit、Codex与全新API矩阵

除此前述新布局之外,OpenAI 在 DevDay 上还重磅推出了面向开发者和企业的 AgentKit 套件,以及正式版 Codex、多个API产品等,进一步强化其"AI 应用+智能体"矩阵。

OpenAI 正式推出 AgentKit,这是一个面向开发者和企业的全流程工具集,旨在从构思到上线、再到性能优化,为智能体(agent)提供端到端支持。AgentKit 包含三大核心组件:Agent Builder,一个可视化画布,开发者可以通过拖拽节点、参数配置、连线逻辑来构建多步骤的 agent 流程;Connector Registry,作为连接器管理层,用于统一管理各种数据源、工具 API、内部系统的接入方式;ChatKit,用于将智能体的聊天界面嵌入到产品中,使得交互体验更自然、更易于定制。

在大会现场,OpenAI 员工演示了从0开始搭建一个业务型智能体的过程:无需写一行代码,只需拖拽节点、设置参数,就能拼出一个完整流程;然后点击预览、运行、调试,几分钟内生成可上线版本。此外,OpenAI 提到早期用户就已用 AgentKit 在数小时内构建起客服机器人或销售助理等多 Agent 工作流。比如金融服务公司 Ramp 宣称,用可视化界面构建一个"买家 agent"流程从零起步只用了几个小时而非几个月。

AgentKit 还集成了新的评估与优化机制:在 AgentKit 内部便支持 Evals 能力强化,比如 trace grading、自动化 prompt 优化、第三方模型支持,以及 RFT(强化反馈调优),从而在上线后能持续改进 agent 性能与稳定性。在这一体系与 "Apps in ChatGPT" 相结合的设计下,OpenAI 有望把"智能体 + 嵌入服务"形成协同效应。

在 DevDay 上,Sam Altman 宣布 Codex 从研究预览版转为正式可用版本(GA,General Availability)。同时,他还推出 Codex SDK,并支持在 Slack 中直接调用 Codex 解答技术问题或生成代码片段。

据现场演示,Codex 的三个亮点值得关注:首先是Slack 集成:企业用户可以在 Slack 聊天频道中向 Codex 提问或请求代码片段,Codex 将在聊天流中直接回应,无需切换应用界面;其次是Codex SDK:企业可以将 Codex 的能力作为模块引入自家内部工作流、工具链中,自动化地扩展开发效率。

最大的亮点是语音交互,Codex 正式版集成了语音输入能力,支持口语指令转为技术操作指令。例如在现场演示中,只需说一句 "将灯光聚焦到观众席",Codex 就通过后台 MCP 服务器控制会场灯光系统,将观众席灯亮起。奥特曼提及,自今年 8 月预览版上线以来,Codex 已处理 40T tokens 的请求,成为 OpenAI 增长最快的产品之一。


目前来看,Codex 正式版的推出,对 OpenAI 在开发者工具和企业自动化方向都是一大补充,不过它在复杂逻辑、跨模块调用、高安全性场景下仍有局限。

在大会尾声,奥特曼又重磅宣布三个新的 API 动作,引发业界高度关注。

GPT-5 Pro 是 OpenAI 面向高端任务推出的顶级模型版本,其训练截止日期为 2024 年 9 月 30 日。该模型支持高达 400k 的上下文窗口,最大输出可达 272k token。


在定价方面,OpenAI 给出了输入价格为 15 美元/百万 token(约为 GPT-5 的 15 倍),输出价格为 120 美元/百万 token(约为 GPT-5 的 12 倍)。目前 GPT-5 Pro 支持文本 + 图像输入,但仅支持文本输出。这条产品线的推出目的很明确:定位那些对上下文长度、理解复杂任务、专业推理要求极高的应用场景,比如科研写作、法律分析、长文档处理、复杂业务流程智能体等。

OpenAI 本次也同时推出了一个轻量级的实时语音 / 聊天模型 gpt-realtime-mini,其优势在于成本更低、延迟更低。相较于常规模型,它在成本方面有大幅度节约,更适合语音交互、实时对话这种高频场景。 OpenAI 在语音交互方向上的策略强调的是多模型组合,以适应不同场景下的计算与成本需求。


此外,Sora 2 也在 DevDay 中正式上线其预览 API。2.0 版本在视频生成、动态画面控制、内容可定制化方面进行了升级。目前尚未披露 Sora 2 的具体定价和输出性能细节。不过奥特曼展示了Sora2在电商行业的一个案例。


演讲的最后,奥特曼表示,"我们的目标,是让 AI 对每一个人都真正有用,这一目标,离不开所有人的参与。"

对文章打分

OpenAI的“操作系统”野心:ChatGPT不再只是聊天机器人

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘