当地时间,OpenAI在旧金山举办了一场备受瞩目的开发者大会,吸引了全球科技界的目光。就在大会开幕前5小时,一则重磅消息引发市场震动:AMD与OpenAI达成深度合作,未来数年将部署高达6GW的AMD Instinct GPU。作为合作的一部分,AMD向OpenAI发行了最高1.6亿股认股权证,行权条件与芯片部署进度及股价表现紧密挂钩。若OpenAI全额行权,可能获得AMD约10%的股权,消息公布后AMD股价一度飙升30%。
这场合作不仅让开发者们热议“资本操作是否抢了技术风头”,更有人指出,OpenAI的布局暗含深意——从底层算力到上层应用,形成完整的技术叙事链。会上,OpenAI公布了一系列令人瞩目的数据:开发者数量从2023年的200万激增至400万,ChatGPT周活跃用户从1亿跃升至8亿,API每分钟处理的token量从3亿暴涨至60亿。这些数字背后,是一个超级应用向平台化迈进的坚定步伐。
作为本次大会的核心亮点,Apps SDK的发布标志着ChatGPT正式向应用平台转型。这一开发框架允许开发者在ChatGPT内部构建真正的交互式应用,而非简单的API调用。开发者可通过Type或Java编写后端逻辑,借助MCP接口连接数据、触发操作,并渲染完全交互式的用户界面。现场演示中,Coursera应用在对话中嵌入视频播放器,用户可边看课程边提问;Zillow展示交互地图,用户输入“找带院子的三居室”后,地图实时过滤结果;Canva则能根据对话生成海报并转换为PPT。这些功能让ChatGPT的对话框变成了“小程序”的运行场。
更引人注目的是“应用对话”机制。通过API,第三方应用可将内部上下文实时暴露给ChatGPT。例如,当用户在Coursera看到视频第5分钟时,ChatGPT能精准识别学习章节;在Zillow点开某套房子时,AI可理解用户关注的地址和价位。这种深度集成让对话式交互真正具备实用价值。现场演示中,用户一句“Spotify,给我周五派对做个歌单”,AI便自动调出Spotify应用,几秒后歌单出现在对话框中,可直接播放。首批合作应用包括Booking.com、Expedia、Figma等知名平台,未来还将扩展至DoorDash、Uber等。
与2023年推出的GPTs相比,Apps SDK实现了质的飞跃。GPTs本质上是Prompt模板,能力有限且生态混乱,最终被OpenAI放弃。而Apps SDK以代码为中心,开发者需在自有服务器上编写应用代码,实现MCP服务器接口,声明OAuth 2.0登录和交互式UI组件。ChatGPT仅作为嵌入对话流的入口,真正的逻辑、状态管理和数据存储均由开发者掌控。这种设计避免了GPTs生态的空转问题——通过实名验证、服务器验证和功能测试的审核前置机制,以及年龄分级和权限管理,Apps SDK更接近App Store的标准。OpenAI还暗示将推出更正式的收入分成方案。
如果说Apps SDK构建的是应用生态,那么AgentKit则是OpenAI为开发者提供的Agent开发工具箱。随着AI从“提问系统”进化为“做事系统”,AgentKit应运而生。它包含四个核心组件:ChatKit提供可嵌入的聊天界面组件,支持流式响应和对话线程管理;Connector Registry作为企业级连接管理中心,统一管理Agent与内部工具和第三方系统的连接;Agent evals提供性能测量和优化能力,包括逐步追踪评分和自动化提示词优化。现场演示中,工程师用8分钟构建了一个名为Ask Froge的DevDay网站Agent,通过设置基本指令、添加防护栏、连接日程数据和自定义Widget,快速将静态网站转化为智能问答助手。
在基础设施层面,OpenAI同样动作频频。Codex正式结束研究预览,进入通用可用阶段。运行在GPT-5-Codex模型上的Codex,在代码重构和审查等任务中表现更出色,日均消息量自8月初以来增长10倍,已处理超40万亿个token。OpenAI内部数据显示,工程师使用Codex后,每周完成的Pull Request数量提升70%。新增的企业功能包括Slack集成、Codex SDK和管理工具,进一步拓展了应用场景。
模型更新方面,GPT-5 Pro API向所有开发者开放,专为金融建模、法律文件分析和医疗诊断等高精度场景设计,定价为每百万输入token 15美元、输出token 120美元。全新发布的Sora 2模型在可控性上实现飞跃,能根据指令生成风格化视频并配以同步音效,其App上线后迅速走红。更小更便宜的GPT-Realtime-Mini语音模型比高级版便宜70%,音质和表达力却保持一致,推动了语音交互的普及。