OpenAI开发者大会正在火热进行中,公司创始人山姆·奥特曼在开场演讲中公布了一系列亮眼数据:目前已有400万开发者使用其平台,ChatGPT每周活跃用户达8亿,API每分钟token消耗量突破60亿。这些数字印证了OpenAI在全球人工智能领域的领先地位。
本次大会最受瞩目的当属AgentKit工具集的发布。这套面向开发者的智能体构建平台包含三大核心组件:可视化工作流设计器Agent Builder、数据连接中枢Connector Registry和嵌入式聊天组件ChatKit。其中Agent Builder采用拖拽式界面设计,支持逻辑节点组合、工具连接和安全策略配置,其内置的Guardrails模块可有效防止智能体产生违规行为。
Connector Registry整合了主流云存储服务(Dropbox、Google Drive等)和协作工具(Microsoft Teams),开发者可通过统一管理面板控制数据流通。ChatKit则允许将对话式智能体直接嵌入网站或应用,目前已被HubSpot、Evernote等企业用于客服支持、知识管理等场景。
在模型更新方面,Codex正式版带来三项重大改进:Slack深度集成使团队可自然语言分配编码任务,SDK工具包支持将智能体嵌入现有工作流,新增的管理控制台则强化了使用监控功能。数据显示,自8月以来Codex日活用户增长超10倍,GPT-5-Codex模型三周内处理量达40万亿token。
ChatGPT生态迎来重要升级,首批可对话应用已向非欧盟地区用户开放。Booking.com、Canva等7家合作伙伴的应用支持自然语言交互,开发者可通过开源的Apps SDK创建自定义应用。该SDK基于Model Context Protocol标准,允许同时设计应用逻辑与界面,优秀作品将收录至即将推出的应用目录。
实时交互领域新增两个轻量级模型:gpt-realtime-mini支持WebRTC等协议实现低延迟响应,gpt-image-1-mini作为多模态模型可同步处理文本图像输入。定价策略显示,这两个模型在保持性能的同时显著降低了使用成本。
视频生成领域迎来重大突破,Sora 2 API首次向开发者开放编程接口。该模型提供标准版和专业版两种变体,前者适合快速内容生成,后者可输出电影级画质。API包含视频创建、状态查询、下载管理等五个端点,支持从提示词生成到后期处理的全流程控制。
备受期待的GPT-5 pro推理模型API同步上线,其强化微调功能已全面开放o4-mini模型,GPT-5版本正在与数十家企业进行私测。新增的Custom tool calls功能使模型能精准调用工具,Custom graders则允许用户自定义评估标准,这两项特性将显著提升专业场景的适配性。
在开放策略上,ChatKit和评估工具立即向所有开发者开放,Agent Builder启动公开测试,Connector Registry则分批向企业客户开放。OpenAI透露,未来计划为ChatGPT增加独立的工作流API和智能体部署选项,进一步拓展应用边界。