ITBear旗下自媒体矩阵:

OpenAI与Cerebras携手推出Codex-Spark模型 实时编程响应速度超千Tokens每秒

   时间:2026-02-13 07:53:38 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

OpenAI与Cerebras联合宣布推出面向实时编程场景的GPT-5.3-Codex-Spark模型,这是双方合作的首个公开技术成果。该模型以每秒超1000 tokens的推理速度实现近乎即时的代码反馈,专门针对需要快速交互的软件开发场景设计,现已通过"研究预览"形式向特定用户开放。

在软件开发领域,"agentic coding"模式正引发变革——AI系统可在无人值守状态下持续工作数小时甚至数天。但这种自动化趋势也带来新挑战:开发者需要花费更多时间等待系统响应,且对开发过程的掌控力逐渐减弱。OpenAI特别指出,软件开发本质是高度迭代的创造性工作,开发者需要实时调整方向、把控设计风格并做出关键决策。

针对这些痛点,Codex-Spark被定位为"高度专业化的轻量级模型",通过优化推理架构实现快速响应。在SWE-Bench Pro等专业基准测试中,该模型不仅任务完成速度较GPT-5.1-Codex-mini提升显著,回答质量也获得更高评分。其核心能力包括精准代码修改、动态计划调整以及基于代码库的上下文问答,特别适合界面布局可视化、样式优化等需要快速验证的场景。

支撑这一性能突破的是Cerebras的Wafer-Scale Engine芯片技术。该芯片配备行业领先的片上内存容量,单系统即可支持每秒数千token的推理需求,通过集群扩展更可将内存容量提升至TB级别,满足万亿参数模型的训练需求。OpenAI透露,计划在2026年将这种超高速推理架构推广至更大规模的前沿模型。

目前,Codex-Spark已通过ChatGPT Pro平台向订阅用户推送,集成在Codex应用、命令行工具及VS Code扩展中。API访问权限将分阶段向合作伙伴开放,首批覆盖软件工程、交互设计等领域的企业用户。这种分层次开放策略既保证技术验证的充分性,也为后续功能迭代预留空间。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version