ITBear旗下自媒体矩阵:

GPT5.5半夜突袭发布,OpenAI凭实力打响翻身漂亮仗

   时间:2026-04-25 08:32:36 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

OpenAI在未提前预告的情况下,于深夜悄然发布新一代模型GPT5.5,引发科技圈热议。这款被定位为“面向实际工作与智能体任务”的模型,在编程、科研、知识工作等场景中展现出显著优势,被业界视为OpenAI扭转近期舆论风波的关键一步。

根据第三方评测数据,GPT5.5在多项核心指标上实现突破。在针对复杂软件工程的Expert-SWE测试中,其任务完成率达73.1%,较前代提升4.6个百分点;在Terminal-Bench2.0命令行测试中,以82.7%的得分超越Claude的69.4%。更引人注目的是,该模型在网络安全领域表现突出,CyberGym测试得分81.8%,CTF夺旗赛成绩提升至88.1%,均领先主要竞争对手。

编程能力方面,尽管GPT5.5在SweetBench Pro测试中以58.6%的得分略逊于Opus4.7的64.3%,但OpenAI强调该评测存在过拟合争议,实际编程表现需结合更多场景判断。值得关注的是,模型在真实工作场景中的落地能力得到验证——OpenAI内部数据显示,超过85%的员工已跨部门使用搭载GPT5.5的Codex工具,财务团队更借助该技术完成2.4万份税表审核,效率较往年提升200%。

此次升级的核心突破在于任务自主执行能力。OpenAI介绍,GPT5.5可自动拆解复杂目标、调用工具链、验证中间结果并输出最终方案,实现从“辅助决策”到“参与执行”的跨越。例如,用户输入模糊需求时,模型不再要求补充细节,而是基于现有信息推进任务,这种“强边界服从”特性在确保可控性的同时,也暴露出对需求描述精度要求较高的局限。

技术优化层面,GPT5.5在保持推理速度与前代持平的前提下,将Token消耗压缩至1/36。尽管API价格上调至每百万Token5美元(Pro版30美元),但单位任务成本因效率提升而显著下降。OpenAI总裁格雷格·布罗克曼特别强调,降低企业与个人用户的使用门槛是此次升级的重要目标。

竞争对手Anthropic近期则陷入多重困境。该公司不仅因安全策略争议引发用户不满,还因算力紧张对付费用户实施严格限流,甚至出现大规模封号事件。与此同时,其模型日益高昂的Token费用与消耗量,与GPT5.5的降本增效形成鲜明对比。行业观察人士指出,随着OpenAI算力优势持续扩大,两家公司的技术差距可能进一步拉大。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version