在万众期待中,OpenAI于今日凌晨的线上活动中,震撼发布了其最新的GPT-5模型,标榜为迄今为止最为卓越的人工智能成果。该模型在编程、数学、文学创作、健康咨询及视觉理解等多个维度上,均展现出前所未有的高水平表现。
OpenAI的首席执行官萨姆·奥尔特曼在发布会上激动宣布,GPT-5标志着公司AI技术的一次重大飞跃,与之交流仿佛与跨界精英进行深度对话,体验非凡。
据悉,自本周四起,GPT-5将逐步面向免费及付费用户开放。付费用户将享受更高的使用额度,而Pro订阅用户则将不受限制地访问GPT-5,并独享GPT-5Pro的高级功能。Plus用户更可将GPT-5设为默认应答模型,其使用频率远超普通免费用户。
GPT-5由三大核心组件构成:高效智能模型、深度推理模型(GPT-5thinking)以及智能路由系统。高效智能模型负责日常大部分问题的快速响应,深度推理模型则专注于解决复杂难题。智能路由系统则根据对话情境与复杂度,智能调度最合适的模型进行处理,并持续优化训练。一旦触及使用上限,各模型的精简版本将接力处理剩余请求,OpenAI正致力于将这些功能整合至单一模型中。
在基准测试中,GPT-5以压倒性优势超越了所有前任模型,不仅响应速度更快,且答案更加实用,显著减少了误导性信息,增强了指令遵循能力,并大幅降低了谄媚性回复。特别是在写作、编程及健康咨询等ChatGPT的常见应用场景中,GPT-5的提升尤为明显。
在编程领域,GPT-5被誉为史上最强编程模型,在复杂前端开发与大型代码库调试方面取得了突破性进展,仅凭简单提示即可生成美观且响应迅速的网站、应用及游戏。在文学创作方面,GPT-5能将初步构思转化为具有文学深度与韵律感的作品,擅长处理结构不明确的写作任务,为日常写作提供有力支持。在健康咨询领域,GPT-5同样表现出色,HealthBench得分远超以往模型,能主动识别潜在问题并提出疑问,根据用户背景提供精准可靠的回答,但OpenAI明确指出,GPT-5不能替代专业医疗人员。
GPT-5在数学(AIME2025无工具得分94.6%)、真实世界编程(SWE-bench Verified得分74.9%、Aider Polyglot得分88%)、多模态理解(MMMU得分84.2%)及健康(HealthBench Hard得分46.2%)等领域均创造了新的最高水平。
尤为GPT-5Pro凭借其增强的推理能力,在GPQA测试中刷新了最高纪录,无工具得分高达88.4%。作为OpenAI专为解决最具挑战性任务而设计的模型,GPT-5Pro取代了先前的OpenAI o3-Pro,其思考时间更长,采用高效并行计算技术,能够提供最高品质且全面的答案。
在多个高难度智力基准测试中,GPT-5Pro均展现了卓越表现。在超过1000项具有经济价值的真实世界推理提示评估中,外部专家在67.8%的情况下更倾向于GPT-5Pro的答案,其主要错误率降低了22%,在健康、科学、数学及编程领域均彰显了非凡实力。