ITBear旗下自媒体矩阵:

GPT-5震撼发布:全面领跑AI能力榜单,迈向超级智能新纪元

   时间:2025-08-08 05:11:46 来源:极客公园编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在科技界万众瞩目的期待中,GPT-5终于揭开神秘面纱,于北京时间8月8日凌晨震撼发布。此次发布会,OpenAI以近乎“科技春晚”的阵仗,通过长达一个多小时的直播,全方位展示了GPT-5的卓越性能。

GPT-5的表现堪称惊艳,它在多个领域均实现了全面提升,特别是在文本处理、WebDev以及视觉感知能力上独占鳌头。在硬提示、编码、数学、创造力、长查询等多个维度上,GPT-5同样位居榜首,创下了Arena测试的最高分数记录,真正意义上实现了“全面屠榜”。

OpenAI的首席执行官Sam Altman形象地比喻道,GPT-4像是中学生,而GPT-5则如同大学生,他甚至将GPT-5比作第一部配备视网膜显示屏的iPhone,称其既能给出正确答案,也可能带来令人惊喜的新发现。Altman直言,GPT-5让他第一次感受到了与博士级别专家交谈的真实感。

值得注意的是,GPT-5不仅在智能上实现了飞跃,还显著减少了“幻觉”问题,即生成不切实际或错误信息的倾向。GPT-5在理解和遵循指令方面更为出色,同时降低了过度恭维用户的倾向。此次GPT-5系列推出了包括GPT-5、mini、nano、chat在内的四个版本,其中Chat版本致力于提供更自然、更智能的交互体验。

OpenAI此次还引入了一个路由系统,能够自动为复杂查询切换到推理能力更强的版本,优化了用户体验。在联网搜索和独立思考时,GPT-5出现事实错误的概率分别比GPT-4o降低了45%和80%,表现尤为亮眼。

GPT-5在ARC-AGI-2测试中的表现同样出色,除了在思考测试Grok 4中略逊一筹外,其余测试均优于其他主要模型。更令人惊喜的是,GPT-5变得更加“诚实”,当用户提出不可能完成的任务或指令不明确时,它能够更坦诚地沟通自身局限。

此次GPT-5还推出了四种全新的人格模式供用户选择,包括犬儒、机器人、倾听者和学霸,用户可以根据自己的喜好设定ChatGPT的互动方式。GPT-5还支持为单个聊天窗口更改颜色主题,为代码编辑器主题爱好者带来了福音。

随着GPT-5代码能力的进一步提升,Altman预测,一个“软件按需生成”的时代即将到来。在OpenAI的测试中,GPT-5在多个编码基准测试中均优于其他模型,表现极为抢眼。在发布会上,OpenAI的后期训练负责人现场演示了GPT-5在短短几秒钟内编写数百行代码并展示网站前端界面的能力,令人叹为观止。

在安全性方面,GPT-5也进行了大量测试,以确保模型不会对用户撒谎。尽管GPT-5的幻觉问题有所减少,但OpenAI承认,“自信地撒谎”仍是大型语言模型的固有挑战。为此,GPT-5引入了“安全补全”机制,试图在保持安全的前提下给出尽可能有用的答案。

对于广大用户而言,最关心的问题莫过于如何体验GPT-5。好消息是,所有ChatGPT用户现在即可免费体验GPT-5,不过不同级别的用户权限有所不同。Plus订阅用户可享受更多使用次数,而Pro订阅用户则可访问具备更强推理能力的GPT-5 Pro版本。当用户达到使用上限后,ChatGPT会自动切换到一个“迷你版”的GPT-5来处理后续请求。

GPT-5的上线也意味着一系列旧模型的退役,包括GPT-4o、OpenAI o3、OpenAI o4-mini、GPT-4.1和GPT-4.5等。在定价方面,标准版GPT-5的定价为每百万输入Token 1.25美元,每百万输出Token 10美元,mini版和Nano版定价更为亲民。

除了OpenAI的第一方平台,微软也宣布GPT-5已在微软全系平台上线,包括Microsoft 365 Copilot、Copilot、GitHub Copilot和Azure AI Foundry,所有这些改进均在Azure上进行训练。

在发布会最后,Altman表示,OpenAI的使命是开发通用人工智能(AGI),GPT-5让他们离这一目标更近了一步。然而,他也坦诚地承认,GPT-5仍缺少一些非常重要的东西,比如从遇到的新事物中持续学习的能力。但无论如何,GPT-5无疑是朝着真正强大的模型迈出的重要一步。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version