ITBear旗下自媒体矩阵:

OpenAI重磅推出GPT-5,ChatGPT迈入新纪元引领AI技术革新

   时间:2025-08-09 05:50:14 来源:金融界编辑:快讯团队 IP:北京 发表评论无障碍通道
 

OpenAI近日震撼发布其最新旗舰级人工智能模型GPT-5,此模型将作为技术支柱,驱动公司下一代ChatGPT产品的革新与发展。GPT-5的问世,标志着OpenAI在人工智能领域迈出了历史性的一步,它不仅是OpenAI首个“统一”人工智能模型,更是融合了o系列模型的强大推理能力与GPT系列敏捷响应特性的集大成者。

周四,随着GPT-5的正式亮相,ChatGPT及其背后的OpenAI共同迎来了一个崭新的时代。OpenAI的雄心壮志显露无遗——他们追求的,是创造出更接近智能代理而非传统聊天机器人的人工智能系统。GPT-4曾让聊天机器人能够机智回应各类问题,而GPT-5则让ChatGPT能够代用户执行多样任务,无论是开发软件应用、管理个人日程,还是撰写研究报告,都游刃有余。

GPT-5的引入,还意味着ChatGPT的使用体验将得到显著提升。该模型内置实时路由机制,能够自主判断如何以最佳方式提供答案,无需用户手动设置。无论是迅速解答疑问,还是深思熟虑后给出回应,GPT-5都能自如应对。

在发布会上,OpenAI首席执行官山姆·奥特曼盛赞GPT-5为“全球顶尖模型”,并强调这是公司在开发能够超越人类、胜任高经济价值工作的人工智能(即人工通用智能AGI)道路上迈出的“关键步伐”。奥特曼表示:“GPT-5这样的技术,在以往任何时代都是难以想象的。”

自周四起,GPT-5作为默认模型,将向所有ChatGPT免费用户开放。这是OpenAI首次允许免费用户体验其先进的推理模型,此前这类模型仅对付费用户开放。负责ChatGPT的OpenAI副总裁尼克·特利表示,此举是公司践行使命——让尽可能多的人接触到前沿人工智能技术——的具体体现。

GPT-5自公布以来便备受瞩目,成为OpenAI自2022年ChatGPT爆红以来最受期待的产品发布之一。据OpenAI透露,ChatGPT已迅速成长为全球热门消费级产品,每周用户量超过7亿,约占全球人口的十分之一。

GPT-5被视为人工智能发展的风向标,其在硅谷的反响或将深刻影响大型科技公司、华尔街以及科技监管政策的制定者。各方正密切关注GPT-5能否像GPT-4那样,在人工智能能力上实现飞跃,打破软件功能的传统界限。

在多个领域,GPT-5展现了最先进水平,在关键基准测试中略胜一筹,超越了Anthropic、谷歌DeepMind和埃隆·马斯克的xAI等公司的顶尖模型。特别是在编程领域,GPT-5表现出色,擅长按需生成完整软件应用,实现了所谓的“氛围编程”。在SWE-bench Verified测试中,GPT-5首次尝试便取得74.9%的高分,优于Anthropic的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。

然而,在“人类终极考试”这一衡量数学、人文和自然科学领域表现的测试中,具备扩展推理能力的GPT-5 Pro(在使用工具的情况下)得分42%,略低于xAI的Grok 4 Heavy模型。但在GPQA Diamond针对博士级科学问题的测试中,GPT-5 Pro以89.4%的首次尝试得分,超过了Claude Opus 4.1和Grok 4 Heavy。

GPT-5在健康相关问题的回答上也更加准确。在HealthBench Hard Hallucinations测试中,GPT-5(启用思考功能时)的幻觉率仅为1.6%,远低于GPT-4o和o3模型。尽管聊天机器人非医疗专业人士,但GPT-5能更主动提示潜在健康问题,并辅助用户解读医疗检查结果。

GPT-5在创意设计、写作等主观领域也优于其他模型。特利指出,GPT-5在创意任务中的回应更加自然,展现出“更佳品味”。同时,GPT-5相比OpenAI前代模型更加准确,幻觉现象大幅减少。在ChatGPT提示词回应中,GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为4.8%,显著低于o3和GPT-4o。

尽管在Tau-bench这一衡量人工智能代理能力的基准测试中,GPT-5的表现有好有坏,但OpenAI强调GPT-5的安全性有所提升。GPT-5的欺骗率低于其他模型,不仅提高了安全性,还改善了用户体验,使其更加透明和诚实。

随着GPT-5的发布,ChatGPT也迎来了多项用户体验升级。用户可在设置中选择四种新的人格类型,自动调整ChatGPT的回应方式。ChatGPT Plus订阅用户拥有更高的GPT-5使用限额,而Pro订阅用户则可无限制使用GPT-5,并访问增强版GPT-5 Pro。对于开发者而言,GPT-5将以不同规格通过OpenAI API开放,允许控制回应的详细程度。

GPT-5发布前一周,OpenAI还推出了开源权重推理模型gpt-oss,供开发者和企业免费下载,运行成本极低。尽管GPT-5在编程等领域树立了新的性能标准,但在多个领域与其他前沿模型相当。基准测试仅反映模型部分表现,GPT-5在现实世界中的实际应用及其与竞争对手的比较,仍有待观察。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version