ITBear旗下自媒体矩阵:

GPT-5实测:界面简洁高效,但复杂问题回答仍有待提升

   时间:2025-08-09 19:51:31 来源:贝壳财经编辑:快讯团队 IP:北京 发表评论无障碍通道
 

经过多次延期后,备受瞩目的GPT-5终于在北京时间8月8日正式亮相,OpenAI的首席执行官山姆·奥特曼通过一个长达77分钟的视频,向全球介绍了这款继GPT-4之后再次震撼业界的大模型。

新京报AI研究院迅速对GPT-5进行了测试,发现接入GPT-5后,ChatGPT的对话界面变得更加简洁,完美体现了奥特曼之前提出的将多模态、深度思考、联网搜索等功能集成化的理念。在对话过程中,GPT-5能够根据问题灵活切换回答方式,极大地提升了用户体验。然而,在回答一些复杂问题时,GPT-5仍然会出现错误,其模型能力并未与市面上其他模型拉开太大差距。

ChatGPT最新界面展示

鉴于GPT-4和更早的o1模型在发布时都大幅领先同行,GPT-5自然也被业界寄予厚望,许多人期待它能复制此前的辉煌,甚至成为实现通用人工智能(AGI)的标志。尽管GPT-5在各项跑分测试中依然领先,但其带来的震撼效果显然不及GPT-4和o1。

在AI大模型行业快速迭代的背景下,以及国产优秀AI大模型不断涌现的情况下,山姆·奥特曼要想继续维持OpenAI的领先地位,GPT-5当前的表现显然还不够。但这并不意味着GPT-5在工程化和商业化层面没有亮点。新京报AI研究院接下来将重点测试GPT-5在创意写作和编程这两个奥特曼在发布会上特别强调的能力。

在创意写作方面,GPT-5在多个维度的测评中表现出色,但对于实际应用中的表现,人们更为关注。OpenAI官网特意展示了创意写作、编程设计和药物研究三个方面的视频片段。其中,创意写作是最容易让人理解的大模型能力之一。奥特曼表示,GPT-5的写作能力比GPT-4o要好得多,它采用集成模型,不再需要模型切换器,能够智能、直观且快速地做出决策,适用于所有人,包括免费用户。

为了测试这一能力,新京报AI研究院以网上热议的《明末:渊虚之羽》中的历史问题为背景,向GPT-5输入提示词:“你是一个明末1647年住在四川的农民,请在这个历史背景下,写出这个农民在一年里可能的遭遇,要求写实。”在不使用GPT-5模型时,ChatGPT主要描述了农民在四季的遭遇。而GPT-5不仅给出了农民的名字、住址,还详细撰写了他从1月到12月的生活情景,背景包括明军、大西军、清军,与历史史实相符。

GPT-5还提示是否需要在此基础上补充更多四川的社会背景细节,如“湖广填四川”的人口损失数据、兵乱的路线等,让农民的故事更真实可考。选择继续回答后,GPT-5生成了一份包含农民故事与旁注史料的完整回答,质量显著提升。

GPT-5的部分回答展示

不过,当使用同样的提示词让DeepSeek和Kimi这两个国产大模型生成回答时,它们也给出了不错的回复。其中,DeepSeek的文采更佳,Kimi则展示了更多细节。与ChatGPT使用GPT-5生成的回复相比,三者的差距并不明显。但ChatGPT在引导用户继续提问上更胜一筹,能够依据上下文主动提供多模态能力,提升用户体验。

在编程能力方面,OpenAI在发布会上花费了大量时间介绍。GPT-5展示了制作学习法语的web程序、制作老鼠吃奶酪的游戏等多种神奇能力。为了验证这些能力,新京报AI研究院也进行了实测。当输入“请你做一个学英语的web应用程序,要生动有趣”时,GPT-5仅用了约10秒钟就生成了一个名为“趣味英语学习”的程序。然而,深入体验后就会发现,该程序只能对简单单词有反应,稍微复杂一点的单词就会报错。

尽管GPT-5的编程速度很快,生成的结果往往也可以实现初步交互,但一旦深入使用,就会发现很多错误。如生成的华容道游戏,虽然可以通过点击鼠标移动方块,但最为关键的“隆美尔”方块却出现了无法移动的BUG。

经过测试,新京报AI研究院发现,GPT-5确实做到了奥特曼提及的“智能、直观且快速”,在产品水平和用户体验上都有所提升,但依然没有摆脱大模型固有的幻觉问题,在面对复杂问题时更为明显。不过,与市面上的其他模型相比,GPT-5的能力仍然优于同类模型,如编程能力较o3和GPT-4o模型显著提升。

值得注意的是,尽管GPT-5免费向所有用户开放,但依然有使用次数限制。本次实测中,新京报AI研究院在进行了几轮对话后就触及了限制。要想真正在工作生活中使用GPT-5的能力,还需要付费。在API价格方面,GPT-5的价格低于GPT-4o和Gemini 2.5 Pro,展现出头部厂商抢占市场份额的决心。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version