GPT5:编程接近AGI,写作却很拉跨

GPT‑5的发布被认为是人类迈向AGI的关键一步。它引入了“gpt‑5‑main”与“gpt‑5‑thinking”两种模型,并配备实时路由器,根据对话复杂度与用户意图自动选择应对方案,同时还提供Mini、Nano与Pro版本,适配不同使用场景  。

在编程性能方面,GPT‑5创下多个benchmark记录:

在SWE‑bench Verified上得分74.9%;在Aider Polyglot(支持多语言代码编辑)上达88% 。

与前代o3模型相比,它在高推理模式下输出token数量减少约22%,工具调用次数下降约45%,效率大幅提升。

多位测试者称其“是用过最聪明的模型”,“能捕捉深层次 bug,并完成复杂任务”,堪称“软件即服务”的新时代  。

多篇媒体报道强调GPT‑5在编程、数学、复杂推理任务上表现卓越,是“接近 AGI”的方向标。

写作弱化:不敌 GPT-4.5 的细腻与表达

尽管GPT‑5在技术指标上表现惊艳,但在写作方面,它似乎滑落谷底,被多方评测指出不及GPT‑4.5:

来自Latent.Space的开发者深度测评直言:“GPT‑5是目前最接近AGI的模型,但写作能力比GPT‑4.5还差很多”,在表达自然与语言魅力方面逊色明显。

GPT‑4.5被广泛肯定为创意写作、故事创作和营销文案的优选,尤其语气自然、人性化表现优异  。

虽虽然GPT‑4.5在推理任务表现不如推理型模型如o3-mini,但它在事实准确率与自然表达方面仍具优势,特别在SimpleQA准确率达62.5%,远超GPT‑4o。

为何会出现这种性能偏差?

这是GPT‑5与GPT‑4.5设计理念上的不同导致显著差异:

GPT‑5聚焦“结构化推理+工具协作”:其多模型路由机制与强大推理能力使它在编程与复杂任务上表现出色。

GPT‑4.5 注重“语言的表达与现实感”:虽推理能力不是最顶尖,但它采用强化学习与人类反馈微调,在语言流畅、情感表达上更贴近人类。

如果想找回点GPT4.5的写作感觉,可以尝试在prompt中明确要求采用某种风格或情感:例如“写得像GPT‑4.5那样自然流畅”,或者“体现幽默感与人情味”。

其实我只想说:请把我的GPT4.5还给我!(转载自AI普瑞斯)

  • 英特尔回应特朗普要求CEO陈立武辞职

  • OpenAI发布GPT-5:免费用户首次可使用推理模型

  • GPT5:编程接近AGI,写作却很拉跨

  • OpenAI终于发布大杀器,马斯克各种不服,友却笑不活

  • 前淘宝直播业务负责人道放再创业,要用AI做消费者的「赛博闺蜜」

  • 一文读懂GPT-5发布会:价格屠夫、编程惊艳,新功能乏善可陈

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender