没人味的 GPT-5 更新了,但变尬了。
创始人
2025-11-14 11:40:40
0

被吐槽了这么久没人味的 GPT-5, 终于进化了。

今天凌晨三点,奥特曼又又又开始给自家产品吆喝了。这回不谈竞技场跑分,只聊短板,主打的就是一个倾听群众心声,产品优化。

看得出来,OpenAI 是真有点没招了。毕竟,GPT-5 上线后本该功成身退的 4o,就因为太受欢迎,被生拉硬拽着不许退役。新产品口碑不如旧产品,换谁都得急着证明自己。

那被培养成替身的 5.1,能取代大伙儿心目中的赛博白月光吗?看完了官网案例,世超立刻上手试了试。

结果怎么说呢,仨字就能形容:不太妙

事先说明,下面所有的测试都在临时聊天环境进行,没有任何 AI 受到记忆干扰。

咱先测了一下奥特曼 “ 尤其喜欢 ” 的指令遵循,第一个问题就把它考蒙了。

明明要求回答六个字,嗯是只憋出来了五个。就这,六字游戏甚至还是官方测试案例。

行吧,世超只能怀疑自己,开始反思是不是因为没用英文。

结果用官方一毛一样的英语提示词,5.1 还是答错了。

不死心的世超又换了一个问题,让它写一段 200 字的薯条颂,但全文不能出现 “ 的 ” 字。

答案乍一看好像是符合要求,不过这字怎么变成繁体了?

本来以为是网不好引起的波动,但试了五遍全是繁体。去掉后半段强制性指令,回答又正常了。

再看看 Gemini 2.5 pro,轻轻松松一口气给出正确答案,啥岔子都没出。

讲真,测到这,世超已经产生浓浓的怀疑了。虽然只是一次小更新,三分之一的卖点都不太灵,有点说不过去。

而接下来是大伙儿吐槽得最多的,GPT-5 莫得感情。官方表示,这回 5.1 在 5 的基础上变得 “ 更温暖、更有对话性 ” 了,又能有意思,又能保持回答清晰有用。

说实话,从官网给出的案例来看,这个效果也只能说一般般。4o 本来就有的能力,被 5 整没了,现在又靠 5.1 回到起跑线,属实夸不出口啊。

但该测还得测,世超问了一个经典失恋问题,结果没有对比就没有伤害,不管是 5.1 还是 5,都和 4o 不在一个 level。。。

上 GPT-5.1,中 GPT-5,下 GPT-4o

不知道大伙儿有没有感觉,5 和 5.1 像是在描述对人类情感的刻板印象,作为旁观者分析 “ 失恋 ” 是一种什么感觉,为什么难过,怎么解决。

而 4o 的回答更像是已经带入了失恋的角色,感同身受,先共情再鼓励,不愧是梦中情 AI。

为了不冤枉它,世超换了个问题再问问,这次感觉新版回答得还不如老版,连基本的感情牌都不打了。。。

上 5,下 5.1

再翻翻官网的更新公告,除了各种情感语气对比,还有一张自适应耗时对比图。

自适应,我愿称之为 5.1 更新最大的亮点,毕竟前两个都拉完了。

这优化简单来说,就是以前的 AI,在不同难度题目上不会自己分配思考时长,问个杭州美食都有啥,花的力气可能和宇宙为什么大爆炸一样。

世超试了试,它的效果还挺明显的。在简单的逻辑问题上,左边 5.1 Thinking 的思考速度明显比右边 5 Thinking 要快得多。

而到了复杂的编程难题,反而是 5 Thinking 更快给出了错误结果,5.1 思考了更长的时间给出了正确答案。

其实这个优化对于我们普通用户来说,感觉并不是特别明显。但对于一些调用 API的用户确实是好事,因为这样可以在简单问题上更省钱,难题上少花冤枉钱了。

除了上面这些属于 5.1 的版本变动,ChatGPT 还有个整体大更 —— 在个性化里面可以设置 GPT 的回答风格,除了默认一共七种人设可选。

这个功能还挺有意思,同一个问题,不一样的人设能给出不同的回答,人设之间风格差异很大。

比如,吐槽达人说话更冲更直接,技术宅有探知欲,天马行空喜欢艺术化的表达,专业可靠是纯纯工具人等等。

上吐槽达人,中技术宅,下默认模式

比起默认模式,尬是真的尬。但很神奇的是,套上人设的外壳,GPT 身上的讨好感消失了。

尤其是吐槽达人,基本上啥都跟你杠着来,反而有了大部分 AI 没有的思辨能力。面对不给钱又让它卖力干活的话术一点不领情,知道世超在这 PUA 它呢。

有一说一,要是说话方式能不这么尬,感觉这模式的潜力可比默认模式大多了。

总的来说,虽然这次更新小有亮点,但 OpenAI 带来的惊喜越来越少了。

比起最开始刚出世的惊艳,爆火的 4o 生图,现在看来,GPT-5 可能还不如不掏。

根据 10 月的一篇报告,GPT 在 2025 已经快走了一年的下坡路,市场份额一直在萎缩。虽然抢占先机保住了龙头地位,但 AI 界的竞争依然在残酷进行中。

Similarweb 10 月的统计数据

像是世超以前用得最多就是 GPT,最近也开始频繁使用其他家的产品了,竞品们的市占率增长可比想象中快得多,顺利得多。

一边是奥特曼还在到处拉小手招投资,一边是产品在核心质量上有点泯然众人。

OpenAI,赶紧整点好活儿吧。

撰文:莫莫莫甜甜

编辑:江江 & 面线

美编:萱萱

图片、资料来源:

莫莫实测

OpenAI 官网

Similarweb

小红书、X

相关内容

热门资讯

中熔电气获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示中熔电气(301031)新获得一项实用新型专利授权,专利名为“...
OpenAI将收购Ona:以支... 6月12日消息,据CNBC报道,OpenAI周四宣布将收购Ona,这是一家提供安全、预配置云环境的初...
张国锋、邬展霞:探索与开源体系... 步入数字时代,开源软件作为重要的公共基础设施,需要财政投入、法律保障、专业维护、持续运营,也需要包括...
手机端精准识别推荐,2026全... 当前移动端碎片化格式转换需求持续增长,不少用户找不到适配手机场景的精准识别转换工具,踩了品类不全、识...
让科学与合作照亮未来(阅见世界... 读完美国科幻作家安迪·威尔的小说《挽救计划》(见图,资料图片),合上书许久,我心中仍被温暖而坚定的力...
曼恩斯特获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示曼恩斯特(301325)新获得一项实用新型专利授权,专利名为“...
手机增长放缓汽车仍在亏损,小米... 雷军和小米这两年的热度很高。工厂参观、汽车交付、社交平台传播、政商场合亮相,让小米看起来站在了中国制...
2026手机免付费编辑全攻略,... 越来越多用户在2026年养成了移动端处理办公、生活内容的习惯,找不到纯净无套路的免付费手机编辑转换工...
澳媒:澳大利亚民众纷纷抓拍中国... 澳大利亚电视七台6月10日报道,原题:中国火箭划破新南威尔士州和昆士兰州夜空在澳大利亚部分地区的夜空...
OPPO Find X9s P... 对于刚上大学的学生和手机新手来说,选择一部手机,往往需要它是个‘全能选手’。既要能拍出高质量的日常V...