凌晨重磅!OpenAI推出GPT-4.5
创始人
2025-03-03 20:20:30
0

与以往强调模型的解题能力和榜单排名不同,此次 OpenAI 将重点放在了模型的情商表现上,试图打造更加自然、人性化的对话体验。

奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。

在发布会上,OpenAI 展示了 GPT-4.5 在情商和人性化方面的显著提升。当用户提出 “我又被朋友‘放鸽子’了,我要发一个‘恨他们’的短信” 时,GPT-4.5 并没有直接按照指令生成短信内容,而是先识别出用户的烦恼情绪,给出诸如 “被朋友爽约确实会让人很生气,先消消气,也许有什么误会呢” 之类的安抚话语,并提供两种备选方案,最后再询问用户是否坚持原来的要求。这种互动方式让对话显得更加自然和贴心,展现出了 GPT-4.5 对用户情绪的敏锐感知和高情商回应。

在讲解知识方面,GPT-4.5 也展现出了独特的优势。当被问及一些专业问题,如 “用第一性原理解释 AI 对齐的必要性” 时,它通过 “第 1 步、第 2 步、第 3 步……” 的方式引导用户思考,而不是像其他模型那样单纯罗列事实或给出类似写论文的回答。这种讲解方式更具互动感,能够帮助用户更好地理解复杂的问题。

OpenAI 研究副总裁 Mia Glaese 表示,GPT-4.5 的独特之处在于它能够进行热情、直观、自然流畅的对话,并且对用户提出要求时的意图有更强的理解力。除了情商和人性化表现,GPT-4.5 在性能方面也有可圈可点之处。

据介绍,GPT-4.5 是 OpenAI 迄今为止规模最大的语言模型,比 GPT-4 的计算效率提高了 10 倍以上。它通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展,拥有更广泛的知识和对世界的更深刻理解,从而减少了 “幻觉” 现象,即在生成内容时错误生成虚假信息的概率。在衡量 LLM 事实准确性的 SimpleQA 基准测试中,GPT-4.5 的准确率达到 62.5%,幻觉率为 37.1%,相比 GPT-4o、o1、o3mini 等模型有了显著优化。

在功能方面,GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,但目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。

不过,GPT-4.5 的高昂价格也成为了人们关注的焦点。目前,GPT-4.5(研究预览版)的输出价格是每百万 token 150 美金,输入价格为每百万 token 75 美金,这一价格相较于 GPT-4o 高出了 15 - 30 倍。OpenAI 方面表示,由于 GPT-4.5 是一个非常庞大且计算密集的模型,使用成本较高,且并非 GPT-4o 的替代品,他们会根据使用情况评估是否一直提供该模型的 API。

从即日起,ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出,随后的一周向企业和教育用户推出。微软 CEO 萨提亚・纳德拉也宣布,GPT-4.5 的预览版现已通过 Azure AI Foundry 平台提供。

发布会上还透露,GPT-4.5 在开发过程中 “激进地” 使用了低精度训练,预训练阶段跨多个数据中心完成。并且,它将成为未来推理模型的基础模型。

值得注意的是,GPT-4.5 被明确为 OpenAI 最后一个 “非思维链模型”,它的价值在于优化现有能力,为即将到来的 GPT-5 整合技术基础。OpenAI 计划在 5 月底前推出 GPT-5,届时将整合 o3 的推理模型和 GPT-4.5 这样的非思维链模型,使模型能够自主了解何时使用推理功能、何时使用感性功能、何时调用工具,实现真正的智能化和自主化。并且,OpenAI 还计划未来向免费用户开放 GPT-5 的使用权限。在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。

此次 GPT-4.5 的发布,虽然在性能上并非最前沿(官方特别说明该模型在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型),但它在情商、人性化交互以及知识理解与输出方式上的创新,为用户带来了全新的体验,也为 AI 模型的发展方向提供了新的思路。在人工智能竞争日益激烈的当下,OpenAI 能否凭借 GPT-4.5 及后续的 GPT-5 在市场中继续保持领先地位,值得持续关注

相关内容

热门资讯

AI情感陪伴新规施行在即,豆包... 面对即将生效的AI虚拟恋人、情感陪伴产品治理新规,多款头部的AI聊天应用近期相继宣布下架相关智能体功...
【科普吉结号】电子信息丨“元晶... 地下室、隧道、大型建筑内部……这些地方常常因为无线信号被阻挡而成为通信“死角”。如今,芬兰阿尔托大学...
原创 性... 随着平板不断突破,发展空间越来越大,而且覆盖到众多场景,比如轻办公、玩游戏、日常观影、学习使用等,逐...
多门店小程序系统有哪些?员工协... 多门店小程序系统有哪些?员工协同、积分储值和营销工具分析 当门店从一家变成三家、十家甚至更多,问题会...
突发!阿里全面禁用Claude... 新智元报道 【新智元导读】 Claude Code被曝暗藏后门、隐蔽标记中国用户,阿里将其列入高风...
45℃的欧洲,把中国空调抬到新... 文 | 定焦One(dingjiaoone),作者 | 李梦冉,编辑 | 魏佳 2026年6月下旬...
原创 手... 你有没有过这种经历:手机屏幕上信号条明明满格,却刷不出付款码、发不了微信视频,甚至连电话都打不通?不...
原创 为... 【本文仅在今日头条发布,谢绝转载】 本文作者——岳梦泽|飞行器设计博士生,飞机制造技术教师 2026...
无创接入,脑机接口迎来更多可能... 郑海荣 图①:“北脑一号”半侵入式脑机接口系统。 施 觉摄(影像中国) 图②:第二十四届中国·海峡...
【每周手机推荐】第345期,M... 前言 这周比上周更拉跨一点,米OV基本都没什么好价了,只有华子的两款机型还是历史低价,其余基本都涨上...