凌晨重磅!OpenAI推出GPT-4.5
创始人
2025-03-03 20:20:30
0

与以往强调模型的解题能力和榜单排名不同,此次 OpenAI 将重点放在了模型的情商表现上,试图打造更加自然、人性化的对话体验。

奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。

在发布会上,OpenAI 展示了 GPT-4.5 在情商和人性化方面的显著提升。当用户提出 “我又被朋友‘放鸽子’了,我要发一个‘恨他们’的短信” 时,GPT-4.5 并没有直接按照指令生成短信内容,而是先识别出用户的烦恼情绪,给出诸如 “被朋友爽约确实会让人很生气,先消消气,也许有什么误会呢” 之类的安抚话语,并提供两种备选方案,最后再询问用户是否坚持原来的要求。这种互动方式让对话显得更加自然和贴心,展现出了 GPT-4.5 对用户情绪的敏锐感知和高情商回应。

在讲解知识方面,GPT-4.5 也展现出了独特的优势。当被问及一些专业问题,如 “用第一性原理解释 AI 对齐的必要性” 时,它通过 “第 1 步、第 2 步、第 3 步……” 的方式引导用户思考,而不是像其他模型那样单纯罗列事实或给出类似写论文的回答。这种讲解方式更具互动感,能够帮助用户更好地理解复杂的问题。

OpenAI 研究副总裁 Mia Glaese 表示,GPT-4.5 的独特之处在于它能够进行热情、直观、自然流畅的对话,并且对用户提出要求时的意图有更强的理解力。除了情商和人性化表现,GPT-4.5 在性能方面也有可圈可点之处。

据介绍,GPT-4.5 是 OpenAI 迄今为止规模最大的语言模型,比 GPT-4 的计算效率提高了 10 倍以上。它通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展,拥有更广泛的知识和对世界的更深刻理解,从而减少了 “幻觉” 现象,即在生成内容时错误生成虚假信息的概率。在衡量 LLM 事实准确性的 SimpleQA 基准测试中,GPT-4.5 的准确率达到 62.5%,幻觉率为 37.1%,相比 GPT-4o、o1、o3mini 等模型有了显著优化。

在功能方面,GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,但目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。

不过,GPT-4.5 的高昂价格也成为了人们关注的焦点。目前,GPT-4.5(研究预览版)的输出价格是每百万 token 150 美金,输入价格为每百万 token 75 美金,这一价格相较于 GPT-4o 高出了 15 - 30 倍。OpenAI 方面表示,由于 GPT-4.5 是一个非常庞大且计算密集的模型,使用成本较高,且并非 GPT-4o 的替代品,他们会根据使用情况评估是否一直提供该模型的 API。

从即日起,ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出,随后的一周向企业和教育用户推出。微软 CEO 萨提亚・纳德拉也宣布,GPT-4.5 的预览版现已通过 Azure AI Foundry 平台提供。

发布会上还透露,GPT-4.5 在开发过程中 “激进地” 使用了低精度训练,预训练阶段跨多个数据中心完成。并且,它将成为未来推理模型的基础模型。

值得注意的是,GPT-4.5 被明确为 OpenAI 最后一个 “非思维链模型”,它的价值在于优化现有能力,为即将到来的 GPT-5 整合技术基础。OpenAI 计划在 5 月底前推出 GPT-5,届时将整合 o3 的推理模型和 GPT-4.5 这样的非思维链模型,使模型能够自主了解何时使用推理功能、何时使用感性功能、何时调用工具,实现真正的智能化和自主化。并且,OpenAI 还计划未来向免费用户开放 GPT-5 的使用权限。在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。

此次 GPT-4.5 的发布,虽然在性能上并非最前沿(官方特别说明该模型在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型),但它在情商、人性化交互以及知识理解与输出方式上的创新,为用户带来了全新的体验,也为 AI 模型的发展方向提供了新的思路。在人工智能竞争日益激烈的当下,OpenAI 能否凭借 GPT-4.5 及后续的 GPT-5 在市场中继续保持领先地位,值得持续关注

相关内容

热门资讯

无人机在移动船载平台精准降落 无人机在移动船载平台精准降落 这项智能化技术于黄骅港水域通过测试 工作人员进行起降测试。 通讯员 ...
滴!福天天带你极速打卡福建新一... 它们驻守山巅、倚傍大海、仰望苍穹,将瞬息万变的风云尽收眼底。 它们捕捉每一片云的轨迹,追踪每一滴雨的...
原创 雷... 还记得第一代小米SU7是发布还是上市之后,雷军表示从北京到上海只充一次电。然后雷军被黑惨了!虽然稍有...
全链条共享,千亿集群加速崛起 (来源:河北日报) 转自:河北日报 全链条共享,千亿集群加速崛起 □本报记者 张晓超 “这批元器件急...
我国机构发布全球医学与生命科学... 我国机构自主研发制定的全球医学与生命科学高质量期刊列表3月21日发布,为世界学术期刊评价提供了“中国...
“北脑一号”脑机系统已完成7例... 人民网北京3月22日电 (记者董兆瑞)3月20日,2026年北京市未来产业发展重点工作新闻发布会召开...
全球每4块智能穿戴显示屏,就有... 谁懂啊 在维信诺昆山公司的产品展厅 逛一圈 直接刷新对“显示屏”的认知 薄如蝉翼的电子屏在微风中颤动...
原创 马... 回望过去十几年,马斯克吹过的牛全都变成了现实。当初他说火箭能回收,全网都在嘲笑。如今他的太空探索公司...
自主研发期刊评价体系发布 专家... 中新网北京3月21日电(记者 张素)依据自主研发的“种子期刊引文追溯+引文网络层级结构分级法”,从全...
能吸、能动、能切!西工大院士团... 一块材料能做什么?在大多数人印象里,材料是“被动”的——钢铁承重、塑料绝缘、橡胶密封…… 但如果告诉...