凌晨重磅!OpenAI推出GPT-4.5
创始人
2025-03-03 20:20:30
0

与以往强调模型的解题能力和榜单排名不同,此次 OpenAI 将重点放在了模型的情商表现上,试图打造更加自然、人性化的对话体验。

奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。

在发布会上,OpenAI 展示了 GPT-4.5 在情商和人性化方面的显著提升。当用户提出 “我又被朋友‘放鸽子’了,我要发一个‘恨他们’的短信” 时,GPT-4.5 并没有直接按照指令生成短信内容,而是先识别出用户的烦恼情绪,给出诸如 “被朋友爽约确实会让人很生气,先消消气,也许有什么误会呢” 之类的安抚话语,并提供两种备选方案,最后再询问用户是否坚持原来的要求。这种互动方式让对话显得更加自然和贴心,展现出了 GPT-4.5 对用户情绪的敏锐感知和高情商回应。

在讲解知识方面,GPT-4.5 也展现出了独特的优势。当被问及一些专业问题,如 “用第一性原理解释 AI 对齐的必要性” 时,它通过 “第 1 步、第 2 步、第 3 步……” 的方式引导用户思考,而不是像其他模型那样单纯罗列事实或给出类似写论文的回答。这种讲解方式更具互动感,能够帮助用户更好地理解复杂的问题。

OpenAI 研究副总裁 Mia Glaese 表示,GPT-4.5 的独特之处在于它能够进行热情、直观、自然流畅的对话,并且对用户提出要求时的意图有更强的理解力。除了情商和人性化表现,GPT-4.5 在性能方面也有可圈可点之处。

据介绍,GPT-4.5 是 OpenAI 迄今为止规模最大的语言模型,比 GPT-4 的计算效率提高了 10 倍以上。它通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展,拥有更广泛的知识和对世界的更深刻理解,从而减少了 “幻觉” 现象,即在生成内容时错误生成虚假信息的概率。在衡量 LLM 事实准确性的 SimpleQA 基准测试中,GPT-4.5 的准确率达到 62.5%,幻觉率为 37.1%,相比 GPT-4o、o1、o3mini 等模型有了显著优化。

在功能方面,GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,但目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。

不过,GPT-4.5 的高昂价格也成为了人们关注的焦点。目前,GPT-4.5(研究预览版)的输出价格是每百万 token 150 美金,输入价格为每百万 token 75 美金,这一价格相较于 GPT-4o 高出了 15 - 30 倍。OpenAI 方面表示,由于 GPT-4.5 是一个非常庞大且计算密集的模型,使用成本较高,且并非 GPT-4o 的替代品,他们会根据使用情况评估是否一直提供该模型的 API。

从即日起,ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出,随后的一周向企业和教育用户推出。微软 CEO 萨提亚・纳德拉也宣布,GPT-4.5 的预览版现已通过 Azure AI Foundry 平台提供。

发布会上还透露,GPT-4.5 在开发过程中 “激进地” 使用了低精度训练,预训练阶段跨多个数据中心完成。并且,它将成为未来推理模型的基础模型。

值得注意的是,GPT-4.5 被明确为 OpenAI 最后一个 “非思维链模型”,它的价值在于优化现有能力,为即将到来的 GPT-5 整合技术基础。OpenAI 计划在 5 月底前推出 GPT-5,届时将整合 o3 的推理模型和 GPT-4.5 这样的非思维链模型,使模型能够自主了解何时使用推理功能、何时使用感性功能、何时调用工具,实现真正的智能化和自主化。并且,OpenAI 还计划未来向免费用户开放 GPT-5 的使用权限。在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。

此次 GPT-4.5 的发布,虽然在性能上并非最前沿(官方特别说明该模型在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型),但它在情商、人性化交互以及知识理解与输出方式上的创新,为用户带来了全新的体验,也为 AI 模型的发展方向提供了新的思路。在人工智能竞争日益激烈的当下,OpenAI 能否凭借 GPT-4.5 及后续的 GPT-5 在市场中继续保持领先地位,值得持续关注

相关内容

热门资讯

WPK辅助挂!德扑之星的优势神... WPK辅助挂!德扑之星的优势神器,菠萝德普辅助器免费版在哪里器安装是由北京得黑科技有限公司精心研发的...
WePoKe透明挂!德州之星透... WePoKe透明挂!德州之星透牌器合作,佛手大菠萝有挂吗透明科技教程也叫必备教程,这是一款功能强大的...
WePoKe辅助器!德扑计算软... WePoKe辅助器!德扑计算软件ios,werplan怎么透视工具;玩家必备必赢加哟《1367043...
WPK辅助器!扑克时间有后台控... WPK辅助器!扑克时间有后台控制专用,约局吧德州真的存在透视吗了解;(需添加指定薇757446909...
WPK透明挂!pokerx智能... WPK透明挂!pokerx智能软件必备,德州私人局怎么透视器;实战中需综合运用上述技巧,并根据牌桌动...
wpk作弊器!云扑克渠道,佛手... wpk作弊器!云扑克渠道,佛手大菠萝13道挂哪里透明;《WPK辅助透视》‌:支持手机实时对战,融入全...
wpk作弊器!德扑之星 ai软... wpk作弊器!德扑之星 ai软件德州扑克,约局吧开挂神器是真的吗工具,支持语音通讯、好友开房及战队组...
微扑克辅助器!扑克王辅助工具透... WePoker透视辅助版本解析‌,微扑克辅助器!扑克王辅助工具透视,佛手在线是不是有挂介绍;具体教程...
德扑之星辅助!众合推扑克辅助工... 德扑之星辅助!众合推扑克辅助工具是真的,智星菠萝有挂吗工具;玩家必备必赢加哟《136704302》。...
红龙扑克辅助器!约局吧软件有辅... 红龙扑克辅助器!约局吧软件有辅助最新版,哈糖大菠萝能开挂吗规律;实战中需综合运用上述技巧,并根据牌桌...