凌晨重磅!OpenAI推出GPT-4.5
创始人
2025-03-03 20:20:30
0

与以往强调模型的解题能力和榜单排名不同,此次 OpenAI 将重点放在了模型的情商表现上,试图打造更加自然、人性化的对话体验。

奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。

在发布会上,OpenAI 展示了 GPT-4.5 在情商和人性化方面的显著提升。当用户提出 “我又被朋友‘放鸽子’了,我要发一个‘恨他们’的短信” 时,GPT-4.5 并没有直接按照指令生成短信内容,而是先识别出用户的烦恼情绪,给出诸如 “被朋友爽约确实会让人很生气,先消消气,也许有什么误会呢” 之类的安抚话语,并提供两种备选方案,最后再询问用户是否坚持原来的要求。这种互动方式让对话显得更加自然和贴心,展现出了 GPT-4.5 对用户情绪的敏锐感知和高情商回应。

在讲解知识方面,GPT-4.5 也展现出了独特的优势。当被问及一些专业问题,如 “用第一性原理解释 AI 对齐的必要性” 时,它通过 “第 1 步、第 2 步、第 3 步……” 的方式引导用户思考,而不是像其他模型那样单纯罗列事实或给出类似写论文的回答。这种讲解方式更具互动感,能够帮助用户更好地理解复杂的问题。

OpenAI 研究副总裁 Mia Glaese 表示,GPT-4.5 的独特之处在于它能够进行热情、直观、自然流畅的对话,并且对用户提出要求时的意图有更强的理解力。除了情商和人性化表现,GPT-4.5 在性能方面也有可圈可点之处。

据介绍,GPT-4.5 是 OpenAI 迄今为止规模最大的语言模型,比 GPT-4 的计算效率提高了 10 倍以上。它通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展,拥有更广泛的知识和对世界的更深刻理解,从而减少了 “幻觉” 现象,即在生成内容时错误生成虚假信息的概率。在衡量 LLM 事实准确性的 SimpleQA 基准测试中,GPT-4.5 的准确率达到 62.5%,幻觉率为 37.1%,相比 GPT-4o、o1、o3mini 等模型有了显著优化。

在功能方面,GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,但目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。

不过,GPT-4.5 的高昂价格也成为了人们关注的焦点。目前,GPT-4.5(研究预览版)的输出价格是每百万 token 150 美金,输入价格为每百万 token 75 美金,这一价格相较于 GPT-4o 高出了 15 - 30 倍。OpenAI 方面表示,由于 GPT-4.5 是一个非常庞大且计算密集的模型,使用成本较高,且并非 GPT-4o 的替代品,他们会根据使用情况评估是否一直提供该模型的 API。

从即日起,ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出,随后的一周向企业和教育用户推出。微软 CEO 萨提亚・纳德拉也宣布,GPT-4.5 的预览版现已通过 Azure AI Foundry 平台提供。

发布会上还透露,GPT-4.5 在开发过程中 “激进地” 使用了低精度训练,预训练阶段跨多个数据中心完成。并且,它将成为未来推理模型的基础模型。

值得注意的是,GPT-4.5 被明确为 OpenAI 最后一个 “非思维链模型”,它的价值在于优化现有能力,为即将到来的 GPT-5 整合技术基础。OpenAI 计划在 5 月底前推出 GPT-5,届时将整合 o3 的推理模型和 GPT-4.5 这样的非思维链模型,使模型能够自主了解何时使用推理功能、何时使用感性功能、何时调用工具,实现真正的智能化和自主化。并且,OpenAI 还计划未来向免费用户开放 GPT-5 的使用权限。在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。

此次 GPT-4.5 的发布,虽然在性能上并非最前沿(官方特别说明该模型在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型),但它在情商、人性化交互以及知识理解与输出方式上的创新,为用户带来了全新的体验,也为 AI 模型的发展方向提供了新的思路。在人工智能竞争日益激烈的当下,OpenAI 能否凭借 GPT-4.5 及后续的 GPT-5 在市场中继续保持领先地位,值得持续关注

相关内容

热门资讯

物理学陷入停滞——进步主义神话... 当今的物理学家需要抛弃那个极具吸引力的神话——他们正在揭示我们宇宙的隐藏现实。 浏览物理学科普书籍...
从“数字化”到“数智化”(观象... 从“数字化”到“数智化”,一字之变,体现出我国牢牢把握人工智能机遇,体系化推进人工智能产业创新和赋能...
10万次Claude真实对话洞... IT之家 11 月 26 日消息,Anthropic 昨日(11 月 25 日)发布研究报告,通过分...
AI技术应用越广泛,越要明确边... 发展科技的初心和落点都是服务于人,服务于国家和社会。让安全和便捷成为AI技术应用的一体两面,成为技术...
【多彩新论】警惕碎片化传播的负... 注意力不集中,看书听讲说话容易走神,刷手机却停不下来……数字时代的碎片化传播,已成为我们获取资讯的主...
原创 1... 神舟二十二飞船成功发射,代号“天宫应急1号”,并且也圆满完成了中国空间站任务对接,整个任务全面成功了...
工信部:启动为期两年的卫星物联... C114讯 11月26日消息(颜翊)昨日,工业和信息化部正式印发《关于组织开展卫星物联网业务商用试验...
华为Mate80全系降价背后 华为需要通过更亲民的定价,来从iPhone手上抢更多的市场份额。 文|游勇 编|石兆 作为华为旗下最...
亚洲第一!我国自主研制,海试成... ◎ 科技日报记者 都芃 25日,记者从中交天津航道局有限公司获悉,当天下午,新一代超大型耙吸挖泥船“...
一加总裁:第五代骁龙8由一加高... 【CNMO科技消息】11月26日,一加中国区总裁李杰在社交平台透露,已受邀出席当天下午举行的高通“第...