凌晨重磅!OpenAI推出GPT-4.5
创始人
2025-03-03 20:20:30
0

与以往强调模型的解题能力和榜单排名不同,此次 OpenAI 将重点放在了模型的情商表现上,试图打造更加自然、人性化的对话体验。

奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。

在发布会上,OpenAI 展示了 GPT-4.5 在情商和人性化方面的显著提升。当用户提出 “我又被朋友‘放鸽子’了,我要发一个‘恨他们’的短信” 时,GPT-4.5 并没有直接按照指令生成短信内容,而是先识别出用户的烦恼情绪,给出诸如 “被朋友爽约确实会让人很生气,先消消气,也许有什么误会呢” 之类的安抚话语,并提供两种备选方案,最后再询问用户是否坚持原来的要求。这种互动方式让对话显得更加自然和贴心,展现出了 GPT-4.5 对用户情绪的敏锐感知和高情商回应。

在讲解知识方面,GPT-4.5 也展现出了独特的优势。当被问及一些专业问题,如 “用第一性原理解释 AI 对齐的必要性” 时,它通过 “第 1 步、第 2 步、第 3 步……” 的方式引导用户思考,而不是像其他模型那样单纯罗列事实或给出类似写论文的回答。这种讲解方式更具互动感,能够帮助用户更好地理解复杂的问题。

OpenAI 研究副总裁 Mia Glaese 表示,GPT-4.5 的独特之处在于它能够进行热情、直观、自然流畅的对话,并且对用户提出要求时的意图有更强的理解力。除了情商和人性化表现,GPT-4.5 在性能方面也有可圈可点之处。

据介绍,GPT-4.5 是 OpenAI 迄今为止规模最大的语言模型,比 GPT-4 的计算效率提高了 10 倍以上。它通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展,拥有更广泛的知识和对世界的更深刻理解,从而减少了 “幻觉” 现象,即在生成内容时错误生成虚假信息的概率。在衡量 LLM 事实准确性的 SimpleQA 基准测试中,GPT-4.5 的准确率达到 62.5%,幻觉率为 37.1%,相比 GPT-4o、o1、o3mini 等模型有了显著优化。

在功能方面,GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,但目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。

不过,GPT-4.5 的高昂价格也成为了人们关注的焦点。目前,GPT-4.5(研究预览版)的输出价格是每百万 token 150 美金,输入价格为每百万 token 75 美金,这一价格相较于 GPT-4o 高出了 15 - 30 倍。OpenAI 方面表示,由于 GPT-4.5 是一个非常庞大且计算密集的模型,使用成本较高,且并非 GPT-4o 的替代品,他们会根据使用情况评估是否一直提供该模型的 API。

从即日起,ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出,随后的一周向企业和教育用户推出。微软 CEO 萨提亚・纳德拉也宣布,GPT-4.5 的预览版现已通过 Azure AI Foundry 平台提供。

发布会上还透露,GPT-4.5 在开发过程中 “激进地” 使用了低精度训练,预训练阶段跨多个数据中心完成。并且,它将成为未来推理模型的基础模型。

值得注意的是,GPT-4.5 被明确为 OpenAI 最后一个 “非思维链模型”,它的价值在于优化现有能力,为即将到来的 GPT-5 整合技术基础。OpenAI 计划在 5 月底前推出 GPT-5,届时将整合 o3 的推理模型和 GPT-4.5 这样的非思维链模型,使模型能够自主了解何时使用推理功能、何时使用感性功能、何时调用工具,实现真正的智能化和自主化。并且,OpenAI 还计划未来向免费用户开放 GPT-5 的使用权限。在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。

此次 GPT-4.5 的发布,虽然在性能上并非最前沿(官方特别说明该模型在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型),但它在情商、人性化交互以及知识理解与输出方式上的创新,为用户带来了全新的体验,也为 AI 模型的发展方向提供了新的思路。在人工智能竞争日益激烈的当下,OpenAI 能否凭借 GPT-4.5 及后续的 GPT-5 在市场中继续保持领先地位,值得持续关注

相关内容

热门资讯

布米普特拉北京投资基金管理有限... 美国科技巨头Meta正在经历一场剧烈的人事重构,但企业CEO扎克伯格试图给员工吃下一颗定心丸。当地时...
全国首次!智元机器人在张江试点... 5月20日,全国首次人机协同城市管理执法试点,在上海市浦东新区张江人工智能创新小镇(简称“张江AI小...
加速推动科幻产业“一中心四高地... 2023年,第81届世界科幻大会在成都成功举办;2024年,成都发布全国首个城市科幻发展规划;202...
互联网医院系统搭建与传统医院信... 很多人第一次接触互联网医院时,都会觉得它只是把传统医院搬到了线上。但实际上,互联网医院系统搭建和传统...
万物云宋澜涛:真正的智慧,始于... 5月22日,2026万物云灵石科技生态大会在广州召开,会上正式发布灵石能力开放平台及终端灵石“云芯”...
人类史上最大火箭!星舰V3发射... SpaceX星舰V3终于成功发射了。 北京时间5月23日早晨,SpaceX成功完成了星舰计划的第12...
2026重庆科技活动周正式启幕 央广网重庆5月23日消息(记者陈静)5月23日,以“奋进‘十五五’科技谱新篇”为主题的2026年重庆...
专家解读|筑牢智能向善的伦理安... 近日,全国网络安全标准化技术委员会公布《人工智能应用伦理安全指引1.0》(以下简称《指引》),标志着...
人工智能赋能长期照护体系建设 ... 日内瓦当地时间 2026年5月20日,第 79 届世界卫生大会期间,由国家医疗保障局、世界卫生组织共...
小米REDMI Note 17... 5 月 23 日消息,据外媒 XIMITIME 昨天报道,小米 REDMI Note 17 系列手机...