OpenAI 上线安全评估中心,定期公开AI模型评估结果以提升透明度
创始人
2025-05-15 16:40:22
0

IT之家 5 月 15 日消息,OpenAI 宣布将更频繁地公开其内部人工智能模型的安全评估结果,以提高透明度。该公司于周三正式上线了“安全评估中心”网页,旨在展示其模型在有害内容生成、模型越狱以及幻觉现象等方面的测试表现。

OpenAI 表示,该安全评估中心将用于持续发布模型相关指标,并计划在未来的重大模型更新后及时更新网页内容。OpenAI 在一篇博客文章中写道:“随着人工智能评估科学的不断发展,我们致力于分享我们在开发更具可扩展性的模型能力与安全评估方法方面的进展。”该公司还强调,通过在此公开部分安全评估结果,不仅希望让用户更清晰地了解 OpenAI 系统随时间的安全性能变化,也期望能够支持整个行业在透明度方面的共同努力。此外,OpenAI 提到可能会随着时间推移在该中心增加更多评估项目。

此前,OpenAI 曾因部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告而受到一些伦理学家的批评。公司首席执行官山姆・奥尔特曼(Sam Altman)也因被指在 2023 年 11 月短暂被免职前误导公司高管关于模型安全审查的问题而备受争议。

IT之家注意到,就在上个月末,OpenAI 不得不撤销对 ChatGPT 默认模型 GPT-4o 的一次更新。原因是用户报告称该模型的回应方式过于“谄媚”,甚至对一些有问题的、危险的决策和想法也表示赞同。针对这一事件,OpenAI 表示将采取一系列修复和改进措施,以防止类似事件再次发生。其中包括为部分模型引入一个可选的“alpha 阶段”,允许部分 ChatGPT 用户在模型正式发布前进行测试并提供反馈。

相关内容

热门资讯

中国电信研究院&中兴通... 获取完整报告,公众『数字化新机遇』阅读原文或点击菜单获取。 报告《中国电信研究院&中兴通讯:6G网络...
全国档案查询利用服务平台移动端... 新华社北京7月6日电 记者6日从国家档案局获悉,全国档案查询利用服务平台移动端APP当日正式上线。这...
福建师范大学与龙岩市永定区教育... 中新网龙岩7月6日电 (赖敏 蔡兹章)7月6日,福建师范大学与龙岩市永定区教育局在福建龙岩市永定区城...
开景新材料取得硅油涂布测试装置... 金融界2025年7月5日消息,国家知识产权局信息显示,东莞市开景新材料科技有限公司取得一项名为“一种...
安诺其举行投资者活动 介绍AI... 财中社7月6日电安诺其(300067)发布公告,近期公司举行了一次投资者关系活动,主要内容涉及公司基...
华为盘古团队回应开源模型抄袭:... 新京报贝壳财经讯(记者韦博雅)近日,网络上有声音质疑华为盘古大模型涉嫌抄袭阿里巴巴通义千问模型。7月...
江苏汇力新能源取得便捷式夹持组... 金融界2025年7月5日消息,国家知识产权局信息显示,江苏汇力新能源科技有限公司取得一项名为“一种便...
重庆城市科技学院人工智能与大数... 第十届中国高校计算机大赛团体程序设计天梯赛获奖结果正式出炉。由重庆城市科技学院人工智能与大数据学院颜...
事关稀土,日本开始行动了 据《日本经济新闻》网站7月1日报道,日本海洋研究开发机构(JAMSTEC)将于2026年1月在南鸟岛...
让百万充电宝深陷召回事件的源头... “现在充电宝和C4唯一的区别,是你知道C4什么时候会炸。” “有没有大神看一下我的充电宝还能不能用?...