OpenAI 上线安全评估中心,定期公开AI模型评估结果以提升透明度
创始人
2025-05-15 16:40:22
0

IT之家 5 月 15 日消息,OpenAI 宣布将更频繁地公开其内部人工智能模型的安全评估结果,以提高透明度。该公司于周三正式上线了“安全评估中心”网页,旨在展示其模型在有害内容生成、模型越狱以及幻觉现象等方面的测试表现。

OpenAI 表示,该安全评估中心将用于持续发布模型相关指标,并计划在未来的重大模型更新后及时更新网页内容。OpenAI 在一篇博客文章中写道:“随着人工智能评估科学的不断发展,我们致力于分享我们在开发更具可扩展性的模型能力与安全评估方法方面的进展。”该公司还强调,通过在此公开部分安全评估结果,不仅希望让用户更清晰地了解 OpenAI 系统随时间的安全性能变化,也期望能够支持整个行业在透明度方面的共同努力。此外,OpenAI 提到可能会随着时间推移在该中心增加更多评估项目。

此前,OpenAI 曾因部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告而受到一些伦理学家的批评。公司首席执行官山姆・奥尔特曼(Sam Altman)也因被指在 2023 年 11 月短暂被免职前误导公司高管关于模型安全审查的问题而备受争议。

IT之家注意到,就在上个月末,OpenAI 不得不撤销对 ChatGPT 默认模型 GPT-4o 的一次更新。原因是用户报告称该模型的回应方式过于“谄媚”,甚至对一些有问题的、危险的决策和想法也表示赞同。针对这一事件,OpenAI 表示将采取一系列修复和改进措施,以防止类似事件再次发生。其中包括为部分模型引入一个可选的“alpha 阶段”,允许部分 ChatGPT 用户在模型正式发布前进行测试并提供反馈。

相关内容

热门资讯

华为助科威特电信AI升级,FM... 近日,一则关于科威特电信领域的创新消息引起了广泛关注。科威特通信网络公司Zain携手华为,推出了一款...
奇创智能取得电池外壳切割装置专... 金融界2025年8月16日消息,国家知识产权局信息显示,广东奇创智能科技有限公司取得一项名为“一种电...
32个国内顶尖医疗团队模型汇聚... 制图:陈欣(豆包AI) 城市级全域智慧医疗大脑——医智方舟(MedArk CityBrain)发布会...
2025世界人形机器人运动会拆... 来源:市场资讯 (来源:贝壳财经) 新京报贝壳财经讯(记者韦英姿)8月16日,在2025世界人形机器...
人形机器人史上首个百米“飞人”... 人形机器人史上首个百米“飞人”诞生 视频:央视新闻 今天下午4点多,世界人形机器人运动会最受瞩目...
净网:知道什么是“指尖陷阱”吗 在数字化时代,互联网给人们的生活带来了极大便利,动动指尖,即可获取海量信息、完成各类交易。然而,在这...
突围“无人区”,抢占未来“新”... □ 本报记者 许愿 孙秦旺 长江浩荡,奔涌不息;创新激荡,澎湃不止。 当全球产业版图风云激荡,抢占未...
盈德气体取得防氮塞液氩循环空分... 金融界2025年8月16日消息,国家知识产权局信息显示,盈德气体工程(浙江)有限公司取得一项名为“一...
诺尼可研发高性价比催化剂,助力... 来源:市场资讯 (来源:辰珵) 俄罗斯领先的矿业和金属公司诺尼可(Nornickel)成功测试了一种...
我国长征十号系列火箭一子级试验... 来源:市场资讯 (来源:IT之家) IT之家 8 月 17 日消息,今年 8 月 15 日,我国在文...