OpenAI 上线安全评估中心,定期公开AI模型评估结果以提升透明度
创始人
2025-05-15 16:40:22
0

IT之家 5 月 15 日消息,OpenAI 宣布将更频繁地公开其内部人工智能模型的安全评估结果,以提高透明度。该公司于周三正式上线了“安全评估中心”网页,旨在展示其模型在有害内容生成、模型越狱以及幻觉现象等方面的测试表现。

OpenAI 表示,该安全评估中心将用于持续发布模型相关指标,并计划在未来的重大模型更新后及时更新网页内容。OpenAI 在一篇博客文章中写道:“随着人工智能评估科学的不断发展,我们致力于分享我们在开发更具可扩展性的模型能力与安全评估方法方面的进展。”该公司还强调,通过在此公开部分安全评估结果,不仅希望让用户更清晰地了解 OpenAI 系统随时间的安全性能变化,也期望能够支持整个行业在透明度方面的共同努力。此外,OpenAI 提到可能会随着时间推移在该中心增加更多评估项目。

此前,OpenAI 曾因部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告而受到一些伦理学家的批评。公司首席执行官山姆・奥尔特曼(Sam Altman)也因被指在 2023 年 11 月短暂被免职前误导公司高管关于模型安全审查的问题而备受争议。

IT之家注意到,就在上个月末,OpenAI 不得不撤销对 ChatGPT 默认模型 GPT-4o 的一次更新。原因是用户报告称该模型的回应方式过于“谄媚”,甚至对一些有问题的、危险的决策和想法也表示赞同。针对这一事件,OpenAI 表示将采取一系列修复和改进措施,以防止类似事件再次发生。其中包括为部分模型引入一个可选的“alpha 阶段”,允许部分 ChatGPT 用户在模型正式发布前进行测试并提供反馈。

相关内容

热门资讯

透明辅助!雀神广东麻雀智能科技... 透明辅助!雀神广东麻雀智能科技贴吧,pokernow辅助工具(辅助挂)详细开挂辅助神器 了解更多开挂...
一分钟了解!麻友圈安全版插件,... 一分钟了解!麻友圈安全版插件,哈灵永久辅助(有挂透明挂开挂辅助插件);无需打开直接搜索打开薇:136...
透明规律!关春天辅助凑一桌,h... 透明规律!关春天辅助凑一桌,hhpoker是正规的吗(辅助挂)详细开挂辅助下载;无需打开直接搜索加薇...
一分钟揭秘!烽火互动辅助,闲逸... 一分钟揭秘!烽火互动辅助,闲逸辅助器(存在有挂辅助开挂平台)您好:烽火互动辅助这款游戏可以开挂,确实...
透视安卓版!微乐小程序黑科技免... 透视安卓版!微乐小程序黑科技免费,德州来玩辅助器(辅助挂)详细开挂辅助安装;无需打开直接搜索加(薇:...
一分钟秒懂!微信边锋干橙眼辅助... 【亲,微信边锋干橙眼辅助 这款游戏可以开挂的,确实是有挂的,很多玩家在这款微信边锋干橙眼辅助中打牌都...
总算了解!微信边锋辅助器,开心... 总算了解!微信边锋辅助器,开心泉州辅助(有挂透明挂辅助工具) 了解更多开挂安装加(136704302...
透视美元局!凑一桌游戏关春天辅... 大家好,今天小编来为大家解答凑一桌游戏关春天辅助器这个问题咨询软件客服可以免费测试直接加微信(136...
推荐十款!手机暗宝辅助,福建天... >>您好:福建天天开心辅助工具确实是有挂的,很多玩家在这款福建天天开心辅助工具游戏中打牌都会发现很多...
透视模拟器!神途辅助脚本,we... 透视模拟器!神途辅助脚本,wepoker辅助器有哪些功能(辅助挂)详细开挂辅助神器;无需打开直接搜索...