OpenAI 上线安全评估中心,定期公开AI模型评估结果以提升透明度
创始人
2025-05-15 16:40:22
0

IT之家 5 月 15 日消息,OpenAI 宣布将更频繁地公开其内部人工智能模型的安全评估结果,以提高透明度。该公司于周三正式上线了“安全评估中心”网页,旨在展示其模型在有害内容生成、模型越狱以及幻觉现象等方面的测试表现。

OpenAI 表示,该安全评估中心将用于持续发布模型相关指标,并计划在未来的重大模型更新后及时更新网页内容。OpenAI 在一篇博客文章中写道:“随着人工智能评估科学的不断发展,我们致力于分享我们在开发更具可扩展性的模型能力与安全评估方法方面的进展。”该公司还强调,通过在此公开部分安全评估结果,不仅希望让用户更清晰地了解 OpenAI 系统随时间的安全性能变化,也期望能够支持整个行业在透明度方面的共同努力。此外,OpenAI 提到可能会随着时间推移在该中心增加更多评估项目。

此前,OpenAI 曾因部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告而受到一些伦理学家的批评。公司首席执行官山姆・奥尔特曼(Sam Altman)也因被指在 2023 年 11 月短暂被免职前误导公司高管关于模型安全审查的问题而备受争议。

IT之家注意到,就在上个月末,OpenAI 不得不撤销对 ChatGPT 默认模型 GPT-4o 的一次更新。原因是用户报告称该模型的回应方式过于“谄媚”,甚至对一些有问题的、危险的决策和想法也表示赞同。针对这一事件,OpenAI 表示将采取一系列修复和改进措施,以防止类似事件再次发生。其中包括为部分模型引入一个可选的“alpha 阶段”,允许部分 ChatGPT 用户在模型正式发布前进行测试并提供反馈。

相关内容

热门资讯

六大硬核赛道百余项目参与角逐,... 来源:滚动播报 (来源:上观新闻) 6月12日,第四届嘉定区未来产业颠覆性技术大赛在中国科学院上...
上海:数字技术赋能优质医疗走向... 中新网上海6月12日电 (记者 陈静)12日正在上海举行的第十二届中国(上海)国际技术进出口交易会上...
研究发现陨石撞击改变金元素分布 来源:自然资源部 据Mining.com网站报道,西澳州金田地区的一次古老陨石撞击留下了地球剧烈碰撞...
江苏援青助力青海落地首个国家级... 人民网记者 王丹丹 活动现场。人民网记者 王丹丹摄 6月12日,万界京峰青海智算中心项目(下称“京...
机器人“全自主”奔跑!世界人形... 新华社北京6月12日电(记者阳娜)记者12日在第二届世界人形机器人运动会第二次新闻发布会上获悉,第二...
南通市江海钢绳取得钢丝绳收卷机... 国家知识产权局信息显示,南通市江海钢绳有限公司取得一项名为“一种钢丝绳收卷机”的专利,授权公告号CN...
阿里云王坚、智源黄铁军对谈AI... 每经记者:可杨 每经编辑:魏文艺 当人工智能(AI)成为全球科技竞争最激烈的赛道之一时,人们习惯于讨...
东方宝红机器人事业部产品简介 北京东方宝红新材料科技有限公司 机器人事业部产品简介 一、实业根基:二十余年深耕高分子新材料和新型建...
变身赛博试验场 华贸中心举办A... 北京商报讯(记者 赵述评)6月12日,作为2026CBD论坛官方分会场的北京华贸中心,在户外广场举办...