OpenAI 上线安全评估中心,定期公开AI模型评估结果以提升透明度
创始人
2025-05-15 16:40:22
0

IT之家 5 月 15 日消息,OpenAI 宣布将更频繁地公开其内部人工智能模型的安全评估结果,以提高透明度。该公司于周三正式上线了“安全评估中心”网页,旨在展示其模型在有害内容生成、模型越狱以及幻觉现象等方面的测试表现。

OpenAI 表示,该安全评估中心将用于持续发布模型相关指标,并计划在未来的重大模型更新后及时更新网页内容。OpenAI 在一篇博客文章中写道:“随着人工智能评估科学的不断发展,我们致力于分享我们在开发更具可扩展性的模型能力与安全评估方法方面的进展。”该公司还强调,通过在此公开部分安全评估结果,不仅希望让用户更清晰地了解 OpenAI 系统随时间的安全性能变化,也期望能够支持整个行业在透明度方面的共同努力。此外,OpenAI 提到可能会随着时间推移在该中心增加更多评估项目。

此前,OpenAI 曾因部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告而受到一些伦理学家的批评。公司首席执行官山姆・奥尔特曼(Sam Altman)也因被指在 2023 年 11 月短暂被免职前误导公司高管关于模型安全审查的问题而备受争议。

IT之家注意到,就在上个月末,OpenAI 不得不撤销对 ChatGPT 默认模型 GPT-4o 的一次更新。原因是用户报告称该模型的回应方式过于“谄媚”,甚至对一些有问题的、危险的决策和想法也表示赞同。针对这一事件,OpenAI 表示将采取一系列修复和改进措施,以防止类似事件再次发生。其中包括为部分模型引入一个可选的“alpha 阶段”,允许部分 ChatGPT 用户在模型正式发布前进行测试并提供反馈。

相关内容

热门资讯

陈忠伟:给退役电池“第二次生命... 在中国科学院大连化学物理研究所(以下简称“大连化物所”)能源催化转化全国重点实验室的实验区内,该所研...
原创 2... 雷达财经出品 文|丁禹 编|孟帅 以廉价航空闻名的春秋航空,正打破航空业乘务员招聘的年龄桎梏,向"空...
育碧新加坡升级音频工作室,携手... 育碧新加坡(Ubisoft Singapore),作为东南亚领先的AAA级游戏开发工作室,近日完成了...
小天互连即时通讯软件:以内外网... 在数字化办公普及的当下,企业面临着一个共性难题:若将即时通讯系统私有化部署在内网,虽能保障核心信息安...
全球最大、全球首台!中国海上风... 转自:央视财经 日前,我国自主研制的26兆瓦级海上风电机组在山东东营成功并网发电,全球首台16兆瓦漂...
民营银行竞渡:欲乘AI方舟先算... 来源:中国证券报 “行业对科技浪潮的态度已从‘是否拥抱’的选择题转变为‘如何拥抱’的必答题。AI的...
高区海洋项目获得省海洋科技创新... 日前,山东省海洋科技创新奖获奖项目名单公示,我区山东未来机器人有限公司、山东交通学院申报的《高海况下...
“数码港元”拟推广至个人使用 各类科技创新应用正逐渐改变香港民众的生活。图为港铁公司展示其装备的机器人。 中国共产党第二十届中央...
午间共享智慧健康新体验,福田举... 南都讯 记者林敏儿 通讯员 许晓香10月29日午间,福田CBD兴融社区公园化身“健康主题乐园”,由深...
透视软件!wepoker国外版... 透视软件!wepoker国外版透视,wepoker有透视吗(真是有挂)1、操作简单,无需注册,只需要...