清华团队推出“安全增强版DeepSeek”
创始人
2025-02-24 22:00:24
0

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。

相关内容

热门资讯

宁波沱沱河设计取得折叠支架专利... 国家知识产权局信息显示,宁波沱沱河设计有限公司取得一项名为“折叠支架”的专利,授权公告号CN2243...
孩子第一次换手机,求推荐! 之前一直都是用爸妈淘汰下来的手机,高考完终于可以换一台真正属于自己的新手机了! 问了很多同学朋友,主...
微信AI真正该抄的作业,在谷歌... 这两天微信AI的热度非常高,但大多数讨论都集中在它能做什么、怎么用。 大家都在猜测微信AI会长成什么...
微信会收费吗? 6月8日,微信官方发了篇《关于开发者接入微信AI生态的指引》,确认微信正在内测通过 AI 调用生态内...
浦东携手阅文!上海AI文创产业... 上海人工智能文创产业发展再添新平台。今天,由浦东新区与阅文集团合作共建的人工智能文创产业基地在金桥正...
杰克科技申请缝纫机起缝防脱线结... 国家知识产权局信息显示,杰克科技股份有限公司申请一项名为“一种缝纫机的起缝防脱线结构、以及缝纫机”的...
告别旧机迎接大学,学生党高性价... 高考铃声落下,崭新的大学生活即将启程。一台好用耐用、性价比拉满的新机,既是高中奋斗的犒赏,也是未来四...
离心泵选购指南:上海羽泉如何破... 在流体控制设备领域,离心泵作为重要部件,其可靠性直接影响着整个系统的运行效率。随着工业场景对设备性能...
市级重点项目力能机械新产线投产 10日,市级重点建设项目力能机械的半导体零部件生产线全面投产。 2015年,力能机械在北京成立,专门...
Meta裁员8000人,开发与... 据《商业内幕》,Meta上月裁撤约8000个岗位,其中加州与华盛顿州共4665名受影响员工的岗位名称...