清华团队推出“安全增强版DeepSeek”
创始人
2025-02-24 22:00:24
0

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。

相关内容

热门资讯

黑科技挂(wpk ai辅助)w... 黑科技挂(wpk ai辅助)wpk数据统计软件(wPK)好像真的是有挂(有挂方法)-哔哩哔哩1、wp...
黑科技能赢(wpk最新黑科技)... 黑科技能赢(wpk最新黑科技)wpk线上代打(wpK)本来真的有挂(有挂透明挂)-哔哩哔哩1、下载好...
黑科技软件(wpk最新黑科技)... 黑科技软件(wpk最新黑科技)wpk ai机器人的打法(WPk)真是有挂(有挂讲解)-哔哩哔哩wpk...
黑科技真的(wpk ai辅助)... 黑科技真的(wpk ai辅助)wpk透视辅助工具(WPk)真是真的是有挂(真是有挂)-哔哩哔哩;1)...
黑科技实锤(wpk ai辅助)... 黑科技实锤(wpk ai辅助)wpkai辅助实战效果(wPK)好像是有挂(有挂技巧)-哔哩哔哩;1、...
黑科技ai(wpk最新黑科技)... 黑科技ai(wpk最新黑科技)wpk德州扑克靠不靠谱(wpK)竟然有挂(有挂教程)-哔哩哔哩1、wp...
黑科技免费(wpk最新黑科技)... 黑科技免费(wpk最新黑科技)wpk发牌(WPk)好像真的是有挂(了解有挂)-哔哩哔哩wpk最新黑科...
黑科技ai挂(wpk ai辅助... 黑科技ai挂(wpk ai辅助)wpk被系统针对(WPk)好像真的是有挂(有挂秘笈)-哔哩哔哩1、构...
黑科技计算(wpk最新黑科技)... 黑科技计算(wpk最新黑科技)wpk德州透视辅助(wpK)竟然是真的有挂(有挂方式)-哔哩哔哩1、超...
黑科技插件(wpk ai辅助)... 黑科技插件(wpk ai辅助)wpk游戏是否有挂(wPk)其实存在有挂(有挂解密)-哔哩哔哩黑科技插...