DeepSeek V3.1出现“极”字Bug,影响编码流程
创始人
2025-08-27 13:20:57
0

来源:市场资讯

(来源:三言科技)

日前,DeepSeek最新版V3.1被发现存在严重Bug,会在代码生成中随机插入“极/極/extreme”等token,导致代码无法正常编译。这一问题不仅出现在第三方量化部署中,官方全精度版本也受影响,给依赖自动化编码的团队带来极大困扰。此前DeepSeek曾出现过写作任务语言混杂、代码任务过拟合等问题,但此次“极”字Bug更为严重,直接导致系统崩溃或代理流程卡死。

开源社区用户复现了多种场景,发现即便在保守解码参数下,该问题依然无法避免。初步推测可能是解码概率分布偏移所致,模型在机械地基于概率拼凑文本,而非真正理解文本含义,导致高频token错误插入标识符中。类似稳定性问题在AI领域并非个例,Gemini也曾出现过代码场景下的“自我否定无限循环”Bug,最终被定性为安全层、对齐层、解码层交互问题。

大模型的稳定性一直是行业痛点。今年年初,OpenAI社区就曾大量反馈记忆体系异常导致用户历史上下文丢失。Gemini的人像生成功能也曾因“多样化”需求,将历史人物生成为风格不符的样貌,最终不得不临时下线。此外,模型提供商常做的“热修”也可能引发问题,如换系统提示、微调温度、更新tokenizer等,这些看似无害的调整可能打破原本的平衡,导致代理链在函数签名、JSON严格性、工具返回格式等细节处崩溃。

越来越多的Agent与工具链结合,其脆弱性也逐渐暴露。多智能体系统往往在“工具调用—状态清理—重试策略”链条中出现问题,如超时无兜底、失败后无法还原上下文等。DeepSeek和Gemini的案例提醒我们,AI从“能干活”到“能托付”,最关键的并非仅仅是模型层的SOTA,而是产品层面工程的稳定性,即那种即使犯错也能被预测和控制的“确定性”。

相关内容

热门资讯

原创 尽... 尽管存在“重大”缺陷,阿尔忒弥斯2号仍将发射,这将是1972年以来NASA首次载人探月任务 美国国家...
山东峰杰电气取得大容量消弧线圈... 国家知识产权局信息显示,山东峰杰电气科技有限公司取得一项名为“一种大容量消弧线圈结构”的专利,授权公...
字跳申请交互方法专利,提升信息... 国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“交互方法、装置、设备、存储介质及产品”...
安徽迅和达取得输电导线安装热缩... 国家知识产权局信息显示,安徽迅和达建设有限公司取得一项名为“一种输电导线安装热缩套管机构”的专利,授...
哇!哦!咦?上海科技馆馆长倪闽... 戴上VR眼镜,穿越到上世纪30年代搭乘“福特三发”飞机穿越雷雨云;打开箱子,亲眼探测一下“薛定谔的猫...
国驰电力申请防尘抗震UPS电源... 国家知识产权局信息显示,天津国驰电力技术有限公司申请一项名为“一种具有防尘抗震功能的UPS电源”的专...
全美最火冰茶公司如何“萃取”出... 80年前,Milo’s冰茶诞生在亚拉巴马州的一家汉堡店。如今,家族第三代传人、首席执行官特里西娅·沃...
毕业了,团组织关系怎么办?超详... “智慧团建”系统 毕业学生团员组织关系转接工作指引 一、目的 本《指引》用于指导各级团组织、毕业学生...
万兴科技发布天幕文生图功能写实... 本报讯 (记者舒娅疆)1月27日,记者从万兴科技集团股份有限公司(以下简称“万兴科技”)获悉,该公司...
端侧AI芯片公司2025市值图... 2025年,随着人工智能加速从云端向终端渗透,端侧AI芯片产业迎来了关键的发展转折点。这一年,行业在...