新黄河记者:杜林

5月19日傍晚,DeepSeek发布《关于字符触发模型异常回复的说明》,回应近期围绕网页端输入特殊字符后出现异常输出的讨论。
说明称,近期有用户反馈在对话中输入特定特殊字符后,模型偶发返回不可预期的内容,使部分用户产生“对话泄露”的疑虑。经排查,该现象属于特殊字符引发的模型异常回复,不涉及安全问题或隐私泄露。公司表示,后续将通过针对性训练增强模型对特殊字符的识别与处理能力,修复相关已知问题。

随着官方说明发布,此前在社交平台出现的“串号”猜测逐步降温。
在此前5月18日的网络反馈与独立实测中,该现象曾引发讨论。当时用户在DeepSeek网页端开启快速模式、关闭联网搜索,并在空白对话框中输入包含英文左尖括号与“think”字母的字符组合后,页面出现与当前对话不相关的长文本输出。这些内容涉及数学、物理、线性代数、命理推演及教育学分析等多个方向,其中包括完全二叉树节点计算、2x2矩阵特征向量求解等具体内容。
在这些异常输出文本中,新黄河记者注意到一个特征:思维过程中多次出现“我们被问到……”或“需要询问……”等较为固定的书面表达。
随着官方说明发布,这一文本特征也在开发者社区讨论中被再次提及。有观点认为,这类表达更接近结构化问答语料中的固定句式,而非自然对话生成内容。
在相关技术讨论中,也有开发者将现象与模型在特定输入触发条件下的生成路径变化联系起来,认为在缺乏明确上下文时,模型可能更容易回退到训练阶段的高频语料结构进行补全。
除输出文本结构外,开发者社区此前披露的运行环境测试,也被作为讨论参考。
新黄河记者在GitHub等开源项目技术讨论区看到,多名企业级开发者及自部署用户表示,该现象在完全断网、与外部网络隔离的“本地部署”环境中同样可以复现。
相关技术人员分析,本地部署模型不具备跨用户会话能力,其在离线状态下仍出现类似输出,使“系统混入其他用户对话”的说法缺乏支撑。
在输入层机制方面,有网络安全技术人员表示,尖括号等特殊字符在模型系统中通常具有标记或控制含义。如果网页端在输入层面对相关字符缺乏过滤、转义或限制处理,原本用于内部流程的控制符可能被直接触发,导致模型进入非标准响应路径。
在大模型产品早期迭代中,输入解析和特殊字符处理一直是比较容易出问题的环节之一,也经常需要单独做兼容处理。
部分业内人士的看法是,这类情况通常和输入处理与模型生成之间没有完全对齐有关。如果用户输入的内容没有被统一整理成规范格式,模型有时会“误读”这些输入,从而出现不太稳定的输出结果。
DeepSeek在公告中表示,后续将进一步优化模型在相关场景下的表现。随着官方说明发布,此前围绕该现象的讨论逐渐转向输入触发机制层面。

编辑:曹梦佳 校对:汤琪








