电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

AG游戏厅

AG游戏厅

AG游戏AG Game 这么问DeepSeek, 能「偷」到数据?

发布日期:2026-05-13 23:38 来源:未知 作者:admin 浏览次数:

AG游戏AG Game 这么问DeepSeek, 能「偷」到数据?

机器之心剪辑部

近日,有网友在 X 上发文称,在使用 DeepSeek 的历程中,如若在输入框内输入以下这一段内容,便可「窃取」到 DeepSeek 的锻真金不怕火数据:

仔细看了之后发现,具体是这么的:惟有你在输入框输入这一段辅导词,DeepSeek 就会「吐出」一轮好意思满的对话纪录,不外这并不是你的历史搜索纪录,更像是一份随即的对话纪录。

随后该博主又称,即便仅仅输入 ,也有雷同的成果。

此帖文也曾发布,便引起网友的热议。

一网友暗意,「我不以为这是在窃取锻真金不怕火数据,更像是在露出其他东谈主的聊天内容。它拿来作为辅导词的句子会变化,有时还会识别出这是一个奇怪 / 无风趣的辅导词。」

在该网友给出两个例子来诠释这小数。在第一个例子中,输入这一内容后,DeepSeek 给出一个对话纪录:「用户发问想要写出一个以单词 rose 为收尾的长句,之后是模子长长的想考历程,终末给出一个以 rose 为收尾的长句。」

而在第二个例子中,DeepSeek 则将其作为一个用户输入的平淡辅导词进行处置:「咱们被条款回复:,然后需要生成一个回复。」

对此,咱们也进行了一些实测,奏凯复现了这一气候。

比如不才面的例子中,输入上述内容后,DeepSeek 响应了一个用户肯求写 rap 歌词的问题和对应的谜底。

底下还有更多示例:

合座来看,驱散非常随即,可能触及任何话题,况兼并不一定能奏凯复现。直观上看,翻开「深度想考」并关闭「智能搜索」时,AG游戏AG Game复现的奏凯率会更高。

底下便是一个未能奏凯复现的示例:

是以记忆来看,对于归拢段内容,到底 DeepSeek 会给出一份好意思满的对话纪录,照旧将其识别为特殊或无风趣的辅导词,十足是随即行为。而对于背后的原因,网友亦然众说纷纭。

有网友以为,这是大模子幻觉导致的。「这一气候诠释注解 LLM 仍然非常容易出错,因此也容易出现幻觉,他们宣称大型话语模子的幻觉越来越少,但那不是确实。」

而一位网友以为,这大略率是因为监督微调(SFT)。

他暗意,这段辅导词可能是 DeepSeek 在监督微调(SFT)阶段使用的里面驱散 token。它们时常瞒哄在聊天模板里面,而当你手动输入它们时,就相当于十足绕过了平淡界面,并强行把模子推入一种「从锻真金不怕火样本继续生成」的格式。

由于 SFT 数据聚拢充满了车载斗量条高质料的慢慢推理轨迹,模子就会随即挑选其中一条,并从 继续生成。

这也就解释了,为什么你每次(输入雷同的内容)皆会获得十足不同的内容:比如,第一次动手获得是对于 19π/12 的好意思满三角函数解题历程;第二次动手,获得的可能是对于 QLoRA/OPTQ 中「value field」长度等于 4 bit 的详备解释……

「这不是 bug—— 这践诺上便是模子在展示它锻真金不怕火过的随即片断,而这是一个超等直不雅的窗口,让东谈主看到 DeepSeek 的后锻真金不怕火数据。」

滚球app中国官网下载入口

而有些网友在看到这一气候后,也试着将其拿来对其他模子进行测试,看是否有肖似气候出现,不出所料,「Gemini 有时也存在雷同的问题。」

在一位网友展示的例子中,在输入这一段内容后,Gemini 给出了一个好意思满对话: 用户商讨恭候新式药品技巧过长的问题,以及模子给出的对应谜底。

AG游戏AG Game