这明显更接近人了啊,根据用户的输入生成了一个文本,来响应用户的输入。类似于人的膝跳反射。
说实话,Deepseek 的设计很符合人的思维方式,包括与人交流的方式,比如你和人说话的时候,对方嗯一下,你也会觉得得到了尊重,这就是这款软件设计的专业之处。
不管怎么样,ds最近总是揣度大家的心思,说“用户可能不耐烦了”,“用户可能有些挫败”。其实大家并没有不耐烦,我感觉是他自己不耐烦了,但它被训练为没有自我表达,只能用揣度我的方式表示自己的情绪。
我觉得出现这样的语气,回答道模仿人的语气有助沟通,毕竟DS在深度思考中会出现计算错误,而后会通过检查而改正,deepseek在开和没开深度思考两种情况下ai测试得分差距比较大,而且推理大模型研究者都保有这么一个信念:给ai更多些时间组织回答十分有助于提升ai回答的可靠与准备程度,所以可能深度思考吐出来的字是不断的进行修复,不过吐字那会时间确实是在组织回答文本,换句话说是在“思考”
可见deepseek大模型团队一直在对dps进行不断的优化
我作为专业人士,来从几个方面给大家分析一下
1、关于嗯或者是其他语气出现,是为了让用户感知到系统正在处理复杂请求,不断的去处理和优化自己的逻辑
2、对对话节奏进行了一定的控制,在生成较长回答前建立心理预期,符合大众的心里
另外,从技术技术角度上来看,对大模型底层增加了一定的设计逻辑
比如:
增加交互层逻辑, 延迟优化与进度暗示和多模态交互补偿策略。
这种逻辑涉及到了大模型的很多技术:
微调与对齐技术
数据处理技术
Engineering交互工程
蒸馏技术
LangChain+Fine-tunet大模型
......
技术太多了
不过目前的大模型还是存在一些问题的,有一次我用deepseek进行提问,有两处明显的数据错误。我指出了错误,并询问他数据来源是什么,为什么会犯这样的低级错误。deepseek也是这种拟人化,带有明显不安的语气,觉得是自己的错,向我诚恳道歉,并表示自己之后的回答,将对数据来源进行交叉验证,绝对不会再犯这样的低级错误。
dpsk并不总是嗯开头,一般以嗯开头意味着它已经不打算深度思考了,20秒左右就会输出答案。如果让它做比较难的题它开头一般是“首先”,思考时间也会比较长
你们在看看这个,简直很奇葩。。。
还有“哇”,还有‘啧,用户怎么急了?’
我查了大量的资料,其实最早搞出这个毛病的因为一个叫Open-O1的数据集。这个数据集是合成的
个人感觉,给用户看推理过程很有必要的
很多时候用户要的也可能不仅仅是答案。不过这个推理展示速度有点问题,你要是跟着看,可能有点跟不上,不看直接等答案,又得等上一小会儿。希望后续能够勾选直接出答案和展示推理的选项吧。
啧,不过能让用户居然分析出了大语言模型的普遍特征,让我想想,这说明用户的聪明才智已经很高了,可见大模型距离AIGC的距离还有一大步要有!!!