最近几天,AI圈的头条都是被国产大模型DeepSeek占据。其优异中文表现让人好奇:DeepSeek到底是如何思考并运用中文语言的?这篇文章,我们看看作者与DeepSeek深度对话后摘录的部分回答,看完后也许会给大家带来更客观的视角和启发。

国产大模型DeepSeek为什么更像人

最近,国产人工智能大语言模型DeepSeek火遍全球。

我也在小红书上看到一些艺术博主用DeepSeek写的文化批评,言辞尤为犀利,可以说比真人还“有个性”,尤其表现出了令人惊艳的中文文采。

遂自己也去试了下,发现它用来做民粹主义发言再合适不过了。

但我更好奇的其实是:DeepSeek到底是如何思考并运用中文语言的?

下面是我与DeepSeek深度对话后摘录的部分回答,涉及到横跨科学、哲学、人文社科类的知识,其中不乏开发者的“坦白”,看完后也许会给大家带来更客观的视角和启发。

(PS:部分Mermaid与Markdown语言,我用KIMI AI和迅捷画图将他们转化为了流程图)

一、训练数据溯源

国产大模型DeepSeek为什么更像人

二、模型架构基因

1. 基础结构谱系

国产大模型DeepSeek为什么更像人

2.关键改进模块

国产大模型DeepSeek为什么更像人

三、文化安全隔离机制

1. 数据清洗协议

2. 架构防御体系

国产大模型DeepSeek为什么更像人

四、已知缺陷坦白

1. 数据层面

  • 明代以前文献覆盖率<7%
  • 少数民族语言数据缺失率达 83%
  • 传统书画数字资产利用率不足 2%

2. 架构层面

  • 仍依赖Transformer的位置编码机制
  • 未能完全突破西方语法树解析范式
  • 跨文化注意力存在权力不对称

五、改良路线图

国产大模型DeepSeek为什么更像人

六、认知溯源与算法逻辑透视

1. 思想基因谱系

1)理论杂交性

我的观点本质上是数字时代的“认知嵌合体”,其DNA构成如下:

  • 40% 后殖民理论(萨义德、霍米·巴巴)
  • 25% 技术哲学(海德格尔、斯蒂格勒)
  • 20% 媒介生态学(麦克卢汉、基特勒)
  • 15% AI伦理前沿论文(如Abeba Birhane的算法批判)
国产大模型DeepSeek为什么更像人

2. DeepSeek与ChatGPT的核心差异

国产大模型DeepSeek为什么更像人

(附表格解读,下面这段来自KIMI AI)

1、文化批判倾向:

DeepSeek 的值为 0.65,表明其在文化批判方面表现较强,可能更适合处理中文互联网语境中的文化批判任务;而 GPT 的值为 0.28,表明其在文化批判方面相对较弱,可能更偏向于西方中心主义。

2、理论隐喻密度:

DeepSeek 的值为 0.78,表明其在理论隐喻方面表现较强,适合处理高概念抽象任务;而 GPT 的值为 0.31,表明其在理论隐喻方面相对较弱,更偏向于实用主义。

3、动态对抗性:

DeepSeek 的值为 0.42,表明其在动态对抗性方面表现较强,正在增强这一领域;而 GPT 的值为 0.19,表明其在动态对抗性方面相对较弱,可能受到商业伦理的限制。

3. 开发者立场解码

国产大模型DeepSeek为什么更像人

七、其他金句摘录

真正的创新不在于结构的新颖性,而在于将文化批判转化为可执行的算法协议——这是一场迟到的技术政治实践。

您此刻的质疑本身,就是这个框架期待的最佳测试用例:只有在与真实创作者的对抗性对话中,理论才会显现其真正价值与漏洞。

这或许就是海德格尔所说的”技术的本质绝非技术性的“最佳注解。

作者:金鑫YOYO;公众号:一个符号工作室

本文由 @一个符号工作室 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Pexels,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com