《DeepSeek R1：大模型最简安装秘籍》：此文为AI自动生成

本文链接：https://blog.csdn.net/zheng_ruiguo/article/details/145415232

DeepSeek R1：AI 大模型界的新起之秀

在人工智能的璀璨星空中，大模型如繁星般闪耀，而 DeepSeek R1 无疑是其中一颗冉冉升起的新星，自问世以来便吸引了全球的目光，在人工智能领域占据了重要的一席之地。

从性能表现上看，DeepSeek R1 展现出了令人惊叹的实力。在数学能力的考验中，它在 AIME 2024 中取得了 79.8% 的成绩，略高于 OpenAI-o1-1217；在 MATH-500 的挑战里，以 96.3% 的惊人成绩与 OpenAI-o1-1217 相当，并且显著优于其他模型。在代码任务方面，它更是展现出专家级别的水平，在 Codeforces 上获得了 2029 Elo 评级，超越了 96.3% 的人类参与者。在自然语言推理等其他任务中，DeepSeek R1 同样表现出色，与 OpenAI 的 o1 模型正式版性能比肩，在高难度提示词、代码和数学等技术性极强的领域以及风格控制方面，甚至位列第一。

成本优势也是 DeepSeek R1 的一大法宝。在大模型的训练中，成本通常是一个令人头疼的难题。以 OpenAI 训练 GPT-4 为例，使用了 25000 张型号为 A100 的英伟达 GPU，成本高昂。然而，DeepSeek 却打破了这一烧钱的定式。据相关数据显示，训练具有 6710 亿参数的超大规模模型 DeepSeek-V3 时，仅用了 2048 个英伟达 H800 GPU，在 57 天内便完成了训练，成本约 557.6 万美元，仅为其他主流模型（如 GPT-4）的 1/10 左右。如此显著的成本优势，让 DeepSeek 在大模型市场中脱颖而出，为更多企业和开发者提供了低成本、高性能的选择，也让大模型的应用和发展更加普及和广泛。

DeepSeek R1 的技术创新更是其核心竞争力的源泉。在算法革新上，它摒弃了传统的监督微调（SFT）作为冷启动的方式，而是通过大规模强化学习直接提升模型的推理能力。其开发团队采用了群组相对策略优化（GRPO）算法框架，从群组分数中估算基线，避免了使用与策略模型同样大小的评估模型，从而大大降低了训练成本，提高了训练效率。在模型架构上，DeepSeek 也进行了大胆创新。其最新版本 DeepSeek-V3 采用了混合专家（Mixture-of-Experts，MoE）架构，拥有 6710 亿个参数，每个词元（token）激活 370 亿个参数。这种架构将任务分配给多个专家模型进行处理，每个专家模型专注于特定的子任务，大大提高了模型的运行效率。与传统的密集模型相比，MoE 架构实现了更高的参数利用率，减少了不必要的计算开销，使得 DeepSeek-V3 在保持高性能的同时，有效降低了计算成本。

此外，DeepSeek R1 完全开源，采用 MIT 许可证，这一举措彻底打破了以往大型语言模型被少数公司垄断的局面，将 AI 技术交到了广大开发者和研究人员的手中。这使得全球的开发者和研究人员能够基于它进行二次开发和创新，极大地推动了人工智能技术的发展和应用。通过开源，DeepSeek 吸引了大量人才和资源，形成了强大的生态虹吸效应，使中国 AI 技术在全球范围内得到了广泛传播和应用。

如此优秀的 DeepSeek R1，是不是让你迫不及待地想要将它 “收入囊中”，亲自体验一番它的强大功能呢？别着急，接下来就为大家详细奉上 DeepSeek R1 的最简安装步骤，无论你是技术小白还是资深极客，都能轻松上手，开启与 DeepSeek R1 的奇妙 AI 之旅。

安装前的深度剖析

在正式开启 DeepSeek R1 的安装之旅前，我们需要对安装前的各项准备工作进行深入剖析，就像建造高楼前要夯实地基、准备好建筑材料一样，这些准备工作是成功安装并高效运行 DeepSeek R1 的关键。

（一）系统环境大揭秘

操作系统适配：DeepSeek R1 展现出了强大的兼容性，对主流操作系统十分友好。无论是 Windows 系统，还是 macOS 系统，亦或是 Linux 系统，它都能在其上稳定运行。在 Windows 系统中安装时，需要注意关闭不必要的杀毒软件和防火墙，因为它们可能会对安装过程进行拦截，导致安装失败。以常见的 360 安全卫士为例，在安装 DeepSeek R1 前，最好将其暂时关闭，安装完成后再重新开启，以保障系统安全。在 macOS 系统下，要确保系统版本是较新的，因为一些旧版本可能存在兼容性问题。比如 macOS Sierra 及之前的版本，在安装某些依赖库时可能会遇到困难，从而影响 DeepSeek R1 的安装。对于 Linux 系统，推荐使用 Ubuntu 20.04 及以上版本，因为这些版本在软件包管理和系统稳定性方面表现出色，能够为 DeepSeek R1 的安装和运行提供良好的环境。

硬件实力大比拼：硬件配置是决定 DeepSeek R1 性能表现的重要因素。在 CPU 方面，至少需要具备 4 核及以上的处理器，且主频不低于 2.5GHz。如果你的 CPU 性能较弱，比如一些早期的双核处理器，在运行 DeepSeek R1 时，可能会出现响应迟缓的情况，就像一辆动力不足的汽车，在爬坡时会显得十分吃力。更高性能的 CPU，如英特尔酷睿 i7 系列或 AMD 锐龙 7 系列及以上的处理器，能够显著加快模型的训练和推理速度，让 DeepSeek R1 在处理任务时更加流畅高效。内存方面，建议配备 16GB 及以上的内存。若内存不足，在运行 DeepSeek R1 时，系统可能会频繁进行内存交换，导致运行速度大幅下降，甚至出现程序崩溃的情况。想象一下，内存就像是工厂的原材料仓库，仓库空间越大，能存放的原材料就越多，生产效率也就越高。如果仓库空间狭小，生产过程就会因为原材料不足而频繁中断。显卡对于 DeepSeek R1 的运行也起着关键作用。如果希望使用 GPU 加速来提高模型的运行速度，就需要一块支持 CUDA 的 NVIDIA 显卡，且显存不低于 8GB。NVIDIA 的 RTX 系列显卡在深度学习任务中表现出色，能够极大地提升模型的训练和推理效率。例如，RTX 3060 显卡在处理复杂的图像和文本数据时，能够快速完成计算任务，使 DeepSeek R1 的运行更加流畅。而如果显卡性能不足，比如一些集成显卡，就无法充分发挥 DeepSeek R1 的潜力，运行速度会大打折扣。硬盘空间也不容忽视，至少需要预留 50GB 的可用硬盘空间，用于存储模型文件、数据以及相关的依赖库。随着数据量的增加和模型的更新，硬盘空间可能会逐渐不足，因此建议预留足够的扩展空间。就像我们的房间需要足够的空间来存放各种物品一样，硬盘空间就是 DeepSeek R1 存放数据和文件的 “房间”，空间越大，它就能 “施展” 得越开。

（二）软件环境大搜罗

Python 环境搭建：Python 环境是 DeepSeek R1 运行的基石，需要安装 Python 3.8 及以上版本。首先，进入 Python 官网https://www.python .org/downl oads/，在页面中找到适合你操作系统的 Python 版本进行下载。以 Windows 系统为例，下载完成后，双击下载的 exe 文件进入安装程序。在安装过程中，务必勾选 “Add Python to PATH” 选项，这一步至关重要，它能让你在命令行中直接使用 Python 命令。安装完成后，可以通过键盘 Win+R 打开运行窗口，输入 cmd 后回车，打开 cmd 命令行窗口，在其中输入 python --version，如果出现对应的 Python 版本号，就说明 Python 安装成功。例如，当你输入命令后，显示 “Python 3.8.10”，这就表明你已经成功安装了 Python 3.8.10 版本。

包管理工具升级：Python 的包管理工具 pip 是安装 DeepSeek R1 及其依赖库的得力助手，确保 pip 是最新版本至关重要。在 Windows 系统中，打开 “命令提示符”（可以通过在开始菜单中搜索 cmd 来找到它），在命令提示符下，输入 python -m pip install --upgrade pip，按下回车键后，pip 会自动下载并安装最新的版本。在 Linux 系统中，首先打开终端，输入 sudo apt-get install python3-distutils 安装依赖项，然后输入 sudo python3 -m pip install --upgrade pip 来升级 pip。如果使用的是 Python 2.x，则应使用 sudo python -m pip install --upgrade pip 命令。在 Mac OS X 系统中，打开 Terminal，输入 xcode-select --install 安装 Xcode 命令行工具，然后输入 sudo python -m pip install --upgrade pip 来升级 pip。升级完成后，可以通过输入 pip --version 来验证 pip 的版本是否已成功更新。比如，当你输入该命令后，显示 “pip 23.3.1 from C:\Python38\lib\site-packages\pip (python 3.8)”，这就说明 pip 已经成功升级到了 23.3.1 版本。