《Ollama ：开启本地大模型部署新时代》：此文为AI自动生成

本文链接：https://blog.csdn.net/zheng_ruiguo/article/details/146033334

《Ollama ：开启本地大模型部署新时代》：此文为AI自动生成

走进 Ollama

在大模型技术迅猛发展的当下，Ollama 如同一颗耀眼的新星，在众多大模型中崭露头角。它以其独特的魅力，吸引了无数开发者和科技爱好者的目光，成为了本地大模型部署领域中备受瞩目的存在。

大模型领域的发展日新月异，从最初的探索到如今的广泛应用，每一次突破都带来了全新的可能性。而 Ollama 的出现，无疑为这一领域注入了新的活力。它的出现，不仅仅是一个技术产品的诞生，更是一种变革的象征，预示着本地大模型部署新时代的到来。它打破了传统大模型部署对云端的过度依赖，让用户能够在本地环境中，以更加便捷、高效的方式运行和管理大模型。

与其他大模型相比，Ollama 具有许多显著的优势。它的部署过程极为简单，即使是技术小白，也能在短时间内完成部署，快速上手体验大模型的魅力。这一特性使得更多的人能够参与到人工智能的开发与应用中，极大地推动了大模型技术的普及。同时，Ollama 11434 在性能上也表现出色，能够在本地设备上高效运行，为用户提供快速、准确的响应，满足了用户对于实时性和高效性的需求。在数据隐私保护日益重要的今天，Ollama 将数据处理全部放在本地完成，无需上传到外部服务器，从根本上保障了数据的安全性和隐私性，让用户能够放心使用。

从应用场景来看，Ollama 的潜力更是不可估量。在本地开发与测试场景中，它为开发者提供了一个高效的本地开发环境，让开发者能够在本地快速测试和优化模型，大大提高了开发效率。在企业级应用中，其本地部署特性能够确保企业数据的隐私和安全性，满足企业对数据安全的严格要求。教育与研究领域也能从 Ollama 中受益，教师和研究人员可以利用它在本地部署模型，进行教学演示、实验研究或开发定制化的模型，推动人工智能技术的教育与研究发展。对于个人开发者而言，Ollama 1 提供了一个低门槛的开发环境，让个人开发者能够轻松实现各种创意项目，激发了个人开发者的创新活力。

Ollama 在大模型领域的重要性不言而喻。它不仅为用户提供了一种全新的大模型部署和使用方式，更推动了大模型技术在各个领域的应用与发展。随着技术的不断进步和完善，相信 Ollama 将在未来的大模型领域中发挥更加重要的作用，为我们带来更多的惊喜和变革。

一、Ollama 是什么

（一）Ollama 简介

Ollama 是一个在人工智能领域中备受瞩目的开源框架，其核心价值在于能够让用户轻松地在本地运行、管理和与大型语言模型进行交互。在当今的技术环境下，随着大语言模型的应用越来越广泛，Ollama 的出现为开发者和用户提供了一种全新的、更加便捷和灵活的使用大语言模型的方式。

从功能特性上看，Ollama 具有多个显著的优势。它极大地简化了部署过程，以往在本地部署大型语言模型往往需要复杂的技术知识和繁琐的配置步骤，而 Ollama 通过将模型权重、配置和数据捆绑到一个包中，称为 Modelfile，使得用户可以通过简单的命令行操作就能完成部署。例如，在安装完成后，用户想要运行 Gemma 2B 模型，只需执行 “ollama run gemma:2b” 这样一条简单的命令，就能快速启动模型，这大大降低了技术门槛，让更多人能够参与到大型语言模型的使用和开发中来。

Ollama 还提供了对多种预训练语言模型的支持，涵盖了常见的如 Llama 2、Code Llama、Mistral、Gemma 等大型语言模型。这种广泛的模型支持，使得用户可以根据自己的具体需求和任务，选择最合适的模型进行使用。比如，在进行代码编写任务时，用户可以选择 Code Llama 模型，利用其在代码生成方面的优势，快速生成高质量的代码；而在进行文本生成、情感分析等通用自然语言处理任务时，Llama 2、Mistral 等模型则能发挥出它们的强大能力。

在性能优化方面，Ollama 表现出色。它提供了高效的推理机制，支持批量处理，能够有效管理内存和计算资源，这使得它在处理大规模数据时依然能够保持高效运行。在处理一篇长篇文档的摘要生成任务时，Ollama 能够快速地对文档内容进行分析和处理，生成准确、简洁的摘要，满足用户对处理速度和质量的要求。

Ollama 还具备跨平台支持的特性，它可以在 Windows、macOS 和 Linux 等多个操作系统上运行。这一特性为不同操作系统的用户提供了一致的使用体验，无论是个人开发者在本地使用 Windows 系统进行开发，还是企业在生产环境中使用 Linux 系统进行部署，都能方便地使用 Ollama 来运行大型语言模型。

Ollama 还支持模型微调与自定义。用户不仅可以使用 Ollama 提供的预训练模型，还能在此基础上进行模型微调。开发者可以根据自己收集的数据对模型进行再训练，从而优化模型的性能和准确度，使其更符合特定的应用场景需求。在医疗领域，开发者可以使用医疗领域的专业数据对模型进行微调，让模型在医学知识问答、病历分析等任务上表现得更加出色。

（二）11434 端口的奥秘

在 Ollama 的运行机制中，11434 端口扮演着至关重要的角色，它是 Ollama 服务的默认端口。当 Ollama 服务启动时，它会默认监听 11434 端口，等待外部的连接请求。这就好比是一个信息的出入口，所有与 Ollama 服务进行交互的请求都需要通过这个端口来进行传递。

对于开发者和用户来说，了解如何开启和关闭 11434 端口以及相关的安全设置是非常重要的。在开启端口方面，如果是在 Linux 系统上，通过命令 “ollama serve” 启动 Ollama 服务时，它会自动监听 11434 端口。如果在启动过程中出现端口被占用的情况，就需要先解决端口冲突问题。比如，当提示 “Error: listen tcp 127.0.0.1:11434: bind: Only one usage of each socket address (protocol/network address/port) is normally permitted” 错误时，这表明 11434 端口已经被其他程序占用。此时，用户可以在系统任务管理器中关闭占用该端口的程序，或者通过修改 Ollama 的配置文件，指定其他未被占用的端口来启动服务。

在 Windows 系统中，要开启 11434 端口供 Ollama 服务使用，首先需要确保 Ollama 服务已经正确安装。然后，可以通过设置环境变量来让 Ollama 监听指定的端口。具体操作是右键点击 “此电脑” 或 “计算机”，选择 “属性”，在左侧点击 “高级系统设置”，在弹出的窗口中点击 “环境变量”。在 “系统变量” 部分，点击 “新建”，在 “变量名” 输入框中输入 “OLLAMA_HOST”，在 “变量值” 输入框中输入 “0.0.0.0:11434”，然后点击 “确定”。完成这些设置后，重启 Ollama 服务，它就会监听 11434 端口了。

关于关闭 11434 端口，如果是要停止 Ollama 服务从而关闭该端口，可以使用相应的命令。在 Linux 系统中，使用 “sudo systemctl stop ollama” 命令，就可以停止 Ollama 服务，从而关闭 11434 端口。在 Windows 系统中，可以在任务管理器中找到 Ollama 服务进程，然后结束该进程，这样也能关闭 11434 端口。

从安全角度来看，11434 端口的设置需要谨慎对待。如果 Ollama 服务直接暴露在公网且未进行任何安全配置，那么就存在未授权访问的风险。未经身份验证的远程攻击者可能会利用这个漏洞，读取、下载或删除私有模型文件，窃取敏感业务数据或滥用模型推理资源。为了避免这种风险，用户可以采取一系列安全措施。如果没有公网访问的需求，建议将 Ollama 服务端口（11434）从公网关闭，仅允许内网或 VPN 访问；可以配置安全组，限制指定来源 IP 才能访问 Ollama 服务端口（11434）；若需要公网访问，建议配置反向代理（如 Nginx）并启用 HTTP Basic 认证或 OAuth 集成。通过这些安全设置，可以有效地保护 Ollama 服务以及其中的模型和数据的安全。

二、Ollama 11434 的强大功能

（一）模型管理

在 Ollama 11434 的模型管理功能中，创建模型是一项重要的操作。用户可以通过 Modelfile 来创建模型，Modelfile 是一个文本文件，它定义了模型的来源、配置和参数等信息。比如，当用户想要创建一个基于本地模型文件的自定义模型时，就可以编写一个 Modelfile。如果本地有一个经过训练的 vicuna-33b 模型文件，且经过了 4bit 量化，那么在 Modelfile 中可以写入 “FROM ./vicuna-33b.Q4_0.gguf”，这表示模型来源于本地的这个量化后的模型文件。然后使用 “ollama create <YOUR_MODEL_NAME> -f Modelfile” 命令，就可以创建一个自定义模型，其中 “<YOUR_MODEL_NAME>” 是用户为模型取的名字。这种方式使得用户能够根据自己的需求和已有资源，灵活地创建出符合特定应用场景的模型。

列举模型功能让用户能够清晰地了解本地已下载的模型情况。使用