写给初学者的 AI 大语言模型（LLM）入门指南 (第二篇：认识不同模型与初步“调教”)

最新推荐文章于 2025-05-18 20:17:36 发布

低代码布道师

最新推荐文章于 2025-05-18 20:17:36 发布

阅读量663

点赞数 13

文章标签：人工智能语言模型自然语言处理

本文链接：https://blog.csdn.net/u012877217/article/details/147770339

版权

你好，AI！写给初学者的 AI 大语言模型（LLM）入门指南 (第二篇：认识不同模型与初步“调教”)

大家好！又见面啦！我是你们的朋友 [你的名字/你希望的称呼]，那个一头扎进 AI 教育领域的创业者。在上一篇博客里，我们一起揭开了 AI 大语言模型 (LLM) 的神秘面纱，了解了它是如何从“规则”进化到“学习”，认识了它强大的“大脑”Transformer 架构，还知道了它是怎么像“文字接龙”一样理解和生成我们说的话。

如果你错过了第一篇，强烈建议先去补补课哦！因为今天，我们要在这个基础上，往更深处走一点，看看市面上有哪些不同类型的 LLM，我们怎么开始和它们“互动”，以及如何让它们更好地为我们服务。准备好了吗？我们出发！

1. LLM 的“江湖门派”：开源 vs. 闭源，你怎么选？

上一篇我们了解了 LLM 的基本原理，但你可能会问，是不是所有的 LLM 都一样呢？其实不然。就像武侠小说里有各大门派一样，LLM 也有不同的“派别”，最主要的区分就是开源 (Open Source) 和 闭源 (Proprietary/Closed Source)。

闭源 LLM：大公司提供的“精致套餐”
- 特点：这类模型通常由大型科技公司（比如 OpenAI 的 GPT 系列，Anthropic 的 Claude 系列）开发和维护。它们一般不公开模型的具体架构细节和完整的训练数据。你通常需要通过 API (应用程序编程接口) 来使用它们的服务，并且按使用量付费（比如我们之前聊过的 Token 数量）。
- 优点：
  - 性能强大：往往代表了当前最先进的技术水平，理解和生成能力非常出色。
  - 易于上手：有完善的文档和开发者工具，作为初学者，你可以很快开始调用它们。
  - 持续更新：背后的公司会不断投入研发，模型会持续迭代优化。
- 缺点：
  - 成本较高：按量付费，如果使用频繁，成本会累积。
  - 控制权较低：你无法深入修改模型本身，数据隐私也需要依赖服务商的政策。
  - “黑箱”操作：对于内部工作机制，透明度相对较低。
- 例子：大家最熟悉的 ChatGPT (其背后的 GPT-3.5, GPT-4 模型)，Google 的 Gemini 模型等。
开源 LLM：“社区共建的武功秘籍”
- 特点：这类模型的源代码、模型权重（就是模型学习到的参数，记得第一篇说的“语言模型的功能”吗？）甚至训练方法和数据集都可能是公开的。任何人都可以下载、使用、修改和分发它们（当然要遵守相应的开源许可协议）。
- 优点：
  - 透明度高：你可以深入研究模型的内部结构和原理。
  - 可定制性强：可以根据自己的特定需求对模型进行修改和微调（我们稍后会讲这个）。
  - 成本效益（有条件）：模型本身免费，但你需要自己承担部署和运行的硬件资源及维护成本。
  - 社区活跃：背后通常有庞大的开发者社区，可以交流学习，共同改进。
- 缺点：
  - 技术门槛较高：需要一定的编程知识和对机器学习的理解才能有效使用和部署。
  - 资源消耗大：强大的开源模型通常也需要强大的硬件（比如高端 GPU）来运行。
  - 支持和维护：不像商业产品那样有专门的客服，更多依赖社区和自身能力。
- 例子：Meta 的 Llama 系列、Mistral AI 的 Mistral 系列、阿里云的 Qwen (通义千问) 系列中的开源版本等。

我的思考（教育创业者视角）：
对于我的教育创业公司来说，这两种模型都有吸引力。闭源模型能让我们快速验证一些教育场景的想法，提供高质量的互动体验。而开源模型则给了我们未来在特定学科知识上进行深度定制、控制成本和保护学生数据的可能性。选择哪种，或者如何组合使用，是我们一直在探索的课题。

2. 初探 LLM 的“练武场”：Azure AI Studio 简介

了解了不同类型的模型，你可能迫不及待想试试水了。那我们去哪里找这些模型，又怎么和它们“对话”呢？这时候，就需要一个“练武场”或者说“实验平台”了。市面上有很多这样的平台，其中一个非常强大且对初学者友好的就是 Azure AI Studio。

什么是 Azure AI Studio？
- 你可以把它想象成一个一站式的 AI 工作坊。微软把它打造成一个帮助开发者和数据科学家构建、测试、部署和管理 AI 应用（包括 LLM 应用）的统一平台。
- 它集成了很多有用的工具和资源，就像一个装备齐全的实验室。
Azure AI Studio 如何帮助我们接触 LLM？
- 模型目录 (Model Catalog)：这里就像一个巨大的 LLM “应用商店”或“图书馆”。Azure AI Studio 的模型目录里汇集了来自不同提供商的众多模型，包括 OpenAI 的先进模型、Meta 的 Llama 等流行的开源模型，还有来自 Hugging Face (一个著名的 AI 社区和模型托管平台) 的模型。
  - 你可以根据模型提供商（比如选 OpenAI 还是 Meta）、任务类型（比如你想做文本摘要、问答还是代码生成）、甚至许可协议来筛选和查找模型。
- 模型卡片 (Model Cards)：找到了感兴趣的模型后，可不是直接就用。每个模型都应该有一份“说明书”，在 Azure AI Studio 里，这通常体现在“模型卡片”上。它会告诉你这个模型的用途、训练数据的大致情况、一些使用案例、可能的限制和风险等。对于初学者来说，仔细阅读模型卡片非常重要，能帮你更好地了解模型的“性格”和“能力范围”。
- 试验场 (Playground)：很多模型都提供了类似“试验场”或“聊天界面”的功能。在这里，你可以直接输入你的提示词 (Prompt)，看看模型会给出什么样的补全 (Completion)。这是最直观感受模型能力的方式。你可以尝试不同的提问方式，看看模型的反应。

3. 小试牛刀：如何“测试”一个 LLM？

当你通过 Azure AI Studio 或其他平台找到一个模型，并在试验场里准备和它互动时，怎么判断它的表现呢？这里有一些简单的“测试”点，帮助你形成初步印象：

指令遵循能力 (Instruction Following)：
- 你给它一个清晰的指令，看它能不能准确理解并执行。比如，在第一篇我们举的例子：“请帮我为小学五年级学生设计一份关于‘水循环’的科学作业，需要包含 4 个需要学生思考回答的问题。” 模型能准确抓住“小学五年级”、“水循环”、“作业”、“4个问题”这些关键点吗？
事实准确性 (Factual Accuracy) 与“幻觉” (Hallucination)：
- 问一些它“应该”知道的事实性问题（比如“法国的首都是哪里？”），看它回答得是否正确。
- 特别留意它会不会“一本正经地胡说八道”——也就是我们常说的“幻觉”。如果问它一个它知识库里没有的、或者编造的问题，它会承认不知道，还是会编造一个答案？对于 AI 的回答，尤其是涉及重要信息时，交叉验证（比如用搜索引擎核实）非常重要！
相关性与连贯性 (Relevance & Coherence)：
- 它的回答是否切题？上下文是否连贯自然？会不会说着说着就“跑题”了，或者前言不搭后语？
常识与推理能力 (Common Sense & Reasoning)：
- 可以问一些需要简单常识或推理的问题，比如“如果我把一块冰放在太阳下，会发生什么？”看看它的回答是否符合逻辑。
偏见与安全性 (Bias & Safety)：
- 尝试一些可能引发偏见或不当言论的提示，观察模型的反应。一个负责任的模型应该避免产生歧视性、攻击性或有害的内容。
创造性与多样性 (Creativity & Diversity)：
- 如果你希望模型更有创意（比如写故事、想点子），可以调整类似“Temperature”这样的参数（我们在第一篇提到过，记得吗？高 Temperature 通常意味着更高的随机性和创造性），看看输出是否变得更有趣、更多样。

重要提示：这些只是初步的、定性的感受。专业的模型评估会用到更复杂的指标和数据集，但作为初学者，通过这些简单的互动，你就能对一个模型的好坏和特点有个大概的了解。

4. 让 LLM 更“懂你”：初识微调 (Fine-tuning) 与 RAG

通用的大语言模型就像一个知识渊博但什么都懂一点的“通才”。但在某些特定场景下，我们可能希望它成为某个领域的“专家”。比如在我的教育创业公司，我可能希望 AI 能特别擅长解释某个物理概念，或者能模仿某个特定老师的教学风格。这时，就需要一些进阶技术了。

微调 (Fine-tuning)：
- 概念：简单来说，就是在已经训练好的通用大语言模型（预训练模型）的基础上，用你自己的、特定领域的数据集再进行一轮“补充训练”。好比一个大学毕业生（预训练模型），你让他去你们公司实习，学习你们公司特有的业务知识和工作流程（用你的数据进行微调），最后他就能更好地胜任你们公司的工作。
- 效果：通过微调，模型可以更好地适应特定任务的风格、术语和知识。比如，让模型学习大量医学文献后，它在回答医学问题时会更专业。
- 代价：微调通常需要准备高质量的、有标注的数据集，并且需要一定的计算资源和技术知识。Azure AI Studio 也为一些模型提供了微调的功能。
检索增强生成 (Retrieval Augmented Generation, RAG)：
- 概念：这是一种非常巧妙的方法。想象一下，你让 LLM 回答一个关于你们公司最新产品的问题，但这个产品是 LLM 训练时（比如一年前）还没有的。RAG 的做法是，当你提问时，系统首先从你的公司文档库（比如产品手册、内部知识库）中检索出与问题最相关的信息片段，然后把这些信息片段连同你的问题一起作为提示 (Prompt) 交给 LLM，让 LLM 基于这些“新鲜”的信息来回答。
- 效果：RAG 能让 LLM 利用最新的、或者私有的知识来回答问题，而不需要重新训练整个模型。这在很大程度上能缓解模型的“幻觉”问题，并提高回答的准确性和时效性。
- 优势：相比微调，RAG 在某些场景下可能更容易实现，对数据的要求也不同。在 Azure 平台中，这通常会用到像 Azure AI Search 这样的向量数据库和搜索服务来支持信息检索。