简介
微调代表了模型开发的一种战略方法,我们采用预先训练的 LLM(通过对大量数据集的训练,已经具备了广泛的语言理解能力),并在较小的专业数据集上对其进行进一步训练。该模型在保留其基础知识的同时,还在您的目标领域发展专业知识。
对于某些自定义任务,微调可以比仅使用 LLM 模型产生更好的结果。无论您是处理患者医疗记录以生成治疗摘要、分析历史诊断模式,还是想要构建一个能够理解特定医学术语和医院协议的模型以生成标准化报告,您都可以考虑对 LLM 模型进行微调。
微调具有重要意义,因为您无法从头开始训练整个大型语言模型,因为它在计算能力和时间方面都非常耗费资源。因此,利用预训练模型中嵌入的现有知识可以在数据和计算要求较少的情况下在小众任务上实现高性能。