简介
从 RAG 系统获得最佳结果并非易事。如何切分文档、检索多少个片段,甚至使用的策略(简单、查询重写、重新排序等)都会显著影响最终答案的质量。
我们将为数据集创建一个端到端的最佳 RAG 查找器管道,您可以轻松自定义它以包含不同的技术等等。
看看我们的管道结果:
我们的流程将为我们提供一个整体视图,让我们了解哪些组合以及 RAG 技术在我们的数据集上效果良好。
目录
设置舞台
RAG 快速概览
配置我们的 LLM 连接
定义实验参数
制定评估标准
知识源和测试查询
文本分块函数
余弦相似函数
迭代配置
结果分析
我们下一步该做什么?
设置舞台
每个好的项目都始于合适的工具。我们将安装一些重要的 Python 库,以完成所有设置。
# Install librari