开源项目CAG安装与配置指南

开源项目CAG安装与配置指南

CAG Cache-Augmented Generation: A Simple, Efficient Alternative to RAG CAG 项目地址: https://gitcode.com/gh_mirrors/cag/CAG

1. 项目基础介绍

Cache-Augmented Generation(CAG)是一个开源项目,旨在提出一种简化和高效的知识增强生成方法,作为Retrieval-Augmented Generation(RAG)的替代。CAG通过预先加载所有相关资源到模型上下文中并缓存运行时参数,来避免实时检索步骤,从而降低延迟、提高可靠性,并简化系统设计。该项目的主要编程语言是Python。

2. 关键技术和框架

  • 大型语言模型(LLM): CAG利用现代大型语言模型的扩展上下文窗口功能。
  • 预加载和缓存: 通过预加载资源和缓存模型参数,减少实时检索的需要。
  • BERT分数: 使用BERTscore来评估文本相似性。
  • 环境配置: 使用.env文件来管理环境变量。
  • Docker: 支持Docker容器化,便于部署和运行。

3. 安装和配置准备工作

在开始安装前,请确保您的系统中已安装以下环境和工具:

  • Python 3.x
  • pip(Python包管理器)
  • Docker(可选,用于容器化)

详细安装步骤

步骤1:克隆项目仓库

首先,您需要从GitHub上克隆项目仓库到本地环境:

git clone https://github.com/hhhuang/CAG.git
cd CAG
步骤2:安装依赖

使用pip安装项目所需的Python包:

pip install -r requirements.txt
步骤3:准备数据集

项目依赖于squad和hotpotqa数据集,您需要下载这些数据集:

sh downloads.sh
步骤4:配置环境变量

创建一个.env文件,并填入必要的环境变量:

cp .env.template .env

编辑.env文件,根据需要添加或更新环境变量。

步骤5:运行示例脚本

运行以下任意脚本来执行CAG或RAG实验:

# 运行CAG实验
python kvcache.py --kvcache file --dataset squad-train --similarity bertscore --maxKnowledge 5 --maxParagraph 100 --maxQuestion 1000 --modelname "meta-llama/Llama-3.1-8B-Instruct" --randomSeed 0 --output "./result_kvcache.txt"

# 或者运行RAG实验
python rag.py --index bm25 --dataset hotpotqa-train --similarity bertscore --maxKnowledge 80 --maxParagraph 100 --maxQuestion 80 --topk 3 --modelname "meta-llama/Llama-3.1-8B-Instruct" --randomSeed 0 --output "./rag_results.txt"
步骤6:使用Docker(可选)

如果使用Docker,首先构建项目镜像:

docker build -t my-cag-app .

然后运行Docker容器:

对于GPU用户:

docker run --gpus all -it --rm my-cag-app

对于CPU用户:

docker run -it --rm my-cag-app

确保.env文件中的环境变量在构建镜像之前已经填充完毕。

以上步骤将引导您完成CAG项目的安装和配置。遵循这份指南,即便是编程新手也能够顺利地开始使用这个项目。

CAG Cache-Augmented Generation: A Simple, Efficient Alternative to RAG CAG 项目地址: https://gitcode.com/gh_mirrors/cag/CAG

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

尚榕芯Noelle

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值