mwp_ReFT 项目使用与启动教程
mwp_ReFT 项目地址: https://gitcode.com/gh_mirrors/mw/mwp_ReFT
1. 项目目录结构及介绍
mwp_ReFT 项目目录结构如下:
mwp_ReFT/
├── data/ # 存储数据文件
├── exps/ # 存储脚本和实验配置
│ ├── paper_exps/ # 论文实验脚本
│ │ ├── SFT/ # SFT 实验相关脚本
│ │ ├── ReFT/ # ReFT 实验相关脚本
│ │ ├── OnSL/ # Online-SL 实验相关脚本
│ │ ├── OffSL/ # Offline-SL 实验相关脚本
│ │ └── Sampling/ # 采样实验相关脚本
├── src/ # 源代码目录
├── .gitignore # git 忽略文件
├── License.txt # 项目许可证信息
├── Llama_License.txt # Llama 许可证信息
├── Notice.txt # 通知文件
├── README.md # 项目介绍文件
├── default_config.yaml # 默认配置文件
├── default_config_deepspeed.yaml # DeepSpeed 默认配置文件
├── default_config_deepspeed_ga2.yaml # DeepSpeed GA2 默认配置文件
├── install_dependencies.sh # 安装依赖脚本
├── requirements.txt # 项目依赖文件
└── sampling.py # 采样脚本
data/
:包含项目所需的数据集。exps/
:存放实验相关的脚本和配置文件,其中paper_exps/
包含论文中使用的实验脚本。src/
:项目的源代码,包含主要的实现逻辑。.gitignore
:定义了 Git 应该忽略的文件和目录。License.txt
和Llama_License.txt
:项目所使用的许可证信息。Notice.txt
:项目的通知信息。README.md
:项目的详细说明。default_config.yaml
:项目的默认配置文件。install_dependencies.sh
:用于安装项目依赖的脚本。requirements.txt
:项目的 Python 依赖列表。
2. 项目的启动文件介绍
项目的启动主要通过 exps/paper_exps/
目录下的脚本进行,这些脚本包括了启动不同实验的入口。以下是一些主要的启动脚本:
SFT/gsm8k.sh
:启动针对 GSM8k 数据集的 SFT 实验的脚本。ReFT/gsm8k.sh
:启动针对 GSM8k 数据集的 ReFT 实验的脚本。OnSL/gsm8k.sh
:启动针对 GSM8k 数据集的 Online-SL 实验的脚本。OffSL/gsm8k.sh
:启动针对 GSM8k 数据集的 Offline-SL 实验的脚本。Sampling/gsm8k.sh
:启动针对 GSM8k 数据集的采样实验的脚本。
使用这些脚本,可以通过命令行执行 bash exps/paper_exps/<script_name>.sh
来启动对应的实验。
3. 项目的配置文件介绍
项目的配置文件主要位于 exps/paper_exps/
目录下,每个实验的配置都是通过 YAML 文件来定义的。以下是一些主要的配置文件:
default_config.yaml
:项目的默认配置文件,包含了通用配置。default_config_deepspeed.yaml
:使用 DeepSpeed 时默认的配置文件。default_config_deepspeed_ga2.yaml
:使用 DeepSpeed GA2 时默认的配置文件。
这些配置文件定义了实验的参数,如数据路径、模型超参数等。用户可以根据自己的需求修改这些配置文件,以满足特定的实验设置。