HashHop 项目教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00686/article/details/147298390

HashHop 项目教程

hash-hop Long context evaluation for large language models 项目地址: https://gitcode.com/gh_mirrors/ha/hash-hop

1. 项目介绍

HashHop 是一个用于评估大型语言模型长上下文处理能力的开源项目。它设计了一个基准测试，可以生成含有多个跳转（hops）的问题和解答链，用于训练和评估模型在处理长上下文信息时的表现。

2. 项目快速启动

要开始使用 HashHop，请按照以下步骤进行：

环境准备

确保您的系统中已安装以下依赖：

Git
Python 3.9 或更高版本
Poetry（用于依赖管理）

克隆仓库

git clone git@github.com:magicproduct/hash-hop.git
cd hash-hop

安装依赖

poetry install

生成评估数据

使用 MultiHopEval.make_one 函数可以生成用于评估或训练的数据点。以下是一个使用示例：

from hashhop import MultiHopEval

CHARS_PER_TOKEN = 3
datapoint = MultiHopEval.make_one(
    n_chars_problem=int(1_000_000 * CHARS_PER_TOKEN),
    num_queries=5,
    hops=2,
    hash_pair_str_length=16,
    chain_of_thought=False,
)

print(datapoint.prompt)
print(datapoint.completion)
print(datapoint.targets)

这段代码会创建一个包含问题的提示（prompt）、完成的查询（completion）以及查询与真实答案之间的对应关系（targets）。