使用FireworksEmbeddings在Langchain中进行文本嵌入-CSDN博客

本文链接：https://blog.csdn.net/qahaj/article/details/146449992

在现代的自然语言处理任务中，文本嵌入技术是非常关键的一环。本文将介绍如何使用langchain_fireworks包中的FireworksEmbeddings来在Langchain中嵌入文本。本例中，我们将使用默认的nomic-ai版本1.5模型。

技术背景介绍

Text Embedding是一种将文本转换为向量表示的技术，便于在机器学习模型中进行处理。这些向量表示能够捕获文本的语义信息，从而支持上下游任务如相似性计算和分类。

核心原理解析

FireworksEmbeddings是一种强大的工具，基于预训练的nomic-ai模型，将文本高效嵌入为语义向量。这些向量可用于相似度度量及其他自然语言处理任务。

代码实现演示

首先，确保安装了langchain-fireworks包：

%pip install -qU langchain-fireworks

设置API密钥

由于API调用需要身份验证，我们需要确保API密钥正确配置。你可以使用如下代码设置：

import getpass
import os

if "FIREWORKS_API_KEY" not in os.environ:
    os.environ["FIREWORKS_API_KEY"] = getpass.getpass("Fireworks API Key:")

使用嵌入模型

通过FireworksEmbeddings，您可以直接使用默认模型nomic-ai/nomic-embed-text-v1.5，当然也可以选择不同的模型（如果有的话）。

以下是一个简单的代码示例，展示如何对查询和文档进行嵌入：

from langchain_fireworks import FireworksEmbeddings

# 初始化Fireworks嵌入对象
embedding = FireworksEmbeddings(model="nomic-ai/nomic-embed-text-v1.5")

# 嵌入查询文本
res_query = embedding.embed_query("The test information")

# 嵌入文档列表
res_document = embedding.embed_documents(["test1", "another test"])

# 打印向量的前5个元素来查看嵌入结果
print(res_query[:5])  # 示例输出
print(res_document[1][:5])  # 示例输出

输出结果将展示文本的向量表示，如：

[0.01367950439453125, 0.0103607177734375, -0.157958984375, -0.003070831298828125, 0.05926513671875]
[0.0369873046875, 0.00545501708984375, -0.179931640625, -0.018707275390625, 0.0552978515625]