使用Together AI API进行开源嵌入模型的实战应用

本文链接：https://blog.csdn.net/qahaj/article/details/146450494

技术背景介绍

嵌入模型作为自然语言处理（NLP）中不可或缺的组成部分，能够将文本转换为特征向量，便于进行进一步处理和分析。Together AI提供了一套开源的嵌入模型API，方便开发者快速、高效地应用这些强大的模型。

核心原理解析

嵌入模型通过对输入文本进行处理，生成对应的数值向量。这些向量在高维空间中表示文本的语义信息。借助Together AI的API，我们可以轻松实现文本嵌入，从而提高搜索、分类等任务的性能。

代码实现演示

以下是利用Together AI API进行嵌入的代码示例：

# 安装必需的库
%pip install --upgrade --quiet langchain-together

import os
from langchain_together.embeddings import TogetherEmbeddings

# 设置环境变量，确保API密钥的安全性
os.environ['TOGETHER_API_KEY'] = 'your-api-key'

# 使用TogetherEmbeddings进行嵌入处理
embeddings = TogetherEmbeddings(model="togethercomputer/m2-bert-80M-8k-retrieval")

# 嵌入查询示例
query_embedding = embeddings.embed_query("My query to look up")
print("Query embedding:", query_embedding)

# 嵌入文档示例
documents_embedding = embeddings.embed_documents(
    ["This is a content of the document", "This is another document"]
)
print("Documents embedding:", documents_embedding)

# 异步嵌入查询示例
async def async_example():
    async_query_embedding = await embeddings.aembed_query("My query to look up")
    print("Async query embedding:", async_query_embedding)

    async_documents_embedding = await embeddings.aembed_documents(
        ["This is a content of the document", "This is another document"]
    )
    print("Async documents embedding:", async_documents_embedding)

# 运行异步示例
import asyncio
asyncio.run(async_example())