tt_jishu-CSDN博客

原创使用Infino监控LangChain与OpenAI模型的调用

Infino是一个专为观察性解决方案设计的可扩展遥测存储系统，能够存储和处理日志、指标和跟踪信息。它可以作为一个独立的观察性工具，或作为更大观察性堆栈中的存储层使用。本文将展示如何在调用OpenAI和ChatOpenAI模型时，通过Infino进行详细的调用跟踪。

2025-07-10 15:20:25 255

原创基于Zep的聊天历史长效记忆系统实战指南

此系统适用于需要回溯历史对话的场景，例如智能客服系统、语音助手等。通过引入长效记忆，AI助手能够更好地理解用户偏好，提供更加个性化的服务。如果遇到问题欢迎在评论区交流。

2025-07-10 15:17:31 168

原创利用TiDB存储聊天消息历史并进行AI交互

TiDB 是一款融合了OLTP和OLAP的分布式数据库，支持水平弹性扩展、强一致性、MySQL 兼容以及高可用性。其云服务TiDB Cloud提供了数据库即服务（DBaaS）的解决方案，其中无服务器选项大大简化了数据库管理。

2025-07-10 15:14:00 245

原创使用 SQLite 和 OpenAI 构建对话历史链

SQLite 是一种轻量级的嵌入式数据库引擎，适用于需要内存中存储或文件存储的应用程序场景。它的使用非常广泛，包括在浏览器、操作系统和移动设备中。由于其简单性和稳定性，使用 SQLite 存储对话历史的方式非常有效，并且易于集成。

2025-07-10 15:13:23 237

原创使用PostgreSQL存储聊天消息历史记录的实战指南

PostgreSQL（通常简称为Postgres）是一种强大的开源关系数据库管理系统，以其可扩展性和严格的SQL标准遵循而著称。它提供了丰富的功能和可靠的性能，是许多企业级应用的首选。

2025-07-10 15:10:35 298

原创使用Motörhead实现无状态应用的记忆管理

在对话式AI系统中，维护会话状态以提供上下文相关的回答至关重要。传统的方法是通过将状态保存在客户端或服务器的数据库中，但这种方式可能导致性能瓶颈和复杂性。Motörhead通过自动化的记忆管理来减轻这些问题，让AI应用得以在无状态的环境中高效运行。

2025-07-10 15:09:31 275

原创使用DataStax Astra DB存储聊天信息历史

Astra DB是一个高性能的数据库解决方案，基于Apache Cassandra技术构建。它的优势在于无服务器架构，可以自动扩展，支持向量查询，并通过简单的API进行交互。这使得它成为了处理大规模数据存储与检索的理想选择，尤其是在聊天记录等场景。

2025-07-10 15:05:24 214

原创使用RedisStore进行快速键值存储

Redis是一个开源的内存数据结构存储，可以用作数据库、缓存和信息共享系统。Redis支持丰富的数据结构类型，包括字符串、哈希、列表、集合和有序集合。在分布式系统和高性能应用中，Redis经常被选用为缓存解决方案。

2025-07-10 10:36:34 300

原创使用Yahoo Finance News工具的实战指南

接着，我们将设置环境并使用Langchain和OpenAI代理来处理新闻查询。

2025-07-10 10:31:43 207

原创使用Polygon IO工具包进行股票数据访问

Polygon IO是一款广泛使用的市场数据平台，它提供各种金融市场的数据，包括股票、期权、外汇和加密货币。用户可以通过API访问实时或者历史的市场数据，这对于金融分析和决策支持非常有用。

2025-07-10 10:23:22 132

原创使用Mojeek Search进行智能搜索

结束语：如果遇到问题欢迎在评论区交流。

2025-07-10 10:14:50 299

原创使用Connery Toolkit集成Connery Actions到LangChain代理

Connery Toolkit非常适合需要集成多种AI动作和服务的场景，例如全自动化的内容处理、数据分析及报告生成。它简化了插件管理，使得开发者可以专注于业务逻辑而非底层技术细节。如果遇到问题欢迎在评论区交流。

2025-07-09 15:16:34 575

原创使用AINetwork Toolkit与AINetwork区块链交互

这里有一些示例展示如何使用Agent与AINetwork Toolkit进行交互。如果环境变量中没有私钥，会自动创建一个新的账户并设置私钥。环境变量，以存储你的AIN区块链账户私钥。如果遇到问题欢迎在评论区交流。

2025-07-09 15:10:51 334

原创使用You.com API提升大语言模型的实时数据准确性

大语言模型（LLM）因其强大的语言生成能力而备受关注，但它们的训练数据往往滞后，难以保证实时性和准确性。You.com API致力于解决这一问题，通过集成实时网络数据来弥补训练数据的不足。

2025-07-09 15:08:26 411

原创利用NanoPQ实现高效语义搜索与向量压缩

Product Quantization是k-NN算法的一种改进，通过将向量空间分割成多个小的子空间，并在每个子空间上进行聚类来减少存储需求。这样可以在不显著降低检索精度的情况下实现大规模数据的快速搜索。NanoPQ是Python中的一个包，为我们提供了实现这一技术的便利工具。

2025-07-09 15:01:17 462

原创使用LLMLingua进行文档压缩的实践指南

LLMLingua的文档压缩功能非常适合应用于需要快速响应的大型文本处理任务，例如实时新闻分析、法律文档审核、或者教育资料的自动汇编等。如果遇到问题欢迎在评论区交流。

2025-07-09 14:59:44 250

原创利用BREEBS平台进行知识增强和检索增强生成技术

BREEBS是一个开放协作的知识平台，旨在以PDF格式储存的Google Drive文件夹为基础创建知识胶囊（Breebs），以增强各类大型语言模型（LLM）或聊天机器人的专业知识，减少幻觉并提供来源访问支持。BREEBS在背后实现了多个检索增强生成（RAG）模型，以便在每次迭代中无缝地提供有用的上下文。

2025-07-02 16:34:07 129

原创使用 Activeloop Deep Memory 优化 RAG 系统的实现与应用

在构建复杂的LLM应用程序时，检索增强生成（Retrieval-Augmented Generation, RAG）技术正变得越来越重要。然而，在实际生产环境中，准确性、成本和延迟性仍然是不可忽视的挑战。为此，Activeloop提供了Deep Memory这一工具，帮助用户优化向量存储，从而在不显著增加延迟和成本的情况下提高检索准确性。这一技术适合用于对文档进行复杂问答的系统中。

2025-07-02 16:31:21 230

原创使用VLite进行高效语义搜索：从安装到实例应用

当使用VLite进行项目开发时，建议合理选择文本分块和嵌入策略，考虑数据量和检索需求，以优化性能。同时，利用VLite的多种搜索功能，如相似度搜索和MMR搜索，提升检索效果。VLite支持一系列操作如文本添加、文档更新及删除、最大边际相关性搜索等。如果遇到问题欢迎在评论区交流。

2025-07-02 16:27:32 250

原创使用Tencent Cloud VectorDB进行多维向量数据管理和检索

在AI应用中，处理多维向量数据是一个常见且关键的需求。例如，在推荐系统、自然语言处理（NLP）服务、计算机视觉以及智能客服等场景中，都需要快速、高效地存储和检索大规模向量数据。Tencent Cloud VectorDB是一款企业级分布式数据库服务，专为此类需求而设计。该服务支持多种索引类型和相似性计算方法，能够处理高达十亿规模的向量数据，并实现毫秒级的查询延迟。

2025-07-02 16:20:49 402

原创使用 Pathway 和 Langchain 实现实时数据处理与查询

通过 Pathway 的实时索引功能，可以构建各种实时数据处理和查询应用，例如实时监控、动态数据报告生成、智能文档检索等。它适用于需要处理大量变动数据并实时响应的场合。如果遇到问题欢迎在评论区交流。

2025-07-02 16:11:45 154

原创使用ApertureDB进行多模态数据管理及嵌入功能

注意：安装完成后可能需要重启内核以使更新后的包生效。

2025-07-02 09:54:58 241

原创使用Nuclia API进行非结构化数据索引与分析

在现代数据密集的环境中，企业和开发者面临着来自各种内部和外部来源的大量非结构化数据。为了提高数据访问效率和利用价值，Nuclia 提供了自动化索引这些非结构化数据的能力。Nuclia 可以通过其强大的 API 提供优化的搜索结果和生成性回答，还支持视频和音频转录、图像内容提取，以及文档解析。

2025-07-02 09:46:21 277

原创使用Org-mode文件进行数据加载的实战指南

Org-mode是Emacs中的一种文本编辑模式，专门用于笔记记录、规划和文档撰写。它以层次化的方式组织信息，使得用户能够高效地管理日常任务和复杂的项目。随着数据分析和AI技术的发展，能够将Org-mode中的内容转换为可处理的数据格式变得至关重要。

2025-07-01 17:11:03 225

原创使用Intel®扩展工具量化文本嵌入加速NLP模型推理

量化模型是通过降低模型中的权重和激活的精度来减小内存使用并提高推理速度的方法。这在部署到资源受限的环境（如嵌入式设备或移动平台）时尤为重要。Intel® Extension for Transformers提供了一种简单有效的方法来生成此类量化模型，并通过ITREX Neural Engine的优化支持，使推理过程更高效。

2025-07-01 16:06:53 278

原创使用DashScope Embeddings进行文本嵌入

文本嵌入是一种将文本表示为固定维度向量的技术，通常用于信息检索、分类、聚类等任务中。通过将文本转换为向量，我们可以利用计算机强大的数值处理能力来进行复杂的文本分析。DashScope提供了一种易于使用且功能强大的文本嵌入服务，可以显著简化文本处理的复杂性。

2025-07-01 15:59:20 147

原创使用PygmalionAI的Aphrodite Engine进行自然语言处理

Aphrodite Engine适用于各种场景，包括但不限于对话生成、文本摘要、语义分析等。它尤其适合需要处理复杂语言理解任务的场景，例如智能客服和内容创作。如果遇到问题欢迎在评论区交流。

2025-07-01 13:35:14 94

原创利用Prediction Guard在LangChain中保护预测

Prediction Guard是一种能够帮助开发者控制和调整LLM输出的方法，确保模型生成的内容符合预期。无论是在安全性还是输出结构上，它都提供了高度定制的能力。LangChain是一个广泛使用的框架，可以轻松地集成Prediction Guard实现LLM的安全控制。

2025-07-01 11:14:52 273

原创使用Outline进行团队知识共享与信息检索

Outline 是一个开源的协作知识库平台，旨在帮助团队进行信息共享。它提供了灵活的知识管理和检索功能，可以有效地提高团队的工作效率。

2025-07-01 11:14:29 284

原创使用MyScale进行高性能向量搜索与分析

在现代数据科学应用中，处理和分析数据的需求不断增长，其中包括结构化数据和非结构化的数据（如向量化数据）。MyScale提供了一种解决方案，它结合了SQL和向量数据查询，并且基于ClickHouse的云原生OLAP架构，使得即便是海量数据也能够实现快速处理。下面我们将介绍如何在LangChain中使用MyScale进行高性能向量搜索，并给出详细的代码示例。

2025-07-01 11:06:48 222

原创在LangChain中使用Metal进行语义搜索

在现代AI应用中，语义搜索和数据检索是非常重要的功能。为了实现这些功能，我们需要一个高效且稳定的平台来进行数据索引和检索。Metal提供了一个管理良好的检索与记忆平台，专为生产环境设计，可以轻松地将数据索引到Metal中并进行语义搜索和检索。

2025-07-01 11:05:02 248

原创使用Fiddler进行机器学习模型监控和分析

模型监控和分析对于及时发现问题、提高模型性能以及确保其符合业务需求至关重要。Fiddler通过提供详尽的监控和分析工具，让开发者和数据科学家深入理解模型的行为并改进其性能。

2025-06-30 17:22:09 380

原创深入了解DeepInfra与LangChain的集成应用

DeepInfra是一种云端解决方案，专注于简化机器学习模型的部署与运行。它支持多种开源的LLM（大型语言模型）的直接应用。对于开发者而言，DeepInfra是一个能够显著减轻模型管理负担的利器。LangChain是一种新兴的框架，旨在帮助开发者更容易地在应用程序中使用语言模型。通过将DeepInfra与LangChain结合，开发者可以在无需管理基础设施的情况下，轻松地实现复杂的语言任务。

2025-06-30 17:13:43 286

原创使用LangChain集成DataForSEO搜索API的实战指南

DataForSEO是一款专注于SEO数据的API服务，它提供了丰富的数据接口，让开发者可以获取到详细的搜索引擎数据。这些数据对于优化网页排名、分析竞争对手以及制定营销策略都具有重要意义。而LangChain作为一个框架，为我们提供了更便捷的API调用方式。

2025-06-30 17:12:03 397

原创使用 ClearML 进行 Langchain 实验的高效追踪与管理

实验管理器：自动化的实验追踪、环境管理和结果记录。MLOps：针对机器学习与深度学习任务的编排与自动化解决方案。数据管理：基于对象存储的全面数据版本控制。模型服务：云就绪的可扩展模型服务方案。报表生成：支持嵌入在线内容的丰富马可编辑功能。在本文中，我们重点关注 ClearML 的实验管理器模块，并结合 Langchain 进行实验追踪。

2025-06-30 17:04:59 398