使用Ollama和Langchain动手开发AI搜索问答助手

1 概述

大语言模型虽然已经有了很多的背景知识,但针对模型训练之后新产生的内容,或者领域内的知识进行提问,大模型本身通常无法准确给出回应,一个常用的解决方法是,借助检索增强生成(RAG),将能够用于回答问题的相关上下文给到大模型,利用大模型强大的理解和生成能力,来缓解这个问题。

本文主要介绍如何借助搜索引擎,获取比较新的内容,并对这部分内容的问题进行回答。首先会简单介绍原理,然后是环境准备,代码介绍,最后会通过Chainlit,构造一个完整的可视化Demo。

本文所介绍方法,不需要使用付费大语言模型API,整个流程可以在一台笔记本电脑(8GB以上内存)上运行。效果如下:

img

2 基本原理

本文所介绍内容,总体依然是RAG,下面是总体处理流程。

AI搜索问答并非在用户输入问题时才去互联网爬取数据,这样会来不及处理,通常都是借助搜索引擎。从搜索引擎获取到相关文档后,后续的所有流程,就跟一般的RAG完全一致了。

img

3 环境准备

3.1 操作系统

本文使用的所有组件、库,在Windows、Linux、macOS上都可以安装,理论上在这三个系统上都可以正常运行,但没有对所有系统做兼容性测试,下文以macOS 14.4 Sonoma系统,ARM系列芯片笔记本电脑的环境为例进行介绍。

3.2 Python环境准备

推荐使用Anaconda或者Miniconda准备Python环境,具体兼容的Python版本没有做完整测试,本文所使用的是Python 3.11.4。Python安装完成后,安装如下依赖包:

pip install -r requirements.txt

3.3 Ollama安装及模型下载

Ollama是一个能够在本地运行大语言模型的应用,可以直接在命令行中进行问答交互、或者使用相应的API(本文要用到的方式),以及使用第三方GUI工具,如Lobechat等。

从Ollama官网下载并安装对应操作系统的Ollama,Ollama详细的安装配置,请参考Ollama官网。

3.3.1 模型下载

Ollama安装好之后,在命令行中,执行如下两条命令,下载相应的大语言模型和向量模型:

ollama pull qwen:7b
ollama pull znbang/bge:large-zh-v1.5-q8_0

在Ollama官方的Models页面,提供了非常多支持的模型,如果对相关模型比较熟,可以根据机器的配置选择更大或更小的模型。

下载完成后,执行如下命令,进行二次确认,确保下图中框选的部分在列表中:

ollama list

imgollama_list.png

使用如下命令,检查大语言模型是否可以正常工作:

ollama run qwen:7b

imgollama_run.png

如果输出如上图所示内容,则说明大语言模型工作正常。输入/exit退出问答界面。

3.3.2 使用API

3.3.2.1 大语言模型

如果是依照本文,在本机安装Ollama,执行如下Python代码:

from langchain_community.llms.ollama import Ollama

model_name = 'qwen:7b'
model = Ollama(base_url='http://localhost:11434', model=model_name)

print(model('你是谁'))

如果输出如下内容,则表示API调用正常:

我是阿里云研发的大规模语言模型,我叫通义千问。

如果Ollama安装在其他机器,替换上述代码中的base_url

3.3.2.2 向量模型

类似大语言模型的部分,执行如下Python代码:

from langchain_community.embeddings import OllamaEmbeddings

embedding_model = OllamaEmbeddings(
    base_url='http://localhost:11434',
    model='znbang/bge:large-zh-v1.5-q8_0'
)
print(embedding_model.embed_query('你是谁'))

如果输出类似如下内容,则表明向量模型API调用正常:

[0.8701383471488953, 0.926769495010376, ...

3.4 搜索引擎API准备

许多搜索引擎都有专门的API,只需要两三行代码即可获取结果,本文使用Bing中文版网页请求地址,借助BeautifulSoup库解析结果的方式,获取Bing搜索结果。

执行如下代码:

def search_with_bing(query):
    import requests
    from bs4 import BeautifulSoup
    from urllib.parse import quote 
    url = f'https://cn.bing.com/search?q={quote(query)}'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36'
    }
    resp = requests.get(url, headers=headers)
    soup = BeautifulSoup(resp.text, 'html.parser')
    
    result_elements = soup.select('#b_results > li')
    data = []

    for parent in result_elements:
        if parent.select_one('h2') is None:
            continue
        data.append({
            'title': parent.select_one('h2').text,
            'abstract': parent.select_one('div.b_caption > p').text.replace('\u2002', ' '),
            'link': parent.select_one('div.b_tpcn > a').get('href')
        })
    return data

search_with_bing('大语言模型')

如果结果类似如下所示,则表明执行成功:

[{'title': '什么是LLM大语言模型?Large Language Model,从量变到质变',
  'abstract': '网页2023年4月17日 · 大语言模型(英文:Large Language Model,缩写LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。. 它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。. LLM的特点是 规模庞大,包含数十亿的参数 ...',
  'link': 'https://zhuanlan.zhihu.com/p/622518771'},
 {'title': '什么是大模型(LLMs)?一文读懂大型语言模型(Large ...',
  'abstract': '网页2 天之前 · 大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由 深度神经网络 构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和 推荐系统 等。大模型通过训练海量数据 …',
  'link': 'https://www.aigc.cn/large-models'},
 {'title': '一文读懂“大语言模型” - 知乎',
  'abstract': '网页2023年7月17日 · 谷歌的 Gen AI 开发工具介绍. 2、大语言模型介绍. 2.1 大语言模型的定义. 大语言模型是深度学习的分支. 深度学习是机器学习的分支,大语言模型是深度学习的分支。机器学习是人工智能(AI)的一个子领域,它的核心是让计算机系统能够通过对数据的学习来提高性能。在机器学习中,我们不是直接编程告诉计算机如何完成任务,而是提供大量 …',
  'link': 'https://zhuanlan.zhihu.com/p/644183721'},
...

4 主要流程

4.1 使用搜索引擎检索互联网内容

使用上文提到的search_with_bing函数,直接调用即可

...
search_results = search_with_bing('大语言模型')
...

4.2 获取网页全文

此处简洁起见,使用requests库发送GET请求,获取网页全文。

4.3 文档解析、切片、向量化及检索

本文使用BeautifulSoup解析上文获取到原始HTML对应的文本html。通常使用这种方式解析的HTML效果比较差,可以使用Jina Reader、Firecrawl等库,获得更高质量的解析结果。

...

soup = BeautifulSoup(html, 'html.parser')
item['body'] = soup.get_text()

...

下方的代码,会对文本进行切片,进行向量化,并使用query获取检索结果:

...
text_splitter = RecursiveCharacterTextSplitter(
    ["\n\n\n", "\n\n", "\n"],
    chunk_size=400,
    chunk_overlap=50
)
documents = [Document(
    item['body'],
    metadata={'href': item['href'], 'title': item['title']}
) for item in search_results.values()]
split_docs = text_splitter.split_documents(documents)
vectorstore = Chroma.from_documents(split_docs, embedding_model)
retriever = vectorstore.as_retriever(search_args={'k': 6})
retrieved_docs = retriever.get_relevant_documents(query)
context = '\n\n'.join([doc.page_content for doc in retrieved_docs])

4.4 Prompt构造

使用Prompt如下:

prompt = """请使用下方的上下文(<<<context>>><<</context>>>之间的部分)回答用户问题,如果所提供的上下文不足以回答问题,请回答“我无法回答这个问题”
<<<context>>>
{context}
<<</context>>>

用户提问:{query}
请回答:
""".format(query=query, context=context)

5运行

完整代码点击此处获取。

首先完成第3节中的环境准备,然后执行如下命令:

sh start.sh

出现类似如下的界面,表明启动成功

img

如何零基础入门 / 学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么我作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,希望可以帮助到更多学习大模型的人!至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

👉 福利来袭CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

全套AGI大模型学习大纲+路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

read-normal-img

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈
基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉 福利来袭CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

img

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

### Ollama LangChain 的功能差异 #### 功能特性对比 Ollama 是一种专注于优化部署大规模语言模型的技术框架,旨在简化大模型的应用开发过程[^1]。该平台提供了多种预训练的语言模型,并支持通过简单的API调用来实现复杂的自然语言处理任务。 LangChain 则是一个更通用的库,用于构建基于链式的复杂工作流来操作文本数据,特别适合于创建自定义的数据管道以执行诸如信息提取、问答系统等功能[^2]。它不仅限于语言模型本身的操作,还涵盖了从原始文档到最终输出整个流程中的多个环节。 #### 技术栈与集成能力 对于希望快速上手并利用现有强大语言理解能力的企业来说,Ollama 提供了一套易于使用的工具集,可以迅速将最先进的研究成果转化为实际产品服务[^3]。这使得开发者能够专注于业务逻辑而不必深入研究底层算法细节。 相比之下,LangChain 更加灵活多变,在面对多样化需求时表现出色。它可以轻松与其他开源组件相结合,形成定制化的解决方案,适用于那些需要高度个性化配置以及对模型行为有精细控制权的情况[^4]。 ```python # 使用 LangChain 构建简单的工作流示例 from langchain import Pipeline pipeline = Pipeline([ {'name': 'text_cleaner', 'function': clean_text}, {'name': 'tokenizer', 'function': tokenize_sentence} ]) result = pipeline.execute(input_data) print(result) ``` #### 应用场景分析 当涉及到具体应用场景的选择时: - 如果目标是在短时间内推出高质量的人工智能聊天机器人或其他交互式应用,则可以选择 Ollama 。这是因为其内置了许多经过精心调整过的参数设置,可以直接应用于生产环境而无需过多调试。 - 对于科研机构或者初创公司而言,如果计划长期投入资源进行深度学习领域内的探索技术积累,那么采用 LangChain 可能会更加合适。因为后者允许研究人员自由组合不同类型的神经网络结构来进行实验测试,并且容易扩展至其他相关子域如计算机视觉等跨学科方向的研究工作中去。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值