- 博客(758)
- 收藏
- 关注
原创 【实战项目】手把手教你构建自己的RAG应用:从零开始,全面指南!
RAGRAG 是一个人工智能框架,用于从外部知识库中检索事实,使大型语言模型(LLM)基于最准确的最新信息,并让用户深入了解 LLM 的生成过程。大语言模型训练完后,其内部知识库就已经确定了,所以它无法回答你超过其知识库内容的问题。除非你有能力对其进行微调,否则最简单的方法就是使用RAG检索外部知识库。有人可能会认为,RAG是不是就是让模型在回答问题前先去指定的外部知识库检索一下知识,然后再回答?
2025-05-08 15:29:17
761
原创 大模型+RAG构建知识问答助手入门到精通,收藏这一篇就够了!
知识问答助手已经成为企业在探索大模型应用时的首选场景之一,基于大模型的知识问答助手不仅能够自动整合企业内外部的海量信息,构建全面、精准的知识图谱,还能够通过自然语言查询,实现一键触达精准答案。大模型存在幻觉问题、可解释性差、隐私和安全问题等明显缺点,为了提高知识问答的准确率,一种基于“大模型+RAG(检索增强生成)”架构的方式正在形成。RAG的本质是在大模型交互之前提前进行搜索,召回正确的上下文给到大模型,决定了大模型生成的天花板。
2025-05-08 15:01:01
614
原创 保姆级教程:DeepSeek+RAG技术实现企业级知识库搭建
检索(Retrieval) 的详细过程:准备外部知识库: 外部知识库可能来自本地的文件、搜索引擎结果、API等等通过 Embedding (嵌入) 模型,对知识库文件进行解析: Embedding 的主要作用是将自然语言转化为机器可以理解的高维向量,并且通过这一过程捕获到文本背后的语义信息(比如不同文本之间的相似度关系)通过 Embedding(嵌入) 模型,对用户的提问进行处理: 用户的输入同样会经过嵌入(Embedding)处理,生成一个高维向量。
2025-05-08 14:29:31
738
原创 大模型教程:RAG 知识库高效应用指南(附教程)
构建一个RAG 应用的概念验证过程相对简单,但要将其推广到生产环境中则会面临多方面的挑战。这主要是因为 RAG 系统涉及多个不同的组件,每个组件都需要精心设计和优化,以确保整体性能达到令人满意的水平。
2025-05-08 14:12:27
398
原创 哪个最适合企业搭建AI知识库,让沉淀的企业知识活起来
2023年被誉为元年,。AIGC概念广泛,其中生成式AI技术(Generative AI)尤其受到关注,它通过创新性算法解决传统AI所难以触及的问题,特别是在数字内容创新上实现了质的飞跃。
2025-05-07 16:58:31
920
原创 手把手教你从零搭建自己的知识库
Word2Vec是一种用于处理自然语言处理的模型,它是在2013年由Google的研究员Mikolov等人首次提出的。Word2Vec通过训练海量的文本数据,能够将每个单词转换为一个具有一定维度的向量。这个向量就可以代表这个单词的语义。因为这个向量是在大量语境中学到的,所以这个向量能很好的表达这个单词的语义。Word2Vec包括Skip-Gram和CBOW两种模型,主要是通过优化模型计算词与词之间的关系,从而获得词的向量表示。Skip-Gram模型是通过一个词预测其上下文。
2025-05-07 15:39:26
1225
原创 使用AI大模型的正确姿势!接入知识库、微调,5种方法,总有一种适合你
真正的魔力在于结合这些方法:提示词、RAG、微调、切换模型和使用多模态大模型。利用每种方法的优势,并将其应用于文本和图像数据,以此用大模型提升你的生产力。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型。
2025-05-07 14:52:38
704
原创 什么是AI大模型?(超详细)大模型从入门到精通,看这一篇就够了
大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。
2025-05-06 16:42:19
1172
原创 大模型技术,基于大模型构建本地知识库!
模型以其庞大的数据容量和深度学习能力,为处理复杂任务提供了前所未有的可能性。但在特定应用场景下仍面临挑战,尤其是在需要快速、准确响应的情境中。为了克服这些限制,构建一个基于大模型的本地知识库显得尤为重要。
2025-05-06 15:54:34
857
原创 本地大模型部署和基于RAG方案的私有知识库搭建
以上就是本地大模型部署和基于RAG方案的私有知识库搭建的基本操作。除此之外,还有更多丰富有趣的功能等待探索。如今大模型遍布各行各业、各个领域,基于RAG方案的私有知识库技术也逐渐发展,成为提升个人工作效率与创造潜能的新风尚。本地部署模型意味着用户能在自己的设备上享受即时响应的智能辅助,无需依赖云端,既保护了个人数据隐私,又确保了操作的低延迟与高可靠性。结合RAG方案的私有知识库,则让每位用户能够构建专属自己的知识宇宙。
2025-04-28 17:11:06
1184
原创 如何搭建基于大模型的智能知识库
基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一,从技术角度可以看到,建设方案已经完备;从业务角度,最终的应用效果和业务价值还需要观察,并通过业务侧的反馈不断地促进建设方案的进一步优化,比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。
2025-04-28 17:01:53
945
原创 大模型经典面试题,(非常详细)收藏这一篇就够了!
LangChain是一个用于构建和运行大型语言模型应用的开源框架。它提供了一套工具和组件,帮助开发者将大型语言模型(如 GPT-3)与其他工具和API结合,以完成更复杂的任务。1、LangChain包含哪些核心概念?Components:可重用的模块,例如API调用、数据库查询等。Chains:将多个Components链接在一起以完成特定任务的流程。Prompt Templates: 用于指导语言模型生成输出的文本模板。Output Parsers:解析语言模型输出的工具。
2025-04-28 16:40:49
578
原创 2025大模型面试宝典:20个精选问题及解答,存下吧很难找齐的!
大型语言模型(LLM)是一种通过大量文本材料训练的人工智能系统,能够像人类一样理解和生成语言。通过使用机器学习技术识别训练数据中的模式和关联,这些模型能够提供逻辑上和上下文上适当的语言输出。
2025-04-28 16:07:39
1006
原创 2025年医疗大模型如何发展?私有化部署是重要方向
导读一方面,大模型在医疗场景应用需兼顾安全性与专业性,可通过数据清洗、标注和验证等控制数据质量;另一方面,大模型的计算需要大量的算力作为支撑,轻量化、本地化部署的大模型将成为重要发展方向。2023年被很多人称为“医疗大模型的元年”,国内外均有大量厂家将大语言模型应用于医疗健康领域。据统计,截至2023年10月,我国累计公开的大模型数量已经达到238个,垂直类大模型达到103个。而2-9月,我国发布的医疗大模型近50个,涉及智慧诊疗、医疗文本处理、药物研发和学术科研等多个方面。
2025-04-28 15:51:48
1118
原创 我们为什么要用本地大模型?——本地大模型入门指南
大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。
2025-04-27 15:00:41
874
原创 什么是多模态?多模态大模型综述,看这一篇就够了
多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。随着 LLM 在语言理解和推理能力上的逐步增强,指令微调、上下文学习和思维链工具的应用愈加广泛。然而,尽管 LLM 在处理语言任务时表现出色,但在感知和理解图像等视觉信息方面仍然存在明显的短板。
2025-04-27 14:38:05
1240
原创 国内12家主流大模型,谁是地表最强?亲测后发现是它!
大模型GPT-3.5,2022年11月发布。可谓春风化雨,雨后春笋一般。到现在2024年,国产大模型工信部注册的,已有几百家。国产大模型崛起速度之快,令人惊叹。在如此之多的大模型里面,如何选择好用的,还真是个问题。结合GPT4o和Claude3.5,加上自身的一定使用,总结了如下12家国产大模型:下面表格,排名不分先后各自产品对应的logo如下:文字版介绍:1 百度:推出了“文心一言”大模型,具备强大的自然语言处理能力,广泛应用于搜索、对话等领域。
2025-04-27 14:20:25
1222
原创 基于RAGFlow实践Agent——构建智能客服
智能客服的应用场景非常广泛,如商品咨询,售后问答,配件更换,转人工客服等场景。今天将给大家介绍如何使用 RAGFlow 的来搭建一个商品智能客服,实现能够针对上述四种场景给出不同的解决方案。RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为不同规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
2025-04-27 14:02:40
692
原创 一文详解大模型微调常用方法,大模型微调数据集怎么标注?
最近,深度学习的研究中出现了许多大型预训练模型,例如 GPT-3、ChatGPT、GPT4、ChatGLM-130B 等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT 模型因为在对话生成方面的表现而备受瞩目,成为了自然语言处理领域的热门研究方向。然而,这些大型预训练模型的训练成本非常高昂,需要庞大的计算资源和大量的数据,一般人难以承受。这也导致了一些研究人员难以重复和验证先前的研究成果。
2025-04-26 09:15:00
1544
原创 一文说清大模型微调的6种方法!看到就是赚到!!
前排提示,文末有大模型AGI-CSDN独家资料包哦!1. 基本概念是在大规模数据上进行无监督或自监督学习训练得到的模型。例如在自然语言处理中,像 BERT(Bidirectional Encoder Representations from Transformers)、GPT(Generative Pretrained Transformer)系列等都是典型的预训练模型。这些模型通过学习大量文本数据中的语言模式、语义信息和语法结构等知识,形成了对语言的深度理解能力。在预训练阶段,模型会接触海量的数据。
2025-04-26 09:00:00
976
原创 本地部署大模型的几种方式,非常详细,收藏这一篇就行!
开源大模型, 或者说本地化运行一个开源大模型, 现在已经越发的简单与低门槛了. 只要有足够的。
2025-04-25 15:49:50
961
原创 为何很多企业倾向于私有化部署AI大模型?
最近有人问我:为什么有些企业要求私有化部署AI大模型,难道直接使用大模型产品不香吗?对于这一点,我只能客观地说:两者各有千秋。比如金融、医疗等行业对客户数据和隐私保密性要求非常高,行业私有数据的泄密,很可能给社会及个人带来严重影响,机构自身也会因为信任危机,导致客户灾难性流失,所以这类行业在使用大模型产品时,对私有化训练和部署的需求会相对更高。而他们选择在云上或本地私有化部署模型服务的很大一部分原因,就在于深度保障业务数据传输、存储、训练和使用全流程的安全可控,杜绝潜在风险,让客户更放心。
2025-04-25 15:25:54
926
原创 如何部署私有化大模型+知识库+问答+客服
随着各个大模型厂商的逐步发力,市场上的优秀模型越来越多。Dify基于这些大模型可以简易地创建可持续运营的原生 AI 应用,融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎,平台不仅支持十几种大模型的接入,同时提供多种类型应用的可视化编排能力,开箱即用只需十分钟即可轻松在本地服务器上部署。Features。
2025-04-25 15:06:34
1002
原创 大模型RAG详解:检索、增强、生成,一篇文章彻底掌握!
RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。前排提示,文末有大模型AGI-CSDN独家资料包哦!一、检索增强生成(RAG)什么
2025-04-25 14:36:50
866
原创 大模型RAG入门到实战基础教程(非常详细),非常详细保姆级教程!
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分域时,通用大模型就会面临专业知识不足的问题。相对于成本昂贵的“Post Train”或“SFT”,基于RAG的技术方案往成为一种更优选择。本文从RAG架构入手,详细介绍相关技术细节,并附上一份实践案例。前排提示,文末有大模型AGI-CSDN独家资料包哦!本文列举了LLM的问题。简单介绍了什么是 RAG ,以及 RAG 的流程。最后使用了一个简单的LangChain代码示例来展示 RAG 的使用。
2025-04-24 16:18:04
999
原创 2025最全Transformer面试题汇总(84道题),大模型面试必备!
这篇文案汇总了Transformer模型的基本原理、训练过程、应用场景以及性能优化等多个方面的面试题。
2025-04-24 15:52:07
950
原创 【2025超全汇总】这是我见过最全面的AI大模型面试题集合!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。AI 大模型技术经过2024年的狂飙,2025年必将迎来应用的落地,对 IT 同学来讲,这里蕴含着大量的技术机会,越来越多的企业开始招聘 AI 大模型岗位。
2025-04-24 15:37:29
708
原创 一文搞定面试准备!2025年大模型最新最全面试题,助你吊打面试官!
注意力机制是一种模拟人类注意力分配过程的模型,它能够在处理大量信息时,选择性地关注对任务更重要的信息,忽略无关信息。在自然语言处理中,注意力机制常用于机器翻译、文本摘要、问答系统等任务中,帮助模型捕捉输入序列中的关键信息。在计算机视觉中,注意力机制也用于图像识别、目标检测等任务,使模型能够关注图像中的关键区域。
2025-04-24 15:23:55
809
原创 大模型常见的LoRA算法原理、实现和运用详解
本文是常用算法的快速浏览入门(扫盲),结合论文+代码,从原理、实现以及实际应用上深入介绍。前排提示,文末有大模型AGI-CSDN独家资料包哦!LoRA(Low-Rank Adaptation)是一种用于在预训练模型基础上进行高效微调(Fine-Tuning)的算法,特别适用于大规模语言模型(LLMs)。LoRA 通过引入低秩矩阵的方式来适应和调整模型参数,从而在保持预训练模型原有能力的同时,显著减少微调的计算成本和存储需求。(以上如果看不明白,往后看完一定能懂!
2025-04-12 20:39:45
648
原创 AI大模型 | LangChat带你快速接入并部署本地大模型
LangChat是Java生态下企业级AIGC项目解决方案,在RBAC权限体系的基础上,集成AIGC大模型功能,帮助企业快速定制知识库、企业机器人。还不会部署本地AI大模型?使用LangChat带你快速部署并接入本地Ollama AI大模型。
2025-04-12 20:38:28
981
原创 基于大模型的知识库构建平台(非常详细)零基础入门到精通,收藏这一篇就够了
数据采集模块为平台的数据源引入部分,主要由外部数据采集以及内部数据采集构成。底层模型模块是平台的数据处理核心所在,目前使用的大模型均为国产开源大模型,并通过将大模型进行本地部署使得数据安全可控。通过各种形式Prompt(Prompt意为提示词或引导词,用以描述在AI模型中输入的起始语句或问题,以引导模型进行相关的回答或生成特定内容)(离散、连续)充分挖掘模型在特定任务上的能力。同时实现Prompt评测优化、入库以及管理。最终使得底层各个任务模块效果更优。
2025-04-12 20:36:52
1081
原创 本地部署的医疗大模型探索
在日常生活中,许多人对大模型存在一些误解。有人认为大模型需要高端硬件配置,非得依赖云端的GPU阵列才能运行。有人觉得大模型就是简单的对话机器人,只能一问一答,难以与其他软件融合。还有人认为大模型容易产生不切实际的“幻觉”,写写文章、逗乐一下尚可,但若要应用于严肃的行业则远远不够成熟。自2023年ChatGPT诞生至今,仅仅一年多的时间里,各种创新应用如雨后春笋般涌现。这些误解,或许是因为人们对这一新兴技术的了解还不够深入。
2025-04-12 20:35:25
654
原创 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!
使用Huggingface上的开源医疗数据集,借助 RAGFlow 搭建自己的本地医疗问诊助手。纯本地构建:本地知识库+本地向量化模型+本地大模型原理:RAGFlow是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。它的作用是可以让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出。
2025-04-12 20:33:53
1395
原创 大模型超详细盘点!常用的大模型及其优缺点、有潜力的大模型、国内大模型行业落地的现况、国内大模型优势、挑战与前景
特点与技术:360安全大模型以AI安全为核心,推出了以AI安全为核心的大模型安全解决方案,为企业构建合规、可信、可靠的大模型服务。:Minimax凭借自研实力,推出了包含多个模态(如文本到视觉、文本到语音、文本到文本)的基础模型架构,并成功推出了自研通用大模型“ABAB”,展现了其在多模态处理方面的潜力。例如,盘古大模型在钢铁行业的应用,显著降低了生产调整时间,提高了预测精度和钢板成材率。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。
2025-04-12 20:29:33
1134
原创 Ollama 部署本地大模型与使用
在上一章中,我们通过 HuggingFace 成功调用了 Llama3 模型,但整个过程相对繁琐。不仅需要在 HuggingFace 上申请访问权限,还要编写代码来调用模型。如果我们需要提供外部访问接口,还需要自行实现。本文将介绍如何通过 Ollama 部署 Llama3 模型,并通过接口调用,简化这一过程。前排提示,文末有大模型AGI-CSDN独家资料包哦!Ollama 是一个本地运行的大语言模型(LLM)工具平台,允许用户在本地设备上运行和管理大模型,而无需依赖云服务。
2025-04-12 20:20:12
990
原创 大模型知识图谱:零基础到精通的系统教程
当我们提及大模型时,通常指的是大语言模型(Large Language Model,简称LLM),即文字问答模型,其典型代表便是OpenAI的GPT系列。然而,随着技术的日新月异,大模型已经不单单局限于自然语言处理(Natural Language Processing)领域的发光发热,而是逐渐渗透到了其他多个领域。前排提示,文末有大模型AGI-CSDN独家资料包哦!
2025-04-09 15:37:15
551
原创 大模型极简入门:零基础到实战的保姆级指南
2023年大西洋彼岸的OpenAi公司,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例。
2025-04-09 15:33:28
796
原创 【重磅报告】大模型中国实践:52个领域成功案例汇编
近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023大模型落地应用案例集》(以下简称“《案例集》”)。《案例集》一共119页pdf,作为首部聚焦落地应用的权威研究成果,全面展示了大模型前沿技术和发展成果,推动了大模型为代表的人工智能技术赋能社会经济高质量发展。经专家组的多轮评审,共52个各自领域的典型大模型技术落地应用成功入选。
2025-04-09 15:31:19
1285
原创 手把手教你本地部署大语言模型:零基础也能搞定!
最近小编详细尝试了一下本地部署大语言模型的几种方法,本节来介绍一下个人的一些使用体验,个人观点仅供参考。主要涉及本地部署客户端选择、模型下载、以及后续一些进阶方向。
2025-04-07 21:37:19
880
原创 无需高端显卡!Ollama本地AI模型傻瓜式安装,不挑环境、不挑配置!
Ollama是一个支持在WindowsLinux和MacOS上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如Qwen模型等。用户只需一行命令就可以启动模型。前排提示,文末有大模型AGI-CSDN独家资料包哦!跨平台支持WindowsLinuxMacOS系统。提供了丰富的模型库,包括QwenLlama等1700+大语言模型,可以在官网中直接下载使用。支持用户上传自己的模型。用户可以将等地方的ggml格式模型导入到ollama中使用。也可以将基于pytorch。
2025-04-07 21:34:00
917
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人