
AI大模型
文章平均质量分 87
AI大模型 RAG+Agent+大模型微调
码农~明哥
七年 IT工程师一名 现目前在基金投研公司担任java 大数据开发工程师 天天不是在写软件就是在写bug的路上。
展开
-
《DeepSeek RAG 增强检索知识库系统》Ollama RAG 知识库上传、解析和验证之四
存储到PostgreSQL向量库 : 将向量化后的文本片段及其标记存储到 PostgreSQL 向量库中。PostgreSQL 提供了高效的向量索引和搜索功能,能够支持大规模的文本数据存储和检索。向量化 : 使用 Spring AI 提供的向量模型将标记后的文本片段转换为向量表示。3:TokenTextSplitter : 用于将解析后的文本内容拆分为更小的片段,便于后续处理和存储。4:PostgreSQL向量库 : 用于存储处理后的文本向量数据,支持高效的相似性搜索和检索。原创 2025-04-08 10:50:16 · 87 阅读 · 0 评论 -
《DeepSeek RAG 增强检索知识库系统》Ollama DeepSeek 流式应答页面对接之三
主要我们可以清楚地表达编写页面诉求,AI 工具就可以非常准确且迅速的完成代码的实现。这里我们可以选择的 AI 有很多,包括;注意:原本的 json 文件很大,不适合全部发给 openai。自从有了 AI 工具以后,所有以前头疼前端页面开发的后端程序员👨🏻💻,都漏出了友善😊微笑!要告诉 AI 你的接口请求方式。虽然有AI可以帮助生成,不过有时候并不能一次就成功。// 使用EventSource接收流式响应。// 添加初始AI消息占位。// 构建API URL。原创 2025-04-07 17:27:17 · 82 阅读 · 0 评论 -
《DeepSeek RAG 增强检索知识库系统》Ollama DeepSeek 流式应答接口实现之二
对接 AI 的方式有很多,比如;AI 官网提供的 SDK、自研 SDK 组件、one-api 服务类统一包装接口,其中自研类 SDK 已经在星球 openai 项目对接 chatglm、chatgpt 的时候进行设计,为了差异化学习到不同技术,本项目会采用 Spring AI 框架进行对接。Project Reactor 是一个用于构建响应式应用程序的库,Flux 是 Reactor 中的一个核心组件,用于表示一个异步序列,可以发出 0 到 N 个元素,并且可以是有限的或无限的流。可以看到接口的反馈结果。原创 2025-04-07 17:14:33 · 76 阅读 · 0 评论 -
《DeepSeek RAG 增强检索知识库系统》初始化知识库工程&提交代码之一
如果安装过程中比较慢,推荐使用 docker-compose -f docker-compose-environment-aliyun.yml up -d 带有镜像地址方式安装。1.Windows + wsl2,本地使用 powershell 切换到工程文件夹,执行 docker-compose -f docker-compose-environment-aliyun.yml up -d。课程中有云服务器的操作教程,部署起来更方便。在对应的工程代码,进入工程下 docs/dev-ops,执行安装脚本。原创 2025-04-07 17:07:25 · 161 阅读 · 0 评论 -
DeepSeek部署
当前测试环境部署的DeepSeek(简称DS)采用Ollama(用于多种模型集成运行的工具)加载DeepSeek-R1-Distill-Qwen-14B方式。api接入dify调用ds示例:http请求头http请求体数据API秘钥可通过在dify如下方式创建(先创建和发布聊天助手)Ollama服务:Ollama 是一个开源工具,专为在本地计算机上快速部署和运行大型语言模型(LLMs)而设计。其目标是简化模型的本地化使用流程,尤其适合开发者、研究人员及对隐私敏感的用户.原创 2025-03-05 18:12:02 · 147 阅读 · 0 评论