- 博客(389)
- 收藏
- 关注
原创 矩阵乘法运算符 【@】
是 NumPy 中执行矩阵乘法的简洁运算符,优先使用它替代np.matmul。对于一维数组,它等同于点积;对于二维及以上数组,遵循矩阵乘法规则。注意示例中的数值可能存在问题,建议检查输入数据。
2025-05-24 13:15:56
181
原创 计算serise数据的唯一值数量
统计 Series 中唯一值的 数量(默认不包含 NaN)(用户可能误认为是列表,但实际是 NumPy 数组)。统计 Series 中唯一值的数量,包含 NaN。:将 NaN 视为一个唯一值并统计。方法的参数化调用形式,通过。:包含 NaN(如果存在)。强制包含 NaN 的计数。(顺序按首次出现排列)。
2025-04-17 15:20:54
205
原创 代码仓库使用git lfs上传模型文件
它主要是用来处理大文件的,比如模型文件通常都很大,超过100MB的话,用普通的Git上传可能会出问题,所以必须用LFS。,下载Windows安装包并运行。指定需要追踪的大文件类型(例如。
2025-04-02 10:04:11
487
原创 大模型架构记录13【hr agent】
tool"""生成唯一的时间戳。输入始终为空字符串。Returns:int: 唯一的时间戳,以毫秒为单位。"""timestamp = int(time.time() * 1000) # 获取当前时间的毫秒级时间戳import os@tool"""根据给定的文件夹名创建文件夹。Args:folder_name (str): 要创建的文件夹的名称。Returns:str: 创建的文件夹的路径。
2025-03-30 21:42:09
358
原创 大模型重点5【Agent构建】
包括自定义的字段以及types. 然而,openAI自己也实现了这套逻辑,也叫做functional call, 就是返回用户自定义的Json的structure。Functional Call of OpenAI 是 OpenAI 提供的一种功能,
2025-03-27 00:31:03
763
原创 语音识别执行代码
给 二号 精髓 更 深层 一个 维修工 单 内容 是 设备 次序 能耗 高 可能 与 精髓 不 稳定 有关 发送 给 王宁。----------------> 开始执行所有模型 语音识别, 录音文件:20250324_1106.wav。嗯啊给二号进水泵生成一个维修工单 内容是设备持续能耗高 可能与进水不稳定有关 发送给王林。--------------> 暂定选择模型:ali_speech_paraformer。给二号进水泵生成一个维修工单内容是设备持续能耗高可能与进水不稳定有关发送给王宁。
2025-03-25 15:11:15
197
原创 大模型重点4【RAG优化】
RAG是一种结合了检索和生成的技术,用于提高问答系统的性能。这种方法可以帮助模型更深入地理解问题,并从文档中检索到更相关的内容,从而提高生成答案的质量。根据当前的上下文和已检索到的信息,动态地生成新的查询来进一步检索更精确的信息。在RAG模型中,检索器负责从文档集合中找到与输入查询最相关的文档片段。:在RAG模型中,自我查询检索可能涉及到模型在生成答案的过程中,:可能指的是对检索器的改进,以提高检索结果的相关性和准确性。:可能涉及对查询语句的优化,使其更有效地检索相关信息。模型会生成自己的查询来检索信息。
2025-03-24 23:49:45
833
原创 大模型重点3【综述-langchain】
LangChain 是一个用于开发由大型语言模型(LLM)驱动的应用程序的开源框架。它提供了一套工具、组件和接口,简化了创建由 LLM 和聊天模型支持的应用程序的过程。LangChain 的核心目标是让开发者能够轻松地将 LLM 与外部数据源、API 和其他工具集成,从而构建出更智能、更实用的应用。为什么需要 LangChain?调用多个不同的大模型(gpt4, 视频生成...)向量数据库数据类型(读取,trunk的切分...)langchain功能连接数据源。
2025-03-24 08:53:45
1073
原创 大模型重点1 【综述-文字版】
提示词,是一个非常关键的概念,它指的是,用于引导语言模型生成相应的回答或执行特定任务。:有时又叫Pre-trained Model,预训练模型是指。它通过自监督学习(如掩码语言建模、下一句预测等任务)学习语言的通用知识,包括语法、语义、上下文关系等。:(智能体) 是一种基于大型语言模型(LLM)构建的智能实体,它能够自主感知环境、做出决策并执行任务。拆解复杂任务为可执行的子任务,并评估执行策略。存储和回忆信息,包括短期记忆(会话上下文)和长期记忆(用户特征、业务数据等)。:通过来扩展自身能力。
2025-03-22 11:47:02
1218
原创 VOSK的Python服务端部署完整方案
│ └── vosk-model-cn-0.22 # 预下载的中文模型。│ ├── main.py # FastAPI服务代码。│ └── vosk-helper.py # 音频处理工具。优化的GPU支持(需额外配置NVIDIA容器工具)最终镜像体积约1.2GB(包含完整模型)自动内存管理(限制内存泄漏风险)支持ARM/x86双架构。
2025-03-21 17:32:42
643
原创 大模型agent的构建
用Chain-of-Thought(思维链)或ReAct框架拆分复杂任务。图像:多模态大模型(如GPT-4V)或专用模型(CLIP)。:对小任务使用轻量级模型(如GPT-3.5 Turbo)。(文本、语音、图像等),转化为大模型可处理的格式。:添加内容过滤层,限制危险工具调用(如删除文件)。(如客服、个人助手、数据分析、自动化流程等)。(生成文本、调用API、控制设备等)。语音:ASR模型(如Whisper)。:人工反馈或自动评估(如任务成功率)。(如一个负责规划任务,一个负责执行)。
2025-03-20 22:07:05
976
原创 大模型架构记录-路线分析
大模型下载地址:魔搭社区模型介绍地址:算力租用平台:AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDLGPU显存预估: 显存计算器 - 大模型显存需求分析工具 | LlamaFactory | LlamaFactory
2025-03-20 21:55:39
297
原创 大模型架构记录【综述-langchain】
问题:如何没有langchain会怎么样?langchain是面于大模型开发的框架langchain发展很快,讲解课程时候的版本为 0.1.7,具体的语法和接口标准可能会随时改变,请留意官网的documentation调用多个不同的大模型(gpt4, 视频生成...)向量数据库数据类型(读取,trunk的切分...)langchain是面于大模型开发的框架(framework)
2025-03-15 02:29:44
432
原创 大模型架构记录5-向量数据库
先和N个空间的均值比较再和空间内部的所有点比较,计算最近值。query -> requery 对问题做处理,处理上下文。对query 做 refined query。
2025-03-13 23:36:29
192
原创 大模型架构记录4-文档切分 (chunks构建)
chunks: 块trunks : 树干“RAG”通常指 检索增强生成(Retrieval-Augmented Generation)主要框架:用户提query,找到和它相关的,先把问题转换为向量,和向量数据库的数据做比较,检索相似的向量,返回 对应向量的原始文本,构建prompt,给模型回答问题。
2025-03-11 22:55:25
821
原创 大模型架构记录3-提示工程a
根据下面的上下文回答问题。保持答案简短且准确。如果不确定答案,请回答“不确定答案”。Teplizumab起源于一个位于新泽西的药品公司,名为Ortho Pharmaceutical。在那里,科学家们生成了一种早期版本的抗体,被称为OKT3。最初这种分子是从小鼠中提取的,\能够结合到T细胞的表面,并限制它们的细胞杀伤潜力。在1986年,它被批准用于帮助预防肾脏移植后的\器官排斥,成为首个被允许用于人类的治疗性抗体。问题:OKT3最初是从什么来源提取的?"""OKT3最初是从小鼠中提取的。
2025-03-09 03:15:58
1076
原创 大模型架构记录1
整合文档资源:将公司 产品文档、规范文档、定价信息及FAQ等纳入向量数据库。向量数据库与模型交互:将文档内容向量化后存入向量数据库,供模型实时检索与交互,提供服务。
2025-03-05 23:07:54
2363
原创 anaconda安装报错
Cannot open 本地 Failed to start [powershell.exe, -ExecutionPolicy, RemoteSigned, -NoExit, -Command, & 'D:\anaconda3\condabin\conda.bat' shell.powershell hook | Out-String | Invoke-Expression;
2025-02-22 23:06:38
655
原创 使用QQ登录(头条项目-09)
QQ登录成功后,我们需要将QQ⽤户和芒果头条⽤户 关联到⼀起,⽅便下次QQ登录 时使⽤,所以我们选择使⽤MySQL数据库进⾏存储。为了给项⽬中模型类补充数据创建时间和更新时间两个字段,我们需要定义模型类 基类。在mgproject.utils/models.py⽂件中创建模型类基类。"""为模型类补充字段"""verbose_name="创建时间")update_time = models.DateTimeField(auto_now=True, verbose_name="更新时间")
2025-01-18 21:25:13
824
原创 用户登录及状态保持(头条项目-08)
提示:LoginRequired(object)依赖于视图类View,复⽤性很差。"""验证⽤户是否登陆"""# ⾃定义as_view()⽅法中,调⽤⽗类的as_view()⽅法"""⽤户中⼼""""""提供个⼈信息界⾯"""提示:LoginRequired(object)不依赖于任何视图类,复⽤性更强。
2025-01-18 18:45:25
764
原创 UaExpert客户端工具使用
服务器发现与连接自动发现:UaExpert可以自动扫描网络中的OPC UA服务器,并提供一个列表供用户选择。用户可以选择需要连接的服务器,输入或确认安全信息后点击“连接”按钮即可建立连接。手动连接:用户可以手动输入服务器的URI、端口号以及必要的安全配置信息来连接服务器。支持多种会话安全策略,如None等。节点浏览与操作节点浏览:UaExpert提供了一个树状结构的服务器视图,用户可以轻松浏览服务器中的所有节点。节点属性查询:用户可以查询任何选定节点的属性,如节点ID、节点类别、访问权限等。
2025-01-13 09:58:45
2066
原创 多并发发短信处理(头条项目-07)
管道pipeline可以⼀次性发送多条命令并在执⾏完后⼀次性将结果返回。pipeline通过减少客户端与Redis的通信次数来实现降低往返延时时间。实现的原理实现的原理是队列。Client可以将三个命令放到⼀个tcp报⽂⼀起发送。Server则可以将三条命令的处理结果放到⼀个tcp报⽂返回。队列是先进先出,这样就保证数据的顺序性。开源AMQP实现,Erlang 语⾔编写,⽀持多种客户端分布式、⾼可⽤、持久化、可靠、安全⽀持多种协议适⽤于多系统之间的业务解耦的消息中间件。
2025-01-12 00:11:08
850
原创 图片和短信验证码(头条项目-06)
图形验证码视图# views.py视图⽂件pass"""短信验证码"""""":param reqeust: 请求对象:param phone: ⼿机号"""pass4.3 知识要点保存短信验证码是为注册做准备的。为了避免⽤户使⽤图形验证码恶意测试后端提取了图形验证码后,⽴即删除图形验证码。Django不具备发送短信的功能,所以我们借助第三⽅的互亿⽆线短信平台来帮助我们发送短信验证码。互亿⽆线官⽹⽬前注册可免费使⽤50条短信验证码。
2025-01-11 22:57:48
1219
2
原创 用户注册模块用户校验(头条项目-05)
状态保持将通过认证的⽤户的唯⼀标识信息(⽐如:⽤户ID)写⼊到当前浏览器的 cookie 和服务端的 session中。请求⽅式选项⽅案请求⽅法GET请求地址/phones/(?
2025-01-11 21:26:53
934
原创 用户注册模块创建用户(头条项目-04)
⽤户注册路由# 项⽬根路由)),# ⽤户模块⼦路由Django⾃带AbstractUser⽤户模型类中没有⼿机号字段。verbose_name='⼿机号')verbose_name = '⽤户表'对于接⼝的设计,我们要根据具体的业务逻辑,设计出适合业务逻辑的接⼝。设计接⼝的思路:分析要实现的业务逻辑:明确在这个业务中涉及到⼏个相关⼦业务。将每个⼦业务当做⼀个接⼝来设计。分析接⼝的功能任务,明确接⼝的访问⽅式与返回数据:请求⽅法(如GET、POST、PUT、DELETE等)。
2025-01-04 23:20:23
990
原创 rancher 操作参考 【待优化】
rancher 操作参考 Rancher2.8.5操作手册(持续更新)_rancher 2.8-CSDN博客
2025-01-02 17:47:57
315
线性模型训练问题111111
2023-09-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人