自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 【实例分割】Mask2Former一文读懂!

而Mask2Former参考了Detr的做法,将这些二值mask用一组C维的特征向量来表示(object query),这样就可以用transformer decoder,通过一组固定的query来进行训练。一方面是使用了新的学习率调整策略,即基于梯度动量的学习率调整策略,可以更好地控制学习率的大小和梯度的变化,从而提高训练的稳定性和收敛速度;在Mask2Former网络中,Mask Attention模块的作用是通过注意力机制来学习当前位置与其他位置之间的依赖关系,同时考虑输入序列中的掩码信息。

2025-04-21 17:41:39 812

原创 一文看懂深度学习【白话解释+8个优缺点+4个典型算法】

随着警察和小偷之间的这种「交流」与「切磋」,小偷们都变得非常谨慎,他们有着极高的偷窃技巧,表现得跟普通群众一模一样,而警察们都练就了「火眼金睛」,一旦发现可疑人员,就能马上发现并及时控制——最终,我们同时得到了最强的小偷和最强的警察。根据不同任务的需要,水管网络的层数、每层的调节阀数量可以有不同的变化组合。下一步,学习“申”字时,我们就用类似的方法,把每一张写有“申”字的图片变成一大堆数字组成的水流,灌进水管网络,看一看,是不是写有“申”字的那个管道出口流水最多,如果不是,我们还得再调整所有的阀门。

2025-04-21 17:31:11 934

原创 机器学习教程(非常详细)从零基础入门到精通,看完这一篇就够了

从范围上来说,机器学习跟模式识别,统计学习,数据挖掘是类似的,同时,机器学习与其他领域的处理技术的结合,形成了计算机视觉、语音识别、自然语言处理等交叉学科。同时,我们平常所说的机器学习应用,应该是通用的,不仅仅局限在结构化数据,还有图像,音频等应用。这些是 Python和机器学习的6大库。“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导 “预测”。其实,机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识别,自然语言处理等领域有着很深的联系。

2025-04-21 17:16:08 818

原创 一文读懂RNN&LSTM

在左边部分中,是神经网络的输入,是输入层到隐藏层之间的权重矩阵,是记忆单元到隐藏层之间的权重矩阵,是隐藏层到输出层之间的权重矩阵,是隐藏层的输出,同时也是要保存到记忆单元中,并与下一时刻的一起作为输入,是神经网络的输出。循环神经网络的记忆单元会保存时刻时循环层(既图中的隐藏层)的状态,并在时刻,将记忆单元的内容和时刻的输入一起给到循环层。要注意的是,在计算时,每一步使用的参数U 、 W 、 b U、W、bU、W、b都是一样的,也就是说每个步骤的参数都是共享的,这是RNN的重要特点,一定要牢记。

2025-04-19 15:15:59 1227

原创 Transformer模型详解(原理版+图解版+实战版)

第一步:是 Decoder 的输入矩阵和 Mask 矩阵,输入矩阵包含 "<Begin> I have a cat" (0, 1, 2, 3, 4) 五个单词的表示向量,Mask 是一个 5×5 的矩阵。第一个 Encoder block 的输入为句子单词的表示向量矩阵,后续 Encoder block 的输入是前一个 Encoder block 的输出,最后一个 Encoder block 输出的矩阵就是编码信息矩阵 C,这一矩阵后续会用到 Decoder 中。

2025-04-19 15:06:37 774

原创 图神经网络(GNN)最简单全面原理与代码实现

图神经网络综合上面所有的内容,最重要的是以下两点:①不同GNN的本质区别是他们的消息传递机制不同,如GCN/GraphSAGE/GIN/GAT等等,只需要修改层的名称即可,目前已经达到了高度的集成化,不需要进行手撸,除非你的研究需要。Output层的输入不一样。●对于节点层面的任务而言可以直接self.conv = GCNConv(16, dataset.num_classes) ————这是直接把任务融合到卷积层也可以在卷积获取特征之后,后面加几个线性层●对于边层面的任务而言。

2025-04-19 14:54:13 1209

原创 一文读懂什么是智能体?

例如,自主智能体(Autonomous Agents)是一类能够自主决策和行动的智能体,它们可以在没有人类干预的情况下,根据预设的规则和目标,独立地完成任务。以智能音箱为例,亚马逊的Echo和谷歌的Home等智能音箱,通过语音识别和自然语言处理技术,能够响应用户的语音指令,控制家中的各种智能设备,如灯光、空调、电视等。智能体的实现方法主要依赖于先进的算法和模型,这些算法和模型使得智能体能够理解和处理复杂的环境信息,从而做出合理的决策。通过与其他实体的交互,智能体可以更好地理解环境,并做出更加明智的决策。

2025-04-18 16:39:33 1325

原创 从入门到精通UNet: 让你快速掌握图像分割算法

数据分析:对于UNet算法的输入数据和标签数据,你可以计算一些统计信息,如平均值、方差、最小值、最大值等,以了解数据的分布和范围。UNet的设计思想是通过编码器逐渐提取丰富的低级特征和高级特征,然后通过解码器逐渐恢复分辨率,并将低级特征和高级特征进行融合,以便获取准确且具有上下文信息的分割结果。下采样模块(Downsampling Block):由一系列卷积层(通常是卷积、批归一化和激活函数的组合)和池化层(如最大池化或步长卷积)组成,用于逐渐减小特征图的尺寸和通道数。

2025-04-18 16:31:42 817

原创 一文读懂无人驾驶技术L0-L5分级

两者的不同点则有三个:其一,SAE标准下将AEB等安全辅助功能和非驾驶自动化功能都放在0级,称为无驾驶自动化,中国版标准则叫做应急辅助,驾驶员能够掌握驾驶权,系统可感知环境,并提供报警、辅助或短暂介入驾驶,作为一个安全的基础分支,和非驾驶自动化功能分开,更加便于理解;该级别车辆可以在某些条件下进行自动驾驶,汽车能够在某个特定的驾驶交通环境下让驾驶员完全不用控制汽车,而且可以自动检测环境的变化以判断是否返回驾驶员驾驶模式,驾驶员无需一直对系统进行监视,但如果有需要的话,驾驶员可以接管汽车控制。

2025-04-18 16:22:58 518

原创 一文带你HuggingFace快速入门!

可以看到,我们得到的是bert输出的隐层信息,我们可以将该隐层信息输入到一个线性层进行情感分类,然后进行损失函数计算,进而反向传播更新参数即可。1. 从原有模型中拿出主干部分(backbone)1. 然后接上自己的下游任务,构建成新的模型1. 开始训练 这里我以bert-base-uncased模型作为例子,进行一次模型参数更新操作,假设我的任务是一个二分类的情感分类问题。bert-base-uncased的任务是Fill-Mask,也就是填空任务,而我们的任务是情感分类,所以我们要把原本的分类器给去掉。

2025-04-17 16:13:55 723

原创 推荐收藏加学习!一文掌握7种【大模型微调】的方法

这种方法的优势在于不需要调整模型的所有权重,而是通过在输入中添加前缀来调整模型的行为,从而节省大量的计算资源,同时使得单一模型能够适应多种不同的任务。与传统的微调范式不同,前缀调整提出了一种新的策略,即在预训练的语言模型(LM)输入序列前添加可训练、任务特定的前缀,从而实现针对不同任务的微调。直观上,大型模型微调即是向模型“输入”更多信息,对模型的特定功能进行“优化”,通过输入特定领域的数据集,使模型学习该领域知识,从而优化大模型在特定领域的NLP任务中的表现,如情感分析、实体识别、文本分类、对话生成等。

2025-04-17 15:59:37 823

原创 【AI开源项目】LangChain (一)一文让你知道什么是LangChain!

LCEL 的设计理念是提供一个强大而灵活的方式来组合不同的组件和服务,从而创建复杂的工作流程。LangChain 是一个强大的大语言模型开发框架,能够将 LLM 模型(如对话模型、嵌入模型等)、向量数据库、交互层 Prompt、外部知识和代理工具整合在一起,从而自由构建 LLM 应用。LCEL 不仅支持简单的链,还可以构建更复杂的链,例如结合向量数据库进行检索增强的生成(RAG)查询。这个链将用户的输入传递给提示模板,模板生成的提示再传递给模型进行处理,最后由输出解析器将模型的输出转换为最终结果。

2025-04-17 15:46:26 500

原创 一文搞懂时间序列数据与时间序列预测模型

趋势,或者说斜率的定义很简单:b = Δ y / Δ x b=Δy/Δxb=Δy/Δx,其中Δ x ΔxΔx为两点在x坐标轴的变化值,所以对于一个序列而言,相邻两个点的Δ x = 1 Δx=1Δx=1,因此b = Δ y = y ( x ) − y ( x − 1 ) b=Δy=y(x)-y(x-1)b=Δy=y(x)−y(x−1)。如果我们这时用之前的简单平均法,就得使用所有先前数据的平均值,但在这里使用之前的所有数据是说不通的,因为用开始阶段的价格值会大幅影响接下来日期的预测值。

2025-04-16 17:14:25 217

原创 基于Python实现的医疗知识图谱的知识问答系统

除此之外,我们可以考虑一下,在现实世界里,我们除了需要描述事物之间的关系,有时候我们还需要描述事物本身具备的一些特征,比如"小明是一个大学生",“小明发表了10篇论文”、“小明有2台汽车”,对于这种情况,就要考虑另一种类型的节点,也就是属性,属性可以分为对象属性和数据属性,在"小明是一个大学生"中,“大学生"就是一个对象属性节点,边可以是"当前学历”,在"小明发表了10篇论文"中,“10"是一个数据属性,边可以是"已发表论文数”。当然概念的东西简单了解一下就好,实际上看图更容易理解。

2025-04-16 16:55:09 1186

原创 什么是大模型?一文带你读懂大模型的基本概念!

大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。而当模型的训练数据和参数不断扩大,直到达到一定的临界规模后,其表现出了一些未能预测的、更复杂的能力和特性,模型能够从原始训练数据中自动学习并发现新的、更高层次的特征和模式,这种能力被称为“涌现能力”。ChatGPT对大模型的解释更为通俗易懂,也更体现出类似人类的归纳和思考能力:大模型本质上是一个使用海量数据训练而成的深度神经网络模型,其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类的智能。

2025-04-16 16:38:11 1212

原创 【知识图谱】 一个有效的知识图谱是如何构建的?

就鲍立飞而言,构建本体的目的是识别、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的对象模型,并从不同层次的形式化模式上给出了这些对象和对象间相互关系的明确定义。本体描述了知识图谱的概念模式,同时知识图谱在本体的基础上进行了丰富和扩充,而知识图谱则是在本体的基础上,增加了更加丰富的关于实体的信息。在构建行业知识图谱的本体模型时,通常需要借助领域专家知识来引导构建本体模型,才能保证知识图谱的质量,之后的知识计算,知识推理才能更好的发挥作用。因此,知识融合的关键任务在数据层的融合。

2025-04-15 17:23:11 1384 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除