- 博客(267)
- 资源 (70)
- 收藏
- 关注

原创 扩散模型在图像生成中的应用:从真实样例到逼真图像的奇妙转变
扩散模型是深度学习中一种神奇的模型,它就像是一位魔术师,通过不断添加噪声来让图像变得越来越神奇。生成器G就像一个魔法师,将噪声和输入变成令人惊叹的图像;判别器D则像一个挑剔的观众,对魔术表演进行评判。扩散模型不仅在图像生成方面表现出色,在其他领域也有广泛应用,真是让人大开眼界!
2023-09-16 00:44:32
7661
7

原创 机器故障预测:未来24小时的决胜时刻!!!
预测机器故障是保证生产安全和效率的重要任务。随着人工智能和大数据技术的快速发展,利用这些技术进行机器故障预测已经成为一种趋势。本文将探讨如何利用机器学习算法和实时监控数据来预测未来24小时内可能发生的机器故障,并提出了一种基于深度学习的故障预测模型。该模型能够自动检测和分析各种机器参数和传感器数据,识别出异常模式并预测机器故障的发生。通过实时监测和快速响应,这种故障预测模型能够帮助企业及时发现和解决机器故障,提高生产效率和安全性。
2023-09-14 13:22:17
1552

原创 MemSeg:一种差异和共性来检测图像表面缺陷的半监督方法
本文认为人为创建类内差异和保持类内共性可以帮助模型实现更好的缺陷检测能力,从而更好地区分非正常图像。如图一所示。差异(differences):MemSeg引入人工模拟的异常图像在训练阶段使模型能够区分正常和异常的图像,减轻了半监督学习只能用正常样本进行训练的不足,然后在推理阶段可以直接输入图像无需做任何后处理。共性(commonalities):MemSeg引入了一个记忆池来记录正常样本的通用模式,在训练和推理阶段,比较输入图像和记忆池中的样本之间的差异,为异常区域的定位提供有用的信息。
2023-08-21 23:10:31
4081
7

原创 Pytorch——momentum动量
一、Momentum:(动量,冲量):结合当前梯度与上一次更新信息,用于当前更新;二、Momentum的作用?主要是在训练网络时,最开始会对网络进行权值初始化,但是这个初始化不可能是最合适的;因此可能就会出现损失函数在训练的过程中出现局部最小值的情况,而没有达到全局最优的状态。momentum的出现可以在一定程度上解决这个问题。动量来源于物理学,当momentum越大时,转换为势能的能量就越大,就越有可能摆脱局部凹区域,从而进入全局凹区域。momentum主要是用于权值优化。没引入momen
2020-08-25 11:38:19
20605
5

原创 Pytorch-优化器optimizer
一、优化器:optimizer管理并更新模型中可学习参数的值,使得模型输出更接近真实标签 ;导数:函数在指定坐标轴上的变化率;方向导数:指定方向上的变化率;梯度:一个向量,方向为方向导数,取得最大值的方向;梯度下降法的计算过程就是沿梯度下降的方向求解极小值,也可以沿梯度上升方向求解最大值。参考知乎优化器的讲解,图片也是来自这里!图1.梯度下降法二、优化器基本属性defaults:优化器超参数 state:参数的缓存,如momentum的缓存...
2020-08-24 22:48:32
1872

原创 Pytorch-18种经典的损失函数
一、18种损失函数损失函数:衡量模型输出与真实标签的差异;目标函数 = 代价函数 + 正则化项(L1或者L2等,惩罚项)1、nn.CrossEntropyLoss(交叉熵损失)(1)什么是熵?:熵是信息论中最基本、最核心的一个概念,它衡量了一个概率分布的随机程度,或者说包含的信息量的大小。具体公式推导可以参考这篇博主的讲解:一文搞懂交叉损失,讲解浅显易懂!(2)功能: nn.LogSoftmax ()与nn.NLLLoss ()结合,进行交叉熵计算 nn.C..
2020-08-11 20:14:16
11831

原创 Pytorch-池化、线性、激活函数层
1. 池化层——Pooling layer2. 线性层——Linear layer3. 激活函数层——Activation layer1、池化层——Pooling layer池化运算:对信号进行 “收集”并 “总结”,类似水池收集水资源,因而得名池化层“收集”:多变少 “总结”:最大值/平均值最大值池化:import osimport torchimport randomfrom PIL import Imageimport numpy as npimport
2020-08-07 18:27:21
1391

原创 Pytorch-卷积层及其操作
卷积层1、1d/2d/3d(1)卷积运算:卷积核在输入信号(图像)上滑动,相应位置上进行乘加(2)卷积核:又称为滤波器,过滤器,可认为是某种模式,某种特征。(3)卷积过程类似于用一个模版去图像上寻找与它相似的区域,与卷积核模式越相似,激活值越高,从而实现特征提取。(4)AlexNet卷积核可视化,发现卷积核学习到的是边缘,条纹,色彩这一些细节模式卷积操作:卷积维度:一般情况下,卷积核在几个维度上滑动,就是几维卷积1d卷积2d卷积:https://mlnotebook.github.
2020-08-07 18:09:13
1570
1

原创 nn.Module创建模型
目录:网络模型创建 nn.Module属性1、网络模型创建使用nn.ModuleLeNet网络模型结构:nn.Module总结一个module可以包含多个子module; 一个module相当于一个运算,必须实现forward()函数; 每个module都有8个字典管理它的属性;Pytorch代码实现:import torch.nn as nnimport torch.functional as F# LeNet网络构建class LeNet(nn.
2020-08-06 15:34:44
627

原创 堆排序
一、堆排序堆实际上就是一个完全二叉堆,它分为两个类型:1、最大堆:任意的父节点的值都大于等于它左右孩子节点的值。2、最小堆:任意的父节点的值都小于等于它左右孩子节点的值。二叉堆的根节点叫做堆顶。根据最大堆和最小堆的特点,可以得出最大堆的顶点是整个堆中的最大元素,最小堆中的顶点是整个堆中最小的元素。最大堆满足:parent>= 2*parent+1 (左节点) && parent >= 2*parent+2(右节点)最小堆满足:parent <..
2020-07-31 12:10:26
292

原创 如何快速理解快速排序及C++、python代码实现?
1、快速排序对于给定的一个数列,首先选择一个基准元素;(这个值随意选择!) 将数列中的所有元素和这个基准元素进行比较,大于基准的数就放在基准的右边,小于基准的值就放在左边; 然后将基准值左右两边的子列看作两个新的数列,然后再对新的子数列进行重复上述1,2操作;两种方法:这两种方法都差不多,最低还是要掌握一个方法!1、填坑法:参考:https://www.cnblogs.com/curo0119/p/8588565.html2、指针交换法:参考:https://www.pianshen.co
2020-07-31 10:59:22
270

原创 Pytorch逻辑回归
逻辑回归是线性的二分类模型模型表达式:f(x)指的是Sigmoid函数,也称为Logistic函数;通过阈值0.5将所有值表示为0或者1,代表两个类别线性回归是分析自变量x与因变量y(标量)之间关系的方法 逻辑回归是分析自变量x与因变量y(概率)之间关系的方法 直接来代码:import torchimport torch.nn as nnimport matplotlib.pyplot as pltimport numpy as nptorch.ma.
2020-07-24 15:21:51
546

原创 autograd自动求导-Pytorch
1、torch.autograd.backward功能:自动求取梯度Tensor:用于求导的张量,如:lossretain_graph:保存计算图create_graph:创建导数计算图,创建导数计算图,用于高阶求导grad_tensors:多梯度权重autograd:计算图与梯度求导2、torch.autograd.grad功能:求取梯度• outputs: 用于求导的张量,如 loss• inputs : 需要梯度的张量• create_graph : 创建
2020-07-24 15:02:17
407

原创 Pytorch-计算图和动态图机制
一、计算图和动态图1、计算图计算图是用于描述运算的有向无环图计算图的两个重要元素:结点(node)和边(edge)结点表示数据:如向量、矩阵、张量边表示运算:一些数学操作2、叶子结点叶子结点:用户创建的结点称为叶子结点,如x,wtorch.tensor.is_leaf:用来查看是否为叶子结点叶子结点的用处:在反向传播之后,只有叶子结点的梯度会被保留,其他中间结点的梯度数据会被释放,以节省内存若要保存某特定结点的梯度,可以在运行反向传播函数前,补上一句tensor.retain_grad(
2020-07-23 17:52:54
555

原创 Pytorch-张量创建与线性回归
1、张量创建import torch# 设置返回随机种子的数量int型a = torch.manual_seed(1)print(a)help(torch.manual_seed)<torch._C.Generator object at 0x0000025223508DB0>Help on function manual_seed in module torch.random:manual_seed(seed) Sets the seed for generatin
2020-07-23 17:47:37
342

原创 第一章:张量的简介与创建
文章目录1、张量:就是一个多为数组(三维的)2、张量的创建2.1 直接创建张量2.2 依据数值创建2.3 依据概率创建1、张量:就是一个多为数组(三维的)一维的就是一个标量二维的就是一个数组Variable是torch.autograd中的数据类型主要用于封装Tensor,进行自动求导;data:被包装的Tensor;grad:data的梯度;grad_fn:创建Tensor的function,是自动求导的关键;用于对记录对数据使用了什么操作;requires_grad:指示是否需要梯度;
2020-07-19 08:53:49
460

原创 End-to-End Learning of Deep Visual Representations for Image Retrieval
1、主要贡献:1、利用一个大规模并且嘈杂的地标数据集,然后开发一种自动清理方法,产生一个适合深度检索的训练集;2、我们建立在最近的R-MAC区域最大激活描述符(这个是在MAC的基础上提出的局部区域方法)描述符的基础上,说明它可以被解释为一个深度和可微的体系结构,并提出了改进来增强它;3、我们用Simaese体系结构来训练这个网络,然后用一个triplet loss整合三个流;R-MAC区域最大激活描述符:该方法计算了不同尺度下的多个图像区域的基于CNN的描述子,这些描述子被汇总成...
2020-07-15 20:04:34
1479

原创 AttributeError:ImageDataGenerator object has no attribute flow_from_dataframe
from keras_preprocessing.image import ImageDataGeneratorvalidation_generator = valid_datagen.flow_from_dataframe(val_data, directory='./tiny-imagenet-200/val/images/', x_col='Files',y_col='Class',ta.
2020-06-28 20:10:54
3666
2

翻译 DenseNet Models for Tiny ImageNet Classification(翻译+代码)
PS:个人学习记录;有问题请留言,看到会回复!谢谢!原文地址:https://arxiv.org/pdf/1904.10429摘要:本文提出了两种基于微型ImageNet数据集的图像分类模型。我们基于密接卷积网络的思想从无到有地建立了两个截然不同的网络。根据该数据集的图像分辨率,通过计算卷积层的接收场,设计了网络结构。我们还使用了一些与图像增强和循环学习率相关的非常规技术来提高模型的准确性。该网络在高约束和低计算资源下训练。我们的目标是达到60%的前1验证精度,并给出了结果和误差分析。1. 引.
2020-06-28 12:00:55
2089
1

原创 可视化一张图像的卷积神经网络的激活区域
可视化卷积神经网络的激活区域将图像的激活区域与原始图像进行比较,检查激活区域并发现网络学习的特征,发现较浅层中的通道学习颜色和边缘等简单特征,较深层中的通道学习复杂特征。下面都是基于matlab R2018b实现。1、加载预训练的网络和图像加载网络;我这里选择简单的alexnetnet = alexnet;% 读取图像im = imread('hehe.jpg');% 查看网络结构net.Layersalexnet的网络结构信息如下:ans = 25x1 Layer
2020-05-15 11:06:26
1230

原创 C++ Primer Plus (第六版)源代码
1、C++ primer source code链接:https://pan.baidu.com/s/108MKrf-miy4beBvg8lMpIQ&shfl=sharepset提取码:vxg22、C++相关中文电子书链接:https://pan.baidu.com/s/1mE5MzG7EVwSryAp-EiG2hA&shfl=sharepset提取码:yr6...
2019-10-22 15:51:40
5076
16

原创 C++ Primer Plus (第6版) 第5章课后编程题
1、输出区间的数之和#include <iostream>using std::cout;using std::endl;using std::cin;intmain (void) { int nLowerBound, nUpperBound; cout << "输入区间:"; cin >> nLowerBound >...
2019-10-22 14:46:28
374

原创 C++ Primer Plus(第六版) 第4章 课后编程题
1、输出下列的信息;名字包含多个字母;程序中将下调整成绩,向上调整一个字母What is your first name? Betty Sue What is your last name? Yewe What letter grade do you deserve? B What is your age? 22 Name: Yewe, Betty Sue Gra...
2019-10-20 10:13:02
458

原创 如何使用VGG16提取某层的特征?
1、VGG16网络结构图VGG16结构为:卷积层 + 全连接层=13 + 3 = 161、卷积层:由上图可知分为5个部分共13层,即conv1~conv52、三个全连接层,即fc6、fc7、fc8这个VGG16网络就是基于ImageNet数据集来的;它的数据集的类数为1000类;对应fc8层的输出1000fc6和fc7的输出维数都为4096;因此如果要训练自己的数据集;fc8层的...
2019-10-13 22:38:30
11239
9

原创 Tkinter 编程入门
Tkinter 编程1、Tkinter 是内置到 python 的安装包中、只要安装好 Python 之后就能 import Tkinter 库;基本的GUi都可以实现,但是如果你是要实现专业的;如果真的需要使用Python开发GUI应用,wxPython、PyQt、PyGTK等模块都是不错的选择。2、Tkinter的提供各种控件,如按钮,标签和文本框;这些控件通常被称为控件或者部件。如...
2019-10-13 10:33:48
557

原创 水仙花数、正整数的反转、百钱百鸡问题、花旗骰游戏、斐波那契数列、10000以内的完美数、100以内的所有素数
针对:变量、类型、运算符、表达式、分支结构、循环结构 的练习ps:练习内容来源于Github:python-100-Day1水仙花数 正整数的反转 百钱百鸡问题 花旗骰游戏 斐波那契数列 10000以内的完美数 100以内的所有素数1、水仙花数 水仙花数也被称为超完全数字不变数、自恋数、自幂数、阿姆斯特朗数,它是一个3位数,该数字每个位上数字的立方之和正好等...
2019-09-28 17:18:46
1555
1

翻译 C++ 结构体定义和使用
将结构体的声明放在main()函数中,紧跟在开始括号的后面,内部声明只能被该声明所属的函数使用,通常应使用外部声明,便于所有函数都可以使用这种类型的结构;同时可以使用赋值运算符(=)将结构体赋给另一个同类型的结构体(结构体中的每个成员都设置为另一个结构体中相应成员的值,称为成员赋值)结构数组:元素为结构的数组 (结果被括在花括号中、用逗号分割的值列表,其中每个值本身又是一个被括在花括号中、用逗号分割的值列表)将结构体的声明放在main()的前面,外部声明可以被后面任何函数使用。创建struct结构。
2019-08-01 16:41:06
12965
5

原创 EOFError: Compressed file ended before the end-of-stream marker was reached
出现这种问题不要慌!在stackoverflow上看到的解释:This is because for some reason you have an incomplete download for the MNIST dataset因为MNIST数据集是运行时下载的,很可能是在下载MNIST数据时,由于网络问题, 下载不全。我们可以到自己的datasets文件夹下找到未下载完全的数据集,然...
2019-04-14 10:15:58
20919
16

原创 [keras]如何解决MNIST 数据集下载不了的问题
keras 源码中下载MNIST的方式是 path = get_file(path, origin='https://s3.amazonaws.com/img-datasets/mnist.npz'),数据源是通过 url = https://s3.amazonaws.com/img-datasets/mnist.npz 进行下载的。但是在最近的学习过程中,如果直接从官网的链接下载的话会非常的慢,...
2019-04-11 17:37:14
5447
8

原创 matlab--GUI 如何实现打开图片
在命令行窗口输入guide会自动弹出GUI的初始化状态,选择自己默认的状态,其他的也可以!然后简单绘制一个座标轴用于显示你要的图片!我的简单的GUI如下!当你编辑好界面后,在对应的.m文件里你会看到一堆函数,一开始做学习做简单界面的功能的时候,并不需要理会这些函数究竟写了什么,只需要明白你实现的控件对应的回调函数,也就是Callback函数,实现的功能代码写进函数里就行。而CreateFc...
2019-04-09 10:35:02
21717
5

原创 微信机器人
首先登陆图灵机器人注册一个属于自己的微信机器人,注册成功后可查看apikey以供后面使用!我是在pycharm中使用的,导入相应的模块即可!下面直接看代码吧!代码很简洁!# 源代码如下:# wechat autoreplyimport itchatimport requestsimport re# 抓取网页def getHtmlText(url): try: ...
2019-04-08 09:40:08
3221

原创 如何可视化卷积神经网络特征(基于matlab R2018b)
下面我就简单的说一下,也便于理解!一、先加载预先训练好的网络模型(这里呢,先以Alexnet为例,其他网络模型的应用方法都是一样的!)net = alexnet; 在matlab命令行窗口输入,如果你之前没有加载过Alexnet,也不用担心,matlab还是很人性化的,按上面的指令进行添加即可!接下来呢,我们可以看一下Alexnet的整体框架,在matlab中都是封装好的,可以借助一些...
2019-03-14 11:41:31
9081
27

原创 基于vgg16的图像检索系统(首先要先熟悉VGG16模型)
主要的流程如下:1. 首先要熟悉vgg16模型;(推荐这位博主的文章介绍,讲的比较清楚!)2. 其次就是熟悉图像检索的流程;(基于内容的图像检索技术综述-CNN 方法)以上就是我制作这个系统的全部过程;还有就是可以看一下相关的论文去学习图像检索方面的知识还有就是可以看一下相关的论文去学习图像检索方面的知识。本人是个刚接触matlab的小白,所以两种方式都采用了。第一步:首先我是看了网上其他...
2019-03-06 20:13:52
8603
10

原创 matlab深度学习——【卷积神经网络】手写字的识别
这里主要是基于卷积神经网络的手写字的识别,我是用matlab做的,如果有对卷积神经网络不太熟悉的伙伴可以搜下,网上资源比较多,我这里就不多说了,直接上代码了。%%准备工作空间clcclear allclose all%%导入数据digitDatasetPath = fullfile(’./’,’/HandWrittenDataset/’);imds = imageDatastor...
2019-03-04 21:16:39
19741
160
原创 Windows系统下MinerU的CUDA加速配置指南
MinerU是一款高效的文档解析工具,支持通过CUDA加速显著提升处理速度。本指南详细说明如何在Windows系统中配置CUDA环境,并启用MinerU的GPU加速功能,帮助用户充分利用NVIDIA显卡的计算能力,优化复杂文档的解析效率。
2025-04-30 16:03:58
787
原创 智能文档挖掘新纪元:MinerU如何突破内容提取的界限
MinerU是一款开源高精度文档解析工具,通过多模块协同与PDF-Extract-Kit模型库,突破复杂布局、公式及表格的提取瓶颈,显著提升多样化文档内容的结构化提取质量,性能超越主流开源方案。
2025-04-30 15:20:56
788
原创 Linux环境下通过本地安装包配置Java环境的详细指南
在Linux环境下,通过本地安装包(如.tar.gz或.tar.bz2)安装和配置Java环境(JDK)的步骤相对简单,但需要手动设置环境变量。
2025-04-23 10:24:00
276
原创 SmolDocling:一种超紧凑的视觉语言模型,用于端到端多模态文档转换
SmolDocling 是一个超紧凑型的视觉-语言模型,用于端到端的文档转换。它通过生成一种名为DocTags 的新标记格式,捕捉文档中所有元素的内容、结构和位置。SmolDocling 在多种文档类型(如商务文档、学术论文、技术报告等)上表现出稳健的性能,能够准确重现代码、表格、公式、图表等复杂元素。与更大规模的模型相比,它在性能上具有竞争力,同时显著降低了计算需求。此外,该研究还贡献了多个公开数据集,用于支持图表、表格、公式和代码识别等任务。
2025-04-10 23:11:10
1484
原创 Mistral OCR:重新定义文档理解的下一代 OCR 技术
在数字化时代,文档处理和理解是企业、科研机构以及个人工作流程中的重要环节。然而,传统的光学字符识别(OCR)技术往往难以应对复杂文档中的多语言、多模态内容。近日,法国 AI 明星创企 Mistral AI 推出了一款名为 Mistral OCR 的光学字符识别 API,以其卓越的性能和广泛的应用场景,被誉为“世界最强 OCR 模型”。
2025-04-08 20:01:46
778
原创 YOLO 标注可视化
在目标检测任务中,数据集的质量直接影响模型的性能。图像文件:存储训练图像。标注文件:存储每个图像中目标的标注信息,格式为,其中坐标和尺寸是归一化的。为了确保标注的正确性,我们需要将标注框绘制在图像上并可视化检查。本文将介绍如何使用 Python 实现这一功能。# 定义路径:训练图像所在的目录。:训练图像对应的 YOLO 标注文件所在的目录。通过本文的代码,我们可以方便地可视化 YOLO 数据集中的图像及其标注框。这不仅有助于检查数据集的质量,还能帮助我们更好地理解数据分布和标注情况。多线程处理。
2025-03-25 14:14:14
902
Large-Scale Image Retrieval with Attentive Deep Local Features
2020-12-24
基于角点的动态加权多特征融合图像检索方法.pdf
2020-12-24
particular object retrieval with integral max-pooling of cnn activations.pdf
2020-12-17
A_Baseline_for_Visual_Instance_Retrieval_with_Deep.pdf
2020-12-17
Class-Weighted Convolutional Features for Visual Instance Search.pdf
2020-12-10
tensorflow-2.3.1-cp37-cp37m-win_amd64.whl
2020-12-10
Unsupervised Part-based Weighting Aggregation
2020-12-10
tutorials.zip
2020-12-08
手写数字识别数据集(基于matlab实现)
2020-10-28
Corel1K.zip
2020-08-03
Image Retrieval via Decoupling Diffusion into Online and Offline Processing
2019-08-29
Image Retrieval using CNN and Low-level Feature Fusion
2019-07-01
SmolDocling-256M-preview的权重文件,包含调用工具
2025-04-08
机器故障预测这个竞赛的焦点是预测机器是否会在未来24小时内故障 数据包括与机器性能相关的各种特征,例如温度、振动
2023-12-19
YOLOv7格式的EDS数据集,直接放在yolov7的目录下即可训练
2022-08-06
基于tensorflow2.4.0版本的transformer computer vision 训练数据集是cifar10
2022-03-13
使用windows中的fonts解决ubuntu中的乱码情况
2021-12-28
Joint Feature and Labeling Function Adaptation for Unsupervised Domain Adaptation.pdf
2021-09-28
浅析软件工程对人工智能的影响.pdf
2021-04-06
CNN-Prediction-Based-Reversible-Data-Hiding-main (1).zip
2021-04-06
Aggregating Deep Convolutional Features for Image Retrieval.pdf
2021-03-09
Fast object retrieval using direct spatial matching.pdf
2020-12-25
Deep Image Retrieval:Learning global representations for image search
2020-12-25
Google Landmarks Dataset v2 A Large-Scale Benchmark for Instance-Level Recogniti
2020-12-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人