
计算机视觉
文章平均质量分 77
计算机视觉
mind_programmonkey
好久没上线了~,有问题私信哈,每周末尽量抽时间回答问题哈
展开
-
【语义分割专题】语义分割相关工作--Attemtion U-Net
Attention U-Net: Learning Where to Look for the PancreasAttention注意力机制,把注意力集中到对特定任务有用的显著特征,抑制输入图像中的不相关区域。在级联神经网络中,需要明确的外观组织/器官定位模块,而使用Attention就不需要了。提出了grid-base gating,使attention coefficients更具体到局部区域;在一个feed-forward CNN模型中使用soft-attention技术。提出的attenti原创 2021-10-19 14:42:17 · 1383 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--DANet
Dual Attention Network for Scene Segmentation提出了双重注意力网络(DANet)来自适应地集成局部特征和全局依赖。在传统的扩张FCN之上附加两种类型的注意力模块,分别模拟空间和通道维度中的语义相互依赖性。位置注意力模块通过所有位置处的特征的加权和来选择性地聚合每个位置的特征。无论位置如何,类似的特征都将彼此相关。通道注意力模块通过整合所有通道映射之间的相关特征来选择性地强调存在相互依赖的通道映射。将两个注意力模块的输出相加并加以进一步改进特征表示,这有助原创 2021-10-19 14:40:40 · 399 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--DeepLab系列
DeepLab系列:DeepLabV1贡献:首次把空洞卷积引入图形分割领域。基本内容:基于VGG16去掉最后两个池化层改为卷积层(控制分辨率不要太小)去掉全连接层(保留最后一个用于softmax分类)后三个卷积改为空洞卷积(保证感受野与去掉池化层前接近)对结果上采样后用CRF细化分割效果。DeepLabv2贡献:引入带空洞卷积的空间金字塔池化(ASPP)基本内容:基础网络由VGG16->ResNet多尺度空洞卷积并行采用多项式lr衰减与v1一样,对结果上采样后用CR原创 2021-10-19 14:39:12 · 2930 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--Multi-Scale Context Aggregation by Dilated Convolution
Multi-Scale Context Aggregation by Dilated ConvolutionYu, Fisher and Vladlen Koltun. “Multi-Scale Context Aggregation by Dilated Convolutions.” CoRR abs/1511.07122 (2016): n. pag.本文主要是对空洞卷积(扩张卷积)以及感受野的理解dilated convolution是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出原创 2021-10-19 14:36:39 · 809 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--PSPNet
Pyramid Scene Parsing Network论文在结构上提供了一个pyramid pooling module,在不同层次上融合feature,达到语义和细节的融合。PSPNet通过引入空洞卷积来修改基础的ResNet架构,,特征经过最初的池化,在整个编码器网络中以相同的分辨率处理(原始图像的1/4),直到它到达空间池化模块。在ResNet的中间层引入辅助损失,以优化整体学习。在修改后的ResNet编码器顶部的空间金字塔池化聚合全局上下文。或许可以考虑在金字塔结构那里加一个SE模块原创 2021-10-19 12:45:57 · 682 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--ENet网络相关工作
ENet: A Deep Neural Network Architecture for Real-Time Semantic SegmentationPaszke, A., Chaurasia, A., Kim, S., & Culurciello, E. (2016). ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation. ArXiv, abs/1606.02147. # Initial原创 2021-10-19 12:42:51 · 610 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--Fully Convolutional DenseNet
The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation在本文中扩充了DenseNets,以解决语义分割的问题。在城市场景基准数据集(CamVid和Gatech)上获得了最优异的结果,没有使用进一步的后处理模块(如CRF)和预训练模型。此外,由于模型的优异结构,这个方根比当前发布在这些数据集上取得了最佳的网络参数要少得多。DenseNets背后的思想是让每一层以一种前馈的方式与所有层相原创 2021-10-19 12:40:59 · 1144 阅读 · 1 评论 -
【语义分割专题】语义分割相关工作--UNet网络介绍
U-Net: Convolutional Networks for Biomedical Image SegmentationU-Net架构包括一个捕获上下文信息的收缩路径和一个支持精确本地化的对称扩展路径。U-Net证明了这样一个网络使用非常小的图像可以进行端到端的训练,并在生物分割挑战赛中取得了比以前最好的方法。收缩路径由2个3 * 3的卷积组成,每个卷积后面跟的是RELU激活函数和一个进行下采样的2 * 2较大池化运算。扩张阶段包括一个特征通道的上采样。后面跟得上是2 * 2的转置卷积,它能够原创 2021-10-19 12:37:45 · 1055 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--SegNet
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image SegmentationSegNet新颖之处在于解码器对其较低分辨率的输入特征图进行上采样的方法。具体的说,解码器使用了在相应编码器的最好池化步骤中计算的池化索引来执行非线性上采样。这种房型消除了学习上采样的需要。经上采样后的特征图是稀疏的,因此随后使用可训练的卷积核进行卷积操作,生成密集的特征图。SegNet也没有全连接层。SegNet和FCN的思路相似,不同之处在于原创 2021-10-19 12:34:32 · 585 阅读 · 0 评论 -
【语义分割专题】语义分割相关工作--FCN网络介绍
Fully Convolutional Networks for Semantic Segmentation将当前分类网络(AlexNet,VGGNet和GoogleNet)修改为全卷积网络,通过对分割任务进行微调,将它们学习的表征转移到网络中。然后,定义了一种新的架构,将深度、粗糙的网络层的语义信息和浅的、精细的网络层的表征信息结合起来,来生成精确和详细的分割。即在上采样的每一个阶段通过融合(简单的相加)下采样阶段网络中的底层的更加粗糙但是分辨率更高的特征图进一步细化特征。https://arxiv.原创 2021-10-19 12:31:15 · 810 阅读 · 0 评论 -
【语义分割专题】语义分割前期预处理工作--数据处理
数据预处理马上毕业了,毕业之前将研究生阶段做过的一些工作做一些分享。本期将分享语义分割的一些前期预处理以及论文。1 数据增强1.1 几何增强原图:import cv2import matplotlib.pyplot as plt%matplotlib inlinefrom skimage import io# img = io.imread('image.jpg')# label = io.imread('label.jpg')img = cv2.imread('imag原创 2021-10-19 11:22:18 · 3066 阅读 · 0 评论 -
FFmpeg初遇见_基本命令
一、FFmpeg的故事1.FFmpeg是什么?从百度百科中来看,FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec,为了保证高可移植性和编解码质量,libavcodec里很多code都是从头开发的。官网:https://www...原创 2020-03-03 21:30:38 · 2757 阅读 · 0 评论 -
Python实现推流直播
Python实现推流直播首先给出展示结果,大体就是检测工业板子是否出现。采取检测的方法比较简单,用的OpenCV的模板检测。大体思路opencv读取视频将视频分割为帧对每一帧进行处理(opencv模板匹配)在将此帧写入pipe管道利用ffmpeg进行推流直播中间遇到的问题在处理本地视频时,并没有延时卡顿的情况。但对实时视频流的时候,出现了卡顿延时的效果。在一顿度娘操作之后,...原创 2019-10-24 21:50:59 · 21014 阅读 · 13 评论 -
计算机视觉
01 计算机视觉02 计算机视觉应用03 机器学习训练图像的流程04 深度学习图像识别流程05 卷积神经网络06 物体检测07 传统目标检测方法基于深度神经网络的目标检测...原创 2019-08-16 10:44:58 · 4925 阅读 · 0 评论 -
【实战】python以及opencv实现信用卡的数字识别
本项目利用python以及opencv实现信用卡的数字识别前期准备导入工具包定义功能函数模板图像处理读取模板图像 cv2.imread(img)灰度化处理 cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)二值化 cv2.threshold()轮廓 - 轮廓信用卡图像处理读取信用卡图像 cv2.imread(img)灰度化处理 cv2.c...原创 2019-08-15 18:53:38 · 6815 阅读 · 12 评论 -
08 计算机视觉-opencv直方图与傅里叶变换
# opencv图像读取的格式是BGR# matplotlib读取图像的格式是RGBimport cv2import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinedef cv_show(name,img): cv2.imshow(name,img) cv2.waitKey(0) cv2...原创 2019-08-13 21:28:19 · 800 阅读 · 0 评论 -
07 计算机视觉-opencv模板匹配
import cv2import numpy as npimport matplotlib.pyplot as plt%matplotlib inline模板匹配模板匹配和卷积原理很像,模板在原图像上从原点开始滑动,计算模板与(图像被模板覆盖的地方)的差别程度,这个差别程度的计算方法在opencv里有6种,然后将每次计算的结果放入一个矩阵里,作为结果输出。假如原图形是AxB大小,而模板...原创 2019-08-13 21:24:05 · 1490 阅读 · 1 评论 -
04计算机视觉-opencv图像梯度处理
import cv2import matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedef cv_show(name,img): cv2.imshow(name,img) cv2.waitKey(0) cv2.destroyAllWindows()1 图像梯度-Sobel算子img = ...原创 2019-08-13 21:10:47 · 552 阅读 · 0 评论 -
05计算机视觉-opencv边缘检测
Canny边缘检测使用高斯滤波器,以平滑图像,滤除噪声。计算图像中每个像素点的梯度强度和方向。应用非极大值(Non-Maximum Suppression)抑制,以消除边缘检测带来的杂散响应。应用双阈值(Double-Threshold)检测来确定真实的和潜在的边缘。通过抑制孤立的弱边缘最终完成边缘检测。1 高斯滤波器2 梯度和方向3 非极大值抑制...原创 2019-08-13 21:14:46 · 918 阅读 · 0 评论 -
06 计算机视觉-opencv图像金字塔与轮廓检测
import cv2import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinedef cv_show(name,img): cv2.imshow(name,img) cv2.waitKey(0) cv2.destroyAllWindows()1 图像金字塔高斯金字塔拉普拉斯金字塔...原创 2019-08-13 21:20:58 · 759 阅读 · 1 评论 -
03 计算机视觉-opencv图像形态学处理
# 先定义一个opencv展示函数import cv2import matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedef cv_show(name,img): cv2.imshow(name,img) cv2.waitKey(0) cv2.destroyAllWindows()1 形...原创 2019-08-13 21:04:42 · 624 阅读 · 1 评论 -
02 计算机视觉-opencv阈值与滤波处理
1 灰度图# opencv读取的格式是BGR# matplotlib读取的格式是RGBimport cv2import numpy as npimport matplotlib.pyplot as plt%matplotlib inlineimg = cv2.imread("cat.jpg")img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GR...原创 2019-08-13 20:54:35 · 727 阅读 · 3 评论 -
01 计算机视觉-opencv图像基本操作
计算机视觉-opencv图像基本操作1 数据读取-图像cv2.IMREAD_COLOR:彩色图像cv2.IMREAD_GRAYSCALE:灰度图像import cv2import matplotlib.pyplot as pltimport numpy as np%matplotlib inline#读取彩色图像img = cv2.imread("cat.jpg")im...原创 2019-08-13 20:49:14 · 1039 阅读 · 0 评论