echo_hao-CSDN博客

原创 Swin Transformer论文笔记

Swin Transformer: Hierarchical Vision Transformer using ShiftedWindows.动机：解决尺度问题和计算复杂度高的问题Shifted Window based MSA[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yICZTwa9-1626162828549)(https://github.com/haodongze/markdown4zhihu/blob/master/Data/%E8%A7%86%E8%

2021-07-13 17:02:53 487

原创 Transformer笔记

Attention Is All You NeedTransformer网络结构整个网络结构由encoder和decoder两个部分组成。网络的输入是n个不同的向量$ (x_1,…,x_n)$，将其输入到encoder模块，z = (z1,...,zn)(z_1,...,z_n)(z1,...,zn), 然后将 z 输入到decoder模块，每一次输出(y1,...,ym)(y_1,...,y_m)(y1,...,ym) 中的一个向量，最终得到整个网络的输出。 Enc

2021-05-17 17:14:13 243

原创基于物品的协同过滤算法(ItemCF)

2021-01-29 16:58:28 4382

原创【算法笔记】栈与队列互相实现（leetcode232，225）

用队列实现栈：class MyStack {public: /** Initialize your data structure here. */ queue<int> q1; queue<int> q2; MyStack() { } /** Push element x onto stack. */ void push(int x) { q2.push(x);//将新进来的元素放入辅助队列2

2021-01-27 10:42:14 142

原创【算法笔记】二叉树的非递归遍历(leetcode144，94，145）

前序遍历：/** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; * TreeNode *right; * TreeNode(int x) : val(x), left(NULL), right(NULL) {} * }; */class Solution {public: vector<int> preor

2021-01-27 10:09:14 130

原创 JDK安装教程

官网下载网址：https://www.oracle.com/java/technologies/javase-downloads.html点击JDK Download，然后去下载对应平台的合适的JDK版本。下载好jdk-15_windows-x64_bin.exe之后，运行程序，点击下一步。可以点击更改，改变安装路径。等待安装完成，然后开始配置环境变量。右击文件夹中的此电脑，选择属性进入。点击高级系统设置。点击环境变量。选中系统变量中的...

2020-10-07 13:24:20 424

原创 CSS中overflow用法

overflow 属性规定当内容溢出元素框时发生的事情。/* 默认值。内容不会被修剪，会呈现在元素框之外 */overflow: visible;/* 内容会被修剪，并且其余内容不可见 */overflow: hidden;/* 内容会被修剪，浏览器会显示滚动条以便查看其余内容 */overflow: scroll;/* 由浏览器定夺，如果内容被修剪，就会显示滚动条 */overflow: auto;/* 规定从父元素继承overflow属性的值 */overflow: i.

2020-08-15 11:18:09 318

原创 Ubuntu18.04源码编译安装gcc6.3.0（呕心沥血，各种坑）

由于需要在ubuntu18.04上用MATLAB2018b跑一个程序，需要gcc6.3.0编译相关代码，可是直接用apt-get install只能安装gcc6.5.0版本，所以需要用源代码编译。安装gcc之前要安装gmp，mpfr，mpc，isl这几个库，并且要卸载旧的gcc，然而我们需要在最后安装gcc之前再卸载旧的gcc，因为安装必需的库时需要旧的gcc。安装gmp在https:...

2019-12-18 09:55:47 4287 8

原创 KCF算法原理笔记

KCF算法全称是Kernelized Correlation Filters，是在2014年由Joao F. Henriques, Rui Caseiro, Pedro Martins, and Jorge Batista提出来的跟踪算法，这个算法不论是在跟踪效果还是跟踪速度上都有十分亮眼的表现。该算法主要使用循环矩阵对样本进行采集，使用快速傅里叶变换对算法进行加速计算。第一部...

2019-11-26 15:28:16 14662 1

原创 Learning the Model Update for Siamese Trackers论文笔记

Siamese方法通过提取当前帧的模板特征来定位下一帧的目标位置的方法来解决目标跟踪问题。一般来说，模板是前面图像帧的线性组合，导致随着时间的增加模板信息会有一个指数衰减。虽然这种更新方法已经提升了结果，但是它的简单性限制了通过学习更新可能获得的潜在效果。作者提出了用学习更新模板的方式来替代手工更新模板的方式。作者提出了一种叫UpdateNet的卷积神经网络方式，用之前积累的模板和当...

2019-09-09 16:37:41 1955 9

原创 ATOM: Accurate Tracking by Overlap Maximization论文笔记

文章提出了一个新的跟踪架构，包括专门的目标估计和分类部分。通过广泛的离线学习，高水平的知识被融合进目标估计中。目标估计部分被训练来预测目标和一个估计的bbox之间的重叠。通过仔细地整合特定目标信息，该方法达到了一个非常高的回归框精度。之后的分类部分被在线训练保证在干扰物存在的情况下的高分辨能力。整个网络包含两个模块：（1）离线学习的目标估计模块；（2）在线学习...

2019-08-22 18:01:50 362

原创 IoU-Net论文笔记

很多基于CNN的目标检测算法都依赖于回归框和非极大抑制来定位物体。虽然对于分类标签的概率自然地影响分类置信度，但是定位的置信度是缺失的。这就会使边界框在迭代回归中退化甚至在非极大值抑制期间被抑制。文章提出了IoU-Net来预测每个检测边界框和ground-truth的IoU。整个网络获得了边界框的置信度，这样可以改善非极大值抑制过程。而且，文章还提出了一种边界框优化方法。这种方法取得...

2019-08-22 16:06:32 491

原创 C-COT:Beyond Correlation Filters: Learning Continuous Convolution Operators for Visual Trackin论文笔记

文章主要提出了连续卷积算子操作，用一个隐式插值模型来形成一个在连续空间上的学习问题。下图中第一张图表示的是多分辨率的特征图，第二张图表示的是学习到的连续卷积算子，第三张图表示的是每层的置信分数，最后一张表示的是合并后的分数图，得到目标位置。学习连续卷积算子 (1)首先，在一维空间上介绍文章中的学习方法，然后在扩展到图片的二维空间上去。 g:R...

2019-08-20 16:15:24 1542

原创 End-to-end representation learning for Correlation Filter based tracking论文笔记

整体的网络结构类似于SiamFC中的结构。Fully convolutional Siamese networks 网络输入的是一张训练图片x’和一张待搜索图片z’，两张图片用卷积神经网络fρ进行处理，然后得到两张特征图，对两张特征图进行互相关运算。上面的公式相当于用模板图片x‘在z‘上进行搜索，目标是得到响应图的最大值，即目标所在的位置。用随机的图片...

2019-08-09 14:47:01 318

原创 Siamese Instance Search for Tracking论文笔记

SINT算法是Siamese跟踪的开山之作，首次开创性的将目标跟踪问题转化为一个patch块匹配问题，并用神经网络来实现。论文整体模型图下图所示：网络结构由两部分组成，孪生网络分别处理两个输入，用AlexNet或VGGNet进行特征提取，其中为了可以更准确地定位，该网络在设计时几乎不用最大池化层，因为最大池化只会保留邻域中最大的数，会极大降低空间分辨率，它的一个最大优点是引入了局部形变的不...

2019-08-09 14:40:47 616

原创 SiamRPN++论文笔记

SiamRPN++论文笔记传统的基于Siamese网络的跟踪方法不能利用深度卷积网络提取的特征，像resnet-50或更深的网络，作者认为核心的原因在于用很深的网络提取特征会导致缺乏严格的平移不变性。作者通过一种简单而有效的空间感知采样策略打破这一限制，成功地训练了一个性能显著提高的resnet驱动的Sia...

2019-08-08 11:42:05 915

原创 MOSSE论文笔记

MOSSE论文笔记1.背景介绍本文设计了一种新的相关滤波器，误差最小平方和（MOSSE）滤波器，当初始化视频中第一帧，就可以产生稳定的相关滤波器。在669fps的速度的时候，它对亮度，尺度，位姿和不严格的变形的鲁棒性比较好。2.算法实现基于滤波的跟踪就是用在模板图片上训练好的滤波器去对目标物体的外表建模。目标最初是基于以第一帧中的目标为中心的一个小跟踪窗口来选择的。从这点上...

2019-04-24 17:31:05 981

原创 YOLO算法详解

YOLO把目标检测问题简化成了一个回归问题，直接从图像像素出发，去得到框和分类概率。YOLO结构非常简单，如下图所示。一、算法流程YOLO用整个图片的特征去预测每一个边界框。它还同时预测一个图像在所有类中的所有边界框。YOLO先把整个图片划分成S*S个方格，如果一个物体的中心正好落在一个方格中，那么这个方格就负责来预测物体。每一个方格预测出B个边界框和这些框的置信分数。这些表示方格包含...

2019-04-03 11:56:06 32820

原创 Mask R-CNN原理详细解读

Mask R-CNN是在Faster R-CNN的基础上添加了一个预测分割mask的分支，如上图所示。其中黑色部分为原来的Faster-RCNN，红色部分为在Faster-RCNN网络上的修改。将RoI Pooling 层替换成了RoIAlign层；添加了并列的FCN层（mask层）。一、RoIAlign首先介绍一下RoIPooling，它的目的是为了从RPN网络确定的ROI中导出较小...

2019-03-27 14:52:37 75294 7

原创 Faster R-CNN算法详细流程

本博客主要参考了https://blog.csdn.net/Lin_xiaoyi/article/details/78214874，其中夹杂着自己看论文的理解。Faster R-CNN论文采用的结构图如下所示。采用了VGG16作为特征提取的模块。算法流程图如下所示。Faster R-CNN提出了Region Proposal Network (RPN)，从与fast R-CNN共享的卷...

2019-03-27 11:11:37 17520

原创 SiamFC:Fully-Convolutional Siamese Networks for Object Tracking中模板图片的获取方法

在这个算法中，将视频的第一帧作为制作模板图片的素材，第一帧图片有要跟踪目标的box信息，可以得到框的中心x的坐标，框的宽度w，框的高度h，也就是目标中心的坐标。第一种情况：然后获取框周围的context，以目标中心为原点，sqrt{[w+(w+h)/2]*[h+(w+h)/2]}边长构造一个context，这么做的目的是保证最后得到的图能完整包含框里面的目标。得到了conte...

2019-03-24 14:37:38 779

原创 Bounding-box regression

在R-CNN中，作者应用了Bounding-box regression来改善目标的定位。在训练中，输入是一系列的训练对{}，i=1,2,…,N，其中表示候选区域中心的坐标和宽度高度，接下来忽略P的上标i，然后用G来表示原图中每一个标好的框，G=(Gx,Gy,Gw,Gh)，最终的目标是学习一个函数将P转化成G。依据4个函数,前两个公式表示的是中心的平移，接下来的两个公式表示的是宽度和高度的...

2019-03-20 14:41:43 448

原创 R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN详解

一、R-CNNR-CNN的全称是Region-CNN，是第一个成功将深度学习应用到目标检测上的算法。R-CNN基于卷积神经网络(CNN)，线性回归，和支持向量机(SVM)等算法，实现目标检测技术。传统的目标检测方法大多以图像识别为基础。一般可以在图片上使用穷举法选出所所有物体可能出现的区域框，对这些区域框提取特征并使用图像识别方法分类，得到所有分类成功的区域后,通过非极大值抑制(Non...

2019-03-20 11:55:11 1366

原创 SiamFC:Fully-Convolutional Siamese Networks for Object Tracking

作者在本文中提出了一种新的基于全卷积Siamese网络的跟踪算法，并在ILSVRC15数据集上进行了端到端的训练，实时性非常好。全卷积Siamese神经网络结构如上图所示。Z表示模板图片，x表示待搜索的图片。作者提出用一个函数f(z,x) 来比较一个模板图片z和x中相同尺寸的候选区域，如果两个图片描述了相同的物体就得到一个很高的分数，反之得到一个很低的分数。为了得到一张新图片中物体的位...

2019-03-17 10:33:01 2362

原创 SiamMask:Fast Online Object Tracking and Segmentation: A Unifying Approach

SiamMask一种实时的同时进行视频跟踪和分割的方法。SiamMask的算法流程图如上图所示：该算法的输入是两张图片，一张的模板图片，还有一张是待检测的图片。一、RoW的意义用ResNet-50前面4个卷积层作为f(θ) 的主干部分，网络结构如下图所示。通过卷积神经网络的处理，各自得到不同大小的256张图。RoW表示的是上面得到的两张图经过depth-wise（深度...

2019-03-15 11:25:35 1677

转载博士这五年-李沐

博士这五年李沐 · 2 天前前言12年8月提着一个行李箱降落在匹兹堡机场。没找住的地方，也不知道CMU应该怎么去。对未来一片迷茫，但充满乐观。现在，刚完成了博士期间最后的一场报告，在同样的机场，不过是在等待离开的航班。回想过去的五年，是折腾的五年，也是自我感悟和提升的五年。这里我尝试记录这五年主要做过的事情和其中的感想，希望对大家有所启发。第0年：3/11-8/12我第一...

2018-12-17 19:50:24 2771 1

原创 keras中的model.fit和model.fit_generator

fit(self, x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps...

2018-12-15 14:30:11 5024

原创 Windows10环境下安装Anaconda和tensorflow-gpu，然后在jupyter notebook上使用

一、进行Anaconda的下载和安装在官方网站下载Anaconda的Windows版本，下载的网址是https://www.anaconda.com/download/，根据自己电脑的位数下载对应的客户端，推荐下载Python 3.7 version*版本。下载完成之后进行Anaconda的安装：1.首先打开客户端，点击Next。2.点击I Agree。3...

2018-12-14 15:51:48 5015 6

转载 opencv3.3.1安装教程

OpenCV安装：win10 X64+opencv3.3.1安装教程我的电脑64位Win10系统，现在利用VS2017安装opencv3.3.1。首先去官网下个opencv3.10的windows的安装包。解压好，出现opencv3.3.1的文件夹表示解压成功。第一步当然是设置环境变量。我的电脑右击，选择属性选择Pa

2017-11-24 15:04:02 7277

echo_hao的博客