
CVPR2017
文章平均质量分 83
O天涯海阁O
主要从事图像分析算法设计、深度学习
展开
-
语义分割--End-to-End Instance Segmentation with Recurrent Attention
End-to-End Instance Segmentation with Recurrent Attention CVPR2017 https://github.com/renmengye/rec-attend-public本文针对 Instance Segmentation 使用 recurrent neural network (RNN) architecture 将每个物体依次定位分原创 2017-10-16 10:26:27 · 3666 阅读 · 1 评论 -
目标检测--RON: Reverse Connection with Objectness Prior Networks for Object Detection
RON: Reverse Connection with Objectness Prior Networks for Object Detection CVPR2017 https://github.com/taokong/RON本文可以看作是对 SSD 的改进, SSD 对不同尺度特征图进行独立的检测,这里我们 reverse connection block 将相邻的特征图联系起来。同时使用原创 2017-08-30 15:55:11 · 5218 阅读 · 2 评论 -
CNN阴影去除--DeshadowNet: A Multi-context Embedding Deep Network for Shadow Removal
DeshadowNet: A Multi-context Embedding Deep Network for Shadow Removal CVPR2017本文使用深度学习CNN网络来进行阴影去除,最大的特色就是全自动的端对端的实现阴影去除。 automatic and end-to-end deep neural network (DeshadowNet)阴影去除也算是一个老大难问题了,目前存原创 2017-08-29 13:49:15 · 8694 阅读 · 11 评论 -
分割候选区域--FastMask: Segment Multi-scale Object Candidates in One Shot
FastMask: Segment Multi-scale Object Candidates in One Shot CVPR2017 https://github.com/voidrank/FastMask本文针对检测和分割问题提出 FastMask 实现 segment multi-scale objects in one shot 这里的 one shot ( original im原创 2017-08-24 14:30:43 · 1904 阅读 · 0 评论 -
CNN边缘检测--Richer Convolutional Features for Edge Detection
Richer Convolutional Features for Edge Detection CVPR2017 Caffe:https://github.com/yun-liu/rcf本文针对边缘检测问题,基于 VGG16 网络设计了一个 richer convolutional features (RCF) 用于边缘检测,效果目前是很好的。首先来看看 VGG16不同卷积层的特征输出 3原创 2017-08-28 16:54:39 · 13771 阅读 · 1 评论 -
人群计数--Switching Convolutional Neural Network for Crowd Counting
Switching Convolutional Neural Network for Crowd Counting CVPR2017 Code for SCNN is based on Lasagne\Theano :https://github.com/val-iisc/crowd-counting-scnn 针对人群密度估计问题提出了一个 Switch-CNN网络,大的思路...原创 2017-09-06 11:40:54 · 9016 阅读 · 1 评论 -
行人检测--What Can Help Pedestrian Detection?
What Can Help Pedestrian Detection? CVPR2017本文主要分析 extra features 对于 基于CNN 的行人检测有什么帮助,设计了一个行人检测网络 HyperLearner 可以有效利用这些 extra features这里的 extra features 主要指 various channel features 行人检测中存在什么问题了?原创 2017-08-24 10:02:10 · 4033 阅读 · 3 评论 -
随机采样池化--S3Pool: Pooling with Stochastic Spatial Sampling
S3Pool: Pooling with Stochastic Spatial Sampling CVPR2017 https://github.com/Shuangfei/s3pool本文将常规池化看作两个步骤: 1)以步长为1在特征图上滑动池化窗口,尺寸大小基本保持不变, leaves the spatial resolution intact 2)以一种 uniform 和 deter原创 2017-08-23 15:07:14 · 6491 阅读 · 0 评论 -
批量残差网络-Aggregated Residual Transformations for Deep Neural Networks
Aggregated Residual Transformations for Deep Neural Networks Facebook AI Research 大牛 Ross Girshick Kaiming He 作品官方代码 Torch: https://github.com/facebookresearch/ResNeXtCaffe 代码:https://github.com/te原创 2017-02-16 16:41:18 · 4774 阅读 · 2 评论 -
车辆密度估计--Understanding Traffic Density from Large-Scale Web Camera Data
Understanding Traffic Density from Large-Scale Web Camera Data CVPR2017 https://arxiv.org/abs/1703.05868本文介绍了两个算法用于车辆密度估计:1)OPT-RC 根据背景差得到车辆运动区域,对于图像的不同区域学习到一个对应的权值矩阵用于估计车辆密度 2)FCN-MT 使用 FCN 分割框架原创 2017-07-19 11:33:10 · 3432 阅读 · 0 评论 -
弱监督语义分割--Object Region Mining with Adversarial Erasing
Object Region Mining with Adversarial Erasing: A Simple Classification to Semantic Segmentation Approach CVPR2017怎么将只有图像标签的训练图像用于语义分割的训练,这里我们提出使用一个分类网络来讲训练图像中的物体进行分割,得到像素标记的训练图像,同时提出一个 online prohibi原创 2017-09-08 15:17:33 · 8105 阅读 · 5 评论 -
去水印--《On the Effectiveness of Visible Watermarks》
On the Effectiveness of Visible Watermarks CVPR2017大牛 William T. Freeman 去了 Google Research 本文没有使用深度学习,使用传统的优化算法来解决水印去除。首先看图有个感性认识吧 基于单张图像去除水印的难度还是很大的。这里我们在网上搜集使用同一个水印的大量图像,基于这些图像,我们估计出 Watermark (W原创 2017-08-30 10:57:52 · 10837 阅读 · 6 评论 -
视频物体分割--One-Shot Video Object Segmentation
One-Shot Video Object Segmentation CVPR2017 http://www.vision.ee.ethz.ch/~cvlsegmentation/osvos/One-Shot Video Object Segmentation,基于单帧标记的视频物体分割,对于一个视频中的某一个物体,我们只提供一张训练样本,怎么把视频里所有的该物体分割出来? 上图第一张图像原创 2017-09-26 16:17:28 · 9748 阅读 · 0 评论 -
遮挡人脸检测--Detecting Masked Faces in the Wild with LLE-CNNs
Detecting Masked Faces in the Wild with LLE-CNNs CVPR2017本文针对遮挡人脸检测问题,首先建立了一个新的数据库:MAFA, with 30,811 Internet images and 35,806 masked faces,其次提出了一个 CNN 网络 LLE-CNNs 来用于遮挡人脸检测。首先来看看新建的数据库 3 MAFA: A原创 2017-10-23 11:27:32 · 12006 阅读 · 10 评论 -
人脸识别--SphereFace: Deep Hypersphere Embedding for Face Recognition
SphereFace: Deep Hypersphere Embedding for Face Recognition CVPR2017 https://github.com/wy1iu/sphereface针对人脸识别问题,当前的损失函数基本都基于 Euclidean margin ,这里我们提出基于 angular margin 的 angular softmax (A-Softmax) l原创 2017-08-18 10:51:49 · 7174 阅读 · 5 评论 -
人脸检测--Scale-Aware Face Detection
Scale-Aware Face Detection CVPR2017针对人脸检测中的人脸多尺度问题,本文首先用一个 Scale Proposal Network (SPN) 估计出图像中人脸的尺度分布,然后按照该尺度归一化图像,再进行人脸检测 均匀分布的多尺度人脸检测有时是一种浪费,因为图像中可能只有 1-2 个尺度的人脸 所以本文的思路是先估计出人脸的尺度,有了尺度信息就可以根据该尺原创 2017-08-21 11:06:29 · 3199 阅读 · 2 评论 -
人脸检测--S3FD: Single Shot Scale-invariant Face Detector
S3FD: Single Shot Scale-invariant Face Detector CVPR2017 Caffe code will be available本文针对基于 anchor 的检测器对 小的人脸检测率低的问题进行了分析和改进。基于 anchor 的目标检测发展迅速,人脸检测也有很大进展,但是对于小的人脸检测效果仍然不是很好。 the performance of an原创 2017-08-22 11:07:25 · 5868 阅读 · 16 评论 -
小人脸检测 - Finding Tiny Faces
Finding Tiny Faceshttps://www.cs.cmu.edu/~peiyunh/tiny/index.html code: https://github.com/peiyunh/tiny本文主要针对小的人脸检测问题进行深入分析。先看看下面的图 这张图像说是有1000个人脸,本文算法检测到685个。1 Introduction 目标识别在最近几年里取得了很大的原创 2017-01-20 11:27:21 · 12861 阅读 · 1 评论 -
物体分割--Deep Watershed Transform for Instance Segmentation
Deep Watershed Transform for Instance Segmentation CVPR2017 https://github.com/min2209/dwt本文将传统的 watershed transform 分割算法 结合 CNN网络 实现 物体分割首先来回顾一下 instance level segmentation 都有哪些方法: 1)Proposal bas原创 2017-10-20 10:01:37 · 5097 阅读 · 0 评论 -
深度去雨--Deep Joint Rain Detection and Removal from a Single Image
CVPR 2017 https://arxiv.org/abs/1609.07769?context=cs 代码和模型会公布的。首先通过下图感性认识一下图像中去雨是怎么回事 针对去雨问题已经提出了各种算法,当前算法主要存在的问题如下: 1)因为雨水和背景纹理的内在重叠性,当前大部分算法会平滑没有雨区域的纹理细节。 2)雨水在图像中引起的变化是复杂的,但是当前对雨水常用的模型没有很好的覆盖真原创 2017-03-21 15:51:47 · 11620 阅读 · 7 评论 -
视频插帧--Video Frame Interpolation via Adaptive Convolution
Video Frame Interpolation via Adaptive Convolution CVPR2017 http://web.cecs.pdx.edu/~fliu/project/adaconv/本文使用CNN网络完成 frame interpolation,这里我们将像素插值问题看作对相邻两帧中相应图像块的卷积,通过一个全卷积CNN网络来估计 spatially-adapti原创 2017-10-09 14:04:33 · 14636 阅读 · 0 评论 -
深度抠图--Deep Image Matting
CVPR2017 https://arxiv.org/abs/1703.03872抠图问题还是比较难的,简单的用一个公式表达如下: 左边是图像位置 i 的 RGB 值,右边是 前景和背景的线性组合。 matte estimation alpha 是未知的。对于每个像素,有3个已知量,7个未知量,所以这个一个 underconstrained 问题,即变量个数大于方程个数。当前针对抠图问题的原创 2017-03-20 14:25:14 · 22355 阅读 · 21 评论 -
语义分割--Dilated Residual Networks 之转载
Dilated Residual NetworksCVPR2017http://vladlen.info/publications/dilated-residual-networks/这里转载了 http://blog.csdn.net/fx677588/article/details/71308096 1. Background 这次我来介绍一篇转载 2017-06-13 09:24:47 · 1141 阅读 · 0 评论 -
语义分割--Dilated Residual Networks
Dilated Residual Networks CVPR2017 http://vladlen.info/publications/dilated-residual-networks/ 本文针对当前卷积分类网络对输入图像进行一系列降采样处理,得到的特征图尺寸很小(一般7×7),导致spatial information 损失比较严重。这里我们对性能比较好的 residual networks原创 2017-06-13 14:11:36 · 6660 阅读 · 0 评论 -
网络模型--Densely Connected Convolutional Networks
Densely Connected Convolutional Networks CVPR2017 best paper Code: https://github.com/liuzhuang13/DenseNet本文受到 ResNet] and Highway Networks 的启发: bypass signal from one layer to the next via identi原创 2017-07-25 11:04:12 · 5289 阅读 · 0 评论 -
场景解析--Scene Parsing through ADE20K Dataset
Scene Parsing through ADE20K Dataset CVPR2017 https://github.com/CSAILVision/sceneparsing http://sceneparsing.csail.mit.edu/MIT 搞的一个 场景解析数据库 ADE20K,可以在这上面测测自己算法的效果。 在这个数据库上我们跑了一些分割模型,在此基础上我们提出了一个原创 2017-05-18 14:54:38 · 11397 阅读 · 2 评论 -
语义分割--Not All Pixels Are Equal:Difficulty-Aware Semantic Segmentation via Deep Layer Cascade
Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer CascadeCVPR2017本文针对语义分割问题,引入Cascade思想,将图像像素根据分割难易度分为三个等级:Easy、Moderate、Hard ,分别用CNN网络的浅层、中层、高层完成分割。降低运算量同时提高分割精度 上图显示实际图原创 2017-05-18 10:08:44 · 3259 阅读 · 0 评论 -
对象分割--Fully Convolutional Instance-aware Semantic Segmentation
Fully Convolutional Instance-aware Semantic Segmentation CVPR2017 https://github.com/msracver/FCIS本文是以 FCN 【29】为基础,提出 FCIS ,一个网络可以同时完成 分割和检测类别信息。首先来看看FCIS 的网络结构图: 输入图像,使用CNN 提取特征,用 RPN 提取候选区域矩形框,计原创 2017-05-17 09:48:39 · 5003 阅读 · 0 评论 -
GAN人脸修复--Generative Face Completion
Generative Face Completion CVPR 2017 https://arxiv.org/abs/1704.05838Code: https://github.com/Yijunmaverick/GenerativeFaceCompletion首先来直观的认识一下人脸修复是什么? 本文算法训练流程图如下: 主要由三个模块构成:Generator,Discriminato原创 2017-04-26 09:59:13 · 15862 阅读 · 12 评论 -
训练样本制作--Annotating Object Instances with a Polygon-RNN
Annotating Object Instances with a Polygon-RNN CVPR2017 project page: http://www.cs.toronto.edu/polyrnn/这里主要提出一个制作真值数据的工具。如下图所示:这里我们使用VGG网络提取特征,使用一个 Convolutional LSTM 进行物体轮廓的提取。我们的模型之所以是 RNN,是因为它每次原创 2017-04-25 15:52:42 · 4473 阅读 · 2 评论 -
目标定位--Deep Self-Taught Learning for Weakly Supervised Object Localization
Deep Self-Taught Learning for Weakly Supervised Object Localization CVPR 2017https://arxiv.org/abs/1704.05188什么是 Weakly Supervised Object Localization,refers to learning to localize objects within ima原创 2017-04-25 10:15:16 · 4839 阅读 · 0 评论 -
场景解析--Pyramid Scene Parsing Network
Pyramid Scene Parsing Network 语义分割 https://github.com/hszhao/PSPNet针对 FCN 中没有 context 信息,本文提出的 PSPNet 网络嵌入了 global context 信息来提升分割效果2 Related Work对于 scene parsing 和 semantic segmentation 任务, 深度卷积网原创 2017-05-15 15:16:43 · 8200 阅读 · 0 评论 -
行人姿态估计--Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields CVPR 2017 Code: https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation 效果演示视频: https://youtu.be/pW6nZXeWlGM 如果可以看youtu 的话多原创 2017-04-21 10:03:08 · 19390 阅读 · 0 评论 -
目标检测--Feature Pyramid Networks for Object Detection
CVPR2017 Feature Pyramid Networks for Object Detection https://arxiv.org/abs/1612.03144 Code will be made publicly available本文是对 Faster R-CNN 在目标检测问题上的进一步完善。Faster R-CNN 有两个步骤, Region Proposal Net原创 2017-03-24 14:30:43 · 14876 阅读 · 2 评论 -
语义分割--RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation
RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation CVPR2017 https://github.com/guosheng/refinenet本文还是使用 cascaded 思想来做语义分割!但是引入了 residual connections with identity ma原创 2017-06-02 15:35:42 · 5452 阅读 · 0 评论 -
弱监督语义分割--Weakly Supervised Semantic Segmentation using Web-Crawled Videos
Weakly Supervised Semantic Segmentation using Web-Crawled Videos CVPR2017https://arxiv.org/abs/1701.00352一不小心看到了一篇关于弱监督的语义分割的文献,这才发现仅一个弱监督语义分割就是大坑啊,看看这篇文章的参考文献就知道了。与弱监督对应的就是强监督语义分割,即我们平时所说的语义分割,训练样本就是原创 2017-06-09 11:19:03 · 9200 阅读 · 1 评论 -
语义分割--Loss Max-Pooling for Semantic Image Segmentation
Loss Max-Pooling for Semantic Image Segmentation CVPR2017 https://arxiv.org/abs/1704.02966本文采用偏数学语言的角度来描述语义分割样本类别分布不均匀问题,提出一个方法 Pixel-Loss Max-Pooling本文主要解决什么问题了? 针对语义分割训练样本类别分布不均匀问题 handle imbalan原创 2017-06-09 15:05:55 · 5442 阅读 · 0 评论 -
行人检索--Beyond triplet loss: a deep quadruplet network for person re-identification
Beyond triplet loss: a deep quadruplet network for person re-identification CVPR2017 https://arxiv.org/abs/1704.01719本文使用深度学习进行行人检索,侧重点主要在损失函数的改进,提出了 quadruplet loss 用于减小类内方差 和 增加类间方差上图显示,在我们新的 quadr原创 2017-04-19 14:27:11 · 5048 阅读 · 2 评论 -
人体解析--Look into Person: Self-supervised Structure-sensitive Learning
Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing CVPR2017https://arxiv.org/abs/1703.05446 LIP benchmark:http://hcp.sysu.edu.cn/lip/index.php针对 Huma原创 2017-06-06 09:33:29 · 5487 阅读 · 0 评论 -
车辆2D/3D--Deep MANTA: A Coarse-to-fine Many-Task Network for joint 2D and 3D vehicle analysis
Deep MANTA: A Coarse-to-fine Many-Task Network for joint 2D and 3D vehicle analysis from monocular image CVPR2017 https://arxiv.org/abs/1703.07570自动驾驶 很快就可以达到实用的水平了。本文的功能是:给一张灰度图像,使用 多任务CNN网络 Deep MA原创 2017-07-27 09:26:38 · 2555 阅读 · 1 评论