
机器学习
cassiePython
一入代码深似海,从此妹子是路人
展开
-
空间金字塔池化(Spatial Pyramid Pooling, SPP)
空间金字塔池化(Spatial Pyramid Pooling, SPP)在SPPnet和Fast-CNN中都用到了空间金字塔池化(Spatial Pyramid Pooling, SPP)来提高object detection的效率。SPP本质的目的是为了使得CNN可以接受任意尺寸的输入图片,从而避免了图像预处理中要将图片resize到统一尺寸这个限制。SPPnet论文中给出了如下的图示:...原创 2019-08-17 10:27:40 · 1853 阅读 · 2 评论 -
Category-level Adversaries for Semantics Consistent Domain Adaptation
CVPR2019: Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation##引言PS. 来自于悉尼科技大学杨易老师团队一篇paper,CVPR2019的oral。主要是对domain adaptation带来语义的约束(Categor...原创 2019-07-19 11:05:51 · 946 阅读 · 0 评论 -
ICML2019: Learning Classifiers for Target Domain with Limited or No Labels
ICML2019: Learning Classifiers for Target Domain with Limited or No Labels引言本文提出了一种视觉属性编码(visual attribute encoding)方式,将图片编码为低维度的概率向量。得到了图片对应的编码后我们就可以训练分类器进行分类,进一步地该方法可以应用到aomain adaptation(DA),few ...原创 2019-07-18 18:48:08 · 971 阅读 · 0 评论 -
ICML2019: Domain Agnostic Learning with Disentangled Representations
ICML2019: Domain Agnostic Learning with Disentangled Representations引言目前的domain adaptation考虑了两种情况:single source & single target(认为源域为一种分布,目标域为一种分布,进行adapt); multi-souce & single target(存在多个源...原创 2019-07-02 17:03:34 · 2820 阅读 · 2 评论 -
Transferability vs. Discriminability: Batch Spectral Penalization for Adversarial Domain Adaptation
ICML2019: Transferability vs. Discriminability: Batch Spectral Penalization for Adversarial Domain Adaptation引言对抗学习在domain adaptation中常用于adapt源域和目标域特征的分布差异性。 但是在使用对抗学习时,是否会影响到分类效果呢,即我们学到的特征是否依然能保证可区...原创 2019-06-26 15:22:14 · 3894 阅读 · 0 评论 -
目标检测总结整理
目标检测总结整理接触过图像处理的童鞋,对于目标检测一定不陌生吧。目标检测可一直是计算机视觉和机器学习领域的热点。这篇文章主要是依据小编自己的学习体会,对目标检测的发展历程进行了总结。最初,目标检测算法是基于传统手工特征的;大约在2013年,基于深度学习的目标检测开始逐渐火起来,基于传统的手工特征的目标检测算法被逐渐抛弃;目前随着生成式对抗网络GAN的大热,基于GAN的目标检测也开始火起来了。...原创 2018-08-15 16:27:29 · 5930 阅读 · 0 评论 -
跨模态检索:带你领略图文检索的魅力
跨模态检索:带你领略图文检索的魅力引子作为经常“百度一下”的众多网民中的一份子,我们经常使用百度,输入要搜索的关键词,来检索要想的文本信息,此时是使用文本来检索文本;有时我们又会使用百度图片检索的功能,上传图片来寻找相似的图片,此时是以图来检索图;但我们也经常使用文本来搜索相应的图片,此时我们输入信息的类型和获得的信息的类型就不同了,我们称之为“跨模态”。简 介来下个专业点的定义:...原创 2018-08-15 16:19:06 · 18267 阅读 · 5 评论 -
通用人工智能:我们还有多远?
通用人工智能:我们还有多远?通用人工智能的提出已经成为近年研究的一个热点。微软全球执行副总裁、人工智能研发的总掌舵人沈向洋说:“单独做一个东西之后,今天有非常强的AI系统,比如Alphago在围棋上战胜柯洁。这些都非常了不起,开发系统的时候做出些非常了不起的技术,但今天没有人去想通用人工智能到底是什么,到底要多少的输入。”我们一直梦想着有一个通用的模型,可以建模整个世界,使各种各样的问题都...原创 2018-08-15 16:08:00 · 14077 阅读 · 1 评论 -
从佳佳到表情识别
从佳佳到表情识别佳佳机器人是中科大陈小平老师团队的作品,号称 “中国第一美女机器人”。今天我们以佳佳为基础,来谈一谈表情的识别。首先有请“佳佳”自我介绍: “大家好,我是佳佳,身高1.6米,体重90多斤,是个可爱的萌妹子。我可以进行人机对话,进行握手等行为,说话的时候口型也会匹配,还可以根据与用户的交互来表现我的高兴或者沮丧等情感。我曾担任过2016“首届全球华人机器人春晚”和“谁是棋王...原创 2018-08-15 16:03:06 · 1110 阅读 · 0 评论 -
CVPR:Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks摘要背景:图像到图像的迁移是计算机视觉中的一个很有意思的问题。目标是学习一个从输入图片到目标图片的映射,在训练中需要使用成对的训练集。问题:成对的训练数据并不是那么容易获得的。本文方法:学习一个从源域(source dom...原创 2018-07-06 16:24:53 · 12255 阅读 · 13 评论 -
CVPR: Bilateral Ordinal Relevance Multi-instance Regression for Facial Action Unit Intensity
Bilateral Ordinal Relevance Multi-instance Regression for Facial Action Unit Intensity EstimationAbstract问题:捕捉面部表情的微小表化很困难;AU强度的标注费时费力。本文: 提出弱监督的BORMIR模型:weakly supervised regression mod...原创 2018-07-05 10:09:28 · 859 阅读 · 0 评论 -
CVPR:Facial Expression Intensity Estimation Using Ordinal Information
Facial Expression Intensity Estimation Using Ordinal InformationAbstract先前工作不足之处:大都关注于基本的表情的识别,只有少部分工作关注连续的表情强度的检测。原因是缺乏有标记的表情强度的数据。 本文工作:将表情的强度检测看成一个回归问题,通过利用面部表情的onset-apex-offset演化模型,本文的方法可以...原创 2018-07-02 15:23:07 · 1086 阅读 · 0 评论 -
CVPR:Weakly-supervised Deep Convolutional Neural Network Learning for Facial Action Intensity Estima
Weakly-supervised Deep Convolutional Neural Network Learning for Facial Action Intensity EstimationAbstractAU强度检测在情感计算和人机交互中有着重要的作用,实际上以及有很多工作利用CNN来进行AU强度的检测,但是都需要大量的标注数据。因此本文提出一个“基于知识的半监督的深度卷积神...原创 2018-06-27 18:55:19 · 801 阅读 · 0 评论 -
确定性跳跃循环状态网络(CRJ)教程
确定性跳跃循环状态网络(CRJ)教程本篇文章是上一篇文章回声状态网络(ESN)的延申,在阅读本文之前,希望您已经阅读了上一篇博文。确定性跳跃循环状态网络(CRJ)是ESN的一个变种,如下图所示:在CRJ中,中间节点通过单向的循环边和双向的跳跃边连接,所有的输入权重、循环权重、跳跃权重分别共享值ririr_i,rcrcr_c,rjrjr_j。特别地,输入权重的符号由某个无理数的小数展...原创 2018-06-15 10:12:49 · 4006 阅读 · 5 评论 -
人工智能:从搜索角度来谈谈优化
人工智能:从搜索角度来谈谈优化我们先对优化问题进行描述,定义一个优化问题为: min f(x)s.t. h(x)≤0min f(x)s.t. h(x)≤0min~f(x) \\s.t.~~h(x)\leq 0 其中f(x)f(x)f(x)是目标函数,h(x)≤0h(x)≤0h(x)\leq 0是约束条件,对x的取值范围进行限...原创 2018-06-08 13:20:14 · 1141 阅读 · 0 评论 -
Multi-channel Pose-aware Convolution Neural Networks for Multi-view Facial Expression Recognition
Multi-channel Pose-aware Convolution Neural Networks for Multi-view Facial Expression Recognition大体浏览我们知道识别多角度的面部表情是比较困难的,本文提出Multi-channel Pose-aware Convolution Neural Networks(MPCNN)来充分利用有限的数...原创 2018-06-01 15:30:58 · 1247 阅读 · 0 评论 -
回声状态网络(ESN)教程
回声状态网络(ESN)教程基础概念回声状态网络(Echo State Network)提出于2001年,曾经是研究的热点,但近年来随着RNN,LSTM与其它一些变种的网络的出现,现在研究比较少了,但是其在时间序列预测上还有着很不错的应用。传统的MLP网络的隐层是一层层的全连接的神经元,而ESN引入了一个储备池计算模式来替代原始的隐层,这个储备池是什么呢?先来看下下图: 网络结构依...原创 2018-05-21 11:03:03 · 42695 阅读 · 50 评论 -
基于BoF算法的图像分类
基于BoF算法的图像分类图像分类一直是计算机视觉中的一个重要问题,BoF(Bag of features)算法在图像分类中具有着重要的作用。本文旨在介绍BoF算法的基本原理和过程并且给出Python代码的实现:用于解决在Caltech 101数据库上的多分类问题。算法起源起源1:纹理识别纹理(texture)是由一些重复的纹理单元(texton)组成的,如图1所示。原创 2018-04-28 09:27:51 · 5705 阅读 · 2 评论 -
Softmax函数及其导数
Softmax函数及其导数本文翻译自The Softmax function and its derivative基础概念Softmax函数的输入是N维的随机真值向量,输出是另一个N维的真值向量, 且值的范围是(0,1)(0,1),和为1.0。即映射:S(a)=RN→RNS(\textbf{a})=\mathbb{R}^N\rightarrow \mathbb{R}^N: S(a):⎡⎣⎢⎢⎢a翻译 2018-04-26 10:03:16 · 40953 阅读 · 10 评论 -
主成分分析教程
主成分分析(PCA)可以说是目前数据分析的中流砥柱,然而总是将其作为一个黑箱使用却不理解其本质。在搜索相关资料时发现,网上大多数对于PCA的教程都摘自于一篇英文文献(https://datajobs.com/data-science-repo/PCA-Tutorial-[Shlens].pdf),本欲自己整理一下,但发现这篇文章写得非常nice,难以望其项背,所以特地翻译了这篇文献,和大家分享:下...翻译 2018-04-10 14:54:18 · 665 阅读 · 0 评论 -
tensorflow 获取变量&打印权值等方法
tensorflow 获取变量&打印权值等方法在使用tensorflow中,我们常常需要获取某个变量的值,比如:打印某一层的权重,通常我们可以直接利用变量的name属性来获取,但是当我们利用一些第三方的库来构造神经网络的layer时,存在一种情况:就是我们自己无法定义该层的变量,因为是自动进行定义的。比如用tensorflow的slim库时原创 2018-01-27 11:32:06 · 16585 阅读 · 0 评论 -
拉格朗日乘子法与KKT条件
拉格朗日乘子法与KKT条件拉格朗日乘子法在实际中我们常常遇到这样一种优化问题(min和max都是一样的,因为min f(x)等价于max -f(x)): minf(x)s.tg(x)=0 \min f(x) \\s.t \quad g(x)=0 这是一个等式约束问题,按照拉格朗日乘子法,可以转换为无条件约束的形式: f(x)+λg(x)=0f(x)+\lambda g(x)=0 接下原创 2017-11-25 17:44:45 · 2045 阅读 · 0 评论 -
Sparsity constraint稀疏约束详解
Sparsity constraint稀疏约束详解引子: 线性模型是我们经常使用的一种模型,比如:文本分类中,bag-of-words 有p = 20 K 个特征, 共有 N = 5K 个文本样例;在图像去模糊化,图像分类中,有p=65K 个像素点特征,N=100个样例;等等这些问题我们都可以使用线性模型解决,比如线性回归,logistic回归, Cox 回归来原创 2017-11-21 20:40:22 · 10544 阅读 · 0 评论 -
统计学习方法:基于SMO算法的SVM的Python实现
统计学习方法:基于SMO算法的SVM的Python实现前言:在阅读本篇文章之前,希望您已经读过李航老师的《统计学习方法》中的第七章——支持向量机,本文实现SVM的算法使用序列最小最优化算法(SMO)。其中若出现公式的引用,则来自于李航老师的《统计学习方法》,如 公式 (7.107)来自于《统计学习方法》第127页。算法过程:-------------------原创 2017-07-19 14:55:47 · 2435 阅读 · 4 评论 -
论文阅读:Dual Supervised Learning
论文阅读:Dual Supervised Learning概述:许多有监督的学习任务是对偶的,比如从英语翻译成汉语,从汉语翻译成中文;再如图像的分类和图像的生成。但是人们总是分别训练两个模型,没有充分利用对偶的双方之间存在的关系,本文提出可以同时训练对偶的模型,且与分别训练两个模型相比可以提高性能。介绍:两个对偶问题可以看成空间到的映射以及到的映射。使用概率语言描述原创 2017-07-11 20:04:35 · 2908 阅读 · 0 评论 -
论文阅读:Dual Learning for Machine Translation
论文阅读:Dual Learning for Machine Translation问题提出:目前在机器翻译的领域,神经机器翻译(NMT)快速发展,取得了很好的效果,但是为了得到一个好的NMT的模型,需要大量的人工标记的训练集即双语的语句对。人工标记大量的数据费时费力,本文的目的就是提出一种方案(dual learning)来解决这个问题,并且可以得到相比于NMT模型更好的效果原创 2017-07-11 10:05:49 · 5931 阅读 · 0 评论 -
使用Matlab绘制Sigmod函数和Tanh函数
使用Matlab绘制Sigmod函数和Tanh函数Sigmod函数:x = linspace(-10.0,10.0);y = 1./ (1.0 + exp(-1.0*x));plot(x,y)Tanh函数x = linspace(-10.0,10.0);y = 2./(1.0 + exp(-2.0 * x)) - 1;plot(x,y)原创 2017-04-10 14:39:14 · 9139 阅读 · 0 评论