飞跃重洋的思念-CSDN博客

原创 Mac升级为Sierra后安装caffe的问题

三年前的Mac到手后一直懒得做更新，主要是因为系统升级后一些有依赖的软件都需要更新，有时还挺容易出问题。为了安全稳定起见，OSX 10.9系统就被我用了三年。但是，这么久不更新实在跟不上潮流了，最近想安装TensorFlow，结果我这么旧的系统被它鄙视并且拒绝了，只好趁着假期把系统更新一下。结果一更新，原来的caffe就用不了，编译过程出现了些问题，本博文记录了这些问题和对应的解决方案。更新后...

2017-05-01 18:01:19 6757 3

原创深度学习在图像超分辨率重建中的应用

超分辨率技术（Super-Resolution）是指从观测到的低分辨率图像重建出相应的高分辨率图像，在监控设备、卫星图像和医学影像等领域都有重要的应用价值。SR可分为两类:从多张低分辨率图像重建出高分辨率图像和从单张低分辨率图像重建出高分辨率图像。本文介绍几个较新的基于深度学习的SR方法，包括SRCNN，DRCN, ESPCN，VESPCN和SRGAN等。

2017-03-20 17:52:08 14592 5

原创深度对抗学习在图像分割和超分辨率中的应用

深度学习已经在图像分类、检测、分割、高分辨率图像生成等诸多领域取得了突破性的成绩。但是它也存在一些问题。本文介绍使用对抗学习作为一种规则化的方法，设计新的代价函数，提高深度学习在图像分割和高分辨率图像重建的应用。

2017-02-13 19:24:22 7300 2

原创图像可形变配准的Demons方法

图像的可形变配准分为参数法和非参数法，参数法例如仿射变换、B-spline based FFD等方法通过对形变的参数化表示，减小求解的变量个数，但是也限制了形变复杂程度。非参数化的方法将图像的形变表示成位移场，每一个像素都有一个位移，可以表示更加复杂的形变，但是要求解的变量也更多。Demons就是一种著名的非参数化可形变配准方法，它最早来自于光流算法。

2016-11-28 07:24:40 18585 12

原创 CNN在基于弱监督学习的图像分割中的应用

最近基于深度学习的图像分割技术一般依赖于卷积神经网络CNN的训练，训练过程中需要非常大量的标记图像，即一般要求训练图像中都要有精确的分割结果。对于图像分割而言，要得到大量的完整标记过的图像非常困难, 因此使用弱监督学习可以克服这个问题。

2016-11-21 01:55:24 12506

原创深度卷积神经网络在目标检测中的进展

近些年来，深度卷积神经网络（DCNN）在图像分类和识别上取得了很显著的提高。回顾从2014到2016这两年多的时间，先后涌现出了R-CNN，Fast R-CNN, Faster R-CNN, ION, HyperNet, SDP-CRC, YOLO,G-CNN, SSD等越来越快速的监测方法。

2016-08-20 00:06:08 41654 1

原创 CRF as RNN的原理及Caffe实现

CRF（Conditional Random Field）是图像分割中很常用的后处理算法。在《全卷积网络（FCN）与图像分割》这篇博文中提到，FCN可以得到较好的分割结果，Chen, Liang-Chieh, et al. 2014在其基础上使用fully connected CRF得到了更好的效果，但是FCN的步骤和CRF的步骤是分开的。Zheng et al 2015将fully connec

2016-06-30 23:36:41 14725 2

原创深度学习的资料清单

神经网络和卷积神经网络的基础知识1, Michael Nielsen写的在线教程 http://neuralnetworksanddeeplearning.com/介绍了神经网络的基本结构，有例子展示为何神经网络可以学习任何函数，为什么传统的深度学习很慢等。还提供了基于Theano的用于MNIST手写数字的识别的例子代码。2, 斯坦福大学的深度学习课程 http://cs231n.github.i

2016-06-30 04:09:10 3345

原创全卷积网络（FCN）与图像分割

与传统用CNN进行图像分割的方法相比，FCN有两大明显的优点：一是可以接受任意大小的输入图像，而不用要求所有的训练图像和测试图像具有同样的尺寸。二是更加高效，因为避免了由于使用像素块而带来的重复存储和计算卷积的问题。

2016-05-14 02:00:07 161879 12

原创 ImageNet和CNN可以帮助医学图像的识别吗?

对于医学图像而言，得到大规模的训练数据是比较不容易的，那么可否使用Transfer Learning利用现成的ImageNet的图像来帮助医学图像的识别呢？ImageNet里面的图像（二维，彩色）没有医学图像，包含一些诸如鸟类、猫、狗、直升机等物体的识别，与医学图像（二维或三维，非彩色）相差很大。如果回答是肯定的话，是一件令人非常振奋的事情。

2016-03-08 00:34:19 15647 1

原创 MVC, MVP与MVVM

MVC(Model-View-Controller)是开发有用户界面的软件最常见的架构之一。它将一个给定的软件应用程序分成三个相互连接的部分，从而将信息的内部表示与它被展示给用户或者接受用户输入的部分分开。MVC的概念最初在70年代提出，随后不断地演化，产生了许多变种，例如HMVC, MVP, MVVM等。

2016-03-06 06:48:07 1163

原创深度学习框架Caffe在Mac上的安装和测试

先概括一下深度学习的几大流行的框架：Pylearn2, Theano, Caffe, Torch, Cuda-covnet，Deeplarning4j等。Theano是一个Python库，也是一个强大的数学表达式编译器。Pylearn2是在Theano基础上建立的机器学习库。用户可以用数学表达式写Pylearn2的插件(新的model, algorithm等), Theano将这些表达式进行优化和稳定化，然后进行编译。

2016-02-18 01:56:31 22033

原创神经网络及卷积神经网络的训练——反向传播算法

神经网络的训练过程，就是通过已有的样本，求取使代价函数最小化时所对应的参数。代价函数测量的是模型对样本的预测值与其真实值之间的误差，最小化的求解一般使用梯度下降法（Gradient Decent）或其他与梯度有关的方法。其中的步骤包括：初始化参数。求代价函数关于参数的梯度。根据梯度更新参数的值。经过迭代以后取得最佳参数，从而完成神经网络的训练。

2016-01-31 00:02:42 31530

原创卷积神经网络及其在图像处理中的应用

一，前言卷积神经网络（Constitutional Neural Networks, CNN）是在多层神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法。先回顾一下多层神经网络: 多层神经网络包括一个输入层和一个输出层，中间有多个隐藏层。每一层有若干个神经元，相邻的两层之间的后一层的每一个神经元都分别与前一层的每一个神经元连接。在一般的识别问题中，输入层代表特征向量，输入

2016-01-18 00:19:13 118602 7

原创期望值最大化算法

一，最大似然估计与隐变量期望值最大化算法是用来对包含隐变量的样本点的分布函数的参数估计方法。在参数估计中常常通过最大似然函数进行估计，由于隐变量的存在，不能直接求解这个最大似然函数，期望值最大化算法就是将这个最大似然函数的求解问题转化为求解其下界的最大值的问题，通过一个求隐变量的分布的“期望值”步骤和一个求似然函数最大化的“最大值”步骤完成。假如有一批训练样本Xi （i=1,2,..I

2015-12-12 19:54:36 9959

原创机器学习在器官定位方面的应用

随着计算机计算能力的增强和大批量医学图像的涌现，机器学习技术在医学图像处理领域的应用已获得越来越多的关注。其思想是通过计算机对大批量训练数据的统计学习，来预测新的待处理图像的相关信息。关于统计学习，推荐一本Hastie的2009年的一本书: The Elements of Statistical Learning: Data Mining, Inference and Prediction (pd

2015-11-16 01:27:24 2828

原创 Cmake的使用例子

以前习惯了在windows下写代码时直接用MSVC新建项目，后来要在Linux下开发，以前写的代码不能直接使用，还要仔细地写makefile，实在是费事费力；再后来又在Mac中使用Xcode，除了对自己编写的代码本身的可移植性有很高的要求外，还会遇到使用QT、VTK、ITK、OpenCV等其他开源库的情况，这时安装好这些库后要在自己的项目文件中使用，包含文件、依赖库的配置也比较费事。

2015-11-01 05:50:49 2838

原创 MITK简介及安装

一，MITK简介MITK (Medical Imaging Interaction Toolkit)是一个开源软件平台，可用来做交互式的医学图像处理软件。该软件结合了ITK（nsight Toolkit）和VTK(Visualization Toolkit)的特性。ITK提供了强大的图像处理（分割、配准等）功能，而VTK主要实现对数据的可视化。VTK虽然提供可视化，但是对用户交互的支持比较弱，

2015-10-20 04:32:56 28136 1

原创医学图像处理开源软件

通用:VTK VTK （the visualization toolkit）是一款免费开源的用于三维计算机图形学、图像处理以及可视化的软件包。包含了C++类库并且提供对Tcl/Tk, Java 和Python等解释性语言的支持.ITK ITK是一个开源、跨平台的，提供了大量的图像处理功能的软件工具。可用于多维图像的分割与配准。FSL

2015-09-27 05:29:42 12636 3

原创图割与最大流和连续最大流算法

在图像分割中，图割是近年来十分流行的交互式分割方法。与比它早一些出现的水平集、活动轮廓等分割方法相似，都是基于能量最小化的最优求解从而得到分割结果，不同的是其结果能得到全局最优解。在离散域中，图像的分割可以通过使以下能量函数最小化得到：其中

2015-06-20 04:14:00 8217

原创磁共振梯度回波（gradiant echo）与自旋回波(spin echo)

在90度脉冲以后，xy平面的磁化向量会按照时间常数为T2的指数函数衰减。而实际上测得的信号比这个理论衰减过程更快，相应的时间常数为T2*。关于T2 和T2*的定义在上一篇文章《》中已有阐述。T2*衰减的原因是磁场的不均匀导致不同位置处的原子核旋转频率不一样，在磁场强度较低的地方旋转得慢，在磁场强度较高的地方旋转得快，因此经过一定时间后，不同位置处的原子核旋转相位不一样 (dephase 失相位

2015-04-19 23:48:42 19140 1

原创决策树算法ID3，C4.5， CART

决策树是机器学习中非常经典的一类学习算法，它通过树的结构，利用树的分支来表示对样本特征的判断规则，从树的叶子节点所包含的训练样本中得到预测值。决策树如何生成决定了所能处理的数据类型和预测性能。主要的决策树算法包括ID3，C4.5， CART等。1，ID3ID3是由 Ross Quinlan在1986年提出的一种构造决策树的方法。用于处理标称型数据集，其构造过程如下：输入训练数据是一组带

2015-04-03 01:02:35 14693

原创磁共振中的T1， T2 和 T2*的原理和区别

从物理的角度，要理解这几个概念的区别,需要对原子核的磁化有所了解，本文通过一些图示对这几个概念进行简明的介绍。首先，磁共振最基本的原理就是氢原子核在磁场中自旋运动时所具有的量子力学特性。在一个均匀磁场B0中，氢原子核的旋转（spin)会出现两种自旋状态，一种是沿着磁场方向（up状态），一种是沿着磁场反方向（down状态）。旋转的频率与磁场强度相关,称为拉莫频率。平均而言，大部分的原子核是沿着磁

2015-04-02 18:16:39 75151 8

原创 Mac中用clang++和nvcc编译cuda程序的一个例子

主函数在main.cpp中，用g++编译，cuda函数放在KernelWrapper.cu中，用nvcc编译。另外main.cpp中需要包含头文件KernelWrapper.hKernelWrapper.h#ifndef _KernelWrapper_h#define _KernelWrapper_hvoid RunTest();#endifKernelWrapper.cu

2015-03-12 02:11:03 4005

原创 SIFT与HOG特征提取

SIFT ：scale invariant feature transformHOG：histogram of oriented gradients这两种方法都是基于图像中梯度的方向直方图的特征提取方法。1. SIFT 特征实现方法： SIFT 特征通常与使用SIFT检测器得到的感兴趣点一起使用。这些感兴趣点与一个特定的方向和尺度（scale）相关联。通

2014-12-28 01:53:03 21347 2

原创 QGLWidget不同窗口中的共享纹理

绘制三维体数据时，创建一个QT OpenGL窗口（QGLWidget），将体数据的纹理载入到GPU中进行绘制。这时如果想要再新建一个窗口绘制该体数据的不同截面，则需要使不同的窗口共享纹理。这在QGLWidget的构造函数中提供了相应的实现：http://qt-project.org/doc/qt-4.8/qglwidget.html#QGLWidget-3QGLWidget::QGLW

2014-12-23 06:05:05 3388

原创 vtk和itk图像的相互转换

1，itk 图像转换为vtk图像：使用ImageToVTKImageFilter，例如：2，

2014-08-04 09:52:38 7817 1

原创 ITK+VTK+Python的整合及例子程序

配置： VS2008（32-bit） Python2.7.8（32-bit） Cmake 3.0ITK4.5.2

2014-07-31 14:49:05 11149

原创 win7+VS2010 64bit 编译QT

参考 http://blog.sina.com.cn/s/blog_671c54fe0100w0qz.html

2014-07-25 23:02:33 13991 1

原创 VTK在VS2010中的安装（含python）和第一个例子

计算机环境： win7 64bit， Python 2.7 64位， VTK5.8.0，VS2010

2014-07-18 10:26:22 6745

原创 ITK在VS2010中的安装和第一个例子

1，下载 CMake，选择最新版本。地址 http://www.cmake.org/cmake/resources/software.html

2014-07-16 14:43:07 16199 1

原创体绘制的原理和Raycasting的实现

体绘制 “ 在某一密度条件下，光线穿越体时，每个体素对光线的吸收发射分布情况 ”

2014-06-05 16:22:42 10893

原创 GPU Raycasting的两种实现方法

Raycasting的核心是从每一个屏幕像素处发射一条

2014-06-05 09:53:22 6777

原创针对大数据的体绘制：一种基于FBO的方法

GPU的并行计算能力特别适用于基于ray casting的体绘制方法

2014-05-27 15:35:34 1766

原创 OpenGL 交互方式Trackball的实现代码

Trackball是将屏幕上捕捉到的鼠标位置转换到一个球面的

2014-05-16 14:00:37 4153

原创 GLSL中in和uniform变量的使用

GLSL通过 vertex shader来处理每一个顶点的数据，例如确定去

2014-04-15 12:41:47 5674

原创 CUDA中模板类和模板函数

以向量加法为例，包含三个文件：kernel.h,kernel.cu,test.cppkernel.h:

2014-03-05 10:59:40 6214

原创数据挖掘的功能总结

总的来说，数据挖掘任务可以分为两类：描述性的和预测性的。描述性的数据挖掘任务是对目标数据集中数据的属性进行特征描述，而预测性的挖掘任务是对当前数据进行归纳以进行预测。1，特征描述和区分特征描述是对某类的数据的一般特征或属性的总结。特征描述的结果可以以多种方式进行展现，例如饼状图，条形图，曲线，多维数据立方体，多维表等。数据区分是将某类的数据的一般特征与另一个或多个类别的

2014-02-20 14:40:03 5742

原创 CUDA内存使用

CUDA线程可以在运行过程中从多中内存空间访问数据，分为三个层次：1，局部内存：每一个线程有其私有的局部内存。2，共享内存：每一个线程块（thread block）有一个共享内存，可以被该线程块中的所有线程访问。3，全局内存：所有的线程都能访问。此外还有两个能被所有线程都访问的只读内存空间：constant 和texture内存空间，如下图所示：

2014-02-19 16:03:42 1943

原创数据挖掘中的十个著名算法

2006年的ICDM（the IEEE International Conference on Data Mining) 上，评选出了数据挖掘领域的十大经典算法，分别是1，C4.5,2，k-Means3，SVM4，Apriori5，EM6，PageRank7，AdaBoost8，kNN9，Naive Bayes10，CART,

2014-02-18 13:57:09 12065