4.4 卷积神经网络(CNN)
神经网络(Neual Networks)是人工智能研究领域的一部分,当前最流行的神经网络是卷积神经网络。卷积神经网络目前在很多很多研究领域取得了巨大的成功,例如语音识别,图像识别,图像分割,自然语言处理等。
4.4.1 卷积神经网络的发展背景
在半个世纪以前,图像识别就已经是一个火热的研究课题。1950年中到1960年初,感知机吸引了机器学习学者的广泛关注。这是因为当时数学证明表明,如果输入数据线性可分,感知机可以在有限迭代次数内收敛。感知机的解是超平面参数集,这个超平面可以用作数据分类。然而,感知机却在实际应用中遇到了很大困难,这主要有如下两个问题造成的:
- 多层感知机暂时没有有效训练方法,导致层数无法加深;
- 由于采用线性激活函数,导致无法处理线性不可分问题,比如“异或”。
上述问题随着后向传播(back propagation,BP)算法和非线性激活函数的提出得到解决。1989年,BP算法被首次用于CNN中处理2-D信号(图像)。
在2012年的ImageNet挑战赛中,CNN证明了它的实力,从此在图像识别和其他应用中被广泛采纳。