卷积神经网络笔记(一)

卷积神经网络(Convolutional Neural Network)是近年来最火的机器学习模型之一,尤其是这两年大放异彩的Alpha Go,采用的就是CNN模型,这里就简单介绍一下CNN的基本原理及优势

CNN发明之初主要用在图像识别上

图像的特征识别有三个特点

1 图片的特征仅占整个图片的一小部分

2 同一个特征可能出现在图片的不同地方

3 对图片二次采样后得到的图片与原图片差别不大(例如取原图的奇数行和奇数列像素组成新的图片仍与原图相似)

CNN的结构如下图所示


由若干个卷积层(convolution)和池化层(Max Pooling)组成,然后将平坦化后的结果输入一个全联接的前馈神经网络来得到想要的结果。

卷积神经网络的重点是卷积层,卷积层的作用是进行特征识别


如图所示,右上角的3X3矩阵可以看作是一个特征,左边的6X6矩阵可以看作一副黑白图像,将特征在图像上以1的步距进行覆盖,每次覆盖后都将Filter 与图像做矩阵乘法,最后得到一个4X4的新矩阵。



Max Poolig 的作用是选取每个部分最大值组成一个新的矩阵,比如左图四个区域最大值分别为3,0,3,1,即为新矩阵。


以上两个过程可以重复进行,最终将一个较大的图片处理成比较小的一个矩阵。然后使用flatten将矩阵拉成一列,将其输入一个全联接的前馈神经网络中,最后输出即为我们想要的结果。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容