池化

作者:羊肉串 最后修改日期:2021-04-17 11:28

池化是一种对图片进行压缩的方法。

因图片越大,处理速度与识别难度越大。我们通过池化处理,来降低图片的尺寸。

如通过max pooling这种池化算法

就是让四个像素格子中,选择保留一个最大的像素,舍弃其余三个的方法。


    池化即空间池化,是卷积神经网络中用于提取特征的一种方法,通过对不同特征进行聚合统计处理以获得相对更低的维度,同时避免出现 过拟合 现象。

池化在降低各个特征图维度的同时保留大部分重要信息,目前主要有最大化、平均化、加和等方式。

常见的池化操作
最常见的池化操作有平均池化 (mean pooling) 和最大值池化 (max pooling) 两种。

平均池化:计算图像区域的平均值,并以此作为该区域池化后的值。
最大值池化:选取图像区域的最大值,并以此作为该区域池化后的值。
定义一个空间邻域,并从修正特征图中取出最大的元素,也可以取平均值。

池化的作用

池化函数可以逐渐降低输入表示的空间尺度:

降低特征维度,网络中的参数和计算的数量更加可控的降低;
使网络对于输入图像中更小的变化、冗余和变换变得不变性;
协助获取图像最大程度上的尺度不变性。





池化是使用某一位置的相邻输出的总体统计特征代替网络在该位置的输出,其好处是当输入数据做出少量平移时,经过池化函数后的大多数输出还能保持不变。比如:当识别一张图像是否是人脸时,我们需要知道人脸左边有一只眼睛,右边也有一只眼睛,而不需要知道眼睛的精确位置,这时候通过池化某一片区域的像素点来得到总体统计特征会显得很有用。由于池化之后特征图会变得更小,如果后面连接的是全连接层,能有效的减小神经元的个数,节省存储空间并提高计算效率。 如 图 所示,将一个2×2的区域池化成一个像素点。通常有两种方法,平均池化和最大池化。

 

 如图(a):平均池化。这里使用大小为2×2的池化窗口,每次移动的步幅为2,对池化窗口覆盖区域内的像素取平均值,得到相应的输出特征图的像素值。

如图(b):最大池化。对池化窗口覆盖区域内的像素取最大值,得到输出特征图的像素值。当池化窗口在图片上滑动时,会得到整张输出特征图。池化窗口的大小称为池化大小,用表示。在卷积神经网络中用的比较多的是窗口大小为2×2,步幅为2的池化。


Copyright © 2020 万物律动 旗下 AI算法狮 京ICP备20010037号-1
本站内容来源于网络开放内容的收集整理,并且仅供学习交流使用;
如有侵权,请联系删除相关内容;