使用pooling的目的之一是获取一定的特征不变性,目前用的比较多的是Max..,非线性对于Deep的重要性不用多说,pooling是主要贡献之一,当然少不了relu类的激活函数。pooling还有一个重要的作用是为了保持某种不变性。pooling有优势必有劣势,邻域大小受限造成的顾及只方差增大,卷积层参数误差造成估计均值的偏移。一般ave能减小第一种,而max能减小第二种。Learning Mid-Level Features For Recogniiton对前两者有详尽对比。