机器学习中使用的神经网络第五讲:CNN
Geoffery Hinton教授的Neuron Networks for Machine Learning的第五讲主要介绍物体识别问题的难点及克服这些难点的方法,重点介绍了数字识别和物体识别中使用的卷积网络。
Why object recognition is difficult
我们知道识别真实场景中的物体是很困难的,这一小节我们来介绍造成这些困难的一些东西。
- Segmentation: 在一个图像中,我们很难将其中的一个物体与其他的物体分隔开。在现实生活中,我们人类有两只眼睛且我们身体可以移动,这样在视觉上可以很容易做到分辨物体。而图像是静态的,且一个物体很可能被另一个物体遮住一部分,这就造成了信息的缺失。
- Lighting: 像素点的密度/亮度(intensity)是由物体的亮度决定的,我们从不同亮度的图像中得到的信息是不同的。
- Deformation: 非仿射方式的变形也使得识别变得困难
- Affordances: 这里还涉及到功能可见性(affordance)的问题,有很多物体是从用途角度去定义的,而非从视觉角度,例如椅子有着各种各样的物理性状。
- Viewpoint: 视角的变化会造成图像的变化,而标准的学习方法是无法应付的。