The What and Where in Visual Object Recognition

Sinds kort zijn de technieken om objecten in beelden te herkennen nauwkeurig genoeg om te gebruiken in zoektaken, zoals bijvoorbeeld in Google Image search. Toch blijft het voor computers lastig om objecten te herkennen in een foto. Jasper Uijlings deed onderzoek naar het zogenaamde Bag-of-Words-model en leverde een bijdrage aan de versnelling van het algoritme. Bij het Bag-of-Words- model wordt het beeld opgedeeld in kleine stukjes. Ieder stukje wordt toegekend aan categorieen zoals hoekig, strepig, of egaal blauw. Vervolgens wordt aan het aantal stukjes hoekig en strepig bepaald of er bijvoorbeeld een koe in het plaatje staat. Wat vreemd is aan deze Bag-of-Words-representatie is dat de locatie van een object volledig wordt genegeerd. Uijlings concludeert dat het goed zou zijn om de objectlocatie weer terug te brengen. Daartoe ontwikkelde hij een methode die de objectlocatie op een efficiente manier kan representeren. Hiermee is het mogelijk om meerdere objecten in een beeld te identificeren, in plaats van alleen individuele beelden.

[1]  Cordelia Schmid,et al.  A performance evaluation of local descriptors , 2005, IEEE Transactions on Pattern Analysis and Machine Intelligence.

[2]  Cordelia Schmid,et al.  Local Features and Kernels for Classification of Texture and Object Categories: A Comprehensive Study , 2006, 2006 Conference on Computer Vision and Pattern Recognition Workshop (CVPRW'06).

[3]  Lior Wolf,et al.  A Critical View of Context , 2006, International Journal of Computer Vision.

[4]  Alexei A. Efros,et al.  Putting Objects in Perspective , 2006, CVPR.

[5]  Joost van de Weijer,et al.  Fast Anisotropic Gauss Filtering , 2002, ECCV.

[6]  Frédéric Jurie,et al.  Groups of Adjacent Contour Segments for Object Detection , 2008, IEEE Trans. Pattern Anal. Mach. Intell..

[7]  Marcel Worring,et al.  Content-Based Image Retrieval at the End of the Early Years , 2000, IEEE Trans. Pattern Anal. Mach. Intell..

[8]  Leonidas J. Guibas,et al.  The Earth Mover's Distance as a Metric for Image Retrieval , 2000, International Journal of Computer Vision.

[9]  Ivan Laptev,et al.  Improving object detection with boosted histograms , 2009, Image Vis. Comput..

[10]  Antonio Criminisi,et al.  TextonBoost for Image Understanding: Multi-Class Object Recognition and Segmentation by Jointly Modeling Texture, Layout, and Context , 2007, International Journal of Computer Vision.