Reconnaissance de formes

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

La reconnaissance de formes (ou parfois reconnaissance de motifs) est un ensemble de techniques et méthodes visant à identifier des motifs informatiques à partir de données brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif^[1]. On considère que c'est une branche de l'intelligence artificielle qui fait largement appel aux techniques d'apprentissage automatique et aux statistiques.

Le mot forme est au sens très général, il ne s'agit pas que de forme géométrique. Les formes ou motifs à reconnaître peuvent être de natures très variées. Il peut s'agir de contenu visuel (code barre, visage, empreinte digitale...) ou sonore (reconnaissance de parole), d'images médicales (rayon X, EEG, IRM...) ou multispectrales (images satellitaires) et bien d'autres.

Méthodes

La reconnaissance de motifs peut être effectuée au moyen de divers algorithmes d'apprentissage automatique tels :

un réseau de neurones
une analyse statistique
l'utilisation de modèles de Markov cachés
une recherche d'isomorphisme de graphes ou sous-graphes

Les formes recherchées peuvent être des formes géométriques, descriptibles par une formule mathématique, telles que :

cercle ou ellipse
courbes de Bézier, splines
droite

Elles peuvent aussi être de nature plus complexe :

lettre
chiffre
empreinte digitale

Les algorithmes de reconnaissance peuvent travailler sur des images en noir et blanc, avec en blanc les contours des objets se trouvant dans l'image. Ces images sont le fruit d'algorithmes de détection de contours. Ils peuvent aussi travailler sur des zones de l'image prédéfinies issues de la segmentation de l'image.

Méthodes de reconnaissance de formes :

Mise en correspondance de graphes
Méthode Bayesienne
Estimation Paramétrique
Classifieur linéaire
Réseau de neurones
Local feature focus
SVM : Support Vector Machine
Polytôpes de contrainte
Méthode des hypercubes

Un algorithme bien connu pour la détection de formes, la transformée de Hough, est une méthode d'estimation paramétrique.

La méthode globale

Cette méthode caractérise une forme et extrait des paramètres caractéristiques de l'objet et les comparent par une méthode de classification ou de mise en correspondance à une base d'apprentissage. Par cette méthode, il est impossible d'extraire plusieurs formes de la même image sans pré-traitement.

La méthode multiple à partir de point d'intérêt

Dans cette approche, on extrait des points caractéristiques d'objets comme les coins via les détecteurs de Harris puis on extrait des caractéristiques aux voisinage de ce point. Avec ces caractéristiques, il est possible d'extraire plusieurs objets et de faire la reconnaissance de ceux-ci via un classifieur.

Applications

Jeu de go par ordinateur
Reconnaissance vocale
Recherche d'images par le contenu
Classification de documents
Reconnaissance de l'écriture manuscrite
Reconnaissance optique de caractères

Bibliographie

(en) Richard O. Duda, Peter E. Hart, David G. Stork, Pattern classification, Wiley-interscience,‎ 2001 (ISBN 0-471-05669-3) [détail des éditions]
(en) Dietrich Paulus and Joachim Hornegger (1998) Applied Pattern Recognition (2nd edition), Vieweg. ISBN 3-528-15558-2
(en) J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley&Sons, 1996, ISBN 0-471-13534-8
(en) Sholom Weiss and Casimir Kulikowski (1991) Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5
(en) Christopher M. Bishop, Pattern Recognition And Machine Learning, Springer,‎ 2006 (ISBN 0-387-31073-8) [détail des éditions]

Références

↑ (en) Richard O. Duda, Peter E. Hart, David G. Stork, Pattern classification, Wiley-interscience,‎ 2001 (ISBN 0-471-05669-3) [détail des éditions]

Portail de l'informatique théorique
Portail des probabilités et de la statistique

This article is issued from Wikipédia - version of the Tuesday, August 26, 2014. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.