Reconnaissance de formes
|
Cet article est une ébauche concernant l’informatique. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
|
La reconnaissance de formes (ou parfois reconnaissance de motifs) est un ensemble de techniques et méthodes visant à identifier des motifs informatiques à partir de données brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif[1]. On considère que c'est une branche de l'intelligence artificielle qui fait largement appel aux techniques d'apprentissage automatique et aux statistiques.
Le mot forme est au sens très général, il ne s'agit pas que de forme géométrique. Les formes ou motifs à reconnaître peuvent être de natures très variées. Il peut s'agir de contenu visuel (code barre, visage, empreinte digitale...) ou sonore (reconnaissance de parole), d'images médicales (rayon X, EEG, IRM...) ou multispectrales (images satellitaires) et bien d'autres.
Méthodes
La reconnaissance de motifs peut être effectuée au moyen de divers algorithmes d'apprentissage automatique tels :
- un réseau de neurones
- une analyse statistique
- l'utilisation de modèles de Markov cachés
- une recherche d'isomorphisme de graphes ou sous-graphes
Les formes recherchées peuvent être des formes géométriques, descriptibles par une formule mathématique, telles que :
Elles peuvent aussi être de nature plus complexe :
- lettre
- chiffre
- empreinte digitale
Les algorithmes de reconnaissance peuvent travailler sur des images en noir et blanc, avec en blanc les contours des objets se trouvant dans l'image. Ces images sont le fruit d'algorithmes de détection de contours. Ils peuvent aussi travailler sur des zones de l'image prédéfinies issues de la segmentation de l'image.
Méthodes de reconnaissance de formes :
- Mise en correspondance de graphes
- Méthode Bayesienne
- Estimation Paramétrique
- Classifieur linéaire
- Réseau de neurones
- Local feature focus
- SVM : Support Vector Machine
- Polytôpes de contrainte
- Méthode des hypercubes
Un algorithme bien connu pour la détection de formes, la transformée de Hough, est une méthode d'estimation paramétrique.
La méthode globale
Cette méthode caractérise une forme et extrait des paramètres caractéristiques de l'objet et les comparent par une méthode de classification ou de mise en correspondance à une base d'apprentissage. Par cette méthode, il est impossible d'extraire plusieurs formes de la même image sans pré-traitement.
La méthode multiple à partir de point d'intérêt
Dans cette approche, on extrait des points caractéristiques d'objets comme les coins via les détecteurs de Harris puis on extrait des caractéristiques aux voisinage de ce point. Avec ces caractéristiques, il est possible d'extraire plusieurs objets et de faire la reconnaissance de ceux-ci via un classifieur.
Applications
- Jeu de go par ordinateur
- Reconnaissance vocale
- Recherche d'images par le contenu
- Classification de documents
- Reconnaissance de l'écriture manuscrite
- Reconnaissance optique de caractères
Articles connexes
- Extraction de caractéristique en vision par ordinateur
Bibliographie
- (en) Richard O. Duda, Peter E. Hart, David G. Stork, Pattern classification, Wiley-interscience, (ISBN 0-471-05669-3) [détail des éditions]
- (en) Dietrich Paulus and Joachim Hornegger (1998) Applied Pattern Recognition (2nd edition), Vieweg. ISBN 3-528-15558-2
- (en) J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley&Sons, 1996, ISBN 0-471-13534-8
- (en) Sholom Weiss and Casimir Kulikowski (1991) Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5
- (en) Christopher M. Bishop, Pattern Recognition And Machine Learning, Springer, (ISBN 0-387-31073-8) [détail des éditions]
Références
- ↑ (en) Richard O. Duda, Peter E. Hart, David G. Stork, Pattern classification, Wiley-interscience, (ISBN 0-471-05669-3) [détail des éditions]
- Portail de l'informatique théorique
- Portail des probabilités et de la statistique