La reconnaissance de formes : les expressions faciales
Sommaire
Nous nous centrons sur les différentes méthodes qui peuvent être utilisées par les systèmes de reconnaissance d'expressions faciales (apprentissages, statistiques, etc.). Certaines de ces méthodes sont aussi utilisées pour l'identification faciale. Les deux travaillent sur le visage, mais là ou l'identification cherche à savoir à quel individu de notre base appartient le visage présenté, la reconnaissance des expressions cherche à savoir à quelle classe d'émotion ce visage appartient.
Entre la première partie détection et suivi du visage, et la troisième partie classification des expressions, nous avons inséré une partie essai de détection de bouche. Celle-ci regroupe nos trois tentatives d'algorithme de détection, leur explication et leur critique.
- Le visage
- Détection
- Suivi
- Essai d'algorithme de détection de la bouche
- Essai 1 : Un raisonnement sur les couleurs à proprement parler (RGB)$page->lire_suite('2.1', TRUE);?>
- Essai 2 : Une analyse de la teinte qui prend en compte la saturation et la luminosité$page->lire_suite('2.2', TRUE);?>
- Essai 3 : analyse des contrastes$page->lire_suite('2.3', TRUE);?>
- Les expressions
- Méthodes globales et géométriques$page->lire_suite('3.1', TRUE);?>
- Méthodes supervisées et non-supervisées$page->lire_suite('3.2', TRUE);?>
- Description des différentes approches
- L'approche machine à vecteurs de support (ou séparateurs à vaste marge)$page->lire_suite('3.3.1', TRUE);?>
- L'approche ACP (ou visages propres)$page->lire_suite('3.3.2', TRUE);?>
- L'approche réseaux de neurones$page->lire_suite('3.3.3', TRUE);?>
- Méthode des « k plus proches voisins » (k-nearest neighbor classifier)$page->lire_suite('3.3.4', TRUE);?>
- L'approche statistique/probabiliste$page->lire_suite('3.3.5', TRUE);?>
- L'approche stochastique$page->lire_suite('3.3.6', TRUE);?>
Le visage
Si l'on veut faire de la reconnaissance d'expressions, on a au préalable besoin de détecter un visage dans une photographie, et de le suivre dans une vidéo. On se doute que la difficulté de la tâche augmentera avec la complexité de la scène (objets nombreux, contrastés, etc.), l'orientation du visage et la luminosité.
Détection
La détection du visage est déjà une reconnaissance de forme, même si ce n'est pas sur celle-ci que nous allons nous pencher. L'astuce la plus courante pour détecter un visage, est de repérer le triangle défini par : l'œil droit, l'œil gauche et la bouche. Une idée –naïve– pour le faire ressortir est de flouter l'image : diminuer sa qualité jusqu'à faire apparaître les 3 éléments. Mais des algorithmes plus complexes et bien plus robustes existent, les plus performants étant ceux qui utilisent plusieurs méthodes complémentaires.
Suivi
Le suivi d'un visage dans une vidéo est très intéressant pour la reconnaissance d'expressions. On imagine mal une application d'un système qui se contenterait d'analyser des visage statiques. Suivre les modifications du visage dans le temps permet de prendre en compte la dynamique d'une expression : l'évolution d'un sourire en dit beaucoup plus qu'une seule image de sourire, figé dans le temps. À partir du moment où l'on désir voir les variations qu'il y a eu entre un instant t et t+1, il est nécessaire de prendre en compte le facteur "espace". Un individu étant rarement statique (même devant un ordinateur) il faut pouvoir annuler son déplacement, ou au moins en tenir compte dans les calculs.
Essai d'algorithme de détection de la bouche
L'objectif étant de détecter la bouche d'un individu sur nos photos : nous avons songé à trois méthodes.
Essai 1 : Un raisonnement sur les couleurs à proprement parler (RGB)
C'est une démarche que l'on pourrait qualifier de descendante. Nous analysons des zones de l'image de plus en plus petites. Le résultat est une plage colorée spécifique.
$page->lire_suite('2.1');?>Essai 2 : Une analyse de la teinte qui prend en compte la saturation et la luminosité
Nos données RGB sont traduites en valeurs HSV. Nous partons d'un grillage initial plus fin que le précédent, que nous pouvons ou augmenter ou réduire selon les résultats obtenus.
$page->lire_suite('2.2');?>Essai 3 : analyse des contrastes
Contrairement aux deux autres il s'agit d'une démarche montante. Nous travaillons l'élément atomique de l'image : le pixel. De ces pixels, nous déduisons des formes plus globales, par détection des contours.
$page->lire_suite('2.3');?>Les expressions
Il s'agit des différentes méthodes utilisées pour construire des classes. Ici, nous désirons classer des visages expressifs dans des classes d'émotions de base. Il s'agit donc d'interprétation d'expression faciales plus que de reconnaissance.
Une fois ces classes définies, on peut présenter un nouveau visage à notre système de reconnaissance et celui-ci décidera à quelle classe le visage appartient. Ce choix d'appartenance résulte d'un calcul qui dépend fortement de la méthode utilisée pour obtenir les classes (calcul de moindre distance, sortie d'un réseau, etc.).
Méthodes globales et géométriques
Les systèmes de détection de visages actuels peuvent être classés selon que l'on se base sur le visage en entier ou sur des points caractéristiques.
$page->lire_suite('3.1');?>Méthodes supervisées et non-supervisées
Lorsqu'on utilise un apprentissage automatique, celui-ci peut être: supervisé, non-supervisé, ou encore par renforcement.
$page->lire_suite('3.2');?>