RésuméCet article présente une approche originale de reconstruction et d’animation tridimensionnelle du visage humain à partir d’une séquence monoculaire et non calibrée d’images. Un processus d’analyse-synthèse de l’information contenue dans les images permet le clonage 2D→3D grâce au fonctionnement combiné de deux algorithmes de reconstruction fondés sur le mouvement (synthèse). Le prétraitement sur les images aboutissant à la mise en correspondance temporelle de points (analyse) est réalisé par un algorithme de d’appariement de blocs utilisant la grille fournie par la triangulation de Delaunay de la première image. La classification du mouvement est ensuite réalisée par l’utilisation d’une famille locale de descripteurs invariants. Quelques résultats expérimentaux validant la démarche employée sont également présentés.AbstractAn original approach for three-dimensional reconstruction and animation of human face with a monocular and un-calibrated acquisition system is presented. This method is based on the classical analysis-synthesis scheme. A three-dimensional reconstruction of shape and movement is performed with a combination of two algorithms using the well-known “Zfrom motion” principle. Therefore a pre-processing step is needed to first detect the human face on vidéoconférence sequence. Then, a set of points is tracked with a new hybrid and adaptive block-matching algorithm using the Delaunay tessellation. A local algebraic projective invariant family performs the 3D movement classification to satisfy the 3D synthesis assumptions. Experimental results on synthetic and noisy data set validate the entire approach.
[1]
Thomas S. Huang,et al.
Uniqueness and Estimation of Three-Dimensional Motion Parameters of Rigid Objects with Curved Surfaces
,
1984,
IEEE Transactions on Pattern Analysis and Machine Intelligence.
[2]
Aaron Heller,et al.
An experimental evaluation of projective invariants
,
1992
.
[3]
Long Quan,et al.
Invariants of Six Points and Projective Reconstruction From Three Uncalibrated Images
,
1995,
IEEE Trans. Pattern Anal. Mach. Intell..
[4]
David A. Forsyth,et al.
Invariant Descriptors for 3D Object Recognition and Pose
,
1991,
IEEE Trans. Pattern Anal. Mach. Intell..
[5]
Thomas S. Huang,et al.
Motion and Structure from Orthographic Projections
,
1989,
IEEE Trans. Pattern Anal. Mach. Intell..
[6]
Robert C. Bolles,et al.
Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography
,
1981,
CACM.
[7]
Long Quan,et al.
Invariants of 6 Points from 3 Uncalibrated Images
,
1994,
ECCV.
[8]
Olivier Soligon.
Modélisation et animation du buste humain pour la compression de séquences d'images visiophoniques
,
1998
.
[9]
C. Roux,et al.
Modélisation et représentation du visage humain et de ses expressions
,
1997
.
[10]
Ding Mingyue,et al.
The unique solution of projective invariants of six points from four uncalibrated images
,
1997
.
[11]
Narendra Ahuja,et al.
Matching Two Perspective Views
,
1992,
IEEE Trans. Pattern Anal. Mach. Intell..