Unsupervised Segmentation of Spectral Images with a Spatialized Gaussian Mixture Model and Model Selection
Mélange de Gaussiennes spatialisé et sélection de modèle pour la segmentation non-supervisée d’images spectrales
1
IPANEMA USR 3461 CNRS/MCC, Saint Aubin, BP 48, 91 192
Gif-sur-Yvette -
France
2
École Polytechnique, CMAP UMR 7641 / lnria Saclay Idf,
Select, Route de
Saclay, 91 128
Palaiseau Cedex -
France
e-mail: serge.cohen@synchrotron-soleil.fr - erwan.le-pennec@polytechnique.edu
⋆
Corresponding author
In this article, we describe a novel unsupervised spectral image segmentation algorithm. This algorithm extends the classical Gaussian Mixture Model-based unsupervised classification technique by incorporating a spatial flavor into the model: the spectra are modelized by a mixture of K classes, each with a Gaussian distribution, whose mixing proportions depend on the position. Using a piecewise constant structure for those mixing proportions, we are able to construct a penalized maximum likelihood procedure that estimates the optimal partition as well as all the other parameters, including the number of classes. We provide a theoretical guarantee for this estimation, even when the generating model is not within the tested set, and describe an efficient implementation. Finally, we conduct some numerical experiments of unsupervised segmentation from a real dataset.
Résumé
Dans cet article nous décrivons un nouvel algorithme de segmentation non-supervisée applicable aux images spectrales. Cet algorithme étend les techniques de classification non-supervisée fondées sur les modèles de mélange de Gaussiennes, en y incorporant les informations spatiales : les spectres sont modélisés par un mélange de K classes, chacune avec une distribution Gaussienne, dont les proportions de mélange dépendent de la position. En imposant une structure constante par morceaux aux proportions de mélange, nous construisons une procédure d’estimation, de type maximum de vraisemblance pénalisée, qui optimise simultanément la partition ainsi que les autres paramètres du modèle, en particulier le nombre de classes. Nous fournissons une garantie théorique pour cette estimation, même quand la loi génératrice ne fait pas partie des modèles envisagés, et décrivons une mise en oeuvre efficace. Finalement, nous appliquons cet algorithme à un jeu de données réel.
© 2014, IFP Energies nouvelles