Apport du bootstrap à la régression PLS : application à la prédiction de la qualité des gazoles
Contribution of Bootstrap Techniques to Pls Regression: Application to the Prediction Model of Gas-Oil Quality Control
1
Institut français du pétrole, 1 et 4, avenue de Bois-Préau, 92852 Rueil-Malmaison Cedex - France
2
École du pétrole et des moteurs, 228-232, avenue Napoléon-Bonaparte, 92852 Rueil-Malmaison Cedex - France
Auteur de correspondance : salaheddine.aji@ifp.fr
L'objectif de la modélisation que nous développons s'intègre dans un processus de contrôle de qualité des produits élaborés en raffinerie. Nous construisons un modèle de prédiction statistique des propriétés chimiques des gazoles à partir des spectres proches infrarouges (PIR) de distillats moyens. Le grand nombre de variables explicatives ainsi que leur forte multicolinéarité préconisent une modélisation par régression PLS (partial least squares). La détermination des intervalles de prédiction nous amène à utiliser des techniques de bootstrap. Pour les mettre en Suvre, nous utilisons les propriétés du modèle PLS en tant que méthode de régression linéaire multiple à partir des composantes PLS orthogonales. Nous donnons ensuite des approximations de la distribution des coefficients ainsi que de la distribution des erreurs de prédiction.
Abstract
The objective of our modelling approach is a part of the quality control process of refining products. We build a prediction model of gas oil chemical properties from near infrared spectroscopy (NIR) of mid-distillates. The large number of explanatory variables and their high level of multicolinearity leads to the use of PLS (partial least squares) regression. Then, bootstrap techniques are used to determine prediction intervals. We consider the PLS model as a multiple linear regression on PLS orthogonal components to implement these bootstrap methods. Thus, we approximate the coefficients and prediction errors distributions.
© IFP, 2003