mercredi 2 septembre 2015

Editorial Septembre 2015

C'est la rentrée et l'occasion d'annoncer son traditionnel programme !

Durant les deux derniers mois, vous avez pu découvrir deux méthodes de construction d'un plan de mélange lorsque le domaine expérimental prend la forme d'un simplexe. Les dispositifs expérimentaux proposés par Henry Scheffé sous le nom de Simplex Lattice Design en 1958, puis de Simplex Centroid Design en 1963 ont été tout d'abord introduits sous forme d'un cours magistral, puis illustrés à partir de deux études de cas. D'autres études de cas sont d'ores et déjà programmées pour montrer l'application de cette démarche dans différents secteurs industriels. 

Afin d'estimer les coefficients des modèles sous-jacents à l'analyse de la variation des valeurs observées, j'ai fait appel systématiquement à deux approches : une approche pragmatique d'une part et la mise en oeuvre de la méthode des moindres carrés d'autre part. 

Le pragmatisme provient du fait que le nombre de mélanges proposés par les dispositifs précédemment cités est rigoureusement égal au nombre de coefficients à estimer. On a donc autant d'équations que d'inconnues. Par ailleurs, les proportions des constituants mises en oeuvre dans le plan de mélange permettent d'écrire très facilement des formules analytiques pour calculer les coefficients. Certes, on peut reprocher à la majorité des dispositifs proposés par Henry Scheffé de ne pas être des plans optimaux au sens des critères algébriques sur lesquels on reviendra dans un article spécifique, mais ils offraient (et offrent encore aujourd'hui) aux expérimentateurs une stratégie d'étude cohérente et facile à mettre en oeuvre quand on ne dispose que de moyens de calculs modestes.

Toutefois, lorsque le domaine expérimental devient un polyèdre convexe en raison des contraintes explicites imposées par les expérimentateurs, ou bien quand le nombre de mélanges dépasse le nombre de coefficients à estimer, le pragmatisme des précédentes méthodes de calcul prend fin et il convient de recourir à une méthode d'estimation plus générale.

Issus de la lignée des plans d'expériences pour l'étude des surfaces de réponse, les plans de mélange font le plus souvent appel à la méthode des moindres carrés comme méthode d'ajustement des modèles. C'est en quelque sorte une méthode "historique" d'estimation des coefficients due à Adrien Marie Legendre en 1805 d'une part et à Johan Carl Friedrich Gauss en 1809 d'autre part. Comme chacun le sait, ou le découvrira dans les séquences diffusées ce mois-ci, la méthode des moindres carrés permet de minimiser la somme des carrés des écarts entre les valeurs observées et les valeurs restituées par le modèle. Plus cette somme des carrés des écarts devient faible, plus le modèle présente généralement une qualité descriptive importante.

Lors de la présentation des deux premières études de cas dans les articles de ce blog, j'ai rappelé succinctement les étapes de mise en oeuvre de la méthode des moindres carrés, sans revenir sur quelques démonstrations et justifications qui me semblent aujourd'hui nécessaires. Ce sera donc l'objet des prochains articles à paraître, articles que l'on pourrait regrouper sous un titre générique tel que l'analyse de régression.

La semaine prochaine, je commenterai assez longuement un livre en français consacré à ce sujet. Bien que le contenu de ce livre ne soit pas spécifique aux plans de mélange, je recommande vivement cet ouvrage aux utilisateurs qui trouveront des réponses aux questions que l'on se pose souvent, notamment pour l'analyse des résidus et les diagnostics d'un modèle.

La semaine suivante, nous retrouverons l'exemple d'un mélange binaire de sable et de gravier pour démontrer et justifier l'écriture de la méthode des moindres carrés sous forme matricielle. Ces aspects mathématiques donnent l'occasion d'introduire des noms de matrice, comme par exemple la matrice d'information ou la matrice de dispersion. Les invariants de ces matrices, tels que le déterminant de la matrice d'information et la trace de la matrice de dispersion apparaîtront plus tard dans des articles consacrés aux critères algébriques et à la construction de plans optimaux.

Après avoir abordé les aspects mathématiques, nous traiterons des aspects statistiques, en se limitant à des concepts simples de l'analyse de régression. Nous estimerons la qualité descriptive des modèles puis, après avoir défini la matrice H et la notion de levier, nous estimerons la qualité prédictive des modèles.

Le contenu de la dernière semaine n'est pas encore arrêté, mais rassurez-vous, la publication d'un nouvel article permettra de maintenir le rythme auquel vous vous êtes habitués !

Concernant la forme, le blog a changé légèrement d'aspect en intégrant des pages sous son bandeau frontal. J'ai pris l'initiative de créer quelques rubriques afin de classer les articles du blog, chaque nouvel article publié apparaissant dans la page accueil. Au fur et à mesure de la publication des articles, des liens hyper-textes vous permettent d'atteindre le sujet recherché depuis des pages intitulées "Support de cours", "Etudes de cas", "Excel et Logiciels", "Bibliographie" et "Dictionnaire / Glossaire / Lexique". Cette page suggérée par Pascal, fidèle abonné qui se reconnaîtra depuis sa retraite fourasine, sera implémentée au fur et à mesure de la publication de nouveaux articles. N'hésitez pas à la consulter régulièrement et à me suggérer de nouvelles entrées et de nouvelles définitions pour ce glossaire.

Bonne rentrée à toutes et à tous !