mercredi 10 juin 2015

Ouvrage de référence

Cornell J.A., Experiments with Mixtures, Designs, Models, and the Analysis of Mixture Data, Third Edition, Wiley, Ed. New-York, 2002, 649 pages.

Peu de livres sont intégralement consacrés aux plans de mélange ; ils seront présentés au fil des semaines dans ce blog. Il semble opportun de commencer par l’ouvrage de John Cornell : « Experiments with Mixtures » reprenant ainsi le titre de la publication fondatrice produite par Henry Scheffé en 1958.

Après une première édition en 1980, puis une deuxième édition en 1990, on dispose depuis 2002 d’une troisième édition que beaucoup considèrent à juste titre comme l’ouvrage de référence sur les plans de mélange.

On va s’attarder dans cet article à commenter le sous-titre qui s’articule autour de trois concepts :


  1. Designs : Il s’agit ici de la conception d’une campagne expérimentale qui requiert de définir le nombre et la nature des expériences à réaliser. Dans les problèmes de formulation, la nature des variables est le plus souvent représentée par les proportions des constituants, sans toutefois exclure des variables dites externes, comme des variables technologiques ou la quantité de mélange utilisée. Mais la conception d’une campagne expérimentale ne s’arrête pas là. Il convient d’intégrer la notion d’ordre de mise en œuvre des mélanges et la notion de répétition, deux principes chers à Ronald Fisher (1890-1962) qui posa au début du XXe siècle les bases de l’expérimentation et des plans d’expériences. Un peu plus de 200 pages sont consacrés à la construction des plans d’expériences dédiés aux problèmes de formulation dans cet ouvrage.

    De nombreux exemples viennent illustrer les propos de l’auteur aussi bien pour des constructions empiriques faisant appel à des maillages de type Simplex lattice design, Simplex centroid design ou encore Extreme vertices design, que pour des constructions algorithmiques faisant appel à des critères algébriques conduisant à des maillages de type D-optimal design par exemple. On pourra regretter l’absence de constructions plus géométriques comme les matrices d’expériences produites par des approches de type Distance based design ou encore Uniform design. Mais cette troisième édition a été publié en 2002 et ne pouvait intégrer des développements plus récents.

  2. Models : Quand on met en œuvre un plan d’expériences, on espère a posteriori estimer les coefficients d’un modèle permettant de décrire, de la meilleure façon possible, la variation d'une ou plusieurs réponses en fonction d’une ou plusieurs variables de prédiction qui, rappelons-le, sont souvent représentées par les proportions massiques, volumiques ou molaires des constituants. Or, dans l’espace mathématique, les proportions sont des nombres réels dont les valeurs varient dans un intervalle d’amplitude maximale égale à l’unité, et parfois moins lorsque des contraintes, dictées par l’expertise des métiers, limitent les plages de variation. Par ailleurs, la somme des proportions des constituants que l’on souhaite faire varier doit respecter une valeur constante, cette somme ne pouvant excéder une valeur maximale égale à 100%. C’est pour ces raisons que des modèles spécifiques ont été associés à la construction puis à l’analyse des plans de mélange.

    Une large part est faite ici aux formes canoniques des modèles polynomiaux ou aux modèles synergiques sans oublier toutefois les possibilités de modélisation à partir de variables indépendantes, comme par exemple les rapports judicieusement choisis entre les proportions des constituants. D'autres formes de modélisation sont présentées comme les modèles homogènes de degré un ou l’utilisation de termes inverses. Une partie plus importante pourrait être consacrée au modèle de Cox, bien utile lorsqu’on souhaite interpréter directement les coefficients d’un modèle en tant qu’effet des variations des proportions des constituants. Il faut toujours garder en mémoire que la construction d’un plan d’expériences nécessite de postuler a priori une forme particulière de modélisation, afin d’analyser a posteriori la variation des réponses observées. Cette partie consacrée aux modèles est ici encore largement illustrée.

  3. Analysis of Mixture Data : il existe des techniques d’analyse bien spécifiques aux plans de mélange, bien que largement inspirées des techniques d’analyse de régression. L’estimation des modèles à partir de la méthode des moindres carrés est abondamment décrite dans cet ouvrage, au même titre que différentes méthodes de restitution graphique de l’information contenue dans l’expression du modèle.

    Les aspects statistiques sous-jacents à l’analyse sont présentés de façon très complète avec un formalisme rigoureux. Par contre, on peut regretter qu’il ne soit pas fait mention de méthodes alternatives à la méthode des moindres carrés, comme par exemple la méthode de régression PLS ou la modélisation par réseaux de neurones. Au même titre, une présentation de méthodes d’analyse multidimensionnelle des données aurait été pertinente compte-tenu du nombre important de réponses que l’on rencontre souvent dans les problèmes de mélange et que dire de l’analyse des réponses qualitatives ? Pour la recherche d’un optimum multi-critères, la présentation de l’utilisation des fonctions de désirabilité mériterait des développements plus conséquents ou des propositions alternatives, tant ce type de problématique est rencontré fréquemment. C’est donc sûrement ce troisième volet qui mériterait d’être le plus approfondi dans une nouvelle édition, au risque d’aboutir à un ouvrage trop important …
Pour terminer, cet ouvrage qui date de 2002 est très agréable à lire. Chacun pourra apprécier suivant ses besoins les nombreuses références bibliographiques, les nombreux exercices d’application et leurs éléments de correction, ainsi que quelques lignes de programmation rapportées en annexe. Les développements mathématiques, certes essentiels mais de moindre importance pour la compréhension des chapitres, sont souvent reportés à la fin de ces derniers, ce qui permet différents niveaux de lecture et de recherche d’information. 

L’ouvrage de John Cornell est un ouvrage de référence que les utilisateurs de plans de mélange se doivent de consulter régulièrement.