mercredi 24 juin 2015

Plans de mélange : Position du problème

Au fil des articles, ce blog abordera différentes facettes des plans d'expériences dédiés aux problèmes de formulation. Une classification des articles apparaîtra au fur et à mesure du développement de ce blog et tout naturellement, une page consacrée à des notes de cours y trouvera sa place.

Il m'a semblé important, dans une première publication intégrant des vidéos de cours, de rester généraliste ; les aspects plus mathématiques ou plus statistiques viendront en leur temps. Il s'agit donc ici d'une présentation des plans de mélange en trois volets :

  1. Boucle de la formulation : lorsqu'on est confronté à la recherche d'un optimum dans un problème de formulation, les différentes étapes de la démarche peuvent être regroupées autour d'une boucle décrite dans cette première séquence.

    C'est également dans cette séquence que l'on retrouve la présentation des 6 grandes stratégies expérimentales pour lesquelles des démarches méthodologiques ont été développées.

    Quelques livres (plus largement commentés dans des articles spécifiques de ce blog) sont présentés rapidement à la fin de cette première partie.


  2. Modélisation : derrière la construction de chaque plan d'expériences se cache un modèle, le nombre et la nature des expériences sélectionnées dans le domaine expérimental permettant d'estimer au mieux les paramètres de ce modèle.

    Sans entrer dans le détail de construction des formes canoniques des modèles polynomiaux, on insiste ici sur la notion de répartition uniforme des mélanges afin de minimiser la propagation des incertitudes.

    Un mélange binaire est utilisé pour introduire ce concept important dans cette deuxième séquence. Quand on cherche à trouver dans quelles proportions mélanger des constituants pour atteindre un optimum ou que l'on cherche à estimer les effets des variations des proportions autour d'un mélange de référence, un modèle adapté à chacune des problématiques se révèle être un vecteur d'information.

    Mais n'oublions pas qu'un modèle propage des incertitudes et la construction raisonnée d'un plan de mélange permet d'en contenir les effets.


  3. Mélange binaire et réseau de Scheffé : à partir de l'étude d'un mélange binaire de sable et de gravier, cette troisième séquence présente la démarche logique proposée par Henry Scheffé en 1958 pour construire un maillage de type Simplex Lattice Design.

    On associe à chacun des maillages une forme canonique spécifique pour les modèles polynomiaux, et on introduit la notion de modèle homogène de degré 1, proposé par Niels Becker en 1968.

    A la fin de cette séquence, on présente un récapitulatif de la qualité descriptive et prédictive de chacun des modèles, permettant de retenir ici comme meilleur modèle, la forme canonique du modèle polynomial de degré 3.

    La restitution du modèle sous forme graphique permet de présenter la notion de modèle direct et de modèle inverse, ce dernier étant très utile dans une problématique d'optimisation.


Chacune des séquences est ponctuée par un quizz de quelques questions ; en répondant à ces questions, vous capitaliserez ainsi les connaissances apprises lors de ce chapitre.


mercredi 17 juin 2015

Plans de mélange : Quelle stratégie adopter ?

La réussite d'un plan d'expériences est liée d'une part à l'association de différentes compétences et d'autre part au choix de la meilleure stratégie expérimentale à adopter pour espérer atteindre l'objectif fixé.

Dans les problèmes de formulation, il y a naturellement la compétence du chimiste qui propose différentes natures de constituants à mélanger en associant le plus souvent des contraintes aux plages de variation des proportions de ces constituants. Les proportions des constituants représentent les variables internes du plan de mélange. Mais même la meilleure "recette" n'a pas grande valeur si l'on ne dispose d'une expertise quant au mélangeage, ... qui traduit comme son nom l'indique l'action de mélanger. C'est ainsi que le technologue joue un rôle important pour procéder à des choix judicieux et à des réglages pertinents de variables dites variables externes, comme par exemple les différentes composantes d'un cycle de malaxage ou d'un cycle de cuisson. Il faut faire également appel à des compétences d'ordre métrologique pour caractériser les produits fabriqués, aussi bien à court terme qu'à long terme, avec des mesures physiques, mais aussi des mesures sensorielles. Mettre en œuvre un plan de mélange nécessite donc souvent un dialogue important entre différents acteurs.

Naturellement, les éléments de réponse aux questions que l'on se pose proviendront de la mise en œuvre d'une campagne expérimentale avec deux questions qui reviennent sempiternellement pour chaque nouvelle étude :
  • Combien d'expériences doit-on faire ?
  • Quelles expériences doit-on faire ?
Je serais tenté de répondre à la première question en adaptant à mon propos une phrase du regretté humoriste Fernand Raynaud (1926-1973) que l'on interrogeait sur le temps de refroidissement du fût du canon. S'il faut un certain temps dans le problème précité d'artillerie, il faut un certain nombre d'expériences dans un plan d'expériences !

Conscient que cette réponse évasive, mais pourtant vraie, ne peut satisfaire aucun examinateur et encore moins aucun industriel, on doit se résoudre à faire appel à une compétence supplémentaire, celle de la méthodologie expérimentale, souvent redoutée dans nos contrées parce qu'elle est associée à celle du statisticien, homme terrifiant qui ne sait parler qu'avec des écarts-types !

N'étant pas statisticien, je vais essayer de vous dresser une cartographie des approches expérimentales disponibles, à la fois sans parti pris et sans avoir recours à l'écart-type !

Il faut tout d'abord distinguer :

  • Les approches directes qui ne nécessitent pas l'estimation d'un modèle que ce soit pour chercher un optimum ou représenter l'effet des variations des proportions des constituants. Il s'agit de méthodes moins diffusées que les plans d'expériences. Ces méthodes, basées essentiellement sur du bon sens géométrique, peuvent être regroupées sous les locutions anglaises Sequential Simplex Optimization dans un objectif d'optimisation et Simplex Mixture Screening Design dans une problématique d'estimation et de comparaison des effets des variations des proportions des constituants. Ces approches feront l'objet d'articles spécifiques dans ce blog.

  • Les approches indirectes nécessitent d'abord l'estimation d'un modèle que l'on exploite ensuite pour répondre aux questions posées. La forme générique du modèle étant postulée avant la construction de la matrice d'expériences, il devient possible de calculer le nombre de paramètres de ce modèle, paramètres qui deviendront des coefficients lors de leur estimation. Ce nombre dépend naturellement du nombre de constituants et de variables externes mis en jeu lors de la campagne expérimentale. C'est ainsi que l'on peut répondre à la première question posée sous la forme d'une condition nécessaire : il faut au moins faire autant d'expériences que de coefficients à estimer. La condition suffisante qui fixe le nombre d'expériences à réaliser est liée à la recherche d'une incertitude "acceptable" qui affecte l'estimation des paramètres du modèle. Pour un modèle donné, cette condition dépend essentiellement de la géométrie du domaine expérimental.

Les approches indirectes ont donné lieu à une classification en 6 branches dans une publication proposée en 1994 par Gregory Piepel et John Cornell :

  • Component proportions : les variations de la réponse sont modélisées uniquement à partir des variations des proportions des constituants préalablement choisis.

  • Mixture amount : les variations de la réponse sont modélisées non seulement à partir des variations des proportions des constituants préalablement choisis mais aussi en fonction de la quantité de mélange utilisée.

  • Mixture Process variable : les variations de la réponse sont modélisées non seulement à partir des proportions des constituants préalablement choisis mais aussi en fonction des variations des facteurs externes à la formulation traduisant la mise en oeuvre des variables du procédé.

  • Slack variable : les variations de la réponse sont modélisées uniquement à partir des variations de (q-1) constituants minoritaires préalablement choisis, la proportion du constituant majoritaire restant servant de variable d'ajustement.

  • Mathematically independent variables : les variations de la réponse sont modélisées à partir des variations du rapport des proportions des constituants préalablement choisis.

  • Categorized components - Mixture of mixture : les variations de la réponse sont modélisées à partir de la définition de constituants majeurs représentant des classes de constituants mineurs.



Les références de la publication à l'origine de cette classification sont les suivantes :

Piepel G.F., Cornell J.A., Mixture experiment approaches : examples, discussion
and recommendations, Journal of Quality Technology, 1994, Vol. 26, N°3, 177-196.


On associe à chacun des stratégies précédentes une forme spécifique de modélisation, comme les formes canoniques des modèles polynomiaux ou les modèles produits par exemple. En fonction du nombre de variables internes et/ou externes, on peut donc connaître à l'avance le nombre de paramètres et estimer et donc le nombre minimal d'expériences à réaliser. La nature des mélanges à mettre en oeuvre fera l'objet de méthodes de construction de plan d'expériences, basées sur des approches empiriques, algorithmiques ou géométriques, qui seront présentées à l'occasion de futurs articles dans ce blog.

mercredi 10 juin 2015

Ouvrage de référence

Cornell J.A., Experiments with Mixtures, Designs, Models, and the Analysis of Mixture Data, Third Edition, Wiley, Ed. New-York, 2002, 649 pages.

Peu de livres sont intégralement consacrés aux plans de mélange ; ils seront présentés au fil des semaines dans ce blog. Il semble opportun de commencer par l’ouvrage de John Cornell : « Experiments with Mixtures » reprenant ainsi le titre de la publication fondatrice produite par Henry Scheffé en 1958.

Après une première édition en 1980, puis une deuxième édition en 1990, on dispose depuis 2002 d’une troisième édition que beaucoup considèrent à juste titre comme l’ouvrage de référence sur les plans de mélange.

On va s’attarder dans cet article à commenter le sous-titre qui s’articule autour de trois concepts :


  1. Designs : Il s’agit ici de la conception d’une campagne expérimentale qui requiert de définir le nombre et la nature des expériences à réaliser. Dans les problèmes de formulation, la nature des variables est le plus souvent représentée par les proportions des constituants, sans toutefois exclure des variables dites externes, comme des variables technologiques ou la quantité de mélange utilisée. Mais la conception d’une campagne expérimentale ne s’arrête pas là. Il convient d’intégrer la notion d’ordre de mise en œuvre des mélanges et la notion de répétition, deux principes chers à Ronald Fisher (1890-1962) qui posa au début du XXe siècle les bases de l’expérimentation et des plans d’expériences. Un peu plus de 200 pages sont consacrés à la construction des plans d’expériences dédiés aux problèmes de formulation dans cet ouvrage.

    De nombreux exemples viennent illustrer les propos de l’auteur aussi bien pour des constructions empiriques faisant appel à des maillages de type Simplex lattice design, Simplex centroid design ou encore Extreme vertices design, que pour des constructions algorithmiques faisant appel à des critères algébriques conduisant à des maillages de type D-optimal design par exemple. On pourra regretter l’absence de constructions plus géométriques comme les matrices d’expériences produites par des approches de type Distance based design ou encore Uniform design. Mais cette troisième édition a été publié en 2002 et ne pouvait intégrer des développements plus récents.

  2. Models : Quand on met en œuvre un plan d’expériences, on espère a posteriori estimer les coefficients d’un modèle permettant de décrire, de la meilleure façon possible, la variation d'une ou plusieurs réponses en fonction d’une ou plusieurs variables de prédiction qui, rappelons-le, sont souvent représentées par les proportions massiques, volumiques ou molaires des constituants. Or, dans l’espace mathématique, les proportions sont des nombres réels dont les valeurs varient dans un intervalle d’amplitude maximale égale à l’unité, et parfois moins lorsque des contraintes, dictées par l’expertise des métiers, limitent les plages de variation. Par ailleurs, la somme des proportions des constituants que l’on souhaite faire varier doit respecter une valeur constante, cette somme ne pouvant excéder une valeur maximale égale à 100%. C’est pour ces raisons que des modèles spécifiques ont été associés à la construction puis à l’analyse des plans de mélange.

    Une large part est faite ici aux formes canoniques des modèles polynomiaux ou aux modèles synergiques sans oublier toutefois les possibilités de modélisation à partir de variables indépendantes, comme par exemple les rapports judicieusement choisis entre les proportions des constituants. D'autres formes de modélisation sont présentées comme les modèles homogènes de degré un ou l’utilisation de termes inverses. Une partie plus importante pourrait être consacrée au modèle de Cox, bien utile lorsqu’on souhaite interpréter directement les coefficients d’un modèle en tant qu’effet des variations des proportions des constituants. Il faut toujours garder en mémoire que la construction d’un plan d’expériences nécessite de postuler a priori une forme particulière de modélisation, afin d’analyser a posteriori la variation des réponses observées. Cette partie consacrée aux modèles est ici encore largement illustrée.

  3. Analysis of Mixture Data : il existe des techniques d’analyse bien spécifiques aux plans de mélange, bien que largement inspirées des techniques d’analyse de régression. L’estimation des modèles à partir de la méthode des moindres carrés est abondamment décrite dans cet ouvrage, au même titre que différentes méthodes de restitution graphique de l’information contenue dans l’expression du modèle.

    Les aspects statistiques sous-jacents à l’analyse sont présentés de façon très complète avec un formalisme rigoureux. Par contre, on peut regretter qu’il ne soit pas fait mention de méthodes alternatives à la méthode des moindres carrés, comme par exemple la méthode de régression PLS ou la modélisation par réseaux de neurones. Au même titre, une présentation de méthodes d’analyse multidimensionnelle des données aurait été pertinente compte-tenu du nombre important de réponses que l’on rencontre souvent dans les problèmes de mélange et que dire de l’analyse des réponses qualitatives ? Pour la recherche d’un optimum multi-critères, la présentation de l’utilisation des fonctions de désirabilité mériterait des développements plus conséquents ou des propositions alternatives, tant ce type de problématique est rencontré fréquemment. C’est donc sûrement ce troisième volet qui mériterait d’être le plus approfondi dans une nouvelle édition, au risque d’aboutir à un ouvrage trop important …
Pour terminer, cet ouvrage qui date de 2002 est très agréable à lire. Chacun pourra apprécier suivant ses besoins les nombreuses références bibliographiques, les nombreux exercices d’application et leurs éléments de correction, ainsi que quelques lignes de programmation rapportées en annexe. Les développements mathématiques, certes essentiels mais de moindre importance pour la compréhension des chapitres, sont souvent reportés à la fin de ces derniers, ce qui permet différents niveaux de lecture et de recherche d’information. 

L’ouvrage de John Cornell est un ouvrage de référence que les utilisateurs de plans de mélange se doivent de consulter régulièrement.

mercredi 3 juin 2015

Editorial Juin 2015

Les plans de mélange sont des plans d'expériences particuliers dédiés aux problèmes de formulation.

Les nombreuses publications relatives à l'application des plans de mélange montrent l'intérêt que portent les universitaires et les industriels pour des approches expérimentales raisonnées et formalisées.

On considère généralement que l'article fondateur de la démarche (Experiments With Mixtures) est dû à Henry Scheffé en 1958, article qui présentait la méthode d'exploration d'un domaine sous forme de simplexe régulier à partir d'un maillage de type Simplex Lattice Design. Cet article a permis d'introduire également l'écriture de la forme canonique des modèles polynomiaux sous-jacents à l'analyse de la variation des résultats expérimentaux.

De nombreux articles méthodologiques ont été et continuent à être publiés, offrant aux utilisateurs de nombreuses stratégies expérimentales, parfaitement formalisées d'un point de vue théorique. Il ne faut pas oublier de citer la contribution importante des logiciels de statistiques et de plans d'expériences à la diffusion des plans de mélange dans le monde industriel.

Si à leur origine, l'analyse des résultats d'un plan de mélange devait se contenter de calculs manuels et de représentations graphiques manuscrites, on peut aujourd'hui bénéficier du confort des nombreuses solutions informatiques disponibles.

Mais encore faut-il des guides d'utilisation adaptés et accessibles pour qu'un public souvent néophyte puisse tirer profit de ces innombrables ressources !

L'objectif de ce blog est de poster régulièrement des informations sur ce domaine passionnant et très utile des plans d'expériences : supports ce cours, rappels méthodologiques, bibliographie, utilisation des logiciels, présentation d'études de cas.

Puisse donc ce blog contribuer à une meilleure diffusion des plans de mélange et donner envie de les appliquer dans de nombreux secteurs industriels.