mercredi 25 novembre 2015

Formulation d'un liant pouzzolanique A (Partie II)

Après avoir détaillé, étape par étape la construction de la matrice d'expériences, nous allons décrire maintenant les articulations de l'analyse des résultats, depuis l'analyse globale jusqu'à la restitution graphique du modèle, sous forme de trace de la surface de réponse et de courbes d'isoréponse. C'est l'objet des six séquences publiées dans ce nouvel article.

Rappelons avant toute chose que les auteurs souhaitent maximiser la résistance d'un liant minéral constitué d'un mélange de cendres volantes (fly ash), de chaux (lime) et d'eau (water). Les performances mécaniques observées après 28 jours de vieillissement dans l'eau sont liées à la réactivité des cendres volantes, finement divisées et riches en silice soluble, provoquant ainsi une réaction qualifiée de pouzzolanique par les spécialistes.

Dans la cinquième séquence, nous allons aborder l'analyse globale des valeurs observées. Les courbures que l'on peut pressentir en reportant les valeurs observées sur un graphique laissent présager la présence de termes quadratiques ou cubiques significatifs traduisant des synergies. Par ailleurs, l'analyse de la fonction de répartition des valeurs observées révèle une différence importante entre le mélange situé au centre du domaine et les mélanges représentés par les sommets et les milieux des arêtes.


La sixième séquence est consacrée à l'analyse mathématique. Cette analyse consiste à estimer les coefficients du modèle et les résidus, à savoir les écarts de description entre les valeurs observées et les valeurs prévues à partir de l'équation du modèle. La méthode d'ajustement fait appel classiquement au critère des moindres carrés.


La septième séquence aborde l'analyse statique au travers de l'estimation de la qualité descriptive et de la qualité prédictive des modèles. Si la forme canonique du modèle de degré 1 se révèle de piètre qualité en raison des synergies provoquées par le mélange, la forme canonique du modèle de degré 2 et le modèle synergique de degré 3 présentent une qualité descriptive très satisfaisante. Toutefois, la forme canonique du modèle de degré 2 est un peu plus prédictive que le modèle synergique de degré 3 : elle sera retenue dans la suite de l'analyse.


La huitième séquence est dédiée à l'application d'une transformation de Box-Cox de la réponse pour améliorer encore la qualité du modèle. On retiendra l'utilisation d'une transformation logarithmique dans cette étude de cas.


La neuvième séquence porte sur la restitution graphique de l'équation du modèle : on représente dans cette étude de cas les courbes d'isoréponse et la trace de la surface de réponse dont on rappelle le principe de construction.


La dixième et dernière séquence illustre au travers de la conclusion de cette étude, la construction d'un second plan de mélange pour valider les résultats produits par le premier plan de mélange. Les auteurs utilisent les meilleurs essais du premier plan et les complètent par de nouveaux mélanges afin de modéliser la variation de la réponse dans ce nouveau domaine, plus restreint et mieux centré sur la zone d'intérêt d'un point de vue des performances mécaniques du liant pouzzolanique.


Si la méthode de construction d'un plan de mélange proposée par McLean et Anderson se limite à l'étude de mélanges présentant un nombre restreint de constituants, la démarche utilisée pour la définition des coordonnées des sommets et des centres des différents sous-espaces reste toujours d'actualité lors de la construction de plans optimaux que nous aborderons dans les prochains mois.

mercredi 18 novembre 2015

Formulation d'un liant pouzzolanique A (Partie I)

Les débutants apprécieront sûrement cette étude de cas, car elle permet d'illustrer la méthode de construction des plans de mélange proposée par McLean et Anderson, à partir d'un mélange ternaire qui offre la possibilité de représenter graphiquement de façon simple le domaine expérimental et les mélanges retenus dans la matrice d'expériences. Nous allons découvrir cette semaine sous forme de quatre séquences, les étapes qui conduisent de la définition du problème à la construction de la matrice d'expériences.

La première séquence rappelle l'origine des données et le contexte expérimental. Les auteurs cherchent à tirer profit de la réactivité chimique d'une cendre volante, riche en silice et en alumine, en la mélangeant à une poudre calcaire et à de l'eau pour former un liant pouzzonalique. Ce liant sera caractérisé après 28 jours de vieillissement dans de l'eau par un essai mécanique de compression dont la valeur représentera la seule réponse de l'étude. Il convient de maximiser cette performance.


La deuxième séquence propose différentes stratégies expérimentales offertes dans un contexte de formulation. La méthode d'optimisation séquentielle du simplexe sera évoquée et comparée à la stratégie retenue par les auteurs, à savoir une stratégie de type Component Proportions. En s'orientant vers un plan d'expériences, on suppose que les éléments d'information proviendront de l'analyse et de l'interprétation d'un modèle qualifié de modèle empirique. Construire un plan d'expériences consiste à définir ici un nombre nécessaire et suffisant de mélanges, ainsi que leur nature, de manière à estimer efficacement les paramètres du modèle. Un diagramme d'Ishikawa permet de présenter les facteurs de l'étude et les contraintes explicites associées à la variation de ces facteurs.


La troisième séquence s'intéresse à la caractérisation du domaine expérimental d'un point de vue géométrique en introduisant des notions utiles lorsqu'on ne peut plus matérialiser à partir d'une simple figure la géométrie de ce domaine. Lorsque les contraintes explicites représentant des réalités physico-chimiques exprimées par les experts conduisent à explorer un polyèdre convexe, il faut alors définir le nombre de sous-espaces de ce polyèdre. Il s'agit dans cet exemple de calculer le nombre de sommets et le nombre d'arêtes. On s'intéresse également dans cette séquence aux modèles destinés à l'exploration du domaine. Il s'agit de polynômes dont on retient la forme canonique ou la forme synergique. Le nombre de paramètres d'un modèle représente le nombre d'inconnues à estimer et il convient de satisfaire une première condition nécessaire dans la construction d'un plan d'expériences : le nombre de mélanges distincts doit être supérieur ou égal au nombre de monômes des modèles polynomiaux potentiellement utiles pour l'analyse de la variation de la réponse. En se limitant à l'utilisation d'un modèle synergique de degré 3, équivalent ici à la forme du modèle polynomial de degré 3 réduit, on sait qu'il est nécessaire de réaliser au moins 7 mélanges distincts.


La quatrième séquence illustre la construction de la matrice d'expériences en utilisant la méthode Extreme Vertices Design proposée en 1966 par McLean et Anderson. Cette méthode, pratique à mettre en œuvre en présence d'un nombre limité de constituants, a conduit les auteurs à retenir les 6 sommets du domaine, les milieux des 6 arêtes et le centre des sommets. Les 13 mélanges ainsi définis permettront d'estimer les paramètres des différents modèles envisagés lors de la séquence précédente. La matrice d'expériences retenue par les auteurs est également celle que propose un bon nombre de logiciels, notamment le logiciel Statistica qui est utilisé par les auteurs.

Pourtant, le dessin du domaine et des mélanges proposés au sein du polyèdre convexe auraient dû inciter les auteurs à envisager une stratégie alternative, généralement plus satisfaisante en terme de couverture "uniforme" ou "homogène" de l'espace expérimental, afin d'interpoler plus "sereinement" la variation de la réponse entre le centre du domaine et l'ensemble des autres mélanges situés à la périphérie du domaine ...


La seconde partie de la présentation de cette étude illustrera, dès la semaine prochaine, l'analyse des résultats.

mercredi 11 novembre 2015

Ouvrage de référence



Smith W.F., Experimental Design for Formulation, SIAM, Ed. Philadelphia, ASA, Ed. Alexandria, 2005, 368 pages.


Ce livre apparu il y a une dizaine d’années complète fort utilement l’ouvrage de John A. Cornell, considéré comme l’ouvrage de référence sur les plans de mélange.

L’auteur, Wendell F. Smith, marque de son empreinte industrielle chez Eastman Kodak, en particulier dans les laboratoires de recherche, la rédaction des différents chapitres. L’ouvrage est plus concis et sans doute plus appliqué pour l’industrie. Malgré un nombre plus restreint de pages, la lecture des différents chapitres permet d’appréhender de manière efficace la démarche associée à la construction et à l’analyse d’un plan de mélange. Les exemples choisis et les quelques 175 références bibliographiques se révèlent très pertinents ; ils invitent le lecteur à approfondir ses connaissances dans le domaine des plans d’expériences appliqués aux problèmes de formulation.

L’ouvrage est construit autour de 4 grandes parties, elles-mêmes découpées en chapitres. Les chapitres ne sont pas ponctués par des exercices d’application mais les nombreux exemples permettent, au fil des paragraphes, d’appliquer les concepts présentés par l’auteur. Il est parfois fait référence aux logiciels Minitab, Mixsoft, Design Expert ou Jmp pour des graphiques ou des options d’analyse.

  1. La première partie est une introduction (Chapitre 1) qui positionne les plans de mélange parmi les nombreux types de plans d’expériences en spécifiant tout d’abord (Chapitre 2) la nature spécifique du domaine expérimental en présence de facteurs tels que des fractions massiques, volumiques ou molaires, puis (Chapitre 3) les modèles classiques sous-jacents à la construction et à l’analyse des plans de mélange, renvoyant à la stratégie de type Component Proportions.


  2. La deuxième partie, plus conséquente, porte sur les principes de construction des plans de mélange, que ce soit de manière empirique ou algorithmique. Cette partie débute par un chapitre dédié à l’exploration de domaines expérimentaux dont la géométrie est celle d’un simplexe (Chapitre 4). Certes on retrouve les dispositifs proposés par Henry Scheffé en 1958 et en 1969 sous le nom de Simplex Lattice Design et Simplex Centroid Design, mais également, les dispositifs de type Simplex Screening Design, moins connus mais fort utiles pour estimer les effets des variations des proportions des constituants quand le domaine expérimental se présente sous la forme d’un simplexe. Dès que les contraintes transforment la géométrie du domaine en polyèdre convexe, l’auteur passe en revue (Chapitre 5) différents algorithmes de construction de la matrice d’expériences. La présentation des différents critères algébriques retenus pour converger vers une matrice optimale est claire et accessible, mais on ne peut que recommander au lecteur de reprendre l’exploration de ce chapitre après avoir parcouru le chapitre suivant. Les différentes matrices utilisées dans la mise en œuvre de la méthode d’ajustement au sens des moindres carrés, (matrice d’information, matrice de dispersion, matrice H), ou encore la fonction de variance standardisée sont présentées ici (Chapitre 6) en faisant ressortir le rôle des leviers et la définition de la G-Optimalité. Cette deuxième partie consacrée à la construction des plans de mélange s’achève sur un chapitre traitant de l’organisation de la campagne expérimentale sous forme de blocs homogènes (Chapitre 7), concept important dans les principes d’expérimentation proposés par Ronald Fisher au début du XXe siècle.

     
  3. La troisième partie est consacrée à l’analyse des résultats en commençant (Chapitre 8) par l’étude de la qualité descriptive des modèles, puis de la qualité prédictive. La décomposition de la somme des écarts entre les valeurs observées et leur moyenne conduit à la construction d’un ou plusieurs tableaux d'analyse de régression, illustrés par des exemples. L’étude des résidus, avec leurs éventuelles transformations, fait l’objet du chapitre suivant (Chapitre 9) et représente une aide appréciable en complément de celle fournie par les logiciels. Une distribution particulière des valeurs de la réponse peut nuire localement à la qualité descriptive d’un modèle ou empêcher la validation des hypothèses sous-jacentes à l’analyse de régression, comme par exemple la vérification de la normalité des résidus. Un long chapitre (Chapitre 10) est consacré à ces aspects que les logiciels ne peuvent pas prendre en compte de façon automatique. La personne qui analyse les résultats doit savoir utiliser des transformations à bon escient, que ce soit pour la réponse avec une transformation de Box-Cox par exemple ou que ce soit en proposant une autre forme de modélisation. Même si ce chapitre est riche d’informations utiles, il mériterait à lui seul une partie entière du livre, tant ces aspects sont fréquents dans l’utilisation des plans de mélange et leur analyse. L’estimation des effets des variations des proportions des constituants fait l’objet du chapitre suivant (Chapitre 11). Cette approche des plans de mélange est hélas méconnue et rarement intégrée dans les logiciels, si ce n’est au travers de l’étude de la trace d’une surface de réponse. Les effets de Cox et les effets de Piepel sont clairement présentés mais on aurait apprécié un paragraphe spécifique sur les modèles de Cox et leur estimation, au même titre qu’un paragraphe sur la régression PLS qui peut s’avérer très efficace quand on s’intéresse aux effets des facteurs dans un problème de formulation. Le chapitre 12 vient clôturer cette troisième partie en faisant une large place aux techniques d’optimisation associées à l’usage des fonctions de désirabilité.

  4. La quatrième et dernière partie aborde les plans d’expériences qui associent des variables externes aux proportions des constituants dans un plan de mélange, ce qui conduit à une stratégie de type Mixture Process Variables (Chapitre 13). On aurait apprécié des développements plus importants dans ce chapitre, à la fois d’un point de vue méthodologique et d’un point de vue formalisme mathématique et numérique, car les logiciels conduisent souvent à des matrices d’expériences très coûteuses lorsqu’on associe ces deux types de variables. La nature même des facteurs, à savoir des proportions dont la somme est égale à une constante, induit des problèmes numériques spécifiques aux plans de mélange, problèmes que l’on regroupe sous la locution « Collinearity ». Ce dernier chapitre (Chapitre 14) aborde ces problèmes et précise des indicateurs statistiques tels que les facteurs d’inflation de variance ou l’indice de conditionnement d’une matrice. La régression au sens des moindres carrés est très sensible « numériquement » à ces phénomènes ; elle devrait céder sa place en présence de nombreux constituants et de domaines très anisotropes à d’autres méthodes de régression, comme la régression PLS évoquée précédemment. Encore faut-il que ces approches alternatives soient disponibles et bien documentées dans les logiciels de plans d’expériences ! Si ce n’était pas le cas en 2005 lors de la parution de ce livre, les logiciels de plans d’expériences intègrent de plus en plus aujourd’hui ces méthodes de régression. On peut espérer qu’une nouvelle édition vienne combler un jour ce manque !

En conclusion, cet ouvrage trouvera naturellement sa place sur l'étagère des livres consacrés aux plans d'expériences en général et aux plans de mélange en particulier. S'il y a bien moins de démonstrations que dans l'ouvrage de John Cornell, le lecteur appréciera ici une approche plus industrielle des plans de mélange, même si ce livre se limite en grande partie à la stratégie Component Proportions. Enfin, la troisième partie du livre consacrée à l'analyse des résultats peut représenter une excellente aide pour comprendre et bien interpréter les boîtes de dialogues et les résultats produits par les logiciels de plans de mélange.

mercredi 4 novembre 2015

Editorial Novembre 2015

La stratégie expérimentale proposée par McLean et Anderson en 1966 va donner lieu ce mois-ci à une nouvelle illustration au travers d'une étude de cas dont voici le contexte.

L'exemple choisi appartient au monde du ciment, liant minéral qui mélangé à de l'eau fait prise et durcit, même sous l'eau, ce qui lui vaut le qualificatif de liant hydraulique. Le ciment est un produit qui résulte d'un mélange de calcaire et d'argile que l'on cuit à haute température. Le produit formé, appelé clinker, est ensuite broyé et mélangé avec d'autres constituants pour atteindre des performances requises. Toutes ces transformations font de ce liant un ciment artificiel.

Il existe cependant des liants naturels pour lesquels on exploite les propriétés de pouzzolanicité. Ce dénominatif doit son origine à une petite ville, Pouzzoles au pied du Vésuve, où des cendres volcaniques ont manifesté des propriétés remarquables de cohésion, à un tel point qu'elles font partie des liants connus depuis l'Antiquité. Aujourd'hui, des sous-produits industriels tels que les cendres volantes issues des centrales thermiques présentent des analyses chimiques comparables aux cendres de Pouzzoles. Riches en silice et en alumine, des cendres volantes vont être mélangées à une poudre calcaire et à de l'eau en différentes proportions afin d'optimiser une propriété mécanique du mélange.

Cette étude de cas revisitée sera présentée sous la forme de 10 séquences au cours des deux dernières semaines du mois de novembre. Le domaine expérimental sous forme de polyèdre convexe se prête bien à l'approche proposée par McLean et Anderson, même s'il est possible de proposer, certes a posteriori, une approche alternative séduisante. On mettra en œuvre à nouveau la méthode de Box-Cox pour choisir une transformation judicieuse de la réponse. Enfin, il est original de constater que la validation du premier plan de mélange proposé par les auteurs fait appel à un second plan de mélange.

Avant d'aborder cette étude de cas apparentée au domaine de la céramique, des verres et des bétons, je présenterai un troisième ouvrage de référence dans ce blog. Il s'agit du livre publié par Wendell F. Smith en 2005 et intitulé : "Experimental Design for Formulation". Bien que plus concis, il est très complémentaire de l'ouvrage de John A. Cornell, avec une vision plus industrielle et moins académique des plans de mélange.

Je profite de cet éditorial pour vous annoncer l'organisation d'une journée technique sur les plans d'expériences destinés à estimer et à comparer les effets des facteurs. Cette journée, organisée par le Pôle Européen de la Céramique, aura lieu à Vierzon le 10 décembre prochain. Vous trouverez ci-dessous une courte présentation de cette journée sous forme d'un petit clip vidéo. N'hésitez pas à me contacter pour plus d'informations.


Enfin, je suis ravi que ce blog puisse inspirer les enseignants chargés de la mise en oeuvre d'une partie de la réforme du BTS Chimie. Je remercie Cécile, professeure dans un grand lycée parisien, de contribuer à la diffusion de ce blog auprès de ces nombreux collègues en quête d'idées et d'informations.