Les consultations internationales de ce blog devraient m'inciter à m'exprimer en anglais, mais je conserve toutefois ma langue maternelle empreinte d'un accent toulousain pour vous souhaiter, à toutes et à tous, une excellente année 2016, avec un clin d’œil particulier aux anciennes et anciens élèves de l’École Nationale Supérieure de Céramique Industrielle pour qui ce blog rappelle de bons souvenirs ... "Avec l'accent, on s'y croirait presque" me dit Marie qui se reconnaîtra sans doute et que je remercie pour son gentil message, au même titre que Marianne pour ses compliments et encouragements à base de douceurs en chocolat.
2016 : une année riche de ressources !
A. Supports de cours
Nous n'en sommes qu'à un début, puisque les supports de cours mis en ligne ne concernent pour l'instant que des approches empiriques associées à la création des plans de mélange. De nombreux compléments vont apparaître au fil de semaines. En voici une première typologie.
A.1. Estimation des effets des variations des proportions des constituants
Très orientés vers des problématiques d'optimisation, les premiers articles et les premières études de cas publiées dans ce blog n'ont pas fait la part belle à un besoin pourtant bien présent qui est celui d'estimer les effets des variations des proportions des constituants autour d'un mélange de référence. Cet aspect des choses est rarement développé dans les livres et nous y consacrerons au moins deux chapitres. Un premier chapitre exposera une méthode encore une fois très pragmatique dite Simplex Screening Design, tandis qu'un second chapitre plus "mathématique" s'intéressera aux modèles de Cox dont les coefficients peuvent être directement interprétés en tant qu'effets. Je ne promets rien pour l'instant quant à l'utilisation de la régression PLS pour répondre à cette problématique car, pour bénéficier de clarté pédagogique, l'exposé doit être long et détaillé, nécessitant de surcroît de trouver le bon exemple. Il y aura cependant un article dédié à des techniques de régressions avancées.
A.2. Les enjeux des plans optimaux et des constructions algorithmiques
Ce n'est que lorsque les ordinateurs ont permis d'accéder plus aisément à des calculs itératifs que des méthodes alternatives aux approches empiriques ont pu voir des réelles applications dans le domaine des plans d'expériences en général et des plans de mélange en particulier. Ces approches rebutent parfois les utilisateurs en raison d'un manque de pédagogie à propos des critères algébriques sur lesquels elles fondent leur fonctionnement. En effet, préoccupé dans son environnement industriel, l'homme de la formulation à parfois du mal à comprendre le bien fondé de l'usage du déterminant d'une matrice. Avant d'aborder un chapitre dédié aux plans de mélanges optimaux, on s'intéressera à la présentation et à l'interprétation d'indicateurs algébriques. L'aspect ludique et interactif de la présentation devrait inciter une généralisation de la mise en œuvre de telles approches, lorsque cela est nécessaire. Ces chapitres devraient contribuer à éclairer l'utilisateur de solutions informatiques quant au sens qu'il convient de donner à certaines boîtes de dialogue. Un troisième chapitre, indépendant des deux précédents, sera consacré à une approche géométrique de construction des plans de mélange appelée Distance Based Design.
A.3. Quelques autres stratégies expérimentales
Nous avons exclusivement parlé de la stratégie de type Component Proportions dans le cadre des approches directes. Il sera temps d'aborder la stratégie de type Slack Variable, très utile lorsqu'un constituant majoritaire sert de variable d'ajustement, sans réel effet supposé sur les variations de la réponse observée, ces dernières étant alors imputées aux constituants minoritaires. Ce sera l'occasion de revenir sur les notions d'effet principal et d'interaction, classiquement associées à l'étude des plans "factoriels". On abordera également la stratégie de type Mathematically Independent Variables que l'on illustrera par la suite dans un contexte agro-alimentaire. Enfin, c'est dans cette rubrique qu'il convient de classer la présentation de méthodes directes d'optimisation, plus connues sous le nom de méthodes séquentielles d'optimisation du simplexe. Souvent citées dans les présentations des études de cas comme stratégie alternative à la méthode des plans de mélange, on consacrera un chapitre à ces méthodes efficaces et souvent méconnues.
A.4. Aller plus loin avec des techniques avancées
C'est sous ce titre générique que j'ai décidé de classer quelques chapitres incontournables. Tout d'abord, nous consacrerons un chapitre aux bien-fondés et aux bénéfices des transformations. Nous avons déjà utilisé lors des présentations d'études de cas des transformations en pseudo-constituants dans l'espace des facteurs et des transformations de Box-Cox dans l'espace des réponses. Nous reviendrons dans le détail sur ces transformations en les complétant, en particulier par la transformation des valeurs d'une réponse en indice de satisfaction, plus communément appelé désirabilité. Nous aborderons ensuite la présentation de techniques statistiques d'analyses descriptives multidimensionnelles, s'appuyant sur des analyses en composantes principales et des techniques de classification. En effet, nombreux sont les exemples de plans de mélange pour lesquels on dispose de plusieurs réponses. Les techniques "classiques" liées à l'analyse de régression au sens des moindres carrés imposent de décrire les réponses indépendamment les unes des autres. Les représentations graphiques offertes par l'analyse multidimensionnelle sont très complémentaires et restituent les corrélations entre les différentes variables. Enfin, nous compléterons cette partie dédiée aux techniques avancées, par la présentation d'autres techniques de régression afin de contourner les problèmes de colinéarité liés à la contrainte relationnelle implicite liant les fractions massiques des constituants. On peut citer ici la régression ridge et la régression PLS. Ce sera l'occasion d'introduire en particulier la notion de facteur d'inflation de variance. Des compléments sur l'analyse statistique des modèles de régression feront également l'objet d'un chapitre permettant d'aller au delà des simples critères de qualité descriptive et prédictive des modèles.
B. Études de cas
Le blog affiche aujourd'hui 5 études de cas. Les 10 séquences qui permettent de décrire une étude de cas sont diffusées sous forme de deux articles consécutifs. Généralement, la première partie rappelle la méthode de construction de la matrice d'expériences tandis que la seconde partie s'intéresse à l'analyse des résultats. Ces études de cas sont complémentaires aux supports de cours auxquels elles renvoient. Elles s'appuient sur une publication qui est revisitée pour l'occasion avec un regard neuf, permettant d'introduire de nouvelles techniques ou des approches complémentaires afin de donner des idées à de futurs utilisateurs des plans de mélange. Ces études de cas seront utilisées à nouveau pour illustrer la mise en œuvre de logiciels dédiés.
Ces études de cas ont été classées en fonction des secteurs industriels d'application, et au cours de l'année 2016, vont apparaître de nouveaux secteurs tandis que des secteurs existants seront complétés. En voici un rapide aperçu, non exhaustif.
B.1. Formulation d'un détergent & produits ménagers
Cette rubrique sera complétée par deux nouvelles études de cas, illustrant en particulier la mise en œuvre d'algorithmes d'échange pour la construction de plans optimaux.
B.2. Formulation de poudres et explosifs
Nous découvrirons ensemble un nouvel article sur la formulation de propergol et la mise en œuvre des fonctions de désirabilité pour la recherche d'un optimum multicritères.
B.3. Formulation de verres, céramiques et bétons
De nouveaux articles viendront compléter les articles parus dans le domaine des verres nucléaires d'une part et des liants hydrauliques d'autre part. Par ailleurs, des articles viendront illustrer l'utilisation des plans de mélange dans le domaine des céramiques traditionnelles, notamment dans le secteur de la terre cuite et des émaux.
B.4. Formulation des huiles, des essences et des lubrifiants
Les exemples proposés par Ronald Snee, contributeur très actif au travers de publications traitant de plans de mélange, seront revisités, à la fois pour illustrer la notion d'effet et la mise en œuvre d'algorithmes d'échange pour la construction de plans optimaux. Il s'agit d'une nouvelle rubrique.
B.5. Formulation de produits cosmétiques et pharmaceutiques
Nouvelle rubrique également permettant d'utiliser à des fins pédagogiques quelques publications issues de ce secteur industriel, en commençant, ce qui est sans doute très original, par des exemples de mélanges binaires que vous serez invités à mettre en œuvre à l'aide du tableur Excel.
B.6. Formulation de peintures et colorants
Deux études de cas sont d'ores et déjà largement avancées dans leur préparation et donneront lieu à des articles vous incitant à nouveau à construire la maquette du domaine expérimental. En présence de 4 constituants, cette maquette permet parfois de déjouer les pièges d'une construction algorithmique, un peu trop automatisée. Il s'agit également d'une nouvelle rubrique.
B.7. Formulation de produits agro-alimentaires
Succinctement évoquée de façon amusante lors du dernier article paru au mois de juillet, la formulation de produits agro-alimentaires donnera lieu à différents articles. Parmi ces articles, on trouvera des applications de la stratégie Mathematically Independent Variables pour la fabrication de cookies.
C. Excel & logiciels
Cette rubrique fait pour l'instant office de parent pauvre, essentiellement en raison de problèmes techniques de captation qui ont encore du mal à être résolus, si l'on souhaite une qualité d'image équivalente à celle des supports de cours ou des études de cas. J'ai toutefois mis en ligne le mois dernier une application du tableur Excel pour la construction de représentations triangulaires.
C.1. Application du tableur Excel
Nous reviendrons sur l'application de la méthode des moindres carrés à partir d'exemples simples qui nous permettront en particulier de créer des simulateurs pour mieux comprendre le sens des critères algébriques, tels que le déterminant de la matrice d'information, la trace de la matrice de dispersion, les termes diagonaux de la matrice H. Nous utiliserons également le tableur Excel pour construire en quelques clics de souris la fonction de répartition des valeurs d'une variable de réponse, étape importante dans l'analyse préalable des résultats. Nous illustrerons par ailleurs l'utilisation des transformations de Box-Cox en faisant appel une nouvelle fois à une fonction bien pratique mais méconnue : la fonction TABLE. Comme un plan de mélange comporte souvent plusieurs réponses, nous montrerons comment créer un menu déroulant, à la fois dans une feuille de calcul et dans une feuille graphique pour bénéficier d'une meilleure interactivité entre l'utilisateur et le tableur.
C.2. Les plans de mélange et les logiciels
Les préparations de captation des logiciels Statgraphics et Minitab sont bien avancées sur plusieurs études de cas. J'espère pouvoir illustrer l'utilisation des logiciels Design Expert, Modde et Statistica pour enrichir ce blog. Dès que les problèmes techniques seront résolus, des vidéos illustratives seront mises en ligne.
D. Dictionnaire / Glossaire / Lexique
La liste d'entrée qu'il convient de créer ne cesse de s'allonger au fil des publications d'articles, mais la rédaction de définitions cohérentes demande du temps et un travail de lecture importants avant de passer à la phase de rédaction. On devrait disposer d'une centaine d'entrées dans cette rubrique lors de la mise en ligne des ressources dans le cadre d'une université numérique.
E. Bibliographie
Le nombre d'ouvrages en langue française ou anglaise consacrés exclusivement aux plans de mélange est fort restreint. Nous avons atteint la moitié du parcours en commentant deux références. Il reste donc à commenter une monographie sous forme d'un ouvrage collectif paru chez Springer sous le titre "Optimal Mixture Experiments" et le livre de Jacques Goupy paru chez Dunod sous le titre "Plans d'expériences : les mélanges". Ce sera l'objet de deux nouveaux articles.
Il m'a semblé important de commenter également l'ouvrage "Sequential Simplex Optimization" qui bien que n'étant pas spécifiquement destiné aux formulateurs, présente de nombreuses perspectives d'application dans le domaine des sciences expérimentales lorsqu'on est confronté à un problème d'optimisation.
Je consacrerai un ou plusieurs articles pour commenter des fascicules parus dans la collection des Techniques de l'Ingénieur, en lien direct avec l'objet de ce blog. Ces fascicules en langue française sont souvent méconnus, bien qu'ils soient très facilement accessibles pour un public universitaire et dans bon nombre de médiathèques.
Sans doute, d'autres références viendront compléter la page consacrée à la bibliographie.
2016 : une année riche de ressources ! Bonne année à toutes et à tous !