mercredi 27 janvier 2016

Excel - Zone de liste déroulante

Dans les problèmes de formulation, il est fréquent de devoir prendre en considération plusieurs réponses. On peut ainsi caractériser les mélanges à partir de réponses de nature physico-chimique, sensorielle ou économique, comme la viscosité et la conductivité électrique qui représentent les données de l'exemple traité dans cet article.

L'analyse de la variation des valeurs observées doit être effectuée pour chacune des réponses, que ce soit pour produire des graphiques tels que la représentation de la fonction de répartition et la trace de la surface de réponse, ou bien pour estimer les coefficients et les résidus associés à un modèle donné.

On pourrait envisager de créer autant de fichiers qu'il y a de réponses, ce qui peut rendre compliquée l'analyse des résultats. Il est possible, en quelques clics de souris, de créer à partir d'une même feuille de calcul, un menu déroulant permettant de sélectionner la réponse dont on souhaite analyser et restituer la variation. Ce menu déroulant porte le nom de zone de liste déroulante.

La création d'une zone de liste déroulante est accessible à partir du ruban Développeur du tableur Excel. Dans le film qui suit, on rappelle la procédure d'installation de ce ruban, si ce n'est déjà fait sur votre ordinateur. Vous apprendrez dans cette séquence le rôle primordial de la tabulation des données et de l'utilisation raisonnée des noms, pour définir des plages de cellules.

Vous découvrirez également comment mettre à jour automatiquement le titre d'un axe en fonction de la réponse analysée.



Je vous invite naturellement à mettre en œuvre une zone de liste déroulante à partir de vos données qu'elles soient relatives ou non à l'analyse d'un plan de mélange ! Vous pourrez appliquer la même démarche pour comprendre le fonctionnement des autres contrôles de formulaire disponibles à partir du tableur Excel.


mercredi 20 janvier 2016

Excel - Représentation d'une fonction de répartition

Nous allons présenter dans cet article une méthode simple pour obtenir la fonction de répartition des valeurs d'une réponse à l'aide du tableur Excel.

La fonction de répartition est matérialisée à l'aide d'un nuage de points qui illustre comment les valeurs d'une réponse sont réparties de la plus petite à la plus grande d'entre-elles. La variation des valeurs est reportée sur l'axe horizontal, l'axe vertical indiquant la probabilité ou la fréquence associée à chacune des abscisses. On associe une probabilité égale à 0% à la plus petite valeur et une probabilité égale à 100 % à la plus grande des valeurs observées. La probabilité provient d'une transformation du rang des valeurs, ce dernier résultant d'un tri par ordre non décroissant.

La fonction de répartition permet de mettre en évidence l'étendue de variation des valeurs et la présence d'éventuelles discontinuités. Elle permet d'émettre des hypothèses invitant à utiliser une transformation des valeurs de la réponse lors des étapes consacrées à l'analyse mathématique et à l'analyse statistique du modèle. La méthode proposée par G.E.P. Box et D.R. Cox en 1964 permet alors de retenir la meilleure transformation.



La construction et l'analyse de la fonction de répartition relève de l'étape d'analyse globale des résultats. Elle devrait être systématiquement mise en oeuvre dans les études de cas même si cette démarche n'est pas toujours facilement disponible dans les logiciels.

N'hésitez pas à reproduire la démarche avec vos données !  

mercredi 13 janvier 2016

Ouvrage de référence

Sinha B.K., Mandal N.K., Pal M., Das P., Optimal Mixture Experiments, Springer, Ed. New Delhi, 2014, 210 pages.

Il n'est jamais simple d'écrire une monographie, qui plus est en se limitant à 200 pages à propos d'un sujet qui bien que récent - les plans de mélange n'ont qu'une soixantaine d'années d'existence - a donné lieu à de très nombreux développements théoriques illustrés par d'innombrables applications industrielles.

Les auteurs, comme le titre l'indique, ont pris le parti d'oublier les constructions empiriques des plans de mélange pour positionner leur monographie dans le domaine des plans optimaux aux sens de critères algébriques associés à l'application d'une méthode de régression : la méthode des moindres carrés. Seuls quatre chapitres sur les douze chapitres que compte le livre n'intègrent pas la notion d'optimalité dans leur titre. Ce choix ravira sans doute un lectorat passionné par l'approche algébrique des méthodes de régression, mais laissera sans doute sur sa faim l'ingénieur ou le technicien chargé de mettre en oeuvre très concrètement un plan de mélange. De même ce livre ne m'a pas semblé pas très utile pour choisir la meilleure option parmi celles proposées dans les logiciels, lorsqu'on a recours à un algorithme d'échanges pour la construction d'un plan de mélange. Cet ouvrage est donc à positionner dans le rayon des mathématiques théoriques plutôt que dans le rayon des mathématiques appliquées. Le chapitre consacré aux applications des plans de mélange traite le sujet en onze pages en citant succinctement des cas concrets dans le domaine de la formulation de boissons ou dans le domaine galénique.

Cependant, les ouvrages intégralement aux plans de mélange étant rares, il convient de positionner ce livre en langue anglaise en tant qu'ouvrage de référence, au même titre que l'ouvrage de John Cornell et celui de Wendell Smith.

Rappelons ici que la construction d'un plan d'expériences optimal consiste à définir, de façon analytique ou algorithmique, le nombre et la nature des mélanges à mettre en oeuvre de manière à minimiser les incertitudes qui affectent les estimations des paramètres d'un modèle postulé a priori et les prévisions faites à partir de ce même modèle a posteriori.

Dès leur apparition, les plans de mélange proposés par Henri Scheffé ont privilégié le pragmatisme à l'optimalité, sans toutefois mettre à mal les critères algébriques proposés par Jack Kiefer de façon contemporaine. Vouloir satisfaire à tout prix des critères d'optimalité conduit alors à imposer des répétitions alors que l'expérimentateur préférerait bien logiquement "tester" de nouvelles formules. De même, les fractions massiques des mélanges sélectionnés dans les approches empiriques doivent être remplacées par des formules complexes, certes exactes mais impossibles à mémoriser sans l'aide d'une solution informatique, qui semble renvoyer loin de la paillasse et du malaxeur des préoccupations plus industrielles. L'approche empirique proposée par McLean et Anderson est injustement ignorée pour l'estimation des paramètres de modèles quadratiques lorsque les contraintes explicites transforment le domaine expérimental en polyèdre convexe, alors qu'elle associe, en présence d'un petit nombre de constituants, pragmatisme et efficacité.

Cette monographie ne s'intéresse pas uniquement aux formes canoniques des modèles polynomiaux et aux modèles synergiques que l'on rencontre le plus souvent dans la littérature et dans les logiciels. La lecture de ce livre offre donc comme point positif la possibilité de découverte de nombreuses familles de modèles pour lesquelles le choix des mélanges retenus dans le plan d'expériences est discuté. Mais est-il possible de postuler à l'avance une forme alambiquée pour un modèle, alors que l'on ne dispose encore d'aucun résultat ? On regrettera au premier chapitre une confusion, sans doute typographique, entre les notations de la forme canonique complète et celles de la forme canonique réduite du modèle polynomial de degré 3.

Si la stratégie de type Component Proportions est la plus représentée et commentée dans les chapitres de cette monographie, on appréciera les quelques paragraphes consacrés à la stratégie Mixture Amount au même titre que ceux consacrés à l'organisation de la campagne expérimentale sous forme de blocs.

Ce livre, trop éloigné de la majorité des préoccupations industrielles, doit toutefois inciter un lectorat plus universitaire à se livrer à quelques simulations numériques à partir des formules analytiques qui, quand elles ne sont pas intégralement démontrées, sont correctement commentées. De nombreuses et patientes simulations numériques pourront ainsi permettre de mieux comprendre le gain, que l'on jugera tantôt important ou tantôt faible, apporté par les plans optimaux par rapport aux approches plus empiriques, que l'on soit dans des domaines sous forme de simplexe ou sous forme de polyèdre convexe. C'est ainsi qu'à force d'exercices, on peut se forger un point de vue objectif sur les critères d'optimalité et proposer aux utilisateurs un conseil raisonné cherchant à satisfaire à la fois les besoins d'un pragmatisme expérimental et la rigueur inflexible de développements mathématiques, tout en contenant le nombre de mélanges pour respecter les inévitables contraintes économiques. Ce me semble être la meilleure façon d'apprécier, avec le temps, les pages de cette monographie.




mercredi 6 janvier 2016

Editorial Janvier 2016

Les consultations internationales de ce blog devraient m'inciter à m'exprimer en anglais, mais je conserve toutefois ma langue maternelle empreinte d'un accent toulousain pour vous souhaiter, à toutes et à tous, une excellente année 2016, avec un clin d’œil particulier aux anciennes et anciens élèves de l’École Nationale Supérieure de Céramique Industrielle pour qui ce blog rappelle de bons souvenirs ... "Avec l'accent, on s'y croirait presque" me dit Marie qui se reconnaîtra sans doute et que je remercie pour son gentil message, au même titre que Marianne pour ses compliments et encouragements à base de douceurs en chocolat.

Je forme le vœu que ce blog puisse continuer à vous aider à mieux comprendre les intérêts et les usages des plans d'expériences dédiés aux problèmes de formulation, mais aussi leurs limites. La diffusion hebdomadaire d'articles, souvent agrémentés de vidéos semble répondre à un réel besoin, puisque, nous avons dépassé en un semestre le seuil des 5300 pages vues. Merci donc à tous les internautes qui consultent régulièrement ce blog, favorisant ainsi son référencement naturel.

Je vais profiter maintenant de l'éditorial du mois de janvier pour dresser un carnet de route qui devrait nous accompagner plusieurs mois durant et vous donner un aperçu des thèmes qui seront abordés pour compléter les différentes pages de ce blog.

2016 : une année riche de ressources !

A. Supports de cours


Nous n'en sommes qu'à un début, puisque les supports de cours mis en ligne ne concernent pour l'instant que des approches empiriques associées à la création des plans de mélange. De nombreux compléments vont apparaître au fil de semaines. En voici une première typologie.

A.1. Estimation des effets des variations des proportions des constituants


Très orientés vers des problématiques d'optimisation, les premiers articles et les premières études de cas publiées dans ce blog n'ont pas fait la part belle à un besoin pourtant bien présent qui est celui d'estimer les effets des variations des proportions des constituants autour d'un mélange de référence. Cet aspect des choses est rarement développé dans les livres et nous y consacrerons au moins deux chapitres. Un premier chapitre exposera une méthode encore une fois très pragmatique dite Simplex Screening Design, tandis qu'un second chapitre plus "mathématique" s'intéressera aux modèles de Cox dont les coefficients peuvent être directement interprétés en tant qu'effets. Je ne promets rien pour l'instant quant à l'utilisation de la régression PLS pour répondre à cette problématique car, pour bénéficier de clarté pédagogique, l'exposé doit être long et détaillé, nécessitant de surcroît de trouver le bon exemple. Il y aura cependant un article dédié à des techniques de régressions avancées.

A.2. Les enjeux des plans optimaux et des constructions algorithmiques


Ce n'est que lorsque les ordinateurs ont permis d'accéder plus aisément à des calculs itératifs que des méthodes alternatives aux approches empiriques ont pu voir des réelles applications dans le domaine des plans d'expériences en général et des plans de mélange en particulier. Ces approches rebutent parfois les utilisateurs en raison d'un manque de pédagogie à propos des critères algébriques sur lesquels elles fondent leur fonctionnement. En effet, préoccupé dans son environnement industriel, l'homme de la formulation à parfois du mal à comprendre le bien fondé de l'usage du déterminant d'une matrice. Avant d'aborder un chapitre dédié aux plans de mélanges optimaux, on s'intéressera à la présentation et à l'interprétation d'indicateurs algébriques. L'aspect ludique et interactif de la présentation devrait inciter une généralisation de la mise en œuvre de telles approches, lorsque cela est nécessaire. Ces chapitres devraient contribuer à éclairer l'utilisateur de solutions informatiques quant au sens qu'il convient de donner à certaines boîtes de dialogue. Un troisième chapitre, indépendant des deux précédents, sera consacré à une approche géométrique de construction des plans de mélange appelée Distance Based Design.

A.3. Quelques autres stratégies expérimentales


Nous avons exclusivement parlé de la stratégie de type Component Proportions dans le cadre des approches directes. Il sera temps d'aborder la stratégie de type Slack Variable, très utile lorsqu'un constituant majoritaire sert de variable d'ajustement, sans réel effet supposé sur les variations de la réponse observée, ces dernières étant alors imputées aux constituants minoritaires. Ce sera l'occasion de revenir sur les notions d'effet principal et d'interaction, classiquement associées à l'étude des plans "factoriels". On abordera également la stratégie de type Mathematically Independent Variables que l'on illustrera par la suite dans un contexte agro-alimentaire. Enfin, c'est dans cette rubrique qu'il convient de classer la présentation de méthodes directes d'optimisation, plus connues sous le nom de méthodes séquentielles d'optimisation du simplexe. Souvent citées dans les présentations des études de cas comme stratégie alternative à la méthode des plans de mélange, on consacrera un chapitre à ces méthodes efficaces et souvent méconnues.

A.4. Aller plus loin avec des techniques avancées


C'est sous ce titre générique que j'ai décidé de classer quelques chapitres incontournables. Tout d'abord, nous consacrerons un chapitre aux bien-fondés et aux bénéfices des transformations. Nous avons déjà utilisé lors des présentations d'études de cas des transformations en pseudo-constituants dans l'espace des facteurs et des transformations de Box-Cox dans l'espace des réponses. Nous reviendrons dans le détail sur ces transformations en les complétant, en particulier par la transformation des valeurs d'une réponse en indice de satisfaction, plus communément appelé désirabilité. Nous aborderons ensuite la présentation de techniques statistiques d'analyses descriptives multidimensionnelles, s'appuyant sur des analyses en composantes principales et des techniques de classification. En effet, nombreux sont les exemples de plans de mélange pour lesquels on dispose de plusieurs réponses. Les techniques "classiques" liées à l'analyse de régression au sens des moindres carrés imposent de décrire les réponses indépendamment les unes des autres. Les représentations graphiques offertes par l'analyse multidimensionnelle sont très complémentaires et restituent les corrélations entre les différentes variables. Enfin, nous compléterons cette partie dédiée aux techniques avancées, par la présentation d'autres techniques de régression afin de contourner les problèmes de colinéarité liés à la contrainte relationnelle implicite liant les fractions massiques des constituants. On peut citer ici la régression ridge et la régression PLS. Ce sera l'occasion d'introduire en particulier la notion de facteur d'inflation de variance. Des compléments sur l'analyse statistique des modèles de régression feront également l'objet d'un chapitre permettant d'aller au delà des simples critères de qualité descriptive et prédictive des modèles.


B. Études de cas


Le blog affiche aujourd'hui 5 études de cas. Les 10 séquences qui permettent de décrire une étude de cas sont diffusées sous forme de deux articles consécutifs. Généralement, la première partie rappelle la méthode de construction de la matrice d'expériences tandis que la seconde partie s'intéresse à l'analyse des résultats. Ces études de cas sont complémentaires aux supports de cours auxquels elles renvoient. Elles s'appuient sur une publication qui est revisitée pour l'occasion avec un regard neuf, permettant d'introduire de nouvelles techniques ou des approches complémentaires afin de donner des idées à de futurs utilisateurs des plans de mélange. Ces études de cas seront utilisées à nouveau pour illustrer la mise en œuvre de logiciels dédiés.

Ces études de cas ont été classées en fonction des secteurs industriels d'application, et au cours de l'année 2016, vont apparaître de nouveaux secteurs tandis que des secteurs existants seront complétés. En voici un rapide aperçu, non exhaustif.

B.1. Formulation d'un détergent & produits ménagers


Cette rubrique sera complétée par deux nouvelles études de cas, illustrant en particulier la mise en œuvre d'algorithmes d'échange pour la construction de plans optimaux.


B.2. Formulation de poudres et explosifs


Nous découvrirons ensemble un nouvel article sur la formulation de propergol et la mise en œuvre des fonctions de désirabilité pour la recherche d'un optimum multicritères.


B.3. Formulation de verres, céramiques et bétons


De nouveaux articles viendront compléter les articles parus dans le domaine des verres nucléaires d'une part et des liants hydrauliques d'autre part. Par ailleurs, des articles viendront illustrer l'utilisation des plans de mélange dans le domaine des céramiques traditionnelles, notamment dans le secteur de la terre cuite et des émaux.


B.4. Formulation des huiles, des essences et des lubrifiants


Les exemples proposés par Ronald Snee, contributeur très actif au travers de publications traitant de plans de mélange, seront revisités, à la fois pour illustrer la notion d'effet et la mise en œuvre d'algorithmes d'échange pour la construction de plans optimaux. Il s'agit d'une nouvelle rubrique.


B.5. Formulation de produits cosmétiques et pharmaceutiques


Nouvelle rubrique également permettant d'utiliser à des fins pédagogiques quelques publications issues de ce secteur industriel, en commençant, ce qui est sans doute très original, par des exemples de mélanges binaires que vous serez invités à mettre en œuvre à l'aide du tableur Excel.


B.6. Formulation de peintures et colorants


Deux études de cas sont d'ores et déjà largement avancées dans leur préparation et donneront lieu à des articles vous incitant à nouveau à construire la maquette du domaine expérimental. En présence de 4 constituants, cette maquette permet parfois de déjouer les pièges d'une construction algorithmique, un peu trop automatisée. Il s'agit également d'une nouvelle rubrique.


B.7. Formulation de produits agro-alimentaires


Succinctement évoquée de façon amusante lors du dernier article paru au mois de juillet, la formulation de produits agro-alimentaires donnera lieu à différents articles. Parmi ces articles, on trouvera des applications de la stratégie Mathematically Independent Variables pour la fabrication de cookies.


C. Excel & logiciels


Cette rubrique fait pour l'instant office de parent pauvre, essentiellement en raison de problèmes techniques de captation qui ont encore du mal à être résolus, si l'on souhaite une qualité d'image équivalente à celle des supports de cours ou des études de cas. J'ai toutefois mis en ligne le mois dernier une application du tableur Excel pour la construction de représentations triangulaires.


C.1. Application du tableur Excel


Nous reviendrons sur l'application de la méthode des moindres carrés à partir d'exemples simples qui nous permettront en particulier de créer des simulateurs pour mieux comprendre le sens des critères algébriques, tels que le déterminant de la matrice d'information, la trace de la matrice de dispersion, les termes diagonaux de la matrice H. Nous utiliserons également le tableur Excel pour construire en quelques clics de souris la fonction de répartition des valeurs d'une variable de réponse, étape importante dans l'analyse préalable des résultats. Nous illustrerons par ailleurs l'utilisation des transformations de Box-Cox en faisant appel une nouvelle fois à une fonction bien pratique mais méconnue : la fonction TABLE. Comme un plan de mélange comporte souvent plusieurs réponses, nous montrerons comment créer un menu déroulant, à la fois dans une feuille de calcul et dans une feuille graphique pour bénéficier d'une meilleure interactivité entre l'utilisateur et le tableur.


C.2. Les plans de mélange et les logiciels


Les préparations de captation des logiciels Statgraphics et Minitab sont bien avancées sur plusieurs études de cas. J'espère pouvoir illustrer l'utilisation des logiciels Design Expert, Modde et Statistica pour enrichir ce blog. Dès que les problèmes techniques seront résolus, des vidéos illustratives seront mises en ligne.


D. Dictionnaire / Glossaire / Lexique


La liste d'entrée qu'il convient de créer ne cesse de s'allonger au fil des publications d'articles, mais la rédaction de définitions cohérentes demande du temps et un travail de lecture importants avant de passer à la phase de rédaction. On devrait disposer d'une centaine d'entrées dans cette rubrique lors de la mise en ligne des ressources dans le cadre d'une université numérique.

E. Bibliographie


Le nombre d'ouvrages en langue française ou anglaise consacrés exclusivement aux plans de mélange est fort restreint. Nous avons atteint la moitié du parcours en commentant deux références. Il reste donc à commenter une monographie sous forme d'un ouvrage collectif paru chez Springer sous le titre "Optimal Mixture Experiments" et le livre de Jacques Goupy paru chez Dunod sous le titre "Plans d'expériences : les mélanges". Ce sera l'objet de deux nouveaux articles.

Il m'a semblé important de commenter également l'ouvrage "Sequential Simplex Optimization" qui bien que n'étant pas spécifiquement destiné aux formulateurs, présente de nombreuses perspectives d'application dans le domaine des sciences expérimentales lorsqu'on est confronté à un problème d'optimisation.

Je consacrerai un ou plusieurs articles pour commenter des fascicules parus dans la collection des Techniques de l'Ingénieur, en lien direct avec l'objet de ce blog. Ces fascicules en langue française sont souvent méconnus, bien qu'ils soient très facilement accessibles pour un public universitaire et dans bon nombre de médiathèques.

Sans doute, d'autres références viendront compléter la page consacrée à la bibliographie.

2016 : une année riche de ressources ! Bonne année à toutes et à tous !