Comme nous l'avons vu dans un précédent article consacré à la présentation d'un ouvrage de référence, l'analyse de régression est un groupement de procédures associées à l'évaluation d'un modèle.
D'un point de vue pédagogique, il me semble utile de distinguer deux parties que j'ai respectivement intitulées : analyse mathématique et analyse statistique. Le présent article porte sur la première de ces deux analyses en s'appuyant sur trois séquences vidéos.
L'analyse mathématique consiste à estimer les paramètres d'un modèle et les écarts entre les valeurs observées et les valeurs restituées à partir de l'équation du modèle. La méthode des moindres carrés sera la méthode d'ajustement utilisée ici, les écarts portant alors le nom de résidus. On retrouvera les données de l'exemple du mélange binaire de sable et de gravier, présenté dans le chapitre consacré à la position du problème.
La première séquence permet de rappeler la position du modèle dans la boucle de la formulation, puis la définition d'un modèle. La méthode des moindres carrés dont l'écriture matricielle sera présentée dans les séquences suivantes est schématiquement introduite ici, en positionnant les différentes matrices et leur nom qui interviennent successivement dans la démarche. On consacre également du temps dans cette séquence pour présenter l'origine des formes canoniques des modèles polynomiaux de degré d, avec en particulier les formes réduites pour les modèles de degré 3 et de degré 4, puis pour présenter l'expression générique d'un modèle synergique du modèle de degré q.
La deuxième séquence présente le passage de la matrice d'expériences à la matrice du modèle. Le nombre d'équations disponibles étant inférieur au nombre d'inconnues à estimer, on justifie alors que la méthode des moindres carrés permet de générer les équations manquantes, en minimisant la somme des carrés des écarts. Les équations manquantes permettent de construire une matrice carrée, appelée matrice d'information dont le déterminant jouera un rôle important dans les méthodes de construction des plans de mélange faisant appel non plus à des critères empiriques ou géométriques, mais à des critères algébriques. L'inversion de cette matrice, lorsqu'elle est possible, conduit à la définition des composantes de la matrice de dispersion, les termes diagonaux de cette matrice étant appelés des coefficients de variance.
La troisième et dernière séquence conduit à l'expression du vecteur des coefficients, puis au vecteur des résidus avant de se livrer à un bilan récapitulatif de l'analyse mathématique.
Chacune des séquences est ponctuée par un quizz de quelques questions ; en répondant à ces questions, vous capitaliserez ainsi les connaissances apprises lors de ce chapitre.
Les conseils de mise en œuvre de la méthode à l'aide d'un tableur présentés dans les séquences de ce chapitre devraient vous inciter à estimer les coefficients et les résidus pour la forme canonique du modèle de degré 3 et la forme canonique du modèle de degré 4. Bien souvent, l'offre des logiciels s'avère assez incomplète pour l'étude des mélanges binaires et le recours à un tableur devient alors incontournable.