Les aspects statistiques présentés dans cet article se restreignent à l'estimation de la qualité descriptive et de la qualité prédictive des modèles.
La première séquence rappelle que l'analyse mathématique a permis d'obtenir, en faisant appel à la méthode des moindres carrés, un modèle, c'est-à-dire une équation dont les coefficients représentent une estimation des paramètres du modèle et des résidus, traduisant les écarts entre les valeurs observées et les valeurs restituées par l'équation du modèle. Pour juger de la qualité descriptive d'un modèle, on peut rapprocher ces deux ensembles de valeurs, soit de façon graphique en construisant le graphe d'adéquation, soit de façon numérique en calculant la somme des carrés des écarts.
La somme des carrés des écarts représente une des composantes de l'équation d'analyse de régression. On présente dans cette deuxième séquence, la construction du tableau d'analyse de régression, puis son exploitation pour calculer d'une part le coefficient de détermination R2 et d'autre part le coefficient de détermination R2ajusté. Ce dernier coefficient permet de comparer d'un point de vue descriptif des modèles ne faisant pas appel au même nombre de paramètres.
En faisant toujours appel à l'exemple d'un mélange binaire de sable et de gravier, cette troisième séquence illustre l'estimation de la qualité prédictive d'un modèle, en faisant appel à une méthode de validation croisée. Suite au plan de mélange, on crée une partition constituée d'un échantillon d'apprentissage et d'un échantillon de validation. L'approche illustrée dans cette séquence permet de positionner la matrice H (Hat matrix) dans la démarche et ses termes diagonaux appelés des leviers. Cette matrice est régulièrement utilisée, à la fois pour la construction des plans de mélange et pour l'analyse des résultats.
Chacune des séquences est ponctuée par un quizz de quelques questions ; en répondant à ces questions, vous capitaliserez ainsi les connaissances apprises lors de ce chapitre.
En faisant toujours appel à l'exemple d'un mélange binaire de sable et de gravier, cette troisième séquence illustre l'estimation de la qualité prédictive d'un modèle, en faisant appel à une méthode de validation croisée. Suite au plan de mélange, on crée une partition constituée d'un échantillon d'apprentissage et d'un échantillon de validation. L'approche illustrée dans cette séquence permet de positionner la matrice H (Hat matrix) dans la démarche et ses termes diagonaux appelés des leviers. Cette matrice est régulièrement utilisée, à la fois pour la construction des plans de mélange et pour l'analyse des résultats.
Chacune des séquences est ponctuée par un quizz de quelques questions ; en répondant à ces questions, vous capitaliserez ainsi les connaissances apprises lors de ce chapitre.