Introduction
Ce qu'on va faire
Le modèle linéaire (régression linéaire) est un modèle très général
Il sera ici adapté spécifiquement à la comparaison de deux moyennes
Il s'agira d'une régression linéaire simple: un vecteur de \(y\) à expliquer par un vecteur de \(x\) dans le cas où x vaut 0 ou 1
La situation générale
Une variable continue \(y\)
\(p\) variables \(\boldsymbol{x} = (x_1, x_2, \ldots, x_p)\)
Deux finalités: prédire \(y\) sachant les \(x\) ou expliquer les \(y\) par les \(x\)
Le meilleur prédicteur de \(y\) est \(\mathbb{E}(y|\boldsymbol{x})\)
Le plus simple est de considérer que \(\mathbb{E}(y|\boldsymbol{x}) = \boldsymbol{x} \beta = \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_p x_p\)
Modèle linéaire car combinaison linéaire de \(\beta\)
→ si besoin on peut introduire des transformations de variables \(x\)
Le cas le plus simple
Régression linéaire simple : \(y=a+bx\)
\(b\) = pente
\(a\) = ordonnée à l'origine
\(y = a + bx \Rightarrow \beta_0 \mathbb{1} + \beta_1 x\)
→ ajouter à la matrice des \(x\) la colonne des 1 pour l'ordonnée à l'origine