Introduction

Ce qu'on va faire

  • Le modèle linéaire (régression linéaire) est un modèle très général

  • Il sera ici adapté spécifiquement à la comparaison de deux moyennes

  • Il s'agira d'une régression linéaire simple: un vecteur de \(y\) à expliquer par un vecteur de \(x\) dans le cas où x vaut 0 ou 1

La situation générale

  • Une variable continue \(y\)

  • \(p\) variables \(\boldsymbol{x} = (x_1, x_2, \ldots, x_p)\)

  • Deux finalités: prédire \(y\) sachant les \(x\) ou expliquer les \(y\) par les \(x\)

  • Le meilleur prédicteur de \(y\) est \(\mathbb{E}(y|\boldsymbol{x})\)

  • Le plus simple est de considérer que \(\mathbb{E}(y|\boldsymbol{x}) = \boldsymbol{x} \beta = \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_p x_p\)

  • Modèle linéaire car combinaison linéaire de \(\beta\)

→ si besoin on peut introduire des transformations de variables \(x\)

Le cas le plus simple

  • Régression linéaire simple : \(y=a+bx\)

    • \(b\) = pente

    • \(a\) = ordonnée à l'origine

  • \(y = a + bx \Rightarrow \beta_0 \mathbb{1} + \beta_1 x\)

→ ajouter à la matrice des \(x\) la colonne des 1 pour l'ordonnée à l'origine