La comparaison de deux moyennes

Le modèle linéaire utilisé

  • On utilise la régression linéaire simple :

  • \(\mathbb{E}(y|\boldsymbol{x}) = \beta_0 + \beta_1 x_1\)

  • Ceci revient à considérer que les \(y\) mesurés sont issus d'une même population munie d'une caractéristique \(x\) différenciant deux « sous-populations »

  • Dans notre exemple des mesures de glycémie selon les régimes : \(y\) est la glycémie et \(x\) doit représenter l'appartenance au groupe de régime alimentaire

  • On peut envisager plusieurs codages de \(x\) mais deux sont les plus intéressants

Le codage de \(\color{#0060A9}{x}\)

  1. \(\mathbb{E}(y|x) = \beta_0 + \beta_1 x\)

  2. \(x\) est le régime alimentaire : régime 1 (\(\color{blue}{x=0}\)) ou 2 (\(\color{blue}{x=1}\)) \(\Rightarrow\) \(\beta_1\) est la différence moyenne de glycémie associée au fait d'avoir le régime 2 par rapport au régime 1

    \(\left\{ \begin{array}{lcl} \mathbb{E}(y|x = 1) &=& \beta_0 + \beta_1 \\[2ex] \mathbb{E}(y|x = 0) &=& \beta_0 \end{array} \right.\)

    \(\Rightarrow \mathbb{E}(y|x=1) - \mathbb{E}(y|x=0) = \color{blue}{\beta_1}\)

    \(\Rightarrow \beta_0\) est la moyenne de glycémie avec le régime 1 et \(\beta_0 + \beta_1\) la moyenne de glycémie avec le régime 2

  3. \(x\) est le régime alimentaire : régime 1 (\(\color{blue}{x=-1}\)) ou 2 (\(\color{blue}{x=1}\))

    \(\left\{ \begin{array}{lcl} \mathbb{E}(y|x = 1) &=& \beta_0 + \beta_1 \\[2ex] \mathbb{E}(y|x = -1) &=& \beta_0 - \beta_1 \end{array} \right.\)

    \(\Rightarrow \mathbb{E}(y|x=1) - \mathbb{E}(y|x=-1) = \color{blue}{2 \beta_1}\)

    \(\Rightarrow \beta_0\) est une moyenne générale de glycémie \(\beta_1\) est l'écart de part et d'autre de \(\beta_0\) menant à la moyenne de glycémie avec chaque régime

\(\beta_0\) correspond au \(\mu\) de notre modèle explicite précédent et \(\beta_1\) au \(\delta\)