La comparaison de deux moyennes
Le modèle linéaire utilisé
On utilise la régression linéaire simple :
\(\mathbb{E}(y|\boldsymbol{x}) = \beta_0 + \beta_1 x_1\)
Ceci revient à considérer que les \(y\) mesurés sont issus d'une même population munie d'une caractéristique \(x\) différenciant deux « sous-populations »
Dans notre exemple des mesures de glycémie selon les régimes : \(y\) est la glycémie et \(x\) doit représenter l'appartenance au groupe de régime alimentaire
On peut envisager plusieurs codages de \(x\) mais deux sont les plus intéressants
Le codage de \(\color{#0060A9}{x}\)
\(\mathbb{E}(y|x) = \beta_0 + \beta_1 x\)
\(x\) est le régime alimentaire : régime 1 (\(\color{blue}{x=0}\)) ou 2 (\(\color{blue}{x=1}\)) \(\Rightarrow\) \(\beta_1\) est la différence moyenne de glycémie associée au fait d'avoir le régime 2 par rapport au régime 1
\(\left\{ \begin{array}{lcl} \mathbb{E}(y|x = 1) &=& \beta_0 + \beta_1 \\[2ex] \mathbb{E}(y|x = 0) &=& \beta_0 \end{array} \right.\)
\(\Rightarrow \mathbb{E}(y|x=1) - \mathbb{E}(y|x=0) = \color{blue}{\beta_1}\)
\(\Rightarrow \beta_0\) est la moyenne de glycémie avec le régime 1 et \(\beta_0 + \beta_1\) la moyenne de glycémie avec le régime 2
\(x\) est le régime alimentaire : régime 1 (\(\color{blue}{x=-1}\)) ou 2 (\(\color{blue}{x=1}\))
\(\left\{ \begin{array}{lcl} \mathbb{E}(y|x = 1) &=& \beta_0 + \beta_1 \\[2ex] \mathbb{E}(y|x = -1) &=& \beta_0 - \beta_1 \end{array} \right.\)
\(\Rightarrow \mathbb{E}(y|x=1) - \mathbb{E}(y|x=-1) = \color{blue}{2 \beta_1}\)
\(\Rightarrow \beta_0\) est une moyenne générale de glycémie \(\beta_1\) est l'écart de part et d'autre de \(\beta_0\) menant à la moyenne de glycémie avec chaque régime
→ \(\beta_0\) correspond au \(\mu\) de notre modèle explicite précédent et \(\beta_1\) au \(\delta\)