Exercice 3

Comparer les proportions suivantes :

Soit une étude transversale étudiant chez des patients ayant ou pas les deux symptômes suivants : HTA et diabète. On a le tableau suivant :

Diabète +

Diabète -

Total

HTA +

572

 27

599

HTA -

445

213

658

Total

1017

240

1257

Question

Analysez ces données avec la technique la plus appropriée.

Solution

Les données ont été colligées dans une étude transversale, qui consiste à à déterminer simultanément pour un sujet la présence ou non d'un diabète et d'une hypertension. Le tableau croisé suit donc une loi multinomiale. Contrairement au cas de l'exercice 1, où les groupes de traitements sont constitués en début d'étude et où l'on attend d'observer ou non l'événement d'intérêt, ce qui amène donc comparer deux lois binomiales, ici, il n'y a pas de « sens » naturel dans les données : les informations sur les deux variables sont obtenues simultanément.

La loi a priori conjuguée d'une loi multinomiale est la loi de de Dirichlet, dont les paramètres s’interprètent comme ceux d'une loi Beta, en nombre de sujets. Si on prend une loi de Dirichlet uniforme Di (1 ; 1 ; 1 ; 1), on peut écrire directement la loi de a posteriori qui est une Di(572+1 ; 27+1 ; 445+1 ; 213+1), dans laquelle on va faire un échantillonnage Monte-Carlo.

Dans R :

library(MCMCpack)

M<-100000

tablo<-rdirichlet(M, c(573,28,446,214) )

OR<-tablo[,1]*tablo[,4]/(tablo[,2]*tablo[,3])

round(quantile(OR,probs=c(0.025,0.05,0.25,0.50,0.75,0.95,0.975)),3)

On obtient en sortie la distribution a posteriori de l'OR qui vaut 9,945 et ayant un intervalle de crédibilité à 95% de [6,673 ; 15,314]

2,5%

5%

25%

50%

75%

95%

97,5%

6.673

7.097

8.623

9.945

11.477

14.243

15.314