Détermination de l’exposition de 394 979 nouveau-nés par imputation multiple de données manquantes dans une étude épidémiologique

2015 
Introduction L’utilisation de bases de donnees administratives a visee epidemiologique est limitee par l’existence de donnees manquantes. Nous avons etudie l’effet des perchlorates contenus dans l’eau sur la TSH (Thyroid Stimulating Hormone) des nouveau-nes. Nous disposions des donnees informatisees du depistage neonatal systematique dosant la TSH. La commune de residence de la mere permettait d’attribuer l’exposition au perchlorate mais etait rarement saisie. L’objectif de ce travail etait d’evaluer une methode d’imputation de la commune de residence permettant d’attribuer une exposition aux nouveau-nes. Methodes La population d’etude etait composee de l’ensemble des nouveau-nes dans le Nord Pas-de-Calais entre 2004 et 2012. Pour une maternite donnee, nous avons calcule la probabilite de residence dans chacune des communes de son recrutement geographique a partir d’une extraction PMSI de l’ensemble des naissances de la periode (GHM d’accouchement par voie basse ou cesarienne). Le gold standard (GS) etait etabli pour l’annee 2012 par saisie informatique systematique des communes de residence. L’imputation multiple des donnees manquantes etait realisee par equations chainees (MICE) pour les variables d’ajustement disponibles (> 15 % de manquantes) et par tirage au sort pondere pour la commune de residence. Le GS etait compare aux imputations a l’aide des odds ratios (OR) d’un modele lineaire mixte. Ce modele etait ensuite realise sur l’ensemble des donnees. Resultats Les six OR obtenus par l’imputation sont similaires a ceux obtenus par imputation en 2012. Les statistiques de test (donc les intervalles de confiance) sont analogues : la plus grande variation est de l’ordre de 0,001 (OR = 1,047 [1,029–1,065] versus 1,042 [1,024–1,059]). Un OR non significatif change de polarite. Le modele realise sur l’ensemble des naissances retrouve des coefficients comparables dont l’intervalle de confiance est plus precis. Discussion/conclusion Ce travail permet de valider notre methode d’imputation multiple. L’utilisation de MICE permet d’obtenir des estimateurs non biaises et dont la variance est preservee. Les resultats obtenus sur les 394 979 nouveau-nes appuient nos conclusions avec une taille d’echantillon dix fois superieure.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []