- Pouvez-vous exécuter une régression avec des données manquantes?
- Comment gérez-vous les données manquantes dans la régression?
- Combien de données manquantes sont acceptables pour la régression?
Pouvez-vous exécuter une régression avec des données manquantes?
Avec l'analyse de régression, la valeur par défaut dans tous les programmes est d'éliminer tous les cas avec des données manquantes sur l'une des variables (i.e., Suppression de la liste). À mesure que la quantité de données manquantes augmente, il peut y avoir une réduction substantielle de la taille de l'échantillon et une perte de puissance qui en résulte.
Comment gérez-vous les données manquantes dans la régression?
Lorsque vous traitez des données manquantes, les scientifiques des données peuvent utiliser deux méthodes principales pour résoudre l'erreur: l'imputation ou la suppression des données. La méthode d'imputation développe des suppositions raisonnables pour les données manquantes. C'est très utile lorsque le pourcentage de données manquantes est faible.
Combien de données manquantes sont acceptables pour la régression?
Les articles d'orientation statistique ont déclaré que le biais est probablement dans les analyses avec plus de 10% de manquement et que si plus de 40% de données manquent dans des variables importantes, les résultats ne devraient être considérés que comme une hypothèse [18], [19].