- Combien de variance doit-elle expliquer?
- Qu'est-ce qu'une charge élevée en PCA?
- Devrais-je supprimer des fonctionnalités hautement corrélées avant PCA?
- Que nous disent les charges d'un PCA?
Combien de variance doit-elle expliquer?
Certains critères indiquent que la variance totale expliquée par tous les composants devrait être entre 70% et 80% de variance, ce qui signifierait dans ce cas environ quatre à cinq composants.
Qu'est-ce qu'une charge élevée en PCA?
Les charges proviennent d'un point de vue numérique, égale aux coefficients des variables, et fournissent des informations sur les variables apportent la plus grande contribution aux composants. Les charges varient de -1 à 1. Une valeur absolue élevée (vers 1 ou -1) décrit que la variable influence fortement le composant.
Devrais-je supprimer des fonctionnalités hautement corrélées avant PCA?
Salut Yong, PCA est un moyen de gérer les variables hautement corrélées, il n'est donc pas nécessaire de les supprimer. Si n variables sont fortement corrélées qu'elles se chargeraient toutes sur le même composant principal (vecteur propre), pas des différents. C'est ainsi que vous les identifiez comme étant fortement corrélés.
Que nous disent les charges d'un PCA?
Les charges positives indiquent une variable et une composante principale est positivement corrélée: une augmentation de l'un entraîne une augmentation de l'autre. Les charges négatives indiquent une corrélation négative. Les charges importantes (positives ou négatives) indiquent qu'une variable a un effet fort sur cette composante principale.