Analyse en composantes principales en 4 langues

Une comparaison entre l'Analyse en Composantes Principales et l'Iconographie des Corrélations


Comment extraire l'information contenue dans des données brutes pour produire une information utile, plus sûre et plus intelligible à un utilisateur humain ?

Le logiciel CORICO, fondé sur « l’Iconographie des Corrélations », contient également des méthodes multivariées classiques, comme « l’analyse en composantes principales » (ACP). Montrons l’un des apports de l’Iconographie des Corrélations.

L’une des limites de l’ACP est qu’elle requiert des ensembles de données homogènes. Or il est souvent utile de travailler sur des données non homogènes, par exemple, mélanger des données quantitatives et des données qualitatives, ou bien des données pluridisciplinaires dont on ne connaît pas à l’avance quelles sont celles qui exercent une influence sur les variables d’intérêt.


Iconographie des corrélations

Figure A : Iconographie des Corrélations.

Considérons le cas d’école suivant : CORICO a donné l'image ci-contre. Il apparait deux ensembles de variables, pratiquement indépendants, en effet :

    Deux groupes de variables distincts apparaissent, avec une structure remarquable en réseau régulier.

    Il existe entre eux des liens : les variables E et H du groupe bleu sont liées négativement (traits pointillés) à certaines variables du groupe rouge.

L'iconographie des corrélations privilégie la représentation des liens et la clarté de la vue globale. Quelle que soit la dimension de l’espace des données (ici 4), la représentation se traduit par une image unique.

Le tracé explicite des liens lève toute ambiguïté entre proximités apparentes et réelles.


Passons à l'Analyse en Composantes Principales (ACP). Celle-ci privilégie au contraire la rigueur des positions, d’où la nécessité de les projeter sur plusieurs plans, au risque de nuire à la lisibilité et à l’interprétation. Le pouvoir de synthèse est inversement proportionnel au nombre d'axes nécessaires à la représentation :

ACP, axes 1 et 2

Figure B : Composantes principales 1 et 2.

Les groupes sont bien séparés par l’axe 1.

Inconvénient : certains points du groupe bleu ont la même projection (et donc ne se distinguent pas).

De plus, les groupes sont vus de profil ; leurs structures n’apparaissent pas.

ACP axes 2 et 3

Figure C : Composantes principales 2 et 3.

La structure du groupe rouge apparaît, mais tous les points du groupe bleu sont confondus en une même projection (au centre)

ACP, axes 3 et 4

Figure D : Composantes principales 3 et 4.

Inconvénients :

La structure des groupes n’apparaît pas.

Les groupes rouge et bleu se croisent.

ACP, axes 4 et 5

Figure E : Composantes principales 4 et 5.

La structure du groupe bleu apparaît, mais tous les points du groupe rouge sont confondus en une même projection (au centre).

Conclusion de la comparaison des traitements de données

L'analyse de données par la méthode CORICO bénéficie des apports des méthodes antérieures sans souffrir de leurs limitations :

  • Avec « l'analyse en composante principales », il a fallu quatre projections (figures B, C, D, E) pour faire apparaître la structure de chacun des groupes, et la relation entre ces groupes. Cela exige de l'utilisateur une certaine concentration d’esprit, et une bonne mémoire, pour synthétiser toute l’information.
  • En « Iconographie des corrélations », la structure des deux groupes apparaît sur la seule figure A, et les liens remarquables sont soulignés d’emblée.

En effet, l'iconographie des corrélation n'est pas la projection sur un plan, mais un schéma de compréhension. La position des points a moins d'importance que la cohérence des liens et leur organisation.

Souvent, les données pertinentes contiennent plus de deux groupes non homogènes; alors l'analyse en composantes principales se complique ou devient inapplicable. En « Iconographie des corrélations » au contraire, il est recommandé d'analyser d'un coup toutes les variables disponibles.

Vous pouvez traiter simultanément les variables qualitatives et quantitatives, et ces dernières n’ont pas besoin d’être mises en classe, d’où un gain en précision.

Conçue pour être compris du plus large public, l'Iconographie des Corrélations nous aide à surmonter notre difficulté à penser les choses dans leurs dépendances réciproques. En savoir plus.

Voir aussi :

D'autres exemples de traitement de données avec CORICO :

Vous êtes enseignant : contactez-nous pour connaître les conditions spéciales qui vous permettront d'équiper votre classe, votre laboratoire, votre école ou votre université.

Devis gratuit - Plans d'expériences économiques

Didacticiel logiciel corico

Formation logiciel corico

Demo logiciel corico

Economisez des années en Recherche et Développement : INDUSTRIE - RECHERCHE - QUALITÉ - ÉPIDÉMIOLOGIE - ENQUÊTES - ECONOMETRIE ...