Exemple d'analyse de données par Iconographie des Corrélations

Voici, sous forme d'exercice, un petit exemple d'analyse de données par « Iconographie des corrélations ».

Nous avons souvent à consulter des tableaux, dans notre travail ou dans la presse. Sommes nous sûrs d'en tirer entièrement parti ?

Considérons un tableau de contingence, c'est à dire un tableau croisant deux variables nominales (ici le secteur d'activité et la formation).

Formation des patrons de PME

Regardez bien ce tableau.

Notez, mentalement ou sur un papier, tout ce qu'il signifie (exemple: "Les patrons de l'industrie ont reçu une formation plutôt technique"). Puis comparez avec les réponses données par l'Iconographie des Corrélations.

Iconographie des corrélations

La figure comprend :

  • des « variables » (Gros Cube : colonne du tableau)
  • des « instants remarquables » de l’analyse (Triangle) : pic ou creux remarquable dans le profil de variation d’une variable, car non entièrement explicable par les variations des autres variables. C’est un événement rare ou atypique.
  • des « propriétés remarquables » d’une variable (Petit Cube oblique) : ce qui « explique » ses ressemblances avec d’autres variables.
  • des traits pleins (corrélation positive "remarquable"), ou pointillés (corrélation négative "remarquable").
  • « Instants » et « propriétés » portent le même nom que la ligne du tableau, mais apportent des informations différentes.

    En Iconographie des Corrélations, la valeur "remarquable" n'est pas forcément la plus forte ou plus faible valeur.

    En effet, TOUS les secteurs présentent de relativement fortes proportions de techniciens et d'autodidactes. Cela n'est pas remarquable. Mais la figure montre que

  • les transports sont les seuls à être si peu scientifiques et si souvent formés à la gestion,
  • les services les seuls à présenter tant de scientifiques et si peu d'autodidactes,
  • le commerce le seul à présenter autant comptables et de commerciaux.
  • les formations juridique et générale, ne sont pas particulièrement « remarquées » pour les secteurs considérés ici.
  • Industrie et BTP ont des profils de formation semblables. L’industrie se caractérise à la fois par la propriété « technique » qui explique la ressemblance de son profil de formation des patrons avec celui des BTP ; et, d’autre part, par une valeur « technique » remarquable, que la ressemblance de son profil avec celui du BTP ne suffit pas à expliquer.

    Les services sont caractérisés à la fois par les propriétés remarquables « scientifique » et « non autodidacte » (trait pointillé), et par des pics remarquables « scientifique » et « technique ».

    Commerce, transport et tourisme partagent une propriété « non scientifique » remarquable (trait pointillé).

    Les patrons du commerce sont caractérisés par deux autres propriétés : formations commerciale et comptable. Il n’y a pas de point atypique.

    Les patrons des transports sont caractérisés par une formation de gestion. Il n’y a pas de point atypique.

    Dans le secteur du tourisme, le profil de formation des patrons ressemble à celui des transports. Ils ont une propriété « autodidacte » remarquable avec, en outre, une valeur remarquable pour cette formation « autodidacte » (c'est d'ailleurs un pic pour la ligne et pour la colonne).

    Commentaire sur cet exemple d'analyse de données

    Si vous aviez trouvé toutes les réponses sans l'aide du schéma, bravo ! Vous bénéficiez d'une attention et d'un esprit de synthèse hors du commun ! Sinon (ou si vous manipulez de plus grands tableaux, ou s'il vous faut mêler variables qualitatives et quantitatives), le schéma de CORICO peut vous aider. Il va droit à l'essentiel !

    L'Iconographie des Corrélations, est plus parlante, plus intuitive et plus complète qu'un simple "test du Chi2", souvent utilisé dans le cas des tableaux de contingence..

    Cet exemple d'analyse de données, volontairement très simple, peut être traité avec une méthode d'analyse de données classique comme l'ACP ou l'AFC. Mais l'ACP est limitée aux variables quantitatives, et l'AFC aux variables qualitatives, ou aux tableaux dans lesquels toutes les cases sont dans la même unité. CORICO n'a pas ces contraintes.

  • Dans l'AFC, seuls les points à la périphérie du plan factoriel peuvent être interprétés. Dans CORICO, aucune position n'est privilégiée sur la sphère, qu'il est possible de faire tourner pour améliorer la lisibilité (en général elle s'oriente d'emblée du meilleur côté). D'ailleurs les liens du dessin lèvent toute ambiguïté sur les proximités.
  • Les cartes factorielles de l'AFC et l'ACP sont souvent difficiles à interpréter, même par le statisticien chevronné (CORICO permet de plaquer sur une ACP les liens trouvés ci dessus).
  • Voir aussi :


    Vous êtes enseignant : contactez-nous pour connaître les conditions spéciales qui vous permettront d'équiper votre classe, votre laboratoire, votre école ou votre université.

    Economisez des années en Recherche et Développement :

    INDUSTRIE - RECHERCHE - QUALITÉ - ÉPIDÉMIOLOGIE - ENQUÊTES - ECONOMETRIE ...

    TUTORIEL

    • Importer les données
    • Iconographie
    • Générer un plan
    • Régression

    Voir les tutoriels

    FORMATION

    • Découvrir et maîtriser
    • l'Analyse de Donnéees
    • le Plan d'expériences
    • les Séries Temporelles

    • Voir les formations