Le logiciel CORICO : l'analyse globale des données multivariées

" Un bon schéma vaut mieux qu'un long discours "

Analyse de données multivariée

Un Outil de visualisation de données multifactorielles sans équivalent.

A partir d'un tableau de données, "L'Iconographie des Corrélations" élimine les "fausses bonnes corrélations" (celles qui sont dues à une tierce variable), et révèle les corrélations "masquées" lorsqu'une variable dépend de plusieurs variables.

Le logiciel élabore ensuite le schéma explicite des seuls liens directs entre les variables quantitatives et/ou qualitatives.

Vous n’avez rien à programmer. Cliquez seulement ! L’apprentissage est court, l’utilisation est facile .

D’emblée, l’essentiel est présent, avec l’assurance que rien n’a été oublié. Le logiciel d'analyse de données CORICO vous dispense de l’examen fastidieux des chiffres. Bien sûr, si vous avez un doute, vous pouvez tout vérifier. Vous disposez d’outils pour repérer très vite les erreurs de saisie des données.

L’iconographie des corrélations rend l’organisation visible et la complexité compréhensible. Elle suscite une adhésion rapide des différentes parties prenantes à l’analyse des données multivariées, même non statisticiennes. Elle offre un moyen facile de s'affranchir des erreurs systématiques et d'identifier les biais de confusion.

C'est une alternative simple à des méthodes d'interprétation souvent délicate comme l'Analyse factorielle, la classification, l'analyse discriminante ou l'analyse canonique.

Explication de la figure ...

Analyse de données multivariée

Analyse de la figure : données corrosion

L’algorithme du schéma tient en une phrase :
Un lien est tracé entre deux variables seulement si la corrélation subsiste quand n’importe quelle des autres variables est maintenue constante (« lien remarquable »).

Cette condition est sévère et garantit la solidité de l’interprétation.

Les conventions des schémas du logiciel analyse de données CORICO sont simples :

les traits pleins indiquent une corrélation positive "remarquable", les traits pointillés une corrélation négative "remarquable".

Les symboles &, ^, sont des cas d' "interactions logiques". Par exemple : "Concentration&-Température" lié par un trait plein à la CORROSION signifie que l'occurence simultanée d'une forte concentration et d'une faible température augmente la corrosion...

L'absence de lien est également une information. Par exemple, la durée n'a, sur ces données, aucune influence sur la corrosion.

Bien entendu, des informations quantitatives sur chacun des liens du schéma sont disponibles à tout moment. Cependant la figure privilégie le côté visuel, afin d’accélérer le processus de compréhension.

La position des points n’a pas d’importance pour l’interprétation. Toutefois, la disposition des points évite au maximum le croisement des liens, pour faciliter une lecture intuitive du schéma.

La relation est la seule réalité ...

La relation est la seule réalité

Le logiciel CORICO remplace un tableau de chiffres qui ne nous dit rien, par un réseau de relations qui s’éclairent et se complètent mutuellement.

Démarche éminemment cartésienne: dans les ouvrages de physique de ce mathématicien hors pair, il n’y a pour ainsi dire aucun chiffre ou formule mathématique !

Les « coordonnées cartésiennes » expriment l’idée de coordination entre variables, mais les variables sont multiples : on ne trouve pas de système de coordonnées dans les œuvres physiques de Descartes !

L’outil mathématique doit s’effacer, comme l’échafaudage, une fois bâtie la maison.

Car il s’agit d’apercevoir l’ordre. Et rien de tel pour cela qu’un graphe composé de lignes (relations), recensement attentif de tout ce qui se rapporte à la question.

« Et nous le faisons autant pour éviter l’ennui d’un calcul fastidieux et superflu, que pour obtenir, et c’est le principal, que les parties du sujet qui touchent à la nature de la difficulté restent toujours distinctes et ne s’enveloppent pas dans des nombres qui ne nous disent absolument rien » (Descartes, Regulae XVI).

Remplacer des données chiffrées par d’autres nombres, fussent-ils moins nombreux, c’est reculer pour mieux sauter, et c’est surtout une perte d’information, au risque d’effacer ou même d’inverser des relations réelles (exemple ici).

Nous avons beaucoup à apprendre de la manière dont se tissent les liens.

Une sphère unique ...

Une sphère unique pour l'analyse des données multidimensionnelles :


Quelques soient les dimensions du problème, la représentation sur une sphère unique (et non sur des plans multiples) assure la vue globale immédiate.

La synthèse de l'organisation des relations (linéaires ou non), débarrassée des multiples redondances qui prêtent à confusion, apparaît en toute clarté.

Par une vue unique, simple et précise, de données issues de différentes sources, le logiciel favorise la collaboration.

C'est un garde-fou dans la prise de décision, et un avantage de l'Iconographie des Corrélation par rapport à l'Analyse en Composante Principales (également disponible dans le logiciel analyse de données CORICO).

Aussi utile pour les petits tableaux que pour les grands ...

Petits ou grands tableaux

Analyse de données multidimensionnelle

Dès lors que vous avez plus de trois variables et plus de trois observations par variable, des problèmes de redondances et d'interaction peuvent masquer l'essentiel.

Le logiciel analyse de données CORICO révèle des relations qui vous étonneront par leur pertinence. (Voir un petit tableau).

A l'opposé, en face d'un énorme tableau, la tentation est grande de n'en considérer qu'une partie. Le logiciel analyse de données CORICO permet de tout apréhender, et d'en dégager l'essentiel, sans a priori.

Vous pouvez importer, exporter ou retravailler diversement des fichiers de type .csv (Excel…)

Un gain de signification sans perte d'information ...

Gain de signification

Submergé par l'information, on croit généralement que la statistique doit travailler sur des moyennes et "consentir à une perte d'information". Cependant, le gain de signification n'est pas garanti car la moyenne mélange tout, et entraîne souvent des erreurs de jugement.

La nouveauté radicale du logiciel analyse de données CORICO consiste à supprimer seulement l'information superflue, et à s'affranchir des facteurs de confusion et des biais de sélection, pour obtenir un gain de signification sans perte d'information.

Économiser des heures de manipulation de tableaux croisés dynamiques, éviter les fausses pistes, c’est s’épargner, parfois, des années de travaux sans issue.

Quel genre de statistique ? ...

Quel genre de statistique ?

La statistique a pour objet la collecte, le traitement et l’interprétation des données.

  • Une partie des méthodes de la statistique, disponible dans CORICO, repose sur les probabilités, c'est-à-dire sur des moyennes ; mais la moyenne mélange tout et n’a pas toujours un sens. Une telle statistique, qui repose sur beaucoup d’hypothèses, peut être appelée la science du désordre.
  • Une autre partie des statistiques, non probabiliste, l’analyse géométrique des données, telle l’iconographie des corrélations, restitue au contraire l’ordre sous-jacent aux données disponibles. C’est un état des lieux qui ne repose sur aucune hypothèse. Et c'est une innovation essentielle du logiciel CORICO.
  • Par exemple, dans un chantier de fouilles préhistoriques, la première approche consisterait à rassembler en un tas les haches de pierre, en un autre les lames de silex, en un troisième les fragments de poteries, etc. Mais l’archéologie bien conduite laisse tout en place, et considère minutieusement les associations d’objets et leurs positions relatives, comme celles des moindres traces et indices, révélateurs d’inférences causales.

    L'Iconographie des Corrélations allie la minutie d’une recherche exacte, attentive et coordonnée à la rapidité de l’ordinateur. Le résultat est une figure lisible et intuitive où chaque élément est situé dans son contexte par ses liaisons remarquables.

    L’iconographie des corrélations, telle une photographie à un moment donné, ne prétend pas représenter ce qui s’est passé à un autre moment. C’est justement ce qui évite le flou des résultats.

    Avec CORICO, la question n’est plus : « Mes données sont-elles significatives ? », mais plutôt : « De quoi mes données sont-elles significatives ?»

    Le logiciel élimine ce qui vous empêche de voir l’ordre, sans lequel il vous est impossible de faire « parler » vos données. En effet le tout est plus que la somme de ses parties : par exemple, dans une phrase, l’organisation des mots est quelque chose d’irréductible à l’ensemble des mots pris dans le désordre, puisque les mêmes mots organisés différemment donnent un sens différent à la phrase.

    Nous avons beaucoup à apprendre de la manière dont se tissent les liens. Le mot « Intelligent », dérivé du latin inter (entre) et legere (lier), veut dire « relier les choses entre elles ». L’iconographie des corrélations nous rend plus intelligents !

    L’exploration visuelle des données est rapide, intuitive et rigoureuse ...

    Exploration visuelle rapide

    Vous pouvez, importer, exporter ou retravailler diversement des fichiers de type .csv (Excel, etc.)

    Dans le logiciel analyse de données CORICO, un graphe unique, réellement multidimensionnel, remplace une multitude de graphes bidimensionnels. Il peut être agrémenté de couleurs et de commentaires, et ouvre pour vous des pistes nouvelles.

    L’Interface du logiciel analyse de données est simple et efficace, facile à apprendre et à utiliser (2 jours de formation).

    Vous disposez d’aides contextuelles conviviales, d’une aide en ligne, d’exemples détaillés, et d'un assistant permanent en cas de trou de mémoire, sans parler des tutoriaux.

    Un outil décisionnel et de modélisation (régression multiple) ...

    Un outil décisionnel et de modélisation

    Analyse des données, interaction

    Le logiciel analyse de données CORICO sélectionne les variables pertinentes, parmi des milliers de possibilités, même si le nombre d'observations est inférieur au nombre de variables.


    Il introduit aussi des variables particulièrement significatives (interactions logiques) dans des modèles non postulés, dont l'interprétation directe et simple vous amène beaucoup d'information.

    Un outil de classification et de segmentation innovant ...

    Un outil de classification et de segmentation

    Copie d'écran, segmentation

    Le logiciel analyse de données travaille aussi bien sur variables quantitatives que qualitatives.

    Il tient compte des interactions.

    D'un simple clic, vous sélectionnez les divers groupes d'observations, dont les groupes extrêmes, et vous pouvez en extraire des règles opérationnelles.

    Réduire les coûts d'un plan d'expériences, et mieux l'analyser ...

    Economiser les expériences

    Copie d'écran Analyse de données
    Le logiciel analyse de données CORICO s'adapte à tous les problèmes concrets du Plan d'Expériences lorsque :
  • il y a beaucoup de facteurs influents, contrôlés ou non;
  • les facteurs contrôlés ne sont pas tous indépendants;
  • il est risqué de postuler un modèle a priori ou de faire l'impasse sur certaines interactions;
  • il est difficile, lors de la réalisation des essais, de respecter exactement les niveaux prévus;
  • les résultats des premiers essais obligent à changer de stratégie;
  • les essais sont coûteux.

  • La sélection automatique du modèle (non postulé) permet une analyse plus facile et mieux ajustée des résultats d’un plan d’expériences.

    L’Analyse Animée des Données, qu’est-ce que c’est ...

    L'analyse animée des données

    Analyser les données par Iconographie des corrélations

    C'est l'analyse de la variabilité de la variabilité.

    Un tableau de données et sa matrice de corrélations peuvent être vus comme un tout.

    Mais les corrélations peuvent évoluer au cours du temps, ou simplement évoluer entre deux groupes de lignes du tableau.

    Le graphique du logiciel d'analyse de données CORICO (sur la sphère) se prête bien à une représentation « mouvante » des liens entre les différents paramètres : il nous libère des problèmes de stabilité ou de validation des axes (puisqu’il n’y a pas d’axe).

    Le mouvement attire l’attention sur des aspects essentiels, inaccessibles autrement.

    Ainsi, il est souvent plus facile d’interpréter une dizaine d’images à la seconde, qu’une seule image de votre tableau de données ; et quelquefois intéressant de découper même un petit tableau en une succession de vues.

    Alors, sous l'apparence désordonnée, se dévoile un ordre intelligible : la "collecte des données brutes" se transforme en "perception des faits", dans leur cohérence concrète.

    En statistique géométrique (non probabiliste), mieux vaut souvent considérer une succession d’images nettes, plutôt qu’un mélange d’images où l’information est brouillée.

    Livre : « L'Analyse de Données par Iconographie des Corrélations », Michel Lesty (201 pages), Juin 2023, disponible sous forme Brochée, ou sous forme ebook.

    Vous êtes enseignant : contactez-nous pour connaître les conditions spéciales qui vous permettront d'équiper votre classe, votre laboratoire, votre école ou votre université.

    Economisez des années en Recherche et Développement :

    INDUSTRIE - RECHERCHE - QUALITÉ - ÉPIDÉMIOLOGIE - ENQUÊTES - ECONOMETRIE ...

    TUTORIEL

    • Importer les données
    • Iconographie
    • Générer un plan
    • Régression

    Voir les tutoriels

    FORMATION

    • Découvrir et maîtriser
    • l'Analyse de Donnéees
    • le Plan d'expériences
    • les Séries Temporelles

    • Voir les formations