Notre force : des data scientists expérimentés pour vous accompagner dans vos projets et vous proposer une méthodologie rigoureuse et innovante.
Quels que soient vos objectifs, notre expertise dans les études sur cas réels nous permettra de vous aider à y répondre.
L’expertise développée par CORYENT est reconnue au plan national et international ainsi qu’en témoigne la diversité de ses commanditaires :
ACNielsen, Aérospatiale, AIRBUS, Aircelle, Alcan, Aluminium Pechiney, Arc International Cookware, ARIANE GROUP, Aventis, BRCM Toulon, Chassis Brakes International, CEA, CNRS, Chimiométrie, Cérib, Chiesi, Danone, D2T, EADS, Ecole Centrale de Nantes, EDF, ENI Tarbes, ENSAIA, ENSAM, ENSCI, Eurocast, Ferrari, Foundation Brakes France,Forbo Sarlino, GlaxoSmithKline Biologicals, Gerflor, Gestion, GIE HARMONY, Hôpital Pitié Salpêtrière, Hispano-Suiza, Hutchinson, Ifremer, IMVAVET,Inoplast, INP - ENSIACET, INPL, INPT, INRA, INSA Toulouse, Institut Polytechnique LaSalle Beauvais, Imphy Alloys, IPG, IRT-M2P, Kraton Polymer Research, Laboratoire de Géographie Physique, Lafarge, LFB, L'Oréal, LPCE, Mairie de Paris, Marine Nationale, Mariebel, Masterfoods, Marketing, Materne, Ministère des Transports, MICROTURBO, Mutuelles du Mans Assurances, Naval Group, Orange Côte d'Ivoire, OXINDUS, Renault, Pôle Européen de Plasturgie, Polytechnique Montréal, PRINCIPIA Marine, Renault F1 Team, Robert Bosch, Rosier, Rencast, Saem, Sanofi Aventis, Sanofi Pasteur, Sema Group, Snecma Groupe Safran, So-Innov, Stactis, Supélec, Ton Géomètre – To Oe Taata Tuniunui Fenua, Total, Turboméca, Université de Lorraine, Université d'Orsay, Université d'Ottawa, Université Paris V, Université Paul Sabatier, Université de Savoie, Valeo Thermique Habitacle, Valfond, Vivendi...
Des compétences éprouvées :
Spécialisé dans l'analyse multivariée, CORYENT Conseil a une expérience importante de l'analyse des données, du traitement d'enquête, des plans d'expériences ou des bancs d'essais en milieu industriel. Nous saurons tirer le meilleur de vos données, en toute confidentialité. Les études ci-dessous sont citées à titre d'exemple :
Analyse des données géochimiques sur les échanges Air-Mer (CNRS - CEA) ...
Le problème : l'étude de la circulation et des échanges de la matière particulaire entre l'océan, l'atmosphère et les continents.
Les données sont issues de campagnes de prélèvements géochimiques en Atlantique et mer de Chine. Elles comprennent une soixantaine de "variables" physiques (date, latitude, longitude, températures de l'air et de la mer, pression, vitesse du vent, état de la mer, visibilité, nébulosité, humidité relative, nombre de particules par classes de taille, etc...) ou chimiques mesurées par absorbtion atomique, activation neutronique, etc. (Ag, Al, Au, Ba, Br, C, Ca, Cd, Ce, Co, Cr, Cs, Cu, Eu, Fe, Hg, I, K, La, Mg, Na, Ni, Rn, Sb, Sc, Se, Sm, SO4, SO2, Sr, Th, V, Zn).
La méthode CORICO d'analyse des données permet de débrouiller les multiples interactions entre tous ces paramètres, en éliminant les "fausses bonnes corrélations" et d'établir un schéma synthétique explicite des relations entre les différents paramètres.
Résultats:
Exploitation de la campagne préliminaire de sondages ARIANE 5 (ArianeGroup) ...
Le problème : Les objectifs de sûreté de fonctionnement liés aux vols habités imposent une meilleure connaissance du vent en altitude au centre spatial de Kourou. Les gradients de vents ne doivent pas en effet conduire à la mise en butée des gouvernes. En outre, le lanceur reçoit un fort gradient comme un choc excitant l'ensemble des modes des structures.
Les données comprennent 54 sondages (27 ballons classiques et 27 "jimsphères", 4 ou 5 lâchers de ballons par jour) et les observations météorologiques au moment des sondages (vents, visibilité, nébulosité, température, humidité, pression, pluie, brume de sable, altitude de cisaillement, flux à 200 pascal, activité de la zone de convergence intertropicale, rapidité et perturbation de l'alizé, date, heure du lâcher, coefficient de marée). Un radar de trajectographie ADOUR 2, fournit, à 20Hz, site, gisement et distance du ballon, corrigé de la réfraction. Le calculateur édite pour chaque altitude le temps TU et les composantes zonale et méridienne du vent par pas de 25 m.
La méthode CORICO d'analyse des données consiste en l'investigation des interactions multiparamétriques sous des conditions variées, et procède par élimination méthodique des relations non pertinentes. Elles libère l'utilisateur des opérations fastidieuses de tri comparaison et contrôle des données. Un schéma synthétique souligne les traits remarquables, aussi bien généraux que particuliers. L'action simultanée de plusieurs variables sur un paramètre est détectée. Un "pic" isolé est décelé, même s'il n'est pas statistiquement significatif.
Les résultats de cette campagne préliminaire ont montré:
Recherche des causes de dysfonctionnement des cordeaux de découpe pyrotechnique (ArianeGroup) ...
Le problème : suite à des anomalies de trajectoire lors du largage des propulseurs d'appoint d'ARIANE 4, il fut émis l'hypothèse d'une mauvaise découpe des attaches. En vue d'industrialiser la fabrications des cordeaux détonants et d'en maîtriser les performances (rebuts importants), un plan d'expériences fut réalisé afin de déterminer les meilleures conditions de performance de découpe.
Les données, sur 82 cordeaux, comprennent 128 paramètres concernant : les données relatives au plomb (spécification, coulée, milllésime, tube, composition chimique) les données relatives à l'hexogène et au cordeau chargé, les dates et écarts de temps divers, le mode opératoire (tréfilage, prélaminage, formage), le profil géométrique (divers angles, épaisseurs, rayon, distance, surfaces).
La méthode CORICO d'analyse des données procède par élimination méthodique des relations non pertinentes. Elle libère l'utilisateur des opérations fastidieuses de tri comparaison et contrôle des données. Un schéma synthétique souligne les traits remarquables, aussi bien généraux que particuliers. L'action simultanée de plusieurs variables sur un paramètre est détectée. Un "pic" isolé est décelé, même s'il n'est pas statistiquement significatif.
Les résultats ont déterminé la conception d'un nouveau banc de fabrication qui a permis la réduction des rebuts dans des proportions considérables.
Mise au point d'une méthode de représentation pour l'analyse des causes insidieuses (AIRBUS) ...
Le problème : En dehors de toute défaillance de composants, ou de toute maladresse au niveau des paramètres d'activation, certains éléments inhérents à la conception ou à la réalisation d'un système peuvent induire des modes de fonctionnement indésirés dans des configurations d'utilisation particulières. L'effet indésiré découle d'une combinaison ou d'une suite non prévue de circonstanes internes. Sa mise en évidence repose sur un savoir faire.
La méthode d'analyse des données part du principe que les erreurs ou insuffisances de conception sont dues pour l'essentiel à la difficulté d'avoir une vue d'ensemble spatiale ou temporelle du fonctionnement du système.
Résultats : Plutôt que d'entamer le développement d'un logiciel, dont la fiabilité ne serait pas garantie avant longtemps, on a préféré utiliser un produit existant (CORICO), quoiqu'à l'origine conçu pour d'autres tâches, afin d'obtenir rapidement un résultat exploitable.
Le problème : analyse d'un plan d'expérience sur une ligne de six presses d'emboutissage destinée à la fabrication des caissons de portes avant. Les étapes sont les suivantes: emboutissage, réemboutissage, détourage, calibrage, poste à came et poinçonnage.
Les données: L'ensemble des essais est réalisé à partir d'une même bobine de tôle et d'un même ensemble de flans. Le plan d'expériences est un plan factoriel complet à 4 facteurs et 16 essais. Les "réponses" sont les mesures de géométrie à l'issue des différentes étapes d'emboutissage.
La méthode CORICO d'analyse des données s'appuie sur l'examen méthodique des corrélations totales et partielles.
Résultats: Le calibrage n'est censé agir sur la pièce que si le réemboutissage n'a pas produit la forme convenable. L'analyse montre que l'outil de calibrage dégrade au contraire la forme de la pièce. Celle-ci serait reprise dans l'état voulu lors des opérations suivantes. L'analyse suggère la suppression de l'étape de calibrage, donc la possibilité de réduire les coûts de fabrication.
Analyse des données d'essai sur le circuit de Monza (FERRARI) ...
Le problème : En vue d'améliorer les performances au tour, divers éléments sont successivement modifiés sur les voitures F1 (pneus, volets, etc...) afin de déterminer quels sont les facteurs influents. Le temps imparti ne permettait pas de réaliser un plan d'expériences au sens propre.
La méthode CORICO d'analyse des données s'appuie sur l'examen méthodique des corrélations totales et partielles. Un schéma synthétique souligne les traits remarquables, aussi bien généraux que particuliers. L'action simultanée de plusieurs variables sur un paramètre est détectée. Un "pic" isolé est décelé, même s'il n'est pas statistiquement significatif.
Les résultats ont attiré l'attention sur un paramètre dont l'importance avait échappé, car plusieurs éléments de la voiture avaient été modifiés en même temps.
Le problème : Surveillance des pollutions marines et observation de la qualité du milieu marin.
Les données relatives à 18 sites côtiers français comprennent une quantité considérable de paramètres régulièrement collectés (qualité de l'eau de mer, micropolluants organiques et minéraux dans l'eau, la matière en suspension et le plancton, écomicrobiologie, biologie, minéralogie).
La méthode CORICO d'analyse des données a consisté à réaliser pour chaque site une visualisation synthétique des relations pertinentes entre les paramètres disponibles.
Résultats: La densité d'information rassemblée dans les différents schémas et dans le catalogue des schémas permet l'intercomparaison rapide des divers sites côtiers. Cet outil permet d'orienter les mesures de protection et de prévention. Il révèle aussi des corrélations inattendues.
Influence des facteurs socio-démographiques sur 40 marchés dans la grande distribution ...
Le problème : déterminer l'influence des facteurs socio-démographiques sur le comportement d'achat. Fournir des indicateurs fiables et précis.
Les données sont les quantités d'achat de 40 produits de consommation courante par 2369 panélistes. On connaît en outre l'âge, la région, le nombre de personnes au foyer et la profession.
La méthode CORICO d'analyse des données donne pour chacun des marchés un schéma explicite des liens influents, expurgé des "fausses bonnes corrélations".
Résultats: L'analyse distingue :
Son utilité est de mettre chaque chose à sa place. L'élimination d'influences seulement apparentes peut être un garde-fou contre une décision erronée dans une stratégie publicitaire, le ciblage d'une clientèle ou un choix d'implantation.
Préparation et analyse d'un plan de mélange (DANONE) ...
Le problème : formulation d'un mélange comportant 11 composants, avec des contraintes. Deux réponses doivent être optimisées.
La méthode CORICO d'analyse des données permet la génération d'un plan d'expériences économique (19 essais seulement pour 11 facteurs), et son analyse détaillée fait intervenir des interactions logiques .
Résultats: Le modèle obtenu est d'autant plus performant qu'il contient des interactions logiques (termes non linéaires) qui collent de plus près à la réalité physique.
Le problème : donner une vision non réductrice, globale et synthétique de l'influence réciproque des différents paramètres, en particulier la taille de l'entreprise.
Les données sont, pour différents secteurs d'activité et différentes années, le nombre de salariés, la typologie, le nombre d'entreprises, le CA net, la sous-traitance, les effectifs, salaires, charges sociales, valeur ajoutée, excédent brut d'exploitation, investissements, nombre de camions, carburant, recettes à l'export, résultat net...
La méthode CORICO d'analyse des données détermine si la forte corrélation avec une variable ne découle pas d'une commune dépendance à un troisième terme. Elle détecte aussi l'action simultanée de plusieurs facteurs sur la variable à expliquer, malgré la faible corrélation de celle-ci avec chacun d'entre-eux. Les résultats sont présentés de façon synthétique sous la forme de liens non-redondants entre les variables.
Résultats: Les schémas synthétiques, extrêmement parlants, montrent les différences en terme de gestion et d'investissement entre les entreprises de plus de 5 salariés et les entreprises de moins de 5 salariés.
Analyse de la qualité de fabrication des composites (Hispano-Suiza) ...
Le problème : La fabrication et l'intégration des composites dans les structures volantes restent souvent délicates et engendrent de nombreux rebuts face aux exigences sévères de fiabilité des matériels.
Les données sont les données existante disponibles dans les procès verbaux de réception de matière, ainsi que les résultats des tests effectués à la réception de ces lots.
La méthode CORICO d'analyse des données détermine si la forte corrélation avec une variable ne découle pas d'une commune dépendance à un troisième terme. Elle détecte aussi l'action simultanée de plusieurs facteurs sur la variable à expliquer, malgré la faible corrélation de celle-ci avec chacun d'entre-eux. Les résultats sont présentés de façon synthétique sous la forme de liens non-redondants entre les variables.
Résultats: La méthode a permis d'éviter le recours à des essais coûteux de type plan d'expériences, en exploitant au mieux les données disponibles, et de réduire les tests effectués habituellement à réception des lots, en ne conservant que les plus pertinents, et enfin, de mieux spécifier le produit vers les fournisseurs. Cette démarche s'inscrit dans la politique continue de réduction des coûts versus fiabilité qui reste un axe important pour la sûreté de fonctionnement au niveau du groupe SNECMA. La méthode peut être transposée à de nombreux problèmes.
Trouver l'année et l'origine de vins d'après leurs spectres infrarouge (chimiométrie) ...
Le problème : Retrouver l'année et la région d'origine de vins issus d'un même cépage à partir de leur spectre infrarouge. Il y a plusieurs producteurs par régions et par années.
Les données : Pour chaque vin, les variables explicatives sont constituées de plusieurs centaines de longueurs d'onde différentes.
La méthode CORICO d'analyse des données sélectionne dans un premier temps les longueurs d'onde pertinentes. Puis un modèle prédictif est construit.
Résultats:
Analyse d'un tableau de bord de gestion ...
Le problème : Le tableau de bord de gestion doit être un moyen de pilotage et de diagnostic. Il doit permetre de connaître la charge de travail, d’apercevoir l’hypertrophie ou l’atrophies d’exécution des différentes tâches, de situer les anomalies de fonctionnement, de redresser certaines situations.
Cependant, compte tenu des limites de notre mémoire, un tableau de bord trop fourni n'est pas d’emploi facile. De plus le principal obstacle à l’obtention d’analyses concluantes est l’influence des facteurs extérieurs (tels que tendances économiques ou décisions de marketing.
Les données : Dans un tableau de bord prospectif (balanced scorecard), la sélection des mesures clés de l’entreprise se partage entre indicateurs avancés, qui prédisent la performance future, et indicateurs rétroviseurs qui mesurent la performance effectivement réalisée :
La méthode d'analyse des données : L’iconographie des corrélations permet d’éliminer les influences extérieures (pourvu qu’elles aient été mesurés) afin de dégager une conclusion sur l’incidence même du tableau de bord dans l’entreprise. Conservant tous les chiffres, elle permet d’exploiter vraiment toutes les informations de l’entreprise et d’identifier plus rapidement, sur une figure unique et synthétique, les relations de cause à effet et les leviers de performance.
Résultats : Comme l’influence mutuelle des tâches apparaît, on peut analyser les causes d’écart entre prévision et réalisation, et faire remonter rapidement l’information brute sous forme de préconisations opérationnelles claires et bien étayées.
Essais de sortie d'eau (AIRBUS) ...
Le problème : Connaître l'influence des conditions de tir d'une maquette d'engin, tirée d'un sous-marin.
Les données comprennent 45 variables sur 23 essais, en divers instants de la trajectoire, par rapport à deux repères (repère fixe et repère maquette, angles marine, angles d'Euler, angles Neyrtec). Courantométrie, paramètres de vidange et bulle de tête sont également pris en compte.
La méthode CORICO d'analyse des données permet d'injecter d'emblée dans l'analyse l'ensemble des paramètres disponibles. Elle met en évidence les liens pertinents entre les variations, indépendamment de l'amplitude de ces variations. Il est bon en effet de savoir si de faibles variations d'un paramètre ont de fortes répercussion sur un autre paramètre. Des variations, même inférieures à la précision de mesure, seront exploitables si les écarts sont systématiques.
Résultats:
Interprétation d'événements vibratoires en sortie de tube (AIRBUS) ...
Le problème : Des événements vibratoires brutaux ont été observés au moment de certains tirs depuis un sous marin. Les spécialistes interrogés ont proposé des interprétations contradictoires. On cherche à expliquer sans a priori ces anomalies à partir de l'ensemble des paramètres recueillis.
Les données comprennent environ 70 variables sur 5 vols d'essais. L'anomalie, susceptible de remettre en cause les spécifications de l'engin, a été observée sur deux vols.
La méthode CORICO d'analyse des données ne dépend d'aucune hypothèse statistique sur la distribution des données. Elle rassemble toutes les informations recueillies (quantitatives et qualitatives) sous la forme d'un schéma synthétique, qui condense l'équivalent de 2400 courbes en coordonnées cartésiennes vues simultanément. Les redondances ou "fausses bonnes corrélations" sont éliminées. La présence ou l'absence de liaison ont une égale importance.
Résultats: L'analyse montre l'influence essentielle du couplage inattendu de deux paramètres sur la présence ou non de l'anomalie vibratoire. L'importance de ces deux paramètres, qui une fois décelée paraît évidente, avait échappé à tous les spécialistes. En effet, vu le nombre important de couplages logiques entre 70 paramètres (A et B, A et non B, A ou B, A ou exclusif B, A si B est faible, A si B est moyen, A si B est fort, etc..) personne n'avait songé à associer ces deux paramètres.
Analyse d'une base de données d'essais (AIRBUS) ...
Le problème : Tirer un profit maximum des données d'essais de lancement.
Les données comprennent 206 variables inégalement renseignées sur 156 essais.
La méthode d'analyse des données a demandé un important travail préliminaire de recodage des variables qualitatives et de traitement des valeurs manquantes.
Résultats: Le catalogue des relations pertinentes détectées par le logiciel CORICO constitue une mine de renseignements qui peut être consultée immédiatement en fonction de questions nouvelles, ou d'incident inopiné.
Analyse d'une base de données d'essais (AIRBUS) ...