CompARe : Comparaison de données analytiques
REFERENCES DU PROJET
- FDCA
- 2013
- Pierre Esseiva (Professeur)
- Romain Voisard (Ingénieur pédagogique ESC), +41 21 692 4647
FICHE PEDAGOGIQUE
-
Dans de nombreux domaines d’activités, par exemple en sciences forensiques, en chimie ou en pharmacie, il est intéressant de pouvoir comparer et classifier les résultats issus d’analyses. Ceci peut par exemple permettre de déterminer si :
– des échantillons de stupéfiant proviennent du même lot de production
– l’origine d’un café est bien celle indiquée
– un document de sécurité (billet de banque, pièce d’identité, …) est vrai ou faux
– un fragment de peinture retrouvé sur un lieu d’accident provient bien d’une voiture suspecte.
Cette problématique complexe de la comparaison d’échantillons fait appel à de nombreuses compétences pluridisciplinaires. En partant de données brutes (images numériques, spectres infra-rouges, etc.), il faut en particulier appliquer différents traitements statistiques aux données afin de pouvoir déterminer si les échantillons analysés ont un pouvoir discriminant suffisant. Ceci implique tout un nombre de questions telles que définir quelles méthodes sont adéquates en regard du but visé, déterminer quels sont les paramètres à prendre en compte ou définir quels sont les zones d’intérêts qui vont fournir des informations utiles.
-
Afin de développer les compétences pluridisciplinaires nécessaires à la résolution de ce type de question complexe, le projet CompARe a consisté à développer une plateforme web permettant de faire toute une série de traitements statistiques sur des jeux de données provenant de saisies de cocaïne et d’ecstasy. Il était en autres nécessaire que cette plateforme soit aussi facile d’utilisation que possible, même pour les étudiants n’ayant pas de connaissances en programmation.
Cette plateforme a été utilisée dans le cours « Traitement statistique de données » de la manière suivante. Les étudiants ont d’abord suivi une partie théorique sur les notions et outils statistiques qu’ils allaient utiliser. Ils ont ensuite eu une phase de prise en main de la plateforme avec une introduction à JavaScript et aux macro-fonctions préprogrammées. Finalement, ils ont traité et analysé le set de données qui leur avait été attribué.
-
Le but de ce projet était de permettre aux étudiants d’utiliser différents outils statistiques afin de répondre à des questions concrètes proches de la réalité du terrain. La difficulté dans ce genre de situation est que pour pouvoir mener de tels traitements statistiques, il est normalement nécessaire d’avoir de bonnes connaissances en programmation et/ou de savoir bien utiliser des logiciels statistiques comme R.
La mise en place de la plateforme web a ainsi permis aux étudiants d’appliquer concrètement les notions apprises lors de la partie théorique du cours. Ayant également dû évaluer la pertinence de l’une ou l’autre méthode pour répondre à la question qui leur était posée, ils ont développé un bien meilleur niveau de compréhension de la matière par rapport à un cours « purement théorique ». Finalement, ils ont pu expérimenter sur le même jeu de données, toutes les étapes liées à la résolution de question de comparaison de données.
-
Pour que les étudiants se sentent encore plus concernés par ce type de projet, il serait intéressant dans le futur d’inclure également des jeux de données provenant par exemple de documents de sécurité (vrais et faux documents, vraie et fausse monnaie) ou microtraces (peintures, fibres). Les étudiants pourraient ainsi choisir de travailler sur le type de données qui les intéressent le plus.