IPSE – Interrogation de corpus de textes littéraires numérisés
PRESENTATION DU PROJET
Ce projet a comme but la mise en oeuvre d’un service informatique pour l’analyse automatique de textes littéraires dans le cadre de séminaires de littérature italienne. L’ambition de cet outil de gestion et d’analyse de textes est en perspective celui de donner un cadre disciplinaire et méthodologique à l’utilisation des ressources déjà disponibles sur le web. À moyen terme, il s’agit de développer, parmi les principaux acteurs de la formation universitaire, une réflexion critique sur les potentialités offertes par l’accès électronique à différents types de textes. Le logiciel envisagé doit repérer un ou plusieurs textes et les « démonter », afin de sélectionner et de classer automatiquement un nombre important de notions spécifiques (index à références multiples : noms propres, toponymes, personnages, ou autres notions morphologiques et syntaxiques). Ces notions pourront être classées simultanément dans un nombre très volumineux de textes afin de dépasser les limites des procédés habituels, basé sur un échantillonnage restreint d’éléments significatifs.
Cet outil informatique sera appliqué, à ce stade, à l’analyse et à l’indexation de textes de langue italienne. La réalisation sera effectuée en collaboration avec Monsieur Davide Picca, assistant diplômé de la Section d’Informatique et Méthodes Mathématiques (IMM-UNIL), spécialisé dans le traitement automatisé de textes.
Le site du projet: