LRDE : nouveau financement
SCRIBO : un projet de recherche financé par l’Etat :
Dans le cadre du 5ème appel à projets du Fonds Interministériel de Soutien aux Projets de Recherche & Développement Collaboratifs des Pôles de Compétitivité, le projet SCRIBO, auquel participe le LRDE, a été soutenu par le pôle de compétitivité System@tic Paris-Région [2], et retenu pour financement par l’État. SCRIBO s’inscrit dans le nouveau Groupe Thématique Logiciel Libre de ce pôle.
System@tic Paris-Région a pour objectif de faire de l’Île-de-France un territoire visible au niveau mondial sur le thème de la conception, de la réalisation et de la maîtrise des systèmes complexes.
Le Groupe Thématique Logiciel Libre (GTLL) a pour vocation de traiter des sujets de R&D spécifiques au logiciel libre, de contribuer à la structuration et au développement de l’offre en la matière et d’accompagner l’organisation de l’innovation qui en est issue.
SCRIBO (Semi-automatic and Collaborative Retrieval of Information Based on Ontologies) a pour but la mise au point d’algorithmes et d’outils collaboratifs pour l’extraction de connaissances à partir de textes et d’images. Il se distingue de l’état de l’art par son ambition de combiner les approches sémantiques et statistiques dans le traitement du langage naturel, par la prise en compte d’une dimension collaborative dans la définition et le paramétrage de règles d’extraction semi-automatique de structures, et par l’accent mis sur l’élaboration (ou le perfectionnement lorsqu’ils existent) de standards de traitement du langage naturel. SCRIBO a l’objectif de concevoir des services d’extraction d’ontologies (systèmes de représentation des connaissances) à partir de corpus de documents, d’extraction de structures dans des documents numériques et d’acquisition de connaissances en mettant en oeuvre des ontologies.
Le LRDE contribuera principalement au sous-projet d’extraction de structures dans des documents numérisés. Les autres partenaires du projet, pilotés par XPertNet, sont l’AFP, le CEA-LIST, le LRDE, l’INRIA, Mandriva, Nuxeo, Proxem, Tagmatica et Xwiki.
Le LRDE a déjà été amené à travailler sur des problématiques de gestion électronique de documents (GED) et de « dématérialisation » de documents papier au cours d’une collaboration de plusieurs années avec l’éditeur de logiciels EMC Captiva (ex-SWT). Le projet SCRIBO permettra d’enrichir la bibliothèque de traitement d’images libre Olena [3] (sous licence GNU GPL) et d’intégrer de nouveaux services dans les outils de GED du LRDE.