BioTex

L’extraction de termes est une tâche essentielle dans l’acquisition des connaissances, l’indexation des documents, la formulation de requêtes. Le contenu du Web évolue plus vite que notre capacité de formaliser et de cataloguer ces informations. Par conséquent, nous nous intéressons aux termes techniques utilisés dans un corpus afin de les indexer et les utiliser pour la construction/enrichissement de ressources, telles que les terminologies ou des ontologies. L’extraction de termes et l’extraction de mots clés sont largement utilisés dans les applications de recherche d’information et/ou d’annotation de textes. Nous présentons BIOTEX, une application qui intègre des approches et mesures pour extraire et ordonner des termes biomédicaux à partir de textes en l’anglais, français, et espagnol.

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projetJuan Antonio Lossio-Ventura, Clement Jonquet, Mathieu Roche, Maguelonne Teisseire
Dernière versionMis-à-jour le 13/04/2015
AccessibilitéAccessible ici
Site webhttp://tubo.lirmm.fr/biotex/
SystèmesWindows, Linux, MacOS
Interface – Ergonomiehttp://tubo.lirmm.fr/biotex/
Format des corpus en entréetxt, xml
Format des corpus en sortietxt, xml
Fonctionnalités
Annotations gérées par l’outil
DocumentationManuel d’utilisation
Type d’outilAnnotation, Analyse