Unitex

Unitex est un ensemble de logiciels permettant de traiter des textes en langues naturelles en utilisant des ressources linguistiques. Ces ressources se présentent sous la forme de dictionnaires électroniques, de grammaires et de tables de lexique-grammaire. Elles sont issues de travaux initiés sur le français par Maurice Gross au Laboratoire d’Automatique Documentaire et Linguistique (LADL) . Ces travaux ont été étendus à d’autres langues au travers du réseau de laboratoires RELEX.(Manuel d’utilisation, septembre 2014)

FICHE DESCRIPTIVE DE L’OUTIL

Dernière versionUnitex 3.1 (septembre 2014)
Site Webhttps://unitexgramlab.org/fr
AccessibilitéTéléchargement en ligne gratuit ici
SystèmesWindows,  Linux,  Mac OS
Interface – ErgonomieInterface en anglais
LicenceLGPL
Format des corpus en entréeTXT (Unicode)
Format des corpus en sortieHTML – XML – CSV – TXT (Unicode)
Fonctionnalités– Création de ressources linguistiques (dictionnaires électroniques, grammaires)
– Recherches complexes dans les corpus– Concordancier– Création de dictionnaires et de règles locales ou morphologiques- Annotation– Alignement de corpus.
Annotations gérées par l’outilAnnotations morphosyntaxiques – DELA
DocumentationManuel d’utilisation
Type d’outilAnnotation – Analyse

PRATIQUES ET USAGES D’UNITEX
1. Fiche renseignée par : Céline Poudat (BCL – Université de Nice Sophia Antipolis)

Objectifs de rechercheAnnoter des motifs textuels dont on fait l’hypothèse pour une typologie textuelle spécifique
ViséeAnnotation de patrons lexicaux et morphosyntaxiques
ScénariosAnnotation avec automates, regexp, possibilité de variabiliser un élément à annoter

2. Fiche renseignée par : Céline Poudat (BCL – Université de Nice Sophia Antipolis)

Objectifs de rechercheRechercher des motifs textuels dont on fait l’hypothèse pour une typologie textuelle spécifique
ViséeAnalyse et traitement de corpus textuels mobilisant des automates (recherche et annotation)
ScénariosConstruction de requêtes en mode graphique (automates) et en mode texte, gestion de différents niveaux d’annotation (DELA), retour au texte, possibilités de faire des diff sur deux concordances

EXEMPLES D’UTILISATEURS INSTITUTIONNELS