Nooj

NooJ est un environnement de développement linguistique qui permet de construire et de gérer des dictionnaires et grammaires électroniques à large couverture, afin de formaliser divers niveaux des langues naturelles : orthographe, morphologie flexionnelle et dérivationnelle, lexique de mots simples, mots composés et expressions figées, syntaxe locale et désambiguïsation, syntaxe structurelle et transformationnelle, sémantique et ontologies. Les descriptions formalisées peuvent ensuite être appliquées pour traiter des textes et corpus de taille importante.

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projetMax Silberztein
Dernière versionNooj 2.0
Site Webhttp://www.nooj-association.org
AccessibilitéTéléchargement en ligne gratuit ici
SystèmesWindows, Mac OSX, LINUX et Unix
Interface – ErgonomieInterface en anglais
LicenceLGPL
Format des corpus en entréeNooJ peut traiter des textes et des corpus dans plus de 100 formats de fichiers, y compris HTML, PDF, MS-Office, toutes les variantes de l’Unicode, ASCII, etc.
Format des corpus en sortieHTML – XML – CSV
FonctionnalitésPermet de formaliser huit niveaux de phénomènes linguistiques : orthographe et typographie, morphologie flexionnelle et dérivationnelle, syntaxe locale et structurelle, grammaire transformationnelle et analyse sémantique contient des outils informatiques adaptés à chaque type de phénomène (grammaires rationnelles, hors contexte, contextuelles et non restreintes)Permet de développer des ressources à large couverture dans une perspective de linguistique descriptive
Annotations gérées par l’outil
DocumentationManuel d’utilisation
Type d’outilAnnotation