Unitex

Unitex est un ensemble de logiciels permettant de traiter des textes en langues naturelles en utilisant des ressources linguistiques. Ces ressources se présentent sous la forme de dictionnaires électroniques, de grammaires et de tables de lexique-grammaire. Elles sont issues de travaux initiés sur le français par Maurice Gross au Laboratoire d’Automatique Documentaire et Linguistique (LADL) … Lire plus

The Sketch Engine

Ce système de gestion de corpus payant est accessible en ligne (il existe aussi une version téléchargeable). Il offre actuellement l’accès à 286 corpus en 66 langues différentes (relevé en août 2015). Les utilisateurs et utilisatrices disposent également d’un espace personnel, partageable avec d’autres personnes inscrites. Sketch Engine permet le dépôt de ses propres corpus, … Lire plus

TextObserver

Le chantier Textopol du Céditec développe TextObserver, outil de d’observation et d’exploitation des données textuelles multidimensionnelles. TextObserver a été conçu pour répondre à des questions de recherche faisant intervenir la variation. La conception de TextObserver repose sur un principe ergonomique et cognitif essentiel qui le différencie des outils textométriques ou lexicométriques classiques: l’interactivité. Chaque action … Lire plus

Nooj

NooJ est un environnement de développement linguistique qui permet de construire et de gérer des dictionnaires et grammaires électroniques à large couverture, afin de formaliser divers niveaux des langues naturelles : orthographe, morphologie flexionnelle et dérivationnelle, lexique de mots simples, mots composés et expressions figées, syntaxe locale et désambiguïsation, syntaxe structurelle et transformationnelle, sémantique et … Lire plus

Lexico 3 et 5

Outil de statistiques textuels FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Equipe universitaire SYLED-CLA2T et André Salem Dernière version Lexico 3.6 – Lexico 5.8 Accessibilité Diffusion commerciale Site web http://www.lexi-co.com/ Systèmes Windows Format des corpus en entrée Corpus textuel Format des corpus en sortie non renseigné Fonctionnalités SegmentationConcordances Décomptes portant sur les formes graphiques, spécificités et … Lire plus

Le Trameur

Programme de génération puis de gestion de la Trame et du Cadre d’un texte (i.e découpage en unité et partitionnement du texte : le métier textométrique) pour construire des opérations lexicométriques / textométriques (ventilation des unités, carte des sections, cooccurrence, spécificité, AFC…). Le Trameur intègre en outre le programme treetagger : système d’étiquetage automatique des … Lire plus

IRaMuTeQ

IRaMuTeQ  est un logiciel d’analyse statistique de données textuelles. FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet  Pierre Ratinaud Dernière version  0.7 alpha 2 Accessibilité Téléchargement ici Site web  http://www.iramuteq.org Systèmes  Windows, Linux, MacOS Interface – Ergonomie  Interface conviviale (développée en wxpython) Format des corpus en entrée  csv Format des corpus en sortie  csv Fonctionnalités Annotations … Lire plus

Hyperbase

Logiciel documentaire et statistique pour l’exploration des textes FICHE DESCRIPTIVE DE L’OUTILS Responsable du projet Etienne Brunet – Laboratoire BCL (UMR 6039) Dernière version Hyperbase 9.0 Accessibilité Téléchargement d’une version d’évaluation ici Systèmes Windows Format des corpus en entrée Corpus textuel Format des corpus en sortie non renseigné Fonctionnalités Retour au texte plein ou lemmatisé pour … Lire plus

Glozz

Environnement d’annotation et d’exploration de corpus FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Projet ANR Annodis (Laboratoire GREYC avec la collaboration des laboratoires ERSS et IRIT) Dernière version GLOZZ 2.0.1 – Juillet 2014 Accessibilité Téléchargement en ligne ici Site web http://www.glozz.org Systèmes OS X, Linux et Windows Format des corpus en entrée Corpus en texte … Lire plus

Frantext

Frantext est le nom d’une base de données de textes français : textes littéraires et philosophiques, mais aussi scientifiques et techniques (environ 10%), développée et maintenue au sein de l’ATILF-CNRS (ex INaLF). Elle a été créée autour d’un noyau de mille textes, dans les années 70, afin de fournir des exemples pour le Trésor de … Lire plus