BioTex

L’extraction de termes est une tâche essentielle dans l’acquisition des connaissances, l’indexation des documents, la formulation de requêtes. Le contenu du Web évolue plus vite que notre capacité de formaliser et de cataloguer ces informations. Par conséquent, nous nous intéressons aux termes techniques utilisés dans un corpus afin de les indexer et les utiliser pour … Read more

Arbil

Arbil is an application for arranging research material and associated metadata into a format appropriate for archiving. Arbil is designed so that it can be used off line in remote locations. The data can be entered at any stage in part or as a whole. When an internet connection is available the work can then … Read more

Anvil

ANVIL is a free video annotation tool, developed by Michael Kipp. It offers multi-layered annotation based on a user-defined coding scheme. During coding the user can see color-coded elements on multiple tracks in time-alignment. Some special features are cross-level links, non-temporal objects, timepoint tracks, coding agreement analysis, 3D viewing of motion capture data and a … Read more

Unitex

Unitex est un ensemble de logiciels permettant de traiter des textes en langues naturelles en utilisant des ressources linguistiques. Ces ressources se présentent sous la forme de dictionnaires électroniques, de grammaires et de tables de lexique-grammaire. Elles sont issues de travaux initiés sur le français par Maurice Gross au Laboratoire d’Automatique Documentaire et Linguistique (LADL) … Read more

The Sketch Engine

Ce système de gestion de corpus payant est accessible en ligne (il existe aussi une version téléchargeable). Il offre actuellement l’accès à 286 corpus en 66 langues différentes (relevé en août 2015). Les utilisateurs et utilisatrices disposent également d’un espace personnel, partageable avec d’autres personnes inscrites. Sketch Engine permet le dépôt de ses propres corpus, … Read more

TextObserver

Le chantier Textopol du Céditec développe TextObserver, outil de d’observation et d’exploitation des données textuelles multidimensionnelles. TextObserver a été conçu pour répondre à des questions de recherche faisant intervenir la variation. La conception de TextObserver repose sur un principe ergonomique et cognitif essentiel qui le différencie des outils textométriques ou lexicométriques classiques: l’interactivité. Chaque action … Read more

Nooj

NooJ est un environnement de développement linguistique qui permet de construire et de gérer des dictionnaires et grammaires électroniques à large couverture, afin de formaliser divers niveaux des langues naturelles : orthographe, morphologie flexionnelle et dérivationnelle, lexique de mots simples, mots composés et expressions figées, syntaxe locale et désambiguïsation, syntaxe structurelle et transformationnelle, sémantique et … Read more

Lexico 3 et 5

Outil de statistiques textuels FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Equipe universitaire SYLED-CLA2T et André Salem Dernière version Lexico 3.6 – Lexico 5.8 Accessibilité Diffusion commerciale Site web http://www.lexi-co.com/ Systèmes Windows Format des corpus en entrée Corpus textuel Format des corpus en sortie non renseigné Fonctionnalités SegmentationConcordances Décomptes portant sur les formes graphiques, spécificités et … Read more

Le Trameur

Programme de génération puis de gestion de la Trame et du Cadre d’un texte (i.e découpage en unité et partitionnement du texte : le métier textométrique) pour construire des opérations lexicométriques / textométriques (ventilation des unités, carte des sections, cooccurrence, spécificité, AFC…). Le Trameur intègre en outre le programme treetagger : système d’étiquetage automatique des … Read more

IRaMuTeQ

IRaMuTeQ  est un logiciel d’analyse statistique de données textuelles. FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet  Pierre Ratinaud Dernière version  0.7 alpha 2 Accessibilité Téléchargement ici Site web  http://www.iramuteq.org Systèmes  Windows, Linux, MacOS Interface – Ergonomie  Interface conviviale (développée en wxpython) Format des corpus en entrée  csv Format des corpus en sortie  csv Fonctionnalités Annotations … Read more