Hyperbase

Logiciel documentaire et statistique pour l’exploration des textes FICHE DESCRIPTIVE DE L’OUTILS Responsable du projet Etienne Brunet – Laboratoire BCL (UMR 6039) Dernière version Hyperbase 9.0 Accessibilité Téléchargement d’une version d’évaluation ici Systèmes Windows Format des corpus en entrée Corpus textuel Format des corpus en sortie non renseigné Fonctionnalités Retour au texte plein ou lemmatisé pour … Lire plus

Glozz

Environnement d’annotation et d’exploration de corpus FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Projet ANR Annodis (Laboratoire GREYC avec la collaboration des laboratoires ERSS et IRIT) Dernière version GLOZZ 2.0.1 – Juillet 2014 Accessibilité Téléchargement en ligne ici Site web http://www.glozz.org Systèmes OS X, Linux et Windows Format des corpus en entrée Corpus en texte … Lire plus

Frantext

Frantext est le nom d’une base de données de textes français : textes littéraires et philosophiques, mais aussi scientifiques et techniques (environ 10%), développée et maintenue au sein de l’ATILF-CNRS (ex INaLF). Elle a été créée autour d’un noyau de mille textes, dans les années 70, afin de fournir des exemples pour le Trésor de … Lire plus

ELAN

ELAN (EUDICO Linguistic Annotator) is an annotation tool that allows you to create, edit, visualize and search annotations for video and audio data. It was developed at the Max Planck Institute for Psycholinguistics, Nijmegen, The Netherlands, with the aim to provide a sound technological basis for the annotation and exploitation of multi-media recordings. ELAN is … Lire plus

ANNIS

A web browser-based search and visualization architecture for complex multilayer linguistic corpora with diverse types of annotation.ANNIS is an open source, cross platform (Linux, Mac, Windows), web browser-based search and visualization architecture for complex multi-layer linguistic corpora with diverse types of annotation. ANNIS, which stands for ANNotation of Information Structure, was originally designed to provide … Lire plus

ANALEC

Logiciel d’annotation et d’analyse de corpus écrits FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Bernard Victorri – LaTTiCe (ENS-CNRS) Dernière version 23 avril 2014 – Analec 1.4 Accessibilité Téléchargement en ligne gratuit ici Systèmes Windows, Mac et Unix – Moteur virtuel Java nécessaire Interface – Ergonomie Onglets donnant accès à différentes opérations (règles, statistiques, schémas, … Lire plus

Appel à finalisation de corpus 2019

Liste des projets acceptés en 2019 Nous avons reçu cette année de nombreuses réponses (28) à notre appel à finalisation de corpus. Toutes les propositions étaient sérieuses et de bonnes qualité ce qui a rendu encore plus délicate l’évaluation des projets à subventionner. Les propositions ont été relues par un comité de 17 personnes membres … Lire plus

Métadonnées (partie 1)

Métadonnées Coordination : Carole Etienne PARTIE 1 – FACILITER LA RÉUTILISATION DES CORPUS PAR D’AUTRES CHERCHEURS Pourquoi un chercheur serait amené à réutiliser un corpus ? Disposer d’un volume de données plus important Explorer les mêmes données dans différentes perspectives : analyses syntaxiques, prosodiques, phonologiques ou interactionnelles d’une même donnée Bénéficier de différents jeux d’annotations qui … Lire plus

Métadonnées (partie 2)

Les métadonnées actuellement disponibles pour les corpus oraux Analyse de l’existant, notamment avec le projet ORFEO (3.5 M de mots, 14 sources de données). Très hétérogènes tant au niveau du format … Fichier texte (pdf, word) Fichiers tabulaires (excel, csv) XML (Dublin Core/OLAC, TEI Header, CMDI) … que des contenus champs basiques : durée, âge, … Lire plus