Inventaire des outils

Vous pouvez proposer un nouvel outil à ajouter à l’inventaire via ce formulaire.

OutilFichedescriptionSite webTypedocumentationDonnées
ANALEC/index.php/analecLogiciel d’annotation et d’analyse de corpus écrits.http://www.lattice.cnrs.fr/ressources/logiciels/analec/Annotation, Analysehttp://www.lattice.cnrs.fr/wp-content/uploads/2018/11/ManuelAnalec_1501.pdfTexte
ANNIS/index.php/annisA web browser-based search and visualization architecture for complex multilayer linguistic corpora with diverse types of annotation.http://corpus-tools.org/annis/AnnotationTexte
ANTCONC/index.php/fiche-antconcLogiciel d’analyse textuelle (concordancier)http://www.laurenceanthony.net/software/antconc/Analysehttp://corpora.files.wordpress.com/2013/03/guide-franc3a7ais.pdfTexte
Anvil/index.php/anvilANVIL is a free video annotation tool, developed by Michael Kipp. It offers multi-layered annotation based on a user-defined coding scheme. During coding the user can see color-coded elements on multiple tracks in time-alignment. Some special features are cross-level links, non-temporal objects, timepoint tracks, coding agreement analysis, 3D viewing of motion capture data and a project tool for managing whole corpora of annotation files. Originally developed for gesture research in 2000, ANVIL is now being used in many research areas including human-computer interaction, linguistics, ethology, anthropology, psychotherapy, embodied agents, computer animation and oceanography.http://www.anvil-software.org/Annotationhttp://www.anvil-software.org/doc/anvil40-manual.pdfVidéo
Arbil/index.php/arbilArbil is an application for arranging research material and associated metadata into a format appropriate for archiving. Arbil is designed so that it can be used off line in remote locations. The data can be entered at any stage in part or as a whole. When an internet connection is available the work can then be transferred to the main archive via Lamus.https://tla.mpi.nl/tools/tla-tools/arbil/Métadonnées
BioTex/index.php/biotexApplication qui intègre des approches et mesures pour extraire et ordonner des termes biomédicaux à partir de textes en l’anglais, français, et espagnol.http://tubo.lirmm.fr/biotex/Annotation, Analysehttp://tubo.lirmm.fr/biotex/documentation.jspTexte
CLAN/index.php/clanCLAN est un logiciel permettant l’analyse de données transcrites dans le format CHILDES.http://dali.talkbank.org/clan/Annotation, Analysehttps://talkbank.org/manuals/CLAN.pdfVidéo
ConQuest/index.php/concquestLogiciel dédié à la recherche d’expressions complexes à travers des corpus monolingue et multilingues alignés.http://turing3.univ-grenoble-alpes.fr/olivier.kraif/index.phpAnalysehttp://turing3.univ-grenoble-alpes.fr/olivier.kraif/index.php?option=com_content&task=view&id=42&Itemid=61Texte
DolmanMêmes fonctionnalités de recherche que sur la plateforme Web du projet PFChttp://www.dolmen-ling.org/http://www.dolmen-ling.org/files/dolmen_manual.pdfAudio
DtmVic/index.php/dtmvicLogiciel d’analyse exploratoire multidimensionnelle des données numériques, nominales et textuelles.http://www.dtmvic.com/Analysehttp://www.dtmvic.com/06_ManualF.htmlTexte
EasyAlignPermet de générer et d'aligner semi-automatiquement des annotations phonétiques à partir de la transcription.http://latlntic.unige.ch/phonetique/easyalign.phpAnnotationhttp://latlcui.unige.ch/phonetique/easyalign/Tutorial_EasyAlign.pdfAudio
ELAN/index.php/elanLogiciel de création d’annotations complexes sur les ressources vidéo et audiohttps://tla.mpi.nl/tools/tla-tools/elan/Annotation, Analysehttps://tla.mpi.nl/tools/tla-tools/elan/Audio, Vidéo
eLite-HTSLogiciel de création d’annotations complexes sur les ressources vidéo et audio.http://cental.uclouvain.be/elitehts/v1/Audio
EMUThe EMU Speech Database Management System (EMU-SDMS)https://ips-lmu.github.io/EMU.htmlAnnotationAudio
EXMARaLDAEXMARaLDA is a system for working with oral corpora on a computerhttps://exmaralda.org/en/Annotation, Analysehttps://exmaralda.org/en/about-exmaralda/Audio
FRANTEXT/index.php/frantextBase textuelle (de 4 515 références, 271 599 218 mots) comportant des textes qui s’échelonnent du début du du Xe au XXIe siècle.https://www.frantext.fr/?CRITERE=ACCUEIL_INTEGRAL;OUVRIR_MENUMENU_INTEGRAL;ss0d49244c;ISISisis_bbibftx.txt;ss0d49244c;;ISISisis_bbibftx.txtAnalyseTexte
GLOZZ/index.php/glozzLogiciel d’annotation manuelle et d’exploration de corpus textuels.http://www.glozz.orgAnnotationhttp://www.glozz.org/Texte
HYPERBASE/index.php/hyperbaseLogiciel d’analyse statistique de données textuelles (textométrie).https://bcl.cnrs.fr/article69Analysehttp://www.unice.fr/bcl/article69Texte
iLexLogiciel d'annotation de corpus vidéo et base de données, spécialisés pour l'annotation de langue des signes.http://www.sign-lang.uni-hamburg.de/ilex/AnnotationVidéo
IMPACT--Outil pédagogique développé à l’Université de Lausanne s’adressant aux enseignants et aux étudiants concernés par la consultation, la transcription et le commentaire de sources audio-visuelles.https://wp.unil.ch/impacthttps://wp.unil.ch/impact/pour-commencer/Audio, Vidéo
IRaMuTeQ/index.php/iramuteqLogiciel d’analyse statistique de données textuelles (textométrie).http://www.iramuteq.orgAnalyse
IrcamCorpusToolsPlate-forme ouverte et facilement extensible pour la création, l’analyse et l’exploitation de corpus de parole.http://articles.ircam.fr/textes/Beller09b/index.pdfAudio
ITEPermet d'annoter sur plusieurs niveaux. Génère un document XML avec la DTD du LACITO, utilisée pour l'archive du LACITO. Un lexique est construit au fur et à mesure pour faciliter la saisie. Mise à jour non suivie.http://michel.jacobson.free.fr/ITE/documentation.htmMétadonnées
LE TRAMEUR/index.php/le-trameurLogiciel d’analyse statistique de données textuelles (textométrie).Analysehttp://www.tal.univ-paris3.fr/trameur/leMetierLexicometrique.pdfTexte
LEXICO3/index.php/lexico3Logiciel d’analyse statistique de données textuelles (textométrie).http://www.lexi-co.com/Analysehttp://www.lexi-co.com/Documentation.html
MAUSAlignement phonétique à partir du son et de la transcription orthographique. A télécharger ou à utiliser en ligne.https://clarin.phonetik.uni-muenchen.de/BASWebServices/interfaceAudio
NOOJ/index.php/noojLogiciel d'analyse de texte par des grammaires locales.http://www.nooj-association.orghttp://www.nooj-association.org/files/app/NooJManual.pdfTexte
PhonExploration phonologique des bases de données CHILDES et TalkBank.https://www.phon.ca/phon-manual/getting_started.htmlhttps://www.phon.ca/phon-manual/getting_started.htmlVidéo
PraatTraitement du son, annotation, analyse du signal, mesures diverses, scripts.https://www.fon.hum.uva.nl/praat/Annotationhttp://llacan.vjf.cnrs.fr/res_manuels.phpAudio
SailAlignBoîte à outils d'alignement phonétique robuste au bruit et aux erreurs de transcription, acceptant de très longues séquences. Langues prises en charge : anglais, espagnol.https://sail.usc.edu/old/software/SailAlign/Annotationhttp://cvsp.cs.ntua.gr/~nassos/sail_align.htmlAudio
SPPASOutil d'annotation phonétique avec alignement son-texte automatisé. Langues prises en charge : français, italien, espagnol, chinois mandarin, anglais, taiwanais, cantonais, japonais, polonais, catalanhttp://www.sppas.org/Annotationhttp://www.sppas.org/documentation_01_introduction.htmlAudio
TELEMETAApplication web à installer sur votre serveur, développé par Parisson en collaboration avec le CREM (UMR 7186), conçu initialement pour les documents sonores d'ethnomusicologie.http://telemeta.org/Annotation, AnalyseAudio, Vidéo
Textobserver/index.php/textobserverLogiciel d’analyse statistique de données textuelles (textométrie).http://textopol.u-pec.fr/textobserver/Annotation, Analysehttp://textopol.u-pec.fr/textobserver/Texte
The Sketch EngineSystème de gestion et d'analyse de corpus.https://www.sketchengine.co.uk/Annotation, Analysehttps://www.sketchengine.eu/guide/
ToolboxPermet d'organiser et d'analyser ses données linguistiques écrites. Annotation multi-linéaire, création de lexiques, tri, accepte des extensions linguistiques Unicode.https://software.sil.org/toolbox/AnalyseTexte
Train&AlignAlignement automatique du son avec sa transcription.http://cental.fltr.ucl.ac.be/train_and_align/Audio
Transanahttps://www.transana.com/Annotationhttps://www.transana.com/Audio, Vidéo
TranscriberA tool for segmenting, labeling and transcribing speechhttp://trans.sourceforge.net/en/presentation.phpAudio
TXM/index.php/txmLogiciel d’analyse statistique de données textuelles (textométrie).http://textometrie.ens-lyon.fr/Analysehttp://textometrie.ens-lyon.fr/spip.php?rubrique64
UAM Corpus Tool/index.php/uam-corpus-tool/The UAM CorpusTool is a state-of-the-art environment for annotation of text corpora. So, whether you are annotating a corpus as part of a linguistic study, or building a training set for use in statistical language processing, this is the tool for you.http://www.corpustool.com/Annotationhttp://www.corpustool.com/documentation.htmlTexte
UNITEX/index.php/unitexLogiciel d'analyse de texte par des grammaires locales.https://unitexgramlab.org/frAnnotation, Analysehttp://www-igm.univ-mlv.fr/~unitex/ManuelUnitex3.1.pdfTexte
WavesurferEdition de fichiers son, programme léger. Spectrogrammes en temps réel.http://www.speech.kth.se/wavesurfer/Annotation, AnalyseAudio
WebAnno/index.php/webannoLogiciel d'annotation manuelle et de gestion d'annotations.https://webanno.github.io/webanno/Annotationhttps://webanno.github.io/webanno/documentation/Texte
WinpitchVisualisation en temps réel, analyse et re-synthèse de la courbe mélodique, interfaces Praat, Transcriber, Excel, ..., multimodal, données Unicode (avec écritures droite-gauche), alignement texte assisté, segmentation automatique, statistiques, création de lexiques, transcription API automatique, etc.http://www.winpitch.com/http://www.winpitch.com/Files/AnnotationprosodiqueavecWinPitch.pdfAudio, Vidéo
LexicoscopeLe Lexicoscope est une interface web d’exploration de corpus développée par Olivier Kraif (Université Grenoble Alpes) et Sascha Diwersy (Université Montpellier 3), avec l'aide de Johan Didier et Nathan De Maestri pour la partie front end (interface web).

Tout comme le Sketch Engine, il permet d’explorer l’environnement lexicosyntaxique des mots du corpus, en s'appuyant sur l'analyse en dépendances.

C'est donc un outil spécialement dédié à l'étude des contextes et des cooccurrences. Dans sa nouvelle version (Lexicoscope 2.0) il permet de comparer différents sous-corpus.

Différents corpus sont préinstallés sur le serveur (EmoBase, Scientext, Termith, Phraseorom, le Grand Débat, le Vrai Débat), concernant différentes langues et différents genres textuels.
Les utilisateurs peuvent composer des corpus personnels à partir des corpus existants ou bien télécharger et traiter leur propre corpus (dans une limite de 10 millions de mots par utilisateur).

L'outil peut être utilisé sans inscription en version limitée. L'inscription est gratuite et permet d'accéder à l'ensemble des fonctionnalités.

Une deuxième instance est gracieusement hébergée par HumaNum :
http://lexicoscope.huma-num.fr/lexicoscope_2.0/
http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_2.0Annotation, Analysehttp://phraseotext.univ-grenoble-alpes.fr/lexicoscope_2.0/doc/InitiationauLexicoscope.pdfTexte, Métadonnées
AnatextAnatext est un outil en ligne qui permet d'analyser des textes à la volée (par simple copier/coller) et ceci en une dizaine de langues.

De par sa simplicité il est adapté pour l'initiation à l'exploration de corpus. Il est d'ailleurs utilisé dans différents cours à l'Université Grenoble Alpes.
http://phraseotext.univ-grenoble-alpes.fr/anaText/Annotation, Analysehttp://phraseotext.univ-grenoble-alpes.fr/anaText/doc/anatext.presentation.pdfTexte
MultitagUne interface en ligne pour comparer des analyseurs syntaxiques (actuellement CoreNLP, HOPS, Talismane; bientôt Stanza) sur des échantillons de texte. En entrée: un court texte ou du XML. En sortie: des visualisations graphiques des arbres obtenus (SVG) pour l'échantillon donné, et une visualisation graphique synthétique permettant de comparer les analyses.https://nlp.llf-paris.fr/multitag/AnalyseTexte
INCEpTIONhttps://corli.huma-num.fr/inception/La plateforme Inception s’adosse au logiciel d’annotation WebAnno et propose des fonctionnalités pour mener une annotation débarquée et embarquée multi-couche sous la forme de projets facilitant une annotation collaborative. L’annotation collaborative proposée comprend (1) la gestion de cohortes d’annotateurs avec distribution des rôles, (2) l’attribution des textes aux annotateurs, (3) l’adjudication et la mesure de l’accord inter-annotateur. Elle permet également d’appliquer des méthodes d’Active Learning qui consistent à « apprendre automatiquement » un modèle sur la base de quelques annotations manuelles pour prédire des annotations sur des données non annotées. Ces nouvelles annotations pourront être (in)validées pour augmenter le jeu de données d’apprentissage. Selon le type d’objet annoté, ces méthodes peuvent réduire considérablement le temps d’annotation.
Possibilité d’installer sur serveur pour permettre une annotation collaborative en ligne (voir le projet CORLI 2022-2025)
https://inception-project.github.io/Annotationhttps://inception-project.github.io/documentation/Texte