ANTCONC

Logiciel d’analyse textuelle ​    ​ FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Laurence Anthony – Université de Waseda (Japon) Dernière version AntConc  3.4.3 Accessibilité Téléchargement en ligne gratuit ici Systèmes Windows XP, Vista, Win 7, Win 8, Mac Interface – Ergonomie Interface simple et facile d’utilisation Format des corpus en entrée TXT, HTML et … Lire plus

Rapports français sur l’intégration (1991-2012)

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées pdf Accès Les corpus français et allemand sont déjà accessibles sur le web, dans des versions identiques, sur les sites institutionnels des pays concernés (voir site web indiqué). Cette publication sur ORTOLANG s’inscrit dans la démarche suivante. Il s’agit pour nous à la fois de rendre … Lire plus

Correspondance de Pierre Bayle

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées Accès CC BY-NC-SA 3.0 FR Site CAHIERLien vers le corpus Mots-clés correspondance, Pierre Bayle, République des Lettres Type de textes Taille du corpus Source Inventaire d’Elisabeth Labrousse : Inventaire critique de la correspondance de Pierre Bayle. – Paris: Vrin 1961 INFORMATIONS SUR LES TEXTES Auteurs des … Lire plus

Présidentielle2017: corpus des tweets de la #présidentielle2017

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès LibreContraintes pour réutiliser tweets : Reprenez le texte complet du Tweet Vous ne devez pas supprimer, masquer ni modifier l’identification de l’utilisateur. Site ORTOLANGLien vers le corpus Mots-clés Type de textes Nouveau mode de communication (Tweet, SMS, etc) Taille du corpus 44 979 tweets … Lire plus

Corpus journalistique issu de l’Est Républicain

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès Libre dans un cadre de recherche ou d’enseignement à l’exclusion de toute utilisiation commerciale et sous réserve de citation de la source : Est Républicain Site ORTOLANGLien vers le corpus Mots-clés Type de textes Journalistique Taille du corpus INFORMATIONS SUR LES TEXTES Auteurs des … Lire plus

WebAnno

Logiciel d’annotation manuelle et de gestion d’annotations. FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Dernière version WebAnno 3.5.7 Accessibilité Téléchargement ici Systèmes Windows, MacOS, Linux Interface – Ergonomie Format des corpus en entrée Format des corpus en sortie Fonctionnalités Annotation manuelle et gestion d’annotations Annotations gérées par l’outil Morphologiques, syntaxiques et sémantiques Manuel, Documentation Documentation … Lire plus

UAM Corpus Tool

The UAM CorpusTool is a state-of-the-art environment for annotation of text corpora. So, whether you are annotating a corpus as part of a linguistic study, or building a training set for use in statistical language processing, this is the tool for you. FICHE DESCRIPTIVE DE L’OUTIL Responsable du projet Mick O’Donnell Dernière version 3.3 Accessibilité … Lire plus

TXM

Plateforme modulaire et open-source de textométrie : textométrie sur corpus tout venant ou structurés, annotés et alignés, préparation de corpus, mise en ligne de corpus.​ FICHE DESCRIPTIVE DE L’OUTIL Dernière version TXM 0.8.0 (mai 2019) Responsable du projet Serge Heiden Accessibilité Téléchargement Site Web http://textometrie.ens-lyon.fr/ Interface – Ergonomie ​Interface conviviale : interface graphique utilisateur classique … Lire plus

Appel 2020 à propositions pour la finalisation de ressources linguistiques FAIR

MERCI de DIFFUSER LARGEMENT CET APPEL AUTOUR DE VOUS Le consortium CORLI de la TGIR Huma-Num (corli.huma-num.fr) lance un appel à propositions en vue de financements sous forme de prestation de service sur des ressources linguistiques (corpus oraux, textuels, multimodaux, lexiques) destinées à être rendues disponibles en suivant les principes FAIR. La réponse à l’appel … Lire plus

Liste des finalisations de corpus (2016-2019)

Finalisations de corpus financées de 2016 à 2019 2016 Porteurs Projets Financé Montémont Ambroise Paré 7500 Tutin Lexique transdisciplinaire des écrits scientifiques 5600 Renault corpus Malherbe 7500 Goutéraux Diderot-Longdale 7500 Poudat DisCoWiki 7500 Gala ReSyf 3000 Boré EMA 5500 Hirsch Parole Bègue 6400 Rossi Corpus COP21 3200 Bras Corpus Ariège 5800 Total   59500 2017 … Lire plus