Bienvenue sur le site du consortium Huma-Num « CORLI »

CORLI est un réseau de laboratoires et de chercheurs travaillant sur les corpus de langage. Son but est d’offrir à tous des données, des outils, de la documentation et des formations autour de l’utilisation scientifique des corpus de langage en suivant les principes FAIR. CORLI est ouvert aux enseignants-chercheurs, chercheurs, ingénieurs, du monde entier et à l’étude de toutes les langues et le démontre particulièrement en étant labellisé Centre K par l’infrastructure européenne CLARIN.

Le consortium CORLI s’attache particulièrement à mettre en commun les ressources existantes des laboratoires du consortium, à aider la communauté scientifique à pérenniser ses données, à mieux les diffuser, et à donner des moyens complémentaires à des projets de réseau validés par les chercheurs en linguistique de corpus.

Plus particulièrement, CORLI propose:

  • de la documentation sur les outils, les formats, les bonnes pratiques, les aspects juridiques
  • des formations à l’utilisation des outils ou des formats
  • une aide aux utilisateurs dans notre centre K.

CORLI travaille activement sur trois projets qui répondent aux besoins de la communauté:

  • l’annotation collaborative
  • la citation de corpus ou d’extraits de corpus
  • le Corpus Ouvert du Français: données de corpus et outils pour la langue française

Le consortium CORLI, coordonné par Christophe Parisse et Céline Poudat et géré par la MESHS de Lille. Il réunit des enseignants-chercheurs, chercheurs, ingénieurs en linguistique, et fédère les équipes et laboratoires engagés dans la production et le traitement de corpus numériques écrits, oraux ou multimodaux.

Pour être informé.e.s des activités du consortium, nous vous invitons à vous inscrire à la liste de diffusion.

 

CORLI est ouvert à toutes et à tous!

Vous pouvez rejoindre l’un des groupes-réseaux, ou nous contacter directement via ce formulaire

Tous les laboratoires sont invités à participer : vous pouvez contacter le Comité de Pilotage de CORLI ou vous inscrire à notre liste de diffusion

Affiche_Atelier_Métadonnées
Métadonnées (partie 1)
Métadonnées (partie 1)

Métadonnées Coordination : Carole Etienne PARTIE 1 – FACILITER LA RÉUTILISATION DES CORPUS PAR D’AUTRES CHERCHEURS Pourquoi un chercheur serait amené à réutiliser un corpus ? Disposer d’un volume de données plus important Explorer les mêmes données dans différentes perspectives : analyses syntaxiques, prosodiques, phonologiques ou interactionnelles d’une même donnée Bénéficier de différents jeux d’annotations qui ... Lire plus

Métadonnées (partie 2)
Métadonnées (partie 2)

Les métadonnées actuellement disponibles pour les corpus oraux Analyse de l’existant, notamment avec le projet ORFEO (3.5 M de mots, 14 sources de données). Très hétérogènes tant au niveau du format … Fichier texte (pdf, word) Fichiers tabulaires (excel, csv) XML (Dublin Core/OLAC, TEI Header, CMDI) … que des contenus champs basiques : durée, âge, ... Lire plus

previous arrow
next arrow