Formation CORLI: découvrir et manipuler la plateforme d’annotation collaborative INCEpTION

Date/heure
Date(s) - 12/05/2022
9h30 - 17h00

Emplacement
Paris Diderot -- Bâtiment Olympe de Gouges

Catégories


Lieu : Paris Diderot – Bâtiment Olympe de Gouge

Formatrices/eurs : formation conçue et assurée par les étudiants du Master LITL (Toulouse)

Descriptif

Annoter un corpus, c’est ajouter une ou plusieurs couches d’interprétation linguistique aux données brutes. Les annotations ajoutées peuvent être de natures très diverses : il peut s’agir de catégories morpho-syntaxiques, d’annotations sémantiques ou discursives, mais également, dans le cas de corpus oraux ou multi-modaux, d’informations sur la prosodie, les gestes, etc.

Les annotations sont réalisées lors de campagnes d’annotation par des annotateurs humains, plus ou moins experts, qui s’appuient sur un guide d’annotation et utilisent un outil d’annotation.

Parmi ces outils, la plateforme INCEpTION a été investie par le consortium CORLI pour mettre à disposition de la communauté une plateforme documentée pour l’annotation collaborative.

La plateforme INCEpTION propose des fonctionnalités pour mener une annotation débarquée et embarquée multi-couche sous la forme de projets facilitant une annotation collaborative. L’annotation collaborative proposée comprend (1) la gestion de cohortes d’annotateurs avec distribution des rôles, (2) l’attribution des textes aux annotateurs, (3) l’adjudication et la mesure de l’accord inter-annotateur.

Dans le cadre du projet Annotation du consortium CORLI 2022-2025 et d’un projet étudiants inscrits dans le master de Sciences du Langage LITL (Toulouse), cet atelier propose une initiation à l’utilisation de la plateforme InCEPTION. Cette formation sera assurée par les étudiants, qui sont au nombre de 12 et qui travaillent sur INCEpTION depuis maintenant plusieurs mois pour CORLI.

Prérequis

Il n’y a pas de prérequis pour cet atelier. Les participants peuvent venir avec leur propre machine ou utiliser les machines qui seront à disposition dans la salle.

Au programme de l’atelier :

Matinée (9h30-12h30)

  • Présentation du projet de mise à disposition d’un outil collaboratif pour l’annotation
  • Présentation « pratique » de la plateforme (présentation et prise en main simultanée d’InCEPTION par les participants) : créer un projet, découverte des fonctionnalités principales, importer un document/corpus, ajouter des membres aux projets, annoter.
    Pour cette première 1/2 journée, un corpus de travail commun sera mis à disposition

Après-midi (14h00-17h00)

Proposition de travailler en petits groupes en fonction des demandes des participants :

  • installation d’INCEpTION sur sa propre machine
  • création de son propre projet
  • import de nouveaux corpus (possibilité de venir avec ses propres corpus)
  • création d’un modèle d’annotation
  • test de l’active learning
  • export de son projet et des corpus annotés

Inscription

L’atelier est limité à 40 participants. Pour s’inscrire, un formulaire d’inscription est disponible ici https://forms.gle/pCSuQ1RRaYGP2dtz9 jusqu’au 30 avril.
Dans ce formulaire, nous vous invitons également à participer à la réunion que nous organisons la veille, le 11 mai de 14 à 17h, afin d’échanger sur le projet d’annotation de CORLI, et de nous rejoindre si vous souhaitez y participer!
Nous pourrons financer quelques missions pour cet événement donc n’hésitez pas à nous le signaler dans le formulaire.