Lieu : Paris Diderot – Bâtiment Olympe de Gouge
Formatrices/eurs : formation conçue et assurée par les étudiants du Master LITL (Toulouse)
Descriptif
Annoter un corpus, c’est ajouter une ou plusieurs couches d’interprétation linguistique aux données brutes. Les annotations ajoutées peuvent être de natures très diverses : il peut s’agir de catégories morpho-syntaxiques, d’annotations sémantiques ou discursives, mais également, dans le cas de corpus oraux ou multi-modaux, d’informations sur la prosodie, les gestes, etc.
Les annotations sont réalisées lors de campagnes d’annotation par des annotateurs humains, plus ou moins experts, qui s’appuient sur un guide d’annotation et utilisent un outil d’annotation.
Parmi ces outils, la plateforme INCEpTION a été investie par le consortium CORLI pour mettre à disposition de la communauté une plateforme documentée pour l’annotation collaborative.
La plateforme INCEpTION propose des fonctionnalités pour mener une annotation débarquée et embarquée multi-couche sous la forme de projets facilitant une annotation collaborative. L’annotation collaborative proposée comprend (1) la gestion de cohortes d’annotateurs avec distribution des rôles, (2) l’attribution des textes aux annotateurs, (3) l’adjudication et la mesure de l’accord inter-annotateur.
Dans le cadre du projet Annotation du consortium CORLI 2022-2025 et d’un projet étudiants inscrits dans le master de Sciences du Langage LITL (Toulouse), cet atelier propose une initiation à l’utilisation de la plateforme InCEPTION. Cette formation sera assurée par les étudiants, qui sont au nombre de 12 et qui travaillent sur INCEpTION depuis maintenant plusieurs mois pour CORLI.
Diapositives de présentation de ce projet :
Prérequis
Il n’y a pas de prérequis pour cet atelier. Les participants peuvent venir avec leur propre machine ou utiliser les machines qui seront à disposition dans la salle.
Au programme de l’atelier :
Matinée (9h30-12h30)
- Présentation du projet de mise à disposition d’un outil collaboratif pour l’annotation
- Présentation « pratique » de la plateforme (présentation et prise en main simultanée d’InCEPTION par les participants) : créer un projet, découverte des fonctionnalités principales, importer un document/corpus, ajouter des membres aux projets, annoter.
Pour cette première 1/2 journée, un corpus de travail commun sera mis à disposition
Après-midi (14h00-17h00)
Proposition de travailler en petits groupes en fonction des demandes des participants :
- installation d’INCEpTION sur sa propre machine
- création de son propre projet
- import de nouveaux corpus (possibilité de venir avec ses propres corpus)
- création d’un modèle d’annotation
- test de l’active learning
- export de son projet et des corpus annotés