INCEpTION : plateforme collaborative pour l’annotation en linguistique

Formations CORLI – Analyse de données textuelles, Manipulation, extraction, exploration de corpus – 16/05/2023

Intervenant.e.s: Lydia-May HO-DAC, Céline POUDAT

Contenu: Annoter un corpus, c’est ajouter une ou plusieurs couches d’interprétation linguistique aux données brutes. Les annotations ajoutées peuvent être de natures très diverses : il peut s’agir de catégories morpho-syntaxiques, d’annotations sémantiques ou discursives, mais également, dans le cas de corpus oraux ou multi-modaux, d’informations sur la prosodie, les gestes, etc.

Les annotations sont réalisées lors de campagnes d’annotation par des annotateurs humains, plus ou moins experts, qui s’appuient sur un guide d’annotation et utilisent un outil d’annotation.

Parmi ces outils, la plateforme INCEpTION a été investie par le consortium CORLI pour mettre à disposition de la communauté une plateforme documentée pour l’annotation collaborative.

La plateforme INCEpTION propose des fonctionnalités pour mener une annotation débarquée et embarquée multi-couche sous la forme de projets facilitant une annotation collaborative. L’annotation collaborative proposée comprend

  1. la gestion de cohortes d’annotateurs avec distribution des rôles,
  2. l’attribution des textes aux annotateurs,
  3. l’adjudication et la mesure de l’accord inter-annotateur.