Annoter un corpus, c’est ajouter une ou plusieurs couches d’interprétation linguistique aux données brutes. Les annotations ajoutées peuvent être de natures très diverses : il peut s’agir de catégories morpho-syntaxiques, d’annotations sémantiques ou discursives, mais également, dans le cas de corpus oraux ou multi-modaux, d’informations sur la prosodie, les gestes, etc.
Les annotations sont réalisées lors de campagnes d’annotation par des annotateurs humains, plus ou moins experts, qui s’appuient sur un guide d’annotation.
Plus de ressources sur le site du CORLI :
- Le groupe-réseau 5 du CORLI est consacré aux problématiques liées à l’annotation de corpus. Vous pouvez vous inscrire à sa liste de diffusion.
- Plusieurs formations organisées par les membres du CORLI ont porté sur l’annotation de corpus. Vous trouverez la liste de ces formations ainsi que les supports de cours disponibles ici.