Guides d’annotation

Coordination: Marie-Anne Sallandre

Toute entreprise d’annotation devrait s’accompagner d’un guide d’annotation détaillant les choix et les annotations posées sur les corpus. Néanmoins, il s’avère que le guide d’annotation est souvent ce que l’on rédige en dernier, et faute d’une version *parfaitement finalisée*, on tarde souvent à le mettre en ligne.

Lorsqu’on annote un corpus et qu’on se lance dans l’écriture d’un guide d’annotation, on récupère les guides disponibles en ligne; il serait donc pertinent de pointer vers les guides d’annotation existants depuis le site de CORLI, et c’est l’objectif de la présente rubrique.

Un guide d’annotation est une publication acceptée par l’HCERES. Le site pointe donc vers les liens HAL de ces guides et propose également des mots clés (e.g. type de discours: LSF, écrits scolaires, projet, logiciel, état d’avancement + descriptif libre optionnel etc.).


  • Balvet A., Barque L., Condette M.-H., Haas P., Huyghe R., Jugnet A., Marı́n R. et Merlo A. Le projet Nomage Description des noms déverbaux du français, 2009. (pdf)
  • Balvet A., Barque L., Condette M.-H., Haas P., Huyghe R., Jugnet A., Marı́n R. et Merlo A. Guide pour l’annotation des noms déverbaux, 2009. (pdf)
  • Benzitoun C. et Bérard L. Manuel d’annotation pour les corpus du projet PERCEO (pdf)
  • Bianchini C., Chèvrefils L., Danet C., Doan P., Rébulard M., et al. Guide d’annotation pour les polices de caractères Typannot dans le cadre du projet Typannot-Graphé. [Rapport de recherche] 1, Université de Rouen Normandie; ESAD Amiens; Université de Poitiers. pp.1-47, 2018. ⟨hal-01965272⟩ (pdf)
  • Bigi B. Enriched Orthographic Transcription : SPPAS convention, 2017. (pdf)
  • Boutet D., Jégo J.-F., Meyrueis V. POLIMOD Pipeline: tutorial: step-by-step tutorial: Motion Capture, Visualization & Data Analysis for gesture studies. [Technical Report] Université de Rouen, Université Paris 8, Moscow State Linguistic University, 2018. ⟨hal-01950615⟩ (pdf)
  • Colléter M., Fabre C., Ho-Dac L.-M., Péry-Woodley M.-P., Rebeyrolle J. et Tanguy L. La ressource ANNODIS multi-échelle : guide d’annotation et « bonus » Carnets de Grammaire 20, 63p., 2012. (pdf)
  • Hickmann M., Hendriks H., Demagny A.-C., Engemann H., Iakovleva T., et al. La représentation de l’espace : études expérimentales et translinguistiques : manuel de codage; 2 volumes. Laboratoire Structures Formelles du langage, CNRS & Université de Paris VIII, 2011. ⟨hal-01247811⟩
  • Johnston T. Auslan Corpus Annotation Guidelines, 2016. (pdf)
  • Muller P., Vergez-Couret M., Prévot L., Asher N., Farah B., Bras M., Le Draoulec A. et Vieu L. Manuel d’annotation en relations de discours du projet ANNODIS. Carnets de Grammaire 21, 34p, 2012. (pdf)
  • Pallaud B. Guide d’annotations des espaces interruptifs (interruptions suspensives et disfluentes) en français parlé dans les huit dilogues du CID (Corpus of Interactional Data), 2016. ⟨hal-02186565⟩ (pdf)
  • Rosset S., Grouin C. et Zweigenbaum P. Entités nommées structurées : guide d’annotation Quaero, 2011. (pdf)
  • Tellier M. GESTURE IN TEACHER TALK Schéma et guide d’annotation. (pdf)
  • Tellier M. Projet Corps en formation – Guide d’annotation, 2017. (pdf)


  • Benzitoun C., L’annotation syntaxique de corpus oraux constitue-t-elle un problème spécifique ?, Actes de la conférence RECITAL, 19-22 avril 2004, Fès, pp. 13-22, 2004. (pdf).
  • Benzitoun C. et Véronis J., Problèmes d’annotation d’un corpus oral dans le cadre de la campagne EASY, Actes de la conférence TALN, 6-10 juin 2005, Dourdan, Tome II, pp. 13-16, 2005. (pdf).
  • Benzitoun C., Fort K. et Sagot B., TCOF-POS : un corpus libre de français parlé annoté en morphosyntaxe Actes de Traitement Automatique des Langues Naturelles (TALN), Grenoble, France, 2012. (pdf)
  • Candito M., Perrier G., Guillaume B., Ribeyre C., Fort K., Seddah D. and De la Clergerie E., Deep Syntax Annotation of the Sequoia French Treebank. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC), Reykjavik, Islande, 2014. (pdf)
  • Estève I. et Millet A., Contacts de Langues et Multimodalité chez des locuteurs sourds : concepts et outils méthodologiques pour Llanalyse. Journal of Language Contact, 2(2), 111-131, 2009.
  • Fort K., Ehrmann M. et Nazarenko A., Vers une méthodologie d’annotation des entités nommées en corpus ? Actes de Traitement Automatique des Langues Naturelles (TALN), Senlis, France, 2009. (pdf)
  • Fort K. et Sagot B., Influence of Pre-annotation on POS-tagged Corpus Development Proceedings of the Fourth ACL Linguistic Annotation Workshop, Uppsala, 2010. (pdf)
  • Fort K., Nazarenko A., and Ris C., Corpus Linguistics for the Annotation Manager Proceedings of the Corpus Linguistics Conference, Birmingham, Angleterre, 2011. (pdf)
  • Fort K., Nazarenko A. et Rosset S., Modeling the Complexity of Manual Annotation Tasks : a Grid of Analysis. Proceedings of the International Conference on Computational Linguistics (COLING), Mumbaï, Inde, 2012 (pdf)
  • Garcia B., Sallandre M.-A., Schoder C. et L’Huillier M.-T., « Typologie des pointages en Langue des Signes Française (LSF) et problématiques de leur annotation ». In Boutora, L. et Braffort, A (eds.), Actes de la conférence TALN 2011, atelier DEGELS 1, Montpellier, 107-119, 1er juillet 2011. (pdf)
  • Garcia B. and Sallandre M.-A., “Transcription systems for sign language: a sketch of the different notation systems for sign language and their characteristics.” In Müller C., Cienki A., Fricke E., Ladewig S., McNeill D. and Tessendorf S. (Eds.), Handbook « Body-Language-Communication ». Berlin/New York: Mouton De Gruyter. 1125-1338, 2013. DOI: 10.13140/RG.2.1.4760.2404 ⟨hal-01043755⟩ (pdf)
  • Grouin C., Rosset S., Zweigenbaum P., Fort K., Galibert O., and Quintard L., Proposal for an Extension of Traditional Named Entitites: from Guidelines to Evaluation, an Overview Proceedings of the Fifth ACL Linguistic Annotation Workshop, Portland, Oregon, 2011. (pdf)
  • Guillaume B. et Fort K., Expériences de formalisation d’un guide d’annotation : vers l’annotation agile assistée. Actes de Traitement Automatique des Langues Naturelles (TALN), Les Sables d’Olonne, France, 2013
  • Millet A. et Estève I., Transcrire et annoter la multimodalité : quand les productions des enfants sourds réinterrogent les outils d’analyse, Lidil,42, 9-33, 2010. (lien) (pdf)
  • Millet A. et Estève I., Transcribing and annotating multimodality : How deaf children’s productions call into the question the analytical tools. In J.-M. Colletta & M. Guidetti (Eds.), Gesture and Multimodal Development (Vol. Benjamins Current Topics, 39, pp.175-197): John Benjamins, 2012.
  • Perrier G., Candito M., Guillaume B., Ribeyre C., Fort K. et Seddah D., Un schéma d’annotation en dépendances syntaxiques profondes pour le français. Actes de Traitement Automatique des Langues Naturelles (TALN), Marseille, France, juillet 2014. (pdf)
  • Rosset S., Grouin C., Fort K., Galibert O., Kahn J. et Zweigenbaum P., Structured Named Entities in two distinct press corpora: Contemporary Broadcast News and Old Newspapers Proceedings of the 6th Linguistic Annotation Workshop (LAW VI), Jeju, République de Corée, 2012. (pdf)
  • Sallandre M.-A. and Garcia B., “Epistemological issues in the semiological model for the annotation of sign language”. In Meurant Laurence, Sinte Aurélie, Van Herreweghe Mieke & Vermeerbergen Myriam (Eds.), Sign Language research, uses and practices, Crossing views on theoretical and applied sign language linguistics, Berlin/Boston: Mouton De Gruyter and Nijmegen: Ishara Press, 159-177, 2013. (pdf)