Plate-forme collaborative et participative de transcription, relecture et annotation de corpus

Date/heure
Date(s) - 18/05/2021
14h00 - 17h30

Catégories


Workshop interdisciplinaire, 18 mai 2021

Huma-Num, la MSH Lorraine et CORLI organisent une demi-journée d’étude autour des plates-formes collaboratives de transcription et d’annotation de corpus.

La recherche en sciences humaines et sociales travaille aujourd’hui sur des corpus de plus en plus complets et complexes. Que ce soit des manuscrits, des textes imprimés, des corpus  oraux, des textes législatifs ou réglementaires, le volume de textes à traiter va croissant avec, selon les disciplines (linguistique, histoire, droit, littérature, théologie), des objectifs scientifiques variés. Cependant, un même verrou technique se pose souvent aux équipes de recherche : celui de ne pas disposer d’outils adéquats pour gérer le travail collaboratif et/ou participatif par des experts (approche collaborative) ou des non-experts (approche participative) en complément des approches automatisées. Cette intervention humaine peut avoir lieu aussi bien au niveau de l’établissement du texte (transcription), de son annotation, de son balisage éventuel en TEI ou encore de son éditorialisation.

L’objet de la demi-journée est d’offrir un cadre pour un échange entre les besoins que peuvent exprimer certaines communautés de chercheurs en sciences humaines et sociales et un certain nombre de solutions existantes. A titre plus exploratoire, la demi-journée permettra de discuter de l’opportunité de développer, notamment  dans le cadre du projet Palamède déposé auprès de l’ANR dans le cadre de l’AMI « Sciences et société », de nouveaux outils en rapport avec de nouveaux besoins présents ou futurs,

 

Programme

La demi-journée se tiendra en distanciel par visioconférence le mardi 18 mai 2021, de 14h à 17h30.

 

14h – 14h15 : introduction

 

14h15 – 15h15 : Quelques exemples de besoins et pratiques

Samuel Ferey (MSHL et BETA, UL). Transcription et balisage d’un corpus juridique: le cas des délibérations du Conseil constitutionnel.

Caroline Masson (Sorbonne Université). Transcription et annotation de corpus oraux: le cas des interactions enfants/adultes dans des objectifs de recherche et de formation.

Jean-Sébastien Rey (MSHL et Ecritures, UL). Annotation et comparaison de versions : l’exemple des manuscrits de Ben Sira.

 

15h30 – 17h : Parcours d’un ensemble de plateformes existantes : du recueil à la transcription et à l’annotation de corpus

Julie Glikman (LILPA, Strasbourg). Corpus et enquêtes. Recueillir des données avec DFS.

Arnaud Bey et Sylvain Hatier (Lidilem, Grenoble). La plateforme d’annotation et de transcription TACT.

Sarra El Ayari (SFL, Paris 8). Sarramanka : entre transcription, annotation et visualisation, une exploration outillée de corpus.

Mai Ho-Dac (CLLE-ERSS, Toulouse) et Céline Poudat (BCL, Nice). Annoter, partager et comparer avec Glozz, Inception et TXM-URS. (diapositives)

 

17h – 17h30 : échanges