Responsables : Antonio Balvet, Sascha Diwersy
Le groupe de travail CORLI « XMLisation » porte sur les multiples facettes de la saisie structurée de données linguistiques en XML, qu’il s’agisse de TEI ou d’autres formats. Nous aborderons l’ensemble du processus: « avant », « pendant », et « après ». Le « avant » traitera des méthodes de nettoyage et de préparation des données brutes pour assurer une compatibilité optimale avec les formats XML. Le « pendant » sera dédié au choix des normes et des métadonnées adaptées aux besoins spécifiques de chaque projet, ainsi que sur la sélection du sous-ensemble pertinent de la TEI ou d’autres standards. Enfin, le « après » mettra l’accent sur l’exploitation des données structurées : comment valoriser et exploiter des corpus linguistiques bien formés pour l’analyse linguistique, la publication, et la diffusion scientifique. Ce groupe de travail vise à offrir une vue d’ensemble des bonnes pratiques pour maximiser la qualité et l’utilisation des données XML dans les projets linguistiques.