Formation reportée à une date ultérieure étant donné la journée de mobilisation prévue le 19 mars par la coordination nationale des facs et labos en lutte pour un « Temps fort national : l’université et la recherche à l’arrêt »
(https://universiteouverte.org/2020/03/07/motion-de-la-deuxieme-coordination-nationale-des-facs-et-labos-en-lutte-reunie-les-6-et-7-mars-2020-a-nanterre/).
Formateur : Matthieu Quignard, ingénieur de recherche au CNRS, Laboratoire ICAR (UMR 5191, CNRS, Université Lyon 2 et ENS de Lyon) http://www.icar.cnrs.fr/membre/mquignard
TXM est un logiciel de textométrie, fondamentalement conçu dans le but d’exploiter par le biais de requêtes et de retours au texte des corpus textuels.
L’usage classique est d’importer le texte déjà annoté (métadonnées, propriétés de structure, propriétés lexicales) et de travailler ainsi sur un corpus stabilisé.
TXM a récemment évolué dans le but de permettre aux utilisateurs d’annoter dans TXM, tant pour corriger des annotations existantes erronées que pour en apporter de nouvelles, entrant ainsi dans une boucle d’exploitation du corpus où l’exploitation vient enrichir le corpus lui-même.
Lors du projet ANR DEMOCRAT, TXM a « absorbé » le logiciel Analec, conçu plutôt pour l’annotation d’expressions référentielles que pour l’exploitation de corpus. Il s’agit de l’extension URS (Unités – Relations – Schémas), du nom de modèle d’annotation commun à Analec et Glozz. Le but de cet atelier est d’introduire cette nouvelle extension, montrer comment on peut l’utiliser pour faire de l’annotation d’expressions référentielles, pour construire des chaînes de référence et exploiter par des analyses croisées les annotations ainsi construites.
Inscription
L’inscription à cette formation doit se faire avant le 10 mars en contactant Lydia-Mai Ho-Dac.
Le consortium CORLI propose aux étudiants de participer au financement de la mission en prenant en charge les frais de déplacement uniquement (pas de prise en charge de l’hébergement). Pour profiter de cette aide, contactez Loic Liegeois en indiquant en objet de courriel : [CORLI] demande financement trajet pour atelier TXM–URS, 19 mars, UT2J
Prérequis
- Avoir installé TXM sur son ordinateur et avoir une connaissance de base de l’outil TXM (possibilité de se former en utilisant les supports fournis ici : https://groupes.renater.fr/wiki/txm-users/public/ateliers_txm).
- Une connaissance du langage CQL est préférable.
Consignes d’installation
- Téléchargement de l’outil : http://textometrie.ens-lyon.fr/files/software/TXM/0.8.0/
- Tutoriel d’installation : https://groupes.renater.fr/wiki/txm-users/public/preparation_ordinateur
- Attention : cet atelier nécessite l’installation de l’extension « URS » comme indiqué dans la documentation suivante : https://zenodo.org/record/3267345
Séminaire associé
Cet atelier est associé à une journée d’étude organisée par Lydia-Mai Ho-Dac, Claudine Garcia-Debanc, Josette Rebeyrolle du laboratoire CLLE (UMR 5263) – Université de Toulouse Jean-Jaurè et sera précédé d’un séminaire de Frédéric Landragin qui se déroulera dans la même salle, de 14h00 à 15h00.
Étude des chaînes de référence en français : le projet ANR Democrat
Frédéric Landragin (Laboratoire LATTICE, ENS, UMR 8094)
Résumé et informations sur le site du laboratoire CLLE : https://clle.univ-tlse2.fr/etude-des-chaines-de-reference-en-francais-le-projet-anr-democrat–701463.kjsp?RH=1463575316422