Coordination : Christophe Parisse, Céline Poudat
La confection de ressources constitue aujourd’hui l’une des productions majeures pour nombre de chercheurs et de laboratoire – leur réalisation ayant une incidence directe sur la structuration de la recherche et la division du travail scientifique. Le développement de cette pratique et le recours croissant aux données dans l’argumentation scientifique – que ce soit dans la construction d’observables ou dans la mise à l’épreuve d’hypothèses – impliquent d’en intégrer l’apport dans le bilan des unités. Si la collecte de ressources exploitables est un préalable à certains modes opératoires et à plusieurs champs disciplinaires en linguistique, la constitution de corpus représente avant tout une activité de recherche de plein exercice. La question des critères d’évaluation de ressources incite au dépôt réfléchi des données, mais aussi permet de faire progresser la recherche dans une optique de transparence et réutilisabilité des données.
Le comité de pilotage du consortium CORLI a ainsi organisé, le 23 septembre 2016, une journée autour de l’évaluation des corpus. Cette journée a été un lieu d’échanges et de réflexions autour des critères d’évaluation des ressources.
Intervenants :
- Franck Neveu – Evaluation des corpus et institutions d’évaluation de la recherche
- Christophe Parisse – Pourquoi déposer ses corpus ?
- Jean-Marie Pierrel – Pourquoi évaluer la qualité d’un corpus ?
- Thierry Chanier – Critères de qualité pour les données de la recherche en général. Transposition aux corpus en linguistique
- Michel Jacobson – Comment décrire un corpus à des fins d’archivage ?
- Olivier Baude – Évaluer la qualité des corpus ? Pourquoi ? Comment ?
- Carole Etienne – Interopérabilité et métadonnés quels besoins dans un projet de recherche
Le 3 octobre 2019, CORLI organise une journée dédiée à l’évaluation des corpus. Ce thème est particulièrement important aujourd’hui, d’une part parce qu’il participe à une meilleure évaluation des travaux réalisés aujourd’hui en linguistique, d’autre part parce qu’il ouvre la linguistique à la diffusion et au partage des données de recherche comme le font de nombreuses autres disciplines (mouvement FAIR).
La journée comporte des présentations de Helene Andreassen (Norvège), Gabriel Bergounioux, Bernard Laks, François Rastier, Mathieu Valette, qui représentent une grande partie des structures impliquées dans l’évaluation de la recherche, mais aussi de la recherche en linguistique de corpus.