CORLI organise une journée dédiée à l’évaluation des corpus. Ce thème est particulièrement important aujourd’hui, d’une part parce qu’il participe à une meilleure évaluation des travaux réalisés en linguistique, d’autre part parce qu’il ouvre la linguistique à la diffusion et au partage des données de recherche comme le font de nombreuses autres disciplines (mouvement FAIR).
La journée se déroulera le 3 octobre 2019 de 10h à 17h à l’Université Paris Diderot, Bâtiment Olympe de Gouges (8 place Paul Ricœur, 75013 Paris). Salle Laplanche (salle 576), 5ème étage.
Accès à la salle :
Demander un badge à l’accueil (à échanger contre une pièce d’identité) pour pouvoir accéder au cinquième étage (ou monter avec une autre personne).
Accès au bâtiment : https://www.eila.univ-paris-diderot.fr/_media/eila/acces-odg.pdf
Programme de la journée :
François Rastier (Directeur de recherche, http://www.revue-texto.net/)
10h – 10h45 :- Data vs Corpora.
Pause café: 20 mn
Mathieu Valette (INALCO, CNU)
11h05 – 11h50 :- Le corpus en linguistique: des moyens et des fins.
Gabriel Bergounioux (LLL, Université d’Orléans)
11h50 – 12h35 :- Les corpus vus par le CNRS
Pause à 12h35
Reprise à 14h00
Bernard Laks (Modyco, HCERES)
14h – 14h45 :- L’évaluation des équipes de recherche par le HCERES : LE « GUIDE DES PRODUITS DE LA RECHERCHE ET DES ACTIVITES DE RECHERCHE » ET LA QUESTION DES CORPUS.
Helene Andreassen (UiT The Arctic University of Norway)
14h45 – 15h30 :- La citation de données de recherche dans des publications en linguistique: L’histoire d’une initiative prise par la communauté scientifique.
Pause café : 20mm
Rappel des enjeux (CORLI) : 15h50 – 15h55.
Discussion entre l’ensemble des participants et le public. – 15h55 – 17h00.
Résumés des interventions:
Gabriel Bergounioux (LLL, Université d’Orléans)
« Les corpus vus par le CNRS »
Le CNRS a été très tôt concerné par la question des corpus, avec un transfert de compétences à effectuer des répertoires archéologiques et des corpus graphiques à des données orales avant que la numérisation ne transforme radicalement le rapport aux données et les pratiques. Après un rappel du pilotage institutionnel, en complément des initiatives de l’ANR notamment, un point sera fait sur la façon dont la section 34 est amenée à considérer les corpus dans les sciences du langage.
Bernard Laks (Modyco, HCERES)
L’évaluation des équipes de recherche par le HCERES : LE « GUIDE DES PRODUITS DE LA RECHERCHE ET DES ACTIVITES DE RECHERCHE » ET LA QUESTION DES CORPUS.
Le Haut Conseil Pour l’Evaluation de l’Enseignement et de la Recherche (HCERES), évalue tous les 5 ans les équipes et laboratoires. Il propose à ses experts de s’appuyer sur un guide méthodologique d’évaluation des produits de la recherche. Je présenterai cette méthodologie en développant plus particulièrement les aspects liés à l’évaluation des corpus linguistiques.
Helene N. Andreassen
UiT Université arctique de Norvège
Helene.n.andreassen@uit.no
La citation de données de recherche dans des publications en linguistique: L’histoire d’une initiative prise par la communauté scientifique
La création et la diffusion de la recherche reproductible reçoivent de plus en plus d’attention dans la discussion sur les meilleures pratiques de publication et d’enseignement. Un élément clé de ces pratiques constitue la citation appropriée des données de recherche.
En 2017, un réseau de chercheurs, archivistes et bibliothécaires a fondé un groupe au sein de Research Data Alliance, Linguistics Data Interest Group, ayant comme objectif principal d’identifier les défis liés aux données de recherche en linguistique et de contribuer à répondre à ceux-ci.
Dans cette communication, je présenterai l’historique du groupe, les objectifs ainsi que les résultats actuels. Je terminerai sur une réflexion sur l’avenir et comment notre réseau pourra collaborer avec d’autres milieux intéressés par ce travail.