Quelles sont les questions juridiques et éthiques posées par la collecte de données puis leur mise à disposition sous forme de corpus ?

Le partage des ressources est primordial dans l’esprit d’une science ouverte telle que promue par le CORLI. Mais les données collectées pour constituer un corpus proviennent de locuteurs, donc de personnes physiques dont les informations personnelles devraient être protégées. Dans certains cas, des données sensibles sont aussi pertinentes pour l’analyse linguistique (informations sur le locuteur, … Lire plus