Les entrepôts de données donnent accès (librement ou sous conditions) aux données, en exposant leurs métadonnées aux moteurs de recherche. En France, plusieurs initiatives nationales proposent une plateforme pour le dépôt et l’accès aux ressources linguistiques : le CRDO, devenu COCOON et SLDR ; l’Equipex Ortolang (qui s’appuie sur l’expérience des Centre de Ressources Numériques CNRTL et SLDR) et TGE-Adonis.
Ils proposent aux auteurs de corpus un environnement permettant la pérennisation et la diffusion de leur production (en respectant le niveau de diffusion souhaité). Ils proposent à tous les utilisateurs une visualisation des données, des requêtes sur l’ensemble des bases ainsi que le téléchargement complet des données (moyennant signature d’une licence). »