Scientext

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès CC-by-NC Site ORFEOLien vers le corpus Mots-clés Type de textes Écrit scientifique Taille du corpus 4,8 millions de mots (1 676 451 tokens) INFORMATIONS SUR LES TEXTES Auteurs des textes NON Dates OUI (Année) Notes Le nombre de mots de chaque texte est précisé

FRANTEXT

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès Libre dans un cadre de recherche ou d’enseignement Site ORFEOLien vers le corpus Mots-clés Type de textes Littérature Taille du corpus 1,8 millions de tokens INFORMATIONS SUR LES TEXTES Auteurs des textes NON Dates OUI (Année) Notes Nombre de mots de chaque texte précisés

Débats parlementaires sur l’Europe à la House of Commons (1998-2015)

FICHE DESCRIPTIVE DU CORPUS Langue Anglais Format des métadonnées TEI Accès CC BY 4.0 Site ORTOLANGLien vers le corpus Mots-clés discours politique, débats parlementaires, Europe Type de textes Parole scriptée/préparée Taille du corpus 188 913 mots (manque une année) INFORMATIONS SUR LES TEXTES Auteurs des textes OUI (Locuteurs) Dates OUI (jour/mois/année) Notes Description des locuteurs … Lire plus

ANNODIS

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès By -NC-SA 3.0 Site ORFEOLien vers le corpus Mots-clés Type de textes Écrit scientifique Taille du corpus 687 000 mots : Est Républicain, Wikipédia, Actes du Congrès Mondial de Linguistique Française 2008 et les rapports de l’Institut Français des relations internationales INFORMATIONS SUR LES … Lire plus

Chambers-Rostand

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès CC-by-NC Site ORFEOLien vers le corpus Mots-clés Type de textes presse écrite, presse quotidienne régionale ou presse quotidienne nationale Taille du corpus 979 831 mots et 1723 articles (Le Monde, l’Humanité et la Dépêche du Midi)1 210 000 tokens INFORMATIONS SUR LES TEXTES Auteurs … Lire plus

WikiDisc

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI-P5 Accès Following Wikipedia.fr recommendation this corpus (and all its related contents) can be freely distributed and shared subject only to attribution, and share alike. Site ORTOLANGLien vers le corpus Mots-clés Type de textes Nouveau mode de communication (Tweet, SMS, etc)Articles de Wikipédia Taille du corpus … Lire plus