Bibliothèques virtuelles humanistes – Corpus Epistemon

FICHE DESCRIPTIVE DU CORPUS Langue Français, Latin, Grec, Italien, Espagnol, Allemand, Gascon, Hébreu, Langue artificielle, Arabe, Basque, Araméen, Limousin, Néerlandais, Ancien araméen, Breton, Béarnais, Danois, Ecossais, Latin macaronique, Lorrain, Picard, Poitevin, Portugais, Tupi. Format des métadonnées TEI Accès Creative Commons Attribution – Non Commercial – ShareAlike 4.0 International Licence. Site CAHIERLien vers le corpus Mots-clés Littérature, … Lire plus

Base de Français Médiéval (BFM)

FICHE DESCRIPTIVE DU CORPUS Langue Français, Dialectes français Format des métadonnées TEI Accès Domaine public, licence EtalabLe fichier XML-TEI préparé par l’équipe de la BFM est mis à disposition sous licence Etalab sur demande par mail auprès de l’administrateur de la BFM. Site CAHIERLien vers le corpus Mots-clés Type de textes Juridiques, religieux, littéraires, didactiques, … Lire plus

Théâtre de Louis de Boissy

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès CC BY-NC-SA 4.0 Site CAHIERLien vers le corpus Mots-clés Théâtre, Comédie Type de textes Pièces de théâtre Taille du corpus 35 textes INFORMATIONS SUR LES TEXTES Auteurs des textes OUI (Louis de Boissy, 1694-1758) Dates OUI (année) Notes Un lien vers le site permet … Lire plus

Rapports allemands sur l’intégration (1991-2014)

FICHE DESCRIPTIVE DU CORPUS Langue Allemand Format des métadonnées pdf Accès Les corpus français et allemand sont déjà accessibles sur le web, dans des versions identiques, sur les sites institutionnels des pays concernés (voir site web indiqué). Cette publication sur ORTOLANG s’inscrit dans la démarche suivante. Il s’agit pour nous à la fois de rendre … Lire plus

PARSEME-FR

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées coNLL-u Accès Licence Creative Commons – Attribution 4.0 International Site ORTOLANGLien vers le corpus Mots-clés expressions polylexicales, verbales, annotation corpus Type de textes Écritures ordinaires et écrits professionnels, Scientifique Taille du corpus INFORMATIONS SUR LES TEXTES Auteurs des textes NON Dates NON Notes EXEMPLE # sentid: … Lire plus

Mooc Ville durable être acteur du changement

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées TEI Accès By-NC-SA 3.0 Site ORTOLANGLien vers le corpus Mots-clés Type de textes Nouveau mode de communication (Tweet, SMS, etc) Taille du corpus INFORMATIONS SUR LES TEXTES Auteurs des textes OUI Dates OUI : du 2015-01-28 au 2015-03-28 Notes Autres informations disponibles : une description du … Lire plus

Les dossiers de Bouvard et Pécuchet

FICHE DESCRIPTIVE DU CORPUS Langue Français, Latin, Arabe Format des métadonnées TEI Accès CC BY-NC-SA 3.0 Site CAHIERLien vers le corpus Mots-clés Agriculture, Médecine, Littérature, Philosophie, Religion, Amour, Politique, Histoire Type de textes Taille du corpus 1 texteEnviron 3500 pages INFORMATIONS SUR LES TEXTES Auteurs des textes OUI (Gustave Flaubert (1821-1880) Dates OUI (années) Notes … Lire plus

Le Pelerinage de Vie humaine de Guillaume de Digulleville

FICHE DESCRIPTIVE DU CORPUS Langue Moyen français Format des métadonnées TEI Accès Ce texte est librement utilisable et rediffusable sous la condition de citer l’auteur (Guillaume de Digulleville) et la transcriptrice (Béatrice Stumpf) Site ORTOLANGLien vers le corpus Mots-clés Type de textes Littéraire Taille du corpus INFORMATIONS SUR LES TEXTES Auteurs des textes NON Dates … Lire plus

Journal intime de Leonore Alt

FICHE DESCRIPTIVE DU CORPUS Langue Allemand Format des métadonnées Accès Licence Creative Commons – Attribution 4.0 International Site ORTOLANGLien vers le corpus Mots-clés Type de textes Écritures ordinaires et écrits professionnels Taille du corpus INFORMATIONS SUR LES TEXTES Auteurs des textes NON Dates NON Notes Il n’y a pas de xml, seules les images du … Lire plus

DEDE : un corpus annoté pour le traitement des DEscriptions DEfinies

FICHE DESCRIPTIVE DU CORPUS Langue Français Format des métadonnées Accès Le corpus annoté est librement téléchargeable. Site ORTOLANGLien vers le corpus Mots-clés Type de textes Littéraire Taille du corpus 48 360 mots INFORMATIONS SUR LES TEXTES Auteurs des textes NON Dates 1987 Notes EXEMPLE 1 <markable headline= »no » id= »sentence_0″ span= »word_0..word_47″/><markable headline= »yes » id= »sentence_1″ span= »word_48..word_55″/><markable headline= »no » id= »sentence_2″ span= »word_56..word_101″/><markable … Lire plus