Inventory of written corpora

NomFicheLangueCorpusSiteFormatsAccèsMots clefs
4-Couv/index.php/4-couvFrançaishttps://www.ortolang.fr/market/corpora/4-couvhttps://www.ortolang.frLibrecorpus arboré, treebank, analyse en constituants, quatrième de couverture
ALLy/index.php/allyFrançais, Occitan, Franco-Provençalhttps://www.ortolang.fr/market/corpora/allyhttps://www.ortolang.fr/pdfRéservé à certains membresAtlas
AMPLOR/index.php/amplorMoyen françaishttps://www.ortolang.fr/market/corpora/amplorhttps://www.ortolang.frTEIlicence Creative Commons Attribution - Pas d'Utilisation Commerciale - Pas de Modification 3.0 non transposé
ANNODIS/index.php/annodisFrançaishttp://ortolang107.inist.fr/?fnomCorpus=ANNODIS+E&locale=frhttps://www.projet-orfeo.fr/TEIBy -NC-SA 3.0
Archive Numérique Desanti (IHRIM UMR5317)/index.php/archive-numerique-desanti-ihrim-umr5317Françaishttp://weboai.cahier.huma-num.fr/set/desantihttp://weboai.cahier.huma-num.fr/Tous droits réservés
Base de Français Médiéval (BFM)/index.php/base-de-francais-medieval-bfmFrançais, Dialectes françaishttp://weboai.cahier.huma-num.fr/set/bfmhttp://weboai.cahier.huma-num.fr/TEIDomaine public, licence Etalab Le fichier XML-TEI préparé par l'équipe de la BFM est mis à disposition sous licence Etalab sur demande par mail auprès de l'administrateur de la BFM.
Bibliothèques virtuelles humanistes – Corpus Epistemon/index.php/bibliotheques-virtuelles-humanistes-corpus-epistemonLangue Français, Latin, Grec, Italien, Espagnol, Allemand, Gascon, Hébreu, Langue artificielle, Arabe, Basque, Araméen, Limousin, Néerlandais, Ancien araméen, Breton, Béarnais, Danois, Ecossais, Latin macaronique, Lorrain, Picard, Poitevin, Portugais, Tupihttp://weboai.cahier.huma-num.fr/set/epistemonhttp://weboai.cahier.huma-num.fr/TEICreative Commons Attribution – Non Commercial – ShareAlike 4.0 International Licence.Littérature, histoire, correspondance, économie
Chambers-Rostand/index.php/chambers-rostandFrançaishttp://ortolang107.inist.fr/?fnomCorpus=Chambers-Rostand+E&locale=frhttps://www.projet-orfeo.fr/TEICC-by-NC
CHISPA Edition numériques des archives de José Mora Guarnido/index.php/chispa-edition-numeriques-des-archives-de-jose-mora-guarnidoEspagnolhttp://weboai.cahier.huma-num.fr/set/chispahttp://weboai.cahier.huma-num.fr/CC BY-NC-SA 3.0
CoMeRe/index.php/comereFrançaishttps://www.ortolang.fr/market/corpora/comerehttps://www.ortolang.fr/TEICC-by-NC
Corpus 14/index.php/corpus-14/Françaishttps://www.ortolang.fr/market/corpora/corpus14https://www.ortolang.fr/TEILicence Creative Commons Attribution – Pas d'Utilisation Commerciale - Partage à l'Identique 3.0 France
Corpus d'articles de linguistiques issus de la revue "Sciences Humaines"/index.php/corpus-darticles-de-linguistiques-issus-de-la-revue-sciences-humainesFrançaishttps://www.ortolang.fr/market/corpora/scienceshumaineshttps://www.ortolang.fr/TEICC BY-NC-SA 2.0
Corpus ÉMA, écrits scolaires/index.php/corpus-ema-ecrits-scolairesFrançaishttps://www.ortolang.fr/market/corpora/ema-ecrits-scolaires-1https://www.ortolang.fr/pdfÉcriture scolaire, Texte argumentatif, Texte narratif
Corpus journalistique issu de l'Est Républicain/index.php/corpus-journalistique-issu-de-lest-republicainFrançaishttps://www.ortolang.fr/market/corpora/est_republicainhttps://www.ortolang.fr/TEILibre dans un cadre de recherche ou d'enseignement à l'exclusion de toute utilisiation commerciale et sous réserve de citation de la source : Est Républicain
Correspondance de Pierre Bayle/index.php/correspondance-de-pierre-bayleFrançaishttp://weboai.cahier.huma-num.fr/set/baylehttp://weboai.cahier.huma-num.fr/CC BY-NC-SA 3.0 FRcorrespondance, Pierre Bayle, République des Lettres
Cuentos de Horacio Quiroga/index.php/cuentos-de-horacio-quirogaEspagnolhttp://weboai.cahier.huma-num.fr/set/quirogahttp://weboai.cahier.huma-num.fr/TEICC-BY-NC-NDCuento, Realismo mágico, Fantástico, Naturalismo, Uruguay, Quiroga Nouvelle, Réalisme magique, Fantastique, Naturalisme, Uruguay, Quiroga
Débats parlementaires sur l'Europe à l'Assemblée nationale (2002-2012)/index.php/debats-parlementaires-sur-leurope-a-lassemblee-nationale-2002-2012Françaishttps://www.ortolang.fr/market/corpora/fr-parlhttps://www.ortolang.fr/TEICC BY 4.0discours politique, débats parlementaires, Europe
Débats parlementaires sur l'Europe à la House of Commons (1998-2015)/index.php/debats-parlementaires-sur-leurope-a-la-house-of-commons-1998-2015Anglaishttps://www.ortolang.fr/market/corpora/uk-parlhttps://www.ortolang.fr/TEICC BY 4.0discours politique, débats parlementaires, Europe
Débats parlementaires sur l'Europe au Bundestag (1998-2015)/index.php/debats-parlementaires-sur-leurope-au-bundestag-1998-2015Allemandhttps://www.ortolang.fr/market/corpora/de-parlhttps://www.ortolang.fr/TEICC BY 4.0discours politique, débats parlementaires
DEDE : un corpus annoté pour le traitement des DEscriptions DEfinies/index.php/dede-un-corpus-annote-pour-le-traitement-des-descriptions-definiesFrançaishttps://www.ortolang.fr/market/corpora/dedehttps://www.ortolang.fr/Le corpus annoté est librement téléchargeable.
Democrat/index.php/democratAncien français, Moyen français, Françaishttps://www.ortolang.fr/market/corpora/democrathttps://www.ortolang.fr/TEICreative Commons Attribution-ShareAlike 3.0référence, coréférence, expression référentielle
Edition de la correspondance et des archives de Marc Michel Rey/index.php/edition-de-la-correspondance-et-des-archives-de-marc-michel-reyFrançaishttp://weboai.cahier.huma-num.fr/set/reyhttp://weboai.cahier.huma-num.fr/TEICC BY-NC-ND 3.0 FR
Dictionnaire électronique de Troyes/index.php/dictionnaire-electronique-de-troyesAncien françaishttps://www.ortolang.fr/market/corpora/decthttps://www.ortolang.fr/TEILes fichiers TEI ne sont disponibles que pour les membres de l'espace de travail Licence Creative Commons Attribution - Pas d'utilisation commerciale - Partage dans les Mêmes Conditions 2.0 GénériqueChrétien de Troyes
FRANTEXT/index.php/frantextFrançaishttp://ortolang107.inist.fr/?fnomCorpus=FRANTEXT+E&locale=frhttps://www.projet-orfeo.fr/TEILibre dans un cadre de recherche ou d'enseignement
Interviews d'Alphonse Daudet dans la presse parisienne (1883-1897)/index.php/interviews-dalphonse-daudet-dans-la-presse-parisienne-1883-1897Françaishttps://www.ortolang.fr/market/corpora/interviewsdaudethttps://www.ortolang.fr/TEILibre sans utilisation commercialeInterviews, Presse, XIXe siècle, Conversation, Alphonse Daudet
Journal intime de Leonore Alt/index.php/journal-intime-de-leonore-altAllemandhttps://www.ortolang.fr/market/corpora/leonore-althttps://www.ortolang.fr/Licence Creative Commons - Attribution 4.0 International
Le Pelerinage de Vie humaine de Guillaume de Digulleville/index.php/le-pelerinage-de-vie-humaine-de-guillaume-de-digullevilleMoyen françaishttps://www.ortolang.fr/market/corpora/digullevillehttps://www.ortolang.fr/TEICe texte est librement utilisable et rediffusable sous la condition de citer l'auteur (Guillaume de Digulleville) et la transcriptrice (Béatrice Stumpf)
Les dossiers de Bouvard et Pécuchet/index.php/les-dossiers-de-bouvard-et-pecuchetFrançais, Latin, Arabehttp://weboai.cahier.huma-num.fr/set/bouvardhttp://weboai.cahier.huma-num.fr/TEICC BY-NC-SA 3.0Agriculture, Médecine, Littérature, Philosophie, Religion, Amour, Politique, Histoire
Les interrogatives directes tirées de dix romans policier/index.php/les-interrogatives-directes-tirees-de-dix-romans-policierFrançaishttps://www.ortolang.fr/market/corpora/interrogatives-in-novelshttps://www.ortolang.frTexteLibre sans utilisation commerciale
Littéracie Avancée/index.php/litteracie-avanceeFrançaishttps://www.ortolang.fr/market/corpora/litteracieavanceehttps://www.ortolang.fr/TEIBy-NC-SA 3.0
Modélisation Contrastive et Computationnelle des Chaînes de Coréférence/index.php/modelisation-contrastive-et-computationnelle-des-chaines-de-coreferenceAncien français, Moyen français, Françaishttps://www.ortolang.fr/market/corpora/mc4https://www.ortolang.fr/TEILibre sans utilisation commerciale
Montesquieu Bibliothèque et éditions/index.php/montesquieu-bibliotheque-et-editionsFrançaishttp://weboai.cahier.huma-num.fr/set/montesquieuhttp://weboai.cahier.huma-num.fr/TEICC BY-NC-SA 3.0
Mooc Ville durable être acteur du changement/index.php/mooc-ville-durable-etre-acteur-du-changementFrançaishttps://www.ortolang.fr/market/corpora/mooc-ville-durable-etre-acteur-du-changementhttps://www.ortolang.fr/TEIBy-NC-SA 3.0
Orthocorpus/index.php/orthocorpusFrançais,https://www.ortolang.fr/market/corpora/orthocorpushttps://www.ortolang.fr/Réservé aux personnes Membres de l'ESR Libre sans utilisation commercialeOrthophonie, Article scientifique
ParCoGLiJe/index.php/parcoglijeFrançais et Anglaishttps://www.ortolang.fr/market/corpora/stosichttps://www.ortolang.fr/TEILibrecorpus parallèle, littérature de jeunesse, français-anglais
PARSEME-FR/index.php/parseme-frFrançaishttps://www.ortolang.fr/market/corpora/parseme-frhttps://www.ortolang.fr/coNLL-uexpressions polylexicales, verbales, annotation corpus
PayeTonCorpus/index.php/payetoncorpusFrançaishttps://www.ortolang.fr/market/corpora/payetoncorpushttps://www.ortolang.fr/TEICC BY-NC-SA 4.0
Présidentielle2017: corpus des tweets de la #présidentielle2017/index.php/presidentielle2017-corpus-des-tweets-de-la-presidentielle2017Françaishttps://www.ortolang.fr/market/corpora/corpus-presidentielle2017https://www.ortolang.frTEILibre Contraintes pour réutiliser tweets : Reprenez le texte complet du Tweet Vous ne devez pas supprimer, masquer ni modifier l’identification de l’utilisateur.
Rapports allemands sur l'intégration (1991-2014)/index.php/rapports-allemands-sur-lintegration-1991-2014Allemandhttps://www.ortolang.fr/market/corpora/rapports-allemands-sur-lintegrationhttps://www.ortolang.fr/pdfLibrerapports administratifs, intégration, immigration
Rapports français sur l'intégration (1991-2012)/index.php/rapports-francais-sur-lintegration-1991-2012Françaishttps://www.ortolang.fr/market/corpora/rapports-francais-sur-lintegrationhttps://www.ortolang.fr/pdfLibrerapports administratifs, intégration, immigration, Haut Conseil à l'Intégration (HCI)
Recherches sur le français parlé/index.php/recherches-sur-le-francais-parleFrançaishttps://www.ortolang.fr/market/corpora/recherches-francais-parlehttps://www.ortolang.fr/TEILicence Creative Commons Attribution - Pas d'utilisation commerciale - Partage dans les Mêmes Conditions 4.0 Internationalfrançais parlé, linguistique, syntaxe
Résolutions du Conseil de sécurité de l'ONU 1946-2015/index.php/resolutions-du-conseil-de-securite-de-lonu-1946-2015Français et Anglaishttps://www.ortolang.fr/market/corpora/csonuhttps://www.ortolang.fr/Libre sans utilisation commerciale
Scientext/index.php/scientextFrançaishttp://ortolang107.inist.fr/?fnomCorpus=Scientext+2010+E&locale=frhttps://www.projet-orfeo.fr/TEICC-by-NC
TermITH (Terminologie et Indexation de Textes intégraux en sciences Humaines et sociales)/index.php/termith-terminologie-et-indexation-de-textes-integraux-en-sciences-humaines-et-socialesFrançaishttps://www.ortolang.fr/market/corpora/termithhttps://www.ortolang.fr/TEIDans chaque catégories, les corpus disciplinaires ne sont disponibles que pour les membres de l'ESR. The Creative Commons Attribution 4.0 International License applies to this document. Selon la convention signée avec l'éditeur, le présent document n'est utilisable que par les partenaires du projet TermITH dans le cadre des traitements développés pour TermITH.
Théâtre de Louis de Boissy/index.php/theatre-de-louis-de-boissyFrançaishttp://weboai.cahier.huma-num.fr/set/boissyhttp://weboai.cahier.huma-num.fr/TEICC BY-NC-SA 4.0Théâtre, Comédie
WikiDisc/index.php/wikidiscFrançaishttps://www.ortolang.fr/market/corpora/wikidischttps://www.ortolang.fr/TEI-P5Following Wikipedia.fr recommendation this corpus (and all its related contents) can be freely distributed and shared subject only to attribution, and share alike.
MPF (Multicultural Paris French)françaishttps://www.ortolang.fr/market/corpora/mpfhttps://www.ortolang.fr/.txtLicence Creative Commonsbanlieue ; contacts de langues ; français multiculturel oral ; non standard ; vernaculaire urbain contemporain ; proximité comm
Aliento - Analyse Linguistique & Interculturelle des ENoncés sapientiels brefs et Transmission Orient/Occident-Occident/Orientfrançais, espagnol, anglaishttps://base.aliento.eu/accueilhttps://www.aliento.eu/fr/actualites/XML/UTF-8 cf. https://www.aliento.eu/fr/methodologie-dappariement/les-standards-informatiques-utilises/L'accès est possible depuis le site en trois langues: https://www.aliento.eu/en/news/ et https://www.aliento.eu/es/noticias/base de données, énoncés sapientiels, moyen âge, circulation, multilangues, multicultures