Vous pouvez proposer un nouveau corpus à ajouter à l’inventaire via ce formulaire.
Nom | Fiche | Langue | Corpus | Site | Formats | Accès | Mots clefs |
---|---|---|---|---|---|---|---|
4-Couv | /index.php/4-couv | Français | https://www.ortolang.fr/market/corpora/4-couv | https://www.ortolang.fr | Libre | corpus arboré, treebank, analyse en constituants, quatrième de couverture | |
ALLy | /index.php/ally | Français, Occitan, Franco-Provençal | https://www.ortolang.fr/market/corpora/ally | https://www.ortolang.fr/ | Réservé à certains membres | Atlas | |
AMPLOR | /index.php/amplor | Moyen français | https://www.ortolang.fr/market/corpora/amplor | https://www.ortolang.fr | TEI | licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Pas de Modification 3.0 non transposé | |
ANNODIS | /index.php/annodis | Français | http://ortolang107.inist.fr/?fnomCorpus=ANNODIS+E&locale=fr | https://www.projet-orfeo.fr/ | TEI | By -NC-SA 3.0 | |
Archive Numérique Desanti (IHRIM UMR5317) | /index.php/archive-numerique-desanti-ihrim-umr5317 | Français | http://weboai.cahier.huma-num.fr/set/desanti | http://weboai.cahier.huma-num.fr/ | Tous droits réservés | ||
Base de Français Médiéval (BFM) | /index.php/base-de-francais-medieval-bfm | Français, Dialectes français | http://weboai.cahier.huma-num.fr/set/bfm | http://weboai.cahier.huma-num.fr/ | TEI | Domaine public, licence Etalab Le fichier XML-TEI préparé par l'équipe de la BFM est mis à disposition sous licence Etalab sur demande par mail auprès de l'administrateur de la BFM. | |
Bibliothèques virtuelles humanistes – Corpus Epistemon | /index.php/bibliotheques-virtuelles-humanistes-corpus-epistemon | Langue Français, Latin, Grec, Italien, Espagnol, Allemand, Gascon, Hébreu, Langue artificielle, Arabe, Basque, Araméen, Limousin, Néerlandais, Ancien araméen, Breton, Béarnais, Danois, Ecossais, Latin macaronique, Lorrain, Picard, Poitevin, Portugais, Tupi | http://weboai.cahier.huma-num.fr/set/epistemon | http://weboai.cahier.huma-num.fr/ | TEI | Creative Commons Attribution – Non Commercial – ShareAlike 4.0 International Licence. | Littérature, histoire, correspondance, économie |
Chambers-Rostand | /index.php/chambers-rostand | Français | http://ortolang107.inist.fr/?fnomCorpus=Chambers-Rostand+E&locale=fr | https://www.projet-orfeo.fr/ | TEI | CC-by-NC | |
CHISPA Edition numériques des archives de José Mora Guarnido | /index.php/chispa-edition-numeriques-des-archives-de-jose-mora-guarnido | Espagnol | http://weboai.cahier.huma-num.fr/set/chispa | http://weboai.cahier.huma-num.fr/ | CC BY-NC-SA 3.0 | ||
CoMeRe | /index.php/comere | Français | https://www.ortolang.fr/market/corpora/comere | https://www.ortolang.fr/ | TEI | CC-by-NC | |
Corpus 14 | /index.php/corpus-14/ | Français | https://www.ortolang.fr/market/corpora/corpus14 | https://www.ortolang.fr/ | TEI | Licence Creative Commons Attribution – Pas d'Utilisation Commerciale - Partage à l'Identique 3.0 France | |
Corpus d'articles de linguistiques issus de la revue "Sciences Humaines" | /index.php/corpus-darticles-de-linguistiques-issus-de-la-revue-sciences-humaines | Français | https://www.ortolang.fr/market/corpora/scienceshumaines | https://www.ortolang.fr/ | TEI | CC BY-NC-SA 2.0 | |
Corpus ÉMA, écrits scolaires | /index.php/corpus-ema-ecrits-scolaires | Français | https://www.ortolang.fr/market/corpora/ema-ecrits-scolaires-1 | https://www.ortolang.fr/ | Écriture scolaire, Texte argumentatif, Texte narratif | ||
Corpus journalistique issu de l'Est Républicain | /index.php/corpus-journalistique-issu-de-lest-republicain | Français | https://www.ortolang.fr/market/corpora/est_republicain | https://www.ortolang.fr/ | TEI | Libre dans un cadre de recherche ou d'enseignement à l'exclusion de toute utilisiation commerciale et sous réserve de citation de la source : Est Républicain | |
Correspondance de Pierre Bayle | /index.php/correspondance-de-pierre-bayle | Français | http://weboai.cahier.huma-num.fr/set/bayle | http://weboai.cahier.huma-num.fr/ | CC BY-NC-SA 3.0 FR | correspondance, Pierre Bayle, République des Lettres | |
Cuentos de Horacio Quiroga | /index.php/cuentos-de-horacio-quiroga | Espagnol | http://weboai.cahier.huma-num.fr/set/quiroga | http://weboai.cahier.huma-num.fr/ | TEI | CC-BY-NC-ND | Cuento, Realismo mágico, Fantástico, Naturalismo, Uruguay, Quiroga Nouvelle, Réalisme magique, Fantastique, Naturalisme, Uruguay, Quiroga |
Débats parlementaires sur l'Europe à l'Assemblée nationale (2002-2012) | /index.php/debats-parlementaires-sur-leurope-a-lassemblee-nationale-2002-2012 | Français | https://www.ortolang.fr/market/corpora/fr-parl | https://www.ortolang.fr/ | TEI | CC BY 4.0 | discours politique, débats parlementaires, Europe |
Débats parlementaires sur l'Europe à la House of Commons (1998-2015) | /index.php/debats-parlementaires-sur-leurope-a-la-house-of-commons-1998-2015 | Anglais | https://www.ortolang.fr/market/corpora/uk-parl | https://www.ortolang.fr/ | TEI | CC BY 4.0 | discours politique, débats parlementaires, Europe |
Débats parlementaires sur l'Europe au Bundestag (1998-2015) | /index.php/debats-parlementaires-sur-leurope-au-bundestag-1998-2015 | Allemand | https://www.ortolang.fr/market/corpora/de-parl | https://www.ortolang.fr/ | TEI | CC BY 4.0 | discours politique, débats parlementaires |
DEDE : un corpus annoté pour le traitement des DEscriptions DEfinies | /index.php/dede-un-corpus-annote-pour-le-traitement-des-descriptions-definies | Français | https://www.ortolang.fr/market/corpora/dede | https://www.ortolang.fr/ | Le corpus annoté est librement téléchargeable. | ||
Democrat | /index.php/democrat | Ancien français, Moyen français, Français | https://www.ortolang.fr/market/corpora/democrat | https://www.ortolang.fr/ | TEI | Creative Commons Attribution-ShareAlike 3.0 | référence, coréférence, expression référentielle |
Edition de la correspondance et des archives de Marc Michel Rey | /index.php/edition-de-la-correspondance-et-des-archives-de-marc-michel-rey | Français | http://weboai.cahier.huma-num.fr/set/rey | http://weboai.cahier.huma-num.fr/ | TEI | CC BY-NC-ND 3.0 FR | |
Dictionnaire électronique de Troyes | /index.php/dictionnaire-electronique-de-troyes | Ancien français | https://www.ortolang.fr/market/corpora/dect | https://www.ortolang.fr/ | TEI | Les fichiers TEI ne sont disponibles que pour les membres de l'espace de travail Licence Creative Commons Attribution - Pas d'utilisation commerciale - Partage dans les Mêmes Conditions 2.0 Générique | Chrétien de Troyes |
FRANTEXT | /index.php/frantext | Français | http://ortolang107.inist.fr/?fnomCorpus=FRANTEXT+E&locale=fr | https://www.projet-orfeo.fr/ | TEI | Libre dans un cadre de recherche ou d'enseignement | |
Interviews d'Alphonse Daudet dans la presse parisienne (1883-1897) | /index.php/interviews-dalphonse-daudet-dans-la-presse-parisienne-1883-1897 | Français | https://www.ortolang.fr/market/corpora/interviewsdaudet | https://www.ortolang.fr/ | TEI | Libre sans utilisation commerciale | Interviews, Presse, XIXe siècle, Conversation, Alphonse Daudet |
Journal intime de Leonore Alt | /index.php/journal-intime-de-leonore-alt | Allemand | https://www.ortolang.fr/market/corpora/leonore-alt | https://www.ortolang.fr/ | Licence Creative Commons - Attribution 4.0 International | ||
Le Pelerinage de Vie humaine de Guillaume de Digulleville | /index.php/le-pelerinage-de-vie-humaine-de-guillaume-de-digulleville | Moyen français | https://www.ortolang.fr/market/corpora/digulleville | https://www.ortolang.fr/ | TEI | Ce texte est librement utilisable et rediffusable sous la condition de citer l'auteur (Guillaume de Digulleville) et la transcriptrice (Béatrice Stumpf) | |
Les dossiers de Bouvard et Pécuchet | /index.php/les-dossiers-de-bouvard-et-pecuchet | Français, Latin, Arabe | http://weboai.cahier.huma-num.fr/set/bouvard | http://weboai.cahier.huma-num.fr/ | TEI | CC BY-NC-SA 3.0 | Agriculture, Médecine, Littérature, Philosophie, Religion, Amour, Politique, Histoire |
Les interrogatives directes tirées de dix romans policier | /index.php/les-interrogatives-directes-tirees-de-dix-romans-policier | Français | https://www.ortolang.fr/market/corpora/interrogatives-in-novels | https://www.ortolang.fr | Texte | Libre sans utilisation commerciale | |
Littéracie Avancée | /index.php/litteracie-avancee | Français | https://www.ortolang.fr/market/corpora/litteracieavancee | https://www.ortolang.fr/ | TEI | By-NC-SA 3.0 | |
Modélisation Contrastive et Computationnelle des Chaînes de Coréférence | /index.php/modelisation-contrastive-et-computationnelle-des-chaines-de-coreference | Ancien français, Moyen français, Français | https://www.ortolang.fr/market/corpora/mc4 | https://www.ortolang.fr/ | TEI | Libre sans utilisation commerciale | |
Montesquieu Bibliothèque et éditions | /index.php/montesquieu-bibliotheque-et-editions | Français | http://weboai.cahier.huma-num.fr/set/montesquieu | http://weboai.cahier.huma-num.fr/ | TEI | CC BY-NC-SA 3.0 | |
Mooc Ville durable être acteur du changement | /index.php/mooc-ville-durable-etre-acteur-du-changement | Français | https://www.ortolang.fr/market/corpora/mooc-ville-durable-etre-acteur-du-changement | https://www.ortolang.fr/ | TEI | By-NC-SA 3.0 | |
Orthocorpus | /index.php/orthocorpus | Français, | https://www.ortolang.fr/market/corpora/orthocorpus | https://www.ortolang.fr/ | Réservé aux personnes Membres de l'ESR Libre sans utilisation commerciale | Orthophonie, Article scientifique | |
ParCoGLiJe | /index.php/parcoglije | Français et Anglais | https://www.ortolang.fr/market/corpora/stosic | https://www.ortolang.fr/ | TEI | Libre | corpus parallèle, littérature de jeunesse, français-anglais |
PARSEME-FR | /index.php/parseme-fr | Français | https://www.ortolang.fr/market/corpora/parseme-fr | https://www.ortolang.fr/ | coNLL-u | expressions polylexicales, verbales, annotation corpus | |
PayeTonCorpus | /index.php/payetoncorpus | Français | https://www.ortolang.fr/market/corpora/payetoncorpus | https://www.ortolang.fr/ | TEI | CC BY-NC-SA 4.0 | |
Présidentielle2017: corpus des tweets de la #présidentielle2017 | /index.php/presidentielle2017-corpus-des-tweets-de-la-presidentielle2017 | Français | https://www.ortolang.fr/market/corpora/corpus-presidentielle2017 | https://www.ortolang.fr | TEI | Libre Contraintes pour réutiliser tweets : Reprenez le texte complet du Tweet Vous ne devez pas supprimer, masquer ni modifier l’identification de l’utilisateur. | |
Rapports allemands sur l'intégration (1991-2014) | /index.php/rapports-allemands-sur-lintegration-1991-2014 | Allemand | https://www.ortolang.fr/market/corpora/rapports-allemands-sur-lintegration | https://www.ortolang.fr/ | Libre | rapports administratifs, intégration, immigration | |
Rapports français sur l'intégration (1991-2012) | /index.php/rapports-francais-sur-lintegration-1991-2012 | Français | https://www.ortolang.fr/market/corpora/rapports-francais-sur-lintegration | https://www.ortolang.fr/ | Libre | rapports administratifs, intégration, immigration, Haut Conseil à l'Intégration (HCI) | |
Recherches sur le français parlé | /index.php/recherches-sur-le-francais-parle | Français | https://www.ortolang.fr/market/corpora/recherches-francais-parle | https://www.ortolang.fr/ | TEI | Licence Creative Commons Attribution - Pas d'utilisation commerciale - Partage dans les Mêmes Conditions 4.0 International | français parlé, linguistique, syntaxe |
Résolutions du Conseil de sécurité de l'ONU 1946-2015 | /index.php/resolutions-du-conseil-de-securite-de-lonu-1946-2015 | Français et Anglais | https://www.ortolang.fr/market/corpora/csonu | https://www.ortolang.fr/ | Libre sans utilisation commerciale | ||
Scientext | /index.php/scientext | Français | http://ortolang107.inist.fr/?fnomCorpus=Scientext+2010+E&locale=fr | https://www.projet-orfeo.fr/ | TEI | CC-by-NC | |
TermITH (Terminologie et Indexation de Textes intégraux en sciences Humaines et sociales) | /index.php/termith-terminologie-et-indexation-de-textes-integraux-en-sciences-humaines-et-sociales | Français | https://www.ortolang.fr/market/corpora/termith | https://www.ortolang.fr/ | TEI | Dans chaque catégories, les corpus disciplinaires ne sont disponibles que pour les membres de l'ESR. The Creative Commons Attribution 4.0 International License applies to this document. Selon la convention signée avec l'éditeur, le présent document n'est utilisable que par les partenaires du projet TermITH dans le cadre des traitements développés pour TermITH. | |
Théâtre de Louis de Boissy | /index.php/theatre-de-louis-de-boissy | Français | http://weboai.cahier.huma-num.fr/set/boissy | http://weboai.cahier.huma-num.fr/ | TEI | CC BY-NC-SA 4.0 | Théâtre, Comédie |
WikiDisc | /index.php/wikidisc | Français | https://www.ortolang.fr/market/corpora/wikidisc | https://www.ortolang.fr/ | TEI-P5 | Following Wikipedia.fr recommendation this corpus (and all its related contents) can be freely distributed and shared subject only to attribution, and share alike. | |
MPF (Multicultural Paris French) | français | https://www.ortolang.fr/market/corpora/mpf | https://www.ortolang.fr/ | .txt | Licence Creative Commons | banlieue ; contacts de langues ; français multiculturel oral ; non standard ; vernaculaire urbain contemporain ; proximité comm | |
Aliento - Analyse Linguistique & Interculturelle des ENoncés sapientiels brefs et Transmission Orient/Occident-Occident/Orient | français, espagnol, anglais | https://base.aliento.eu/accueil | https://www.aliento.eu/fr/actualites/ | XML/UTF-8 cf. https://www.aliento.eu/fr/methodologie-dappariement/les-standards-informatiques-utilises/ | L'accès est possible depuis le site en trois langues: https://www.aliento.eu/en/news/ et https://www.aliento.eu/es/noticias/ | base de données, énoncés sapientiels, moyen âge, circulation, multilangues, multicultures |