Frantext

Frantext est le nom d’une base de données de textes français : textes littéraires et philosophiques, mais aussi scientifiques et techniques (environ 10%), développée et maintenue au sein de l’ATILF-CNRS (ex INaLF). Elle a été créée autour d’un noyau de mille textes, dans les années 70, afin de fournir des exemples pour le Trésor de la Langue Française. Une fois le dictionnaire terminé, elle a continué à évoluer : d’abord mise à disposition dans les années 80 sous forme d’un CD ( » Discotext « ), elle a été mise en ligne sur le web en 1998 par l’informaticien auteur de son moteur de recherches, Jacques Dendien.

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projetLaboratoire ATILF (Analyse et Traitement Informatique de la Langue Française)
Dernière versionFrantext – Octobre 2014
AccessibilitéAccès à la version intégrale sur abonnement ici Accès en ligne à Frantext démonstration avec toutes les fonctionnalités sur un corpus de 40 textes libres de droits
Format des corpus en entréeTxt, Xml, Html
Fonctionnalités– Consultation et sélection de textes grâce à des critères bibliographiques (titres, auteurs, dates, genres littéraires)
– Recherche dans les textes (d’un mot, d’une expression)
– Calcul de fréquences (comptage du nombre d’occurrences d’un mot ou de plusieurs mots donnés)
– Expressions de séquences (recherche de contexte contenant une suite de mots consécutifs)
Annotations gérées par l’outilAnnotations morphosyntaxiques
DocumentationManuel d’utilisation
Type d’outilAnalyse
ViséeMoteur – Recherche d’informations – Traitement quantitatif

PRATIQUES ET USAGES DE FRANTEXT

  • 1. Fiche renseignée par : Véronique Montémont (Université Henri Poincaré – Nancy 1 – ATILF) , Frédéric Landragin (LaTTice – CNRS) :
Objectifs de rechercheCollecte d’exemples attestés sur des phénomènes linguistiques divers
PratiquesConcordance
ScénariosConcordancier en ligne sur corpus à définir par l’utilisateur (max 4842 textes / 261 850 685 occ) – concordances de cooccurrences – corpus annoté ou non