Présidentielle2017: corpus des tweets de la #présidentielle2017

FICHE DESCRIPTIVE DU CORPUS

LangueFrançais
Format des métadonnéesTEI
AccèsLibreContraintes pour réutiliser tweets : Reprenez le texte complet du Tweet Vous ne devez pas supprimer, masquer ni modifier l’identification de l’utilisateur.
SiteORTOLANGLien vers le corpus
Mots-clés
Type de textesNouveau mode de communication (Tweet, SMS, etc)
Taille du corpus44 979 tweets

INFORMATIONS SUR LES TEXTES

Auteurs des textesOUI (ID de l’auteur du tweet)
DatesOUI (année/mois/jour – heure/minute/seconde)
NotesPour chaque personne ayant tweeté : Nom, pseudo et lien vers le profilAutres informations sur les tweets : le nombre de fois que le tweet a été mis en favori, le nombre de retweet, s’il a été retweeté ou non s’il a été tronqué ou non, s’il a été mis en favori ou non …

EXEMPLE

<post xml:id= »cmr-présidentielle-a862332030624948224″ who= »#cmr-présidentielle-p80820758″

when= »2017-05-10T17:42:32.0″ xml:lang= »fra »>

<p> (2/2) Ils préfèrent créer une nouvelle majorité cohérente plutôt que les alliances à géométrie variable opportunistes de leur direction. </p>

<trailer>

<fs>

<f name= »medium »>

<string>Twitter Web Client</string></f>

<f name= »favoritecount »>

<numeric value= »806″/></f>

<f name= »retweetcount »>

<numeric value= »375″/></f>

</fs>

</trailer>

</post>