FICHE DESCRIPTIVE DU CORPUS
Langue | Français |
Format des métadonnées | TEI |
Accès | LibreContraintes pour réutiliser tweets : Reprenez le texte complet du Tweet Vous ne devez pas supprimer, masquer ni modifier l’identification de l’utilisateur. |
Site | ORTOLANGLien vers le corpus |
Mots-clés | |
Type de textes | Nouveau mode de communication (Tweet, SMS, etc) |
Taille du corpus | 44 979 tweets |
INFORMATIONS SUR LES TEXTES
Auteurs des textes | OUI (ID de l’auteur du tweet) |
Dates | OUI (année/mois/jour – heure/minute/seconde) |
Notes | Pour chaque personne ayant tweeté : Nom, pseudo et lien vers le profilAutres informations sur les tweets : le nombre de fois que le tweet a été mis en favori, le nombre de retweet, s’il a été retweeté ou non s’il a été tronqué ou non, s’il a été mis en favori ou non … |
EXEMPLE
<post xml:id= »cmr-présidentielle-a862332030624948224″ who= »#cmr-présidentielle-p80820758″
when= »2017-05-10T17:42:32.0″ xml:lang= »fra »>
<p> (2/2) Ils préfèrent créer une nouvelle majorité cohérente plutôt que les alliances à géométrie variable opportunistes de leur direction. </p>
<trailer>
<fs>
<f name= »medium »>
<string>Twitter Web Client</string></f>
<f name= »favoritecount »>
<numeric value= »806″/></f>
<f name= »retweetcount »>
<numeric value= »375″/></f>
</fs>
</trailer>
</post>