Réunion du 31 mai

Quand

31/05/2012    
13h30 - 18h00

Programme

13h30 : accueil des participants

Merci à tous les participants (présentateurs et non présentateurs) d’être bien présents à cette heure là afin de procéder aux vérifications techniques de dernière minute.

Chaque présentateur déroulera un diaporama dans Adobe Connect en le commentant. Après chaque groupe de présentation, une discussion libre s’en suivra entre les participants. Notez que chaque participant pourra, en cours de présentation, sans gêner le canal audio, donc sur le clavardage, s’exprimer. Les diaporamas des présentateurs sont centralisés et envoyés à Thierry à l’avance (précisions déjà données aux présentateurs) de façon à pouvoir être techniquement essayés et chargés dans Adobe Connect avant la réunion.

Seront également parmi nous, en ligne : Paul Lotin, ingénieur de recherche du LRL et Linda Hriba, ingénieure de l’IR-Corpus , diaporama

14h : Partie 1 : communiquer en quelques signes : Texto, SMS, Twitter

    • Georges Antoniadis : “Alpes4science: corpus de SMS réels dans les Alpes” : 14 mn, diaporama
      • Le Centre de l’Oralité Alpine du Conseil Général des Hautes-Alpes, associé au laboratoire LIDILEM, est à l’origine de la constitution du corpus de SMS réels « Alpes4science » collectés dans les Alpes. Le projet fait partie du projet international sms4science qui vise à constituer et exploiter des corpus de SMS dans plusieurs pays et pour plusieurs langues. Nous présenterons ici, les buts, la méthodologie et les écueils de la collecte, ainsi que le travail d’anonymisation et de transcription des SMS effectué jusqu’ici. Nous conclurons par quelques pistes d’exploitation et d’analyse des données collectées.
    • Rachel Panckhurst (Praxiling) : “Un nouveau corpus de SMS. La collecte sud4science Languedoc-Roussillon ”. 14mn, diaporama
      • La récolte de SMS dans le cadre du projet sud4science Languedoc-Roussillon. Mutation des pratiques scripturales en communication électronique médié (http://www.sud4science.org et http://www.msh-m.fr/programmes-2011/sud4science-lr), lui-même intégré dans le projet international sms4science (http://www.sms4science.org/, Fairon et al. 2006) s’est déroulée à l’automne 2011 à Montpellier. Cette communication succincte retrace l’organisation, le déroulement de la collecte de SMS authentiques (« isolés ») et évoque rapidement les procédures prévues pour le traitement et l’analyse des données recueillies. Une deuxième collecte est prévue en 2013, afin de constituer un corpus de SMS de type « conversationnel », en situation d’échanges.
    • Béatrice Turpin : “Pratiques d’écriture profanes et professionnelles sur les réseaux sociaux” : 12 mn, diaporama
      • L’intervention se centrera sur Twitter, et présentera une recherche naissante sur les pratiques d’écriture propres à ce réseau social (recoupant une thématique, celle de la banlieue)
  • Discussion : 20 mn

15h : Partie 2 : repérage de perspectives, opinions multiples et génétique des corpus

    • Céline Poudat : Deux exemples d’exploration d’opinions multiples: 20mn, diaporama
      • Nous présentons deux exemples d’exploration d’opinions multiples impliquant deux méthodologies distinctes : une analyse des controverses dans Wikipédia, menée dans le cadre du projet Autograph (collab. Télécom ParisTech et Limsi, Auray et al. 2009) et une étude de la régulation des avis sur le web marchand, à travers l’analyse et l’annotation de commentaires d’internautes sur Amazon.fr (projet Confidence, Legallois&Poudat 2008).
    • Claire Doquet : approche génétique des corpus : 20 mn, diaporama
      • La génétique textuelle, née en France dans les années 1970 et appuyée tout d’abord sur des manuscrits, est particulièrement adaptée à l’étude de l’écriture électronique dès lors que cette dernière est capturée en temps réel. Nous présenterons les grandes lignes de l’analyse génétique de l’écriture ainsi que les modifications liées aux corpus en temps réel qui commencent à être collectés.
  • discussion : 20 mn
16h : Pause : 30 mn

16h30 Partie 3 :

    • Thierry Chanier : Corpus d’apprentissage (LETEC) et nouvelles formes de communication : 20mn, diaporama
      • Les corpus d’apprentissage assemblent les données correspondant à des formations en ligne et, notamment, les interactions entre les participants (enseignants, apprenants). Nous indiquerons comment sont rassemblées ces données textuelles provenant de blogues, courriels, forums, clavardage ; pourquoi il est intéressant de pouvoir les relier à des fins d’analyses, analyses que nous esquisserons. Nous indiquerons également quelques liens et analyses entre ces données textuelles et d’autres orales ou non verbales.
    • Natalia Grabar : Corpus biomédicaux distingués selon leur discours et spécialisation: patient et expert : 20mn, diaporama
      • Je présenterai les corpus qui proposent la distinction entre les documents a destination des patients et des experts du domaine biomedical. Leur présentation comporte des informations qualitatives et quantitatives. je mentionnerai aussi quelques projets et applications ou ces corpus sont utilises.
  • discussion : 20 mn

17h30 : Partie 4 : discussion ouverte sur activités du groupe et préparation du 28 juin

18h : clôture de la réunion