Annotation des langues des signes (sign language annotation)

A l'heure actuelle, l'annotation des langues des signes consiste généralement à 1) définir un ensemble de pistes d'annotations qui vont permettre d'annoter plusieurs ou l'ensemble des articulateurs mobilisés en LS (buste, épaules, bras, mains, tête, regard, joues, sourcils, bouche), 2) segmenter temporellement la production en unités, 3) identifier ces unités à l'aide de catégories qui dépendent de l'approche choisie (annotation de la forme ou de la fonction) ou à l'aide de gloses. Généralement, une piste supplémentaire comporte une traduction approchée en français écrit.

Problématique de la transcription de la LS : Il existe divers systèmes spécifiques pour la notation des LS, dont les deux principaux sont HamNoSys et SignWriting. HamNoSys est un système qui se veut phonétique et qui permet de décrire la forme des signes conventionnalisés (voir unité gestuelle) selon cinq paramètres (configuration, emplacement, mouvement, orientation, mimique). Il est monolinéaire et existe sous forme d'une police de caractères qui peut être utilisée dans les logiciels d'annotation ELAN et iLex. Il est d’une relative efficacité pour la représentation de signes isolés mais ne permet pas de représenter le discours en LS, caractérisé par une exploitation massive de l’espace et l’implication simultanée dans la construction du sens des différentes composantes corporelles. SignWriting a été conçu au départ pour permettre l'écriture des LS. Il propose une représentation multilinéaire et en partie analogique. Il fait notamment depuis une décennie l’objet d’expérimentations prometteuses pour la transcription du discours en LS italienne. Cependant, la non standardisation de ses règles d’écriture (orthographie) d’une part, les difficultés de son implémentation informatique d’autre part, en limitent, à ce jour, l’utilisation pour la transcription des corpus de LS au sein des logiciels d'annotation. Ainsi, il n'existe pas à ce jour de système permettant de transcrire les langues des signes.

Annotation par gloses (Gloss-based notation) : Expression consacrée dans le champ international des recherches linguistiques sur les langues des signes (LS) pour désigner les pratiques consistant à représenter le discours en LS par l’écrit d’une langue vocale (LV) (la LV du pays hébergeant la LS et/ou une LV internationale).

Base de la majorité des annotations de corpus de LS jusqu'à maintenant, cette modalité de représentation y est le plus souvent utilisée dès la première piste, alignée sur le signal. Peu standardisés, variant selon les chercheurs et les pays, les modes de recours à la LV écrite y sont hétérogènes, allant de l’étiquetage des unités LS par un (parfois 2 ou 3) mots de la LV —ce qui dans le champ est appelé « glose »— (ex. CHEVAL, pour le signe LS signifiant « cheval ») à l’usage de divers types d’abréviations porteuses d’informations formelles, catégorielles et/ou morpho-syntaxiques (ex : IX1, pour un pointage manuel pronom de 1ère personne).

ID-Gloss : Forme d'annotation par gloses qui tend à devenir le standard actuel. Dans le contexte de l’annotation de corpus de discours en langue des signes (LS), l’ID-Gloss (de l’anglais Identifying Gloss, cf. Johnston 2001) est un mot de la langue vocale annotatrice (choisie par l’annotateur) utilisé de manière systématisée et consistante pour labelliser un signe (voir unité gestuelle) au sein d’un corpus, abstraction faite des variations sémantiques contextuelles et des variations morphologiques et morpho-syntaxiques de ce signe. L’ID-Glose prétend en effet renvoyer à la forme lemmatisée (lemme, ou lexème, selon les terminologies, ou encore forme de citation) du signe (type vs token). Même si le choix du mot de la LV est motivé par sa proximité sémantique avec le signe, l’ID-Gloss n’est pas censée, à quelque titre que ce soit, être une traduction de ce signe.

L’établissement et l’assignation d’ID-Gloss requièrent que la LS annotée par leur biais ait fait l’objet d’une lemmatisation (sur les débats relatifs aux procédures de lemmatisation et d’assignation des ID-Gloses, voir notamment Johnston 2008, 2011 et Konrad 2011).

L’utilisation d’ID-Gloss dans l’annotation appuyée sur des logiciels d’annotation multimédia comme ELAN ou iLex, qui nécessite l’association à une base de données lexicales consistante et évolutive, vise à permettre une annotation régulière et homogène, permettant des requêtes significatives.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)

Langue: 
Français

Il n'y a actuellement aucun contenu classé avec ce terme.

Souscrire à RSS - Annotation des langues des signes (sign language annotation)