BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//MoDyCo - ECPv6.15.11//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:MoDyCo
X-ORIGINAL-URL:https://modyco.fr
X-WR-CALDESC:Évènements pour MoDyCo
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20240331T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20241027T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20250330T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20251026T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20260329T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20261025T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20250401T140000
DTEND;TZID=Europe/Paris:20250401T160000
DTSTAMP:20260623T060229
CREATED:20250211T095909Z
LAST-MODIFIED:20250326T165605Z
UID:3912-1743516000-1743523200@modyco.fr
SUMMARY:Lydia-Mai HO-DAC (Université Toulouse Jean Jaurès) : annotation de données langagières avec INCEpTION [séance du réseau Mate-SHS]
DESCRIPTION:Dans le cadre du séminaire Modyco-Help\nMardi 1er avril 2025\nHoraire : 14h-16h\nLieu : salle A405\, bâtiment Rémond\, 4ème étage\, Université Paris Nanterre\nSéance proposée par Anne Lacheret-Dujour et Aude Da Cruz Lima \nPrésentation en visioconférence organisée par le réseau Mate-SHS dans la série des Tuto@Maté\nNous vous proposons de suivre la retransmission au laboratoire afin de faciliter les échanges. \nConcevoir et mener un projet d’annotation de données langagières avec INCEpTION \nPar Lydia-Mai HO-DAC est Maîtresse de conférences en Sciences du Langage à l’Université Toulouse Jean Jaurès dans le laboratoire CLLE (UM5263). Elle enseigne en linguistique de corpus et Traitement Automatique des Langues.Le projet Inception est développé dans le cadre du consortium CORLI. \nAnnoter un corpus\, c’est ajouter une ou plusieurs couches d’interprétation à des données langagières brutes (textes écrits numérisés ou discours oraux retranscrits). Les annotations sont réalisées lors de campagnes d’annotation par des annotateurs humains\, plus ou moins experts\, qui s’appuient sur un guide d’annotation et utilisent un outil d’annotation. \nL’annotation peut-être définie comme le processus par lequel un groupe d’annotateurs va avoir pour mission d’enrichir manuellement un corpus en y ajoutant des informations linguistiques qui peuvent être de nature très diversifiée : délimitation d’unités (e.g. morphèmes\, tokens\, unités de discours\, expressions référentielles\, entités nommées)\, mise en relation d’unités (e.g. relations syntaxiques\, relations de discours\, relations anaphoriques) ou étiquetage des unités ou des relations (e.g. partie du discours\, fonctions syntaxiques\, type sémantique\, acte de parole). \nCet atelier a pour objectif de revenir sur les éléments fondamentaux d’une campagne d’annotation de données langagières et présenter comment les mettre en oeuvre grâce à la plateforme INCEpTION. Cette plateforme propose des fonctionnalités pour mener des projets d’annotation complexes :\n– mise en place d’un projet d’annotation : import de corpus\, création de couches d’annotation\, mise à disposition des guides d’annotation\n– gestion de cohortes d’annotateurs\n– interface d’annotation\n– interface d’adjudication (i.e. phase de l’annotation qui consiste à trouver un consensus en cas de désaccord entre plusieurs annotateurs)\n– mesure de l’accord inter-annotateur pour évaluer la qualité des annotations récoltées\n– export des annotations dans différents formats \nParmi les atouts de la plateforme INCEpTION\, le caractère collaboratif nous intéresse particulièrement. Un projet d’annotation collaborative consiste à fédérer des annotateurs humains pour annoter un même jeu de données de façon asynchrone et à distance afin de constituer petit à petit une « grande » ressource annotée que ce soit un grand nombre de textes\, une grande diversité de couches d’annotation et/ou un grand nombre d’annotations communes pour mettre au jour les (dés)accords inter-annotateurs. Nous retrouvons ici la même idée que celle de construction collaborative à la base du projet Wikipedia. \nLe caractère collaboratif devrait assurer la mise à disposition d’annotations de qualité dans une quantité suffisante et fournir des données d’entraînement de modèles d’apprentissage automatique\, des données d’évaluation pour le traitement automatique du langage et des données pour réaliser des analyses quantitatives. \nLien : https://inception-project.github.io/ \nsource de l’évènement : https://mate-shs.cnrs.fr/actions/tutomate/tuto70_inception_ho-dac/
URL:https://modyco.fr/event/presentation-inception-annotation-donnees-langagieres/
LOCATION:Université Paris Nanterre\, 200 avenue de la république\, Nanterre\, 92000
END:VEVENT
END:VCALENDAR