- Cet évènement est passé
Séance 7 : 19 juin 2018 Iris Eshkol Taravella (MoDyCo, UMR 7114), Hélène Flamein (Université d’Orléans, LLL)
19 juin 2018 @ 11 h 00 min - 13 h 00 min
Iris Eshkol Taravella (Paris Nanterre, MoDyCo), Hélène Flamein (Université d’Orléans, LLL) – De la modélisation à la détection automatique
Les travaux présentés portent sur les données issues du corpus oral transcrit. Dans les deux cas, il s’agit de la même méthodologie de travail composée de plusieurs étapes :
– l’observation manuelle du corpus donne lieu à la modélisation d’un phénomène recherché sous forme d’étiquettes,
– le corpus est ainsi annoté manuellement, ce qui permet de faire son analyse quantitative et qualitative,
– le corpus annoté sert également de corpus de référence pour l’annotation automatique.
La première communication présentera un travail qui vise à analyser la perception que les habitants ont de leur ville. D’abord seront explicités les critères de constitution de corpus. Ensuite, la communication s’arrêtera sur les étapes nécessaires pour atteindre l’objectif visé : la détection de lieux en prenant compte leur variation à l’oral (Eshkol-Taravella et Flamein 2017, Flamein 2017), la modélisation et l’annotation manuelle de la perception des lieux repérés. Enfin, quelques perspectives du travail seront annoncées.
La deuxième communication portera sur le procédé de reformulation à l’oral mais aussi dans le forum du Web. Le travail présenté fait partie du domaine de la linguistique outillée et du TAL. Il a été effectué en collaboration avec Natalia Grabar (CNRS, STL, Université de Lille) (Eshkol-Taravella et Grabar 2014, 2017, Grabar et Eshkol-Taravella 2015, 2016). Après avoir introduit la notion de reformulation et sa modélisation multidimensionnelle, nous montrerons quelques résultats quantitatifs et qualitatifs obtenus grâce à l’annotation manuelle. La dernière partie sera consacrée aux expériences menées sur la détection automatique de ce processus.
Eshkol-Taravella I., Flamein H. (2017). « Dis-moi Orléans ». Repérage et analyse de la perception d’un lieu dans l’oral transcrit. Echo des études romanes, vol.XIII, n1, p.61-72.
Eshkol-Taravella I., Grabar N. (2016). Reformulation à l’oral et dans le forum Web. CMLF2016, Tours, France.
Eshkol-Taravella I., Grabar N. (2017). Nature de la répétition dans les reformulations à l’oral et sur le Web. La répétition en langue, Revue Repères-Dorif, n.13
Eshkol-Taravella I., Grabar N. (2017). Taxinomie dans les reformulations du point de vue de la linguistique du corpus. In F.Gerhard-Krait & H.Vassiliadou (Ed.) Taxinomies, approximation et flou, Revue syntaxe et sémantique, n.18, Presses Universitaires de Caen, p.149-184
Eshkol-Taravella I., Grabar N. (2014). Paraphrastic reformulations in spoken corpora. POLTAL 2014. Advances in Natural Language Processing Lecture Notes in Computer Science. Volume 8686, p. 425-437.
Flamein H., (2017). Annotation automatique des lieux dans l’oral spontané transcrit. Actes des RECITAL 2017, 30 juin 2017, Orléans.
Flamein H., (2017). Annotation d’éléments spatialisés dans l’oral transcrit. Actes de la 6e édition des JéTou. Les Interfaces en Sciences du Langage, 18 et 19 mai 2017, Toulouse.
Grabar N., Eshkol-Taravella I. (2015). …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux. TALN2015, Caen.
Grabar N., Eshkol-Taravella I. (2016). Detection of reformulations in Spoken French. LREC2016, Slovenia.
Grabar N., Eshkol-Taravella I. (2016). Why do we reformulate ? Automatic prediction of pragmatic functions. HrTAL2016, Croatia.