DAM: Des Données Aux Modèles

Professeure de Sciences du langage à l’Université Paris Nanterre, je mène depuis vingt ans des recherches portant sur la constitution, le traitement et l’analyse des corpus avec les outils informatiques. Mes travaux s’inscrivent dans les trois domaines : Traitement Automatique des Langues (TAL), linguistique de corpus et humanités numériques où je mets à profit mes connaissances linguistiques pour améliorer des solutions informatiques. Deux préoccupations paramètrent mes travaux : la prise en considération de la nature des corpus traités et la modélisation de l’information linguistique destinée à l’analyse.


L’état de ce compte est « Approuvés »
Informations institutionnelles
Eshkol-Taravella
Iris
Université Paris Nanterre
Membre principal
Enseignant-chercheur
Professeur des universités
Classe 1
Habilité à diriger des recherches
Activité scientifique
DAM: Des Données Aux Modèles

L1 SDL : Linguistique et nouvelles technologies
L2 SDL : Humanités numériques
M1 TAL : Python
M1 TAL : Bases de données
M1 TAL : Enrichissement de corpus
M2 TAL : De la modélisation au traitement automatique
M2 TAL : Langages du Web sémantique
M2 TAL : TAL et Ingénierie des connaissances

- Yeo Jun YUN. 1.09.2023 Détection, classification et analyse d’ellipses interrogatives dans un corpus du français parlé (thèse co-dirigée avec Marianne DESMETS)
- Vanessa GAUDRAY. 1.10.2022 Détection automatique d’erreurs de reprise dans les rédactions étudiantes (thèse financée par le projet ANR ecri+ et co-dirigée avec Sabine LEHMANN)
- Aurore LESSIEUX. 1.10.2022 Analyse automatique de la perception des projets d’aménagement de territoire dans les corpus mulimodaux (thèse financée par le projet Labex Vital et co-dirigée avec Olivier RATOUIS)
- Ousseynou GUEYE. 1.09.2020-3.12.2024 Personnalisation adaptative de problèmes mathématiques arithmétiques pour élèves de CM1-CM2 à l’aide de grands modèles de langue via ingénierie de prompt.
- Laura NORESKAL. 1.09.2018-14.12.2022 Erreurs dans les phrases coordonnées au sein des rédactions universitaires : typologie et détection (thèse sur contrat doctoral d’établissement, projet ECRI+, co-dirigée avec Marianne DESMETS)
- Hyun Jung Kang. 1.09.2016-28.01.2021 Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus. (bourse d’études de gouvernement coréen)
- Hélène Flamein. 1.10.2015-10.12.2019 Étude de la perception d’une ville. Repérage automatique, analyse et visualisation. (thèse sur contrat doctoral d’établissement)
- Sandra Cestic. 1.09.2013-11.03.2019 Perception du bruit et de la température en milieu professionnel. Outils et méthodes de la linguistique de corpus pour améliorer les environnements de travail. (thèse CIFRE)

2024- Co-responsable du pôle DAM du laboratoire MoDyCo
2020- Membre du conseil du laboratoire MoDyCo

2020- Responsable du Master TAL, Université Paris Nanterre
2017-2020 Directrice du département Sciences du Langage, Université Paris Nanterre

Publications HAL-SHS
Déroulez la liste des publications dans chaque groupe
133 documents

  • Marina Baidina, Iris Eshkol-Taravella, Jean-Luc Minel, Camille Debras, Valentin-Gabriel Soumah. Représentations de La Défense dans la presse écrite et sur Twitter : analyse outillée. Colloque international ONELA (Outils et Nouvelles Explorations de la Linguistique Appliquée), Oct 2021, Toulouse, France. ⟨hal-04069877⟩
  • Angèle Barbedette, Iris Eshkol-Taravella. Quand les questions en disent plus que les réponses : classification automatique des intentions dans les questions. Discours - Revue de linguistique, psycholinguistique et informatique, 2021, 28, ⟨10.4000/discours.11359⟩. ⟨hal-03660726⟩
  • Iris Eshkol-Taravella, Hélène Flamein, Valentin-Gabriel Soumah. Désigner un espace : une étude outillée de deux corpus. De l'espace à la langue, CPTC Université de Bourgogne, Oct 2021, Dijon, France. ⟨hal-04071491⟩
  • Laura Noreskal, Iris Eshkol-Taravella, Marianne Desmets. Erroneous Coordinated Sentences Detection in French Students’ Writings. Advances in Computational Collective Intelligence, 1463, Springer International Publishing, pp.586-596, 2021, Communications in Computer and Information Science, ⟨10.1007/978-3-030-88113-9_47⟩. ⟨hal-03697928⟩
  • Camille Debras, Iris Eshkol-Taravella, Corentin Vialar. Formes et fonctions des intitulés de postes en anglais : analyse discursive outillée d’un corpus d’annonces d’emplois en ligne. Journée d’étude Social Studies of the English Language in France and the French-speaking world (SSELFF), Jun 2021, Metz, France. ⟨hal-04071988⟩
  • Iris Eshkol-Taravella, Valentin-Gabriel Soumah. Etude de la représentation du quartier d’affaire de La Défense dans la presse française. SAGEO 2021 (16th Spatial Analysis and Geomatics Conference), May 2021, La Rochelle, France. ⟨hal-04072011⟩
  • Hélène Flamein, Iris Eshkol-Taravella. Exploitation du corpus Enquêtes sociolinguistiques à Orléans (ESLO) par les outils du traitement automatique des langues et de la géomatique. Humanités numériques, 2021, 3, ⟨10.4000/revuehn.1911⟩. ⟨hal-03660732⟩
  • Iris Eshkol-Taravella. La synonymie dans les reformulations à l’oral et à l’écrit spontanés. Syntaxe et Sémantique, 2021, Synonymie, polysémie et questions de sémantique lexicale, 21 (1), pp.127-151. ⟨10.3917/ss.021.0127⟩. ⟨hal-03698187⟩
  • Hélène Flamein, Iris Eshkol-Taravella. Exploitation des données orales pour l’enrichissement de ressources lexicales. Christophe Roche. Terminologie et ontologie, théories et applications : actes de la conférence TOTh 2020 : Université de Savoie Mont Blanc, 26 & 27 novembre 2020, Presses Universitaires Savoie Mont Blanc, pp.137-152, 2021, Terminologica, 9782377410651. ⟨hal-03699519⟩
  • Hyun Jung Kang, Iris Eshkol-Taravella. Une étude des avis en ligne : généralisabilité d’un modèle d’évaluation. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.256-263. ⟨hal-03265872⟩
Autres Publications