DAM: Des Données Aux Modèles

Professeure de Sciences du langage à l’Université Paris Nanterre, je mène depuis vingt ans des recherches portant sur la constitution, le traitement et l’analyse des corpus avec les outils informatiques. Mes travaux s’inscrivent dans les trois domaines : Traitement Automatique des Langues (TAL), linguistique de corpus et humanités numériques où je mets à profit mes connaissances linguistiques pour améliorer des solutions informatiques. Deux préoccupations paramètrent mes travaux : la prise en considération de la nature des corpus traités et la modélisation de l’information linguistique destinée à l’analyse.


L’état de ce compte est « Approuvés »
Informations institutionnelles
Eshkol-Taravella
Iris
Université Paris Nanterre
Membre principal
Enseignant-chercheur
Professeur des universités
Classe 1
Habilité à diriger des recherches
Activité scientifique
DAM: Des Données Aux Modèles

L1 SDL : Linguistique et nouvelles technologies
L2 SDL : Humanités numériques
M1 TAL : Python
M1 TAL : Bases de données
M1 TAL : Enrichissement de corpus
M2 TAL : De la modélisation au traitement automatique
M2 TAL : Langages du Web sémantique
M2 TAL : TAL et Ingénierie des connaissances

- Yeo Jun YUN. 1.09.2023 Détection, classification et analyse d’ellipses interrogatives dans un corpus du français parlé (thèse co-dirigée avec Marianne DESMETS)
- Vanessa GAUDRAY. 1.10.2022 Détection automatique d’erreurs de reprise dans les rédactions étudiantes (thèse financée par le projet ANR ecri+ et co-dirigée avec Sabine LEHMANN)
- Aurore LESSIEUX. 1.10.2022 Analyse automatique de la perception des projets d’aménagement de territoire dans les corpus mulimodaux (thèse financée par le projet Labex Vital et co-dirigée avec Olivier RATOUIS)
- Ousseynou GUEYE. 1.09.2020-3.12.2024 Personnalisation adaptative de problèmes mathématiques arithmétiques pour élèves de CM1-CM2 à l’aide de grands modèles de langue via ingénierie de prompt.
- Laura NORESKAL. 1.09.2018-14.12.2022 Erreurs dans les phrases coordonnées au sein des rédactions universitaires : typologie et détection (thèse sur contrat doctoral d’établissement, projet ECRI+, co-dirigée avec Marianne DESMETS)
- Hyun Jung Kang. 1.09.2016-28.01.2021 Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus. (bourse d’études de gouvernement coréen)
- Hélène Flamein. 1.10.2015-10.12.2019 Étude de la perception d’une ville. Repérage automatique, analyse et visualisation. (thèse sur contrat doctoral d’établissement)
- Sandra Cestic. 1.09.2013-11.03.2019 Perception du bruit et de la température en milieu professionnel. Outils et méthodes de la linguistique de corpus pour améliorer les environnements de travail. (thèse CIFRE)

2024- Co-responsable du pôle DAM du laboratoire MoDyCo
2020- Membre du conseil du laboratoire MoDyCo

2020- Responsable du Master TAL, Université Paris Nanterre
2017-2020 Directrice du département Sciences du Langage, Université Paris Nanterre

Publications HAL-SHS
Déroulez la liste des publications dans chaque groupe
133 documents

  • Anaïs Lefeuvre, Jean-Yves Antoine, Agata Savary, Emmanuel Schang, Lotfi Abouda, et al.. Annotation de la temporalité en corpus : contribution à l'amélioration de la norme TimeML. TALN'2014, Jul 2014, Marseille, France. pp.F14-2029. ⟨hal-01075207⟩
  • Judith Muzerelle, Anaïs Lefeuvre, Emmanuel Schang, Jean-Yves Antoine, Aurore Pelletier, et al.. ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland. pp.843-847. ⟨hal-01075679⟩
  • Iris Eshkol-Taravella, Natalia Grabar. Paraphrastic Reformulations in Spoken Corpora. Lecture Notes in Computer Science, 2014, 9th International Conference on NLP, PolTAL2014, 8686, pp.425-437. ⟨10.1007/978-3-319-10888-9_42⟩. ⟨hal-01174657⟩
  • Iris Eshkol, Olivier Baude, Layal Kanaan, Denis Maurel, Céline Dugua. « Procédure d’anonymisation et traitement automatique : l’expérience d’ESLO ». Journée d'études ATALA, Ethique et TAL, 2014, Paris, France. ⟨halshs-01165957⟩
  • Isabelle Tellier, Yoann Dupont, Iris Eshkol, Ilaine Wang. Adapt a Text-Oriented Chunker for Oral Data: How Much Manual Effort is Necessary?. 14th International Conference on Intelligent Data Engineering and Automated Learning (IDEAL), Oct 2013, Hefei, China. ⟨hal-01174605⟩
  • Judith Muzerelle, Emmanuel Schang, Jean-Yves Antoine, Iris Eshkol, Denis Maurel, et al.. Annotation en relations anaphoriques d'un corpus de discours oral spontané en français. Congrès Mondial de Linguistique Française, CMLF'2012, Jul 2013, Lyon, France. 15 pp. ⟨hal-00788164⟩
  • Silvia Adler, Iris Eshkol-Taravella. Noms généraux et complexité discursive. Représentations du sens linguistique (RSL VI), Jul 2013, Nantes, France. ⟨hal-01174725⟩
  • Catherine Dominguès, Iris Eshkol-Taravella. Repérer des toponymes dans les titres de cartes topographiques.. TALN2013, Jun 2013, Les Sables d'Olonne, France. ⟨hal-01174713⟩
  • Athéna Dupont, Iris Eshkol, Laurent Delsol. Etude d'application des méthodes et des outils statistiques sur les données du corpus ESLO : cas de la question sur mai 68. JADT 2012 : 11es Journées internationales d'Analyse statistique des Données Textuelles, Jun 2012, Liège, Belgium. http://www.jadt2012.ulg.ac.be/actes.html. ⟨hal-00713319⟩
  • Isabelle Tellier, Denys Duchier, Iris Eshkol, Arnaud Courmet, Mathieu Martinet. Apprentissage automatique d'un chunker pour le français. TALN2012, Jun 2012, Grenoble, France. pp.431-438. ⟨hal-01174591⟩
Autres Publications