DAM: Des Données Aux Modèles

Professeure de Sciences du langage à l’Université Paris Nanterre, je mène depuis vingt ans des recherches portant sur la constitution, le traitement et l’analyse des corpus avec les outils informatiques. Mes travaux s’inscrivent dans les trois domaines : Traitement Automatique des Langues (TAL), linguistique de corpus et humanités numériques où je mets à profit mes connaissances linguistiques pour améliorer des solutions informatiques. Deux préoccupations paramètrent mes travaux : la prise en considération de la nature des corpus traités et la modélisation de l’information linguistique destinée à l’analyse.


L’état de ce compte est « Approuvés »
Informations institutionnelles
Eshkol-Taravella
Iris
Université Paris Nanterre
Membre principal
Enseignant-chercheur
Professeur des universités
Classe 1
Habilité à diriger des recherches
Activité scientifique
DAM: Des Données Aux Modèles

L1 SDL : Linguistique et nouvelles technologies
L2 SDL : Humanités numériques
M1 TAL : Python
M1 TAL : Bases de données
M1 TAL : Enrichissement de corpus
M2 TAL : De la modélisation au traitement automatique
M2 TAL : Langages du Web sémantique
M2 TAL : TAL et Ingénierie des connaissances

- Yeo Jun YUN. 1.09.2023 Détection, classification et analyse d’ellipses interrogatives dans un corpus du français parlé (thèse co-dirigée avec Marianne DESMETS)
- Vanessa GAUDRAY. 1.10.2022 Détection automatique d’erreurs de reprise dans les rédactions étudiantes (thèse financée par le projet ANR ecri+ et co-dirigée avec Sabine LEHMANN)
- Aurore LESSIEUX. 1.10.2022 Analyse automatique de la perception des projets d’aménagement de territoire dans les corpus mulimodaux (thèse financée par le projet Labex Vital et co-dirigée avec Olivier RATOUIS)
- Ousseynou GUEYE. 1.09.2020-3.12.2024 Personnalisation adaptative de problèmes mathématiques arithmétiques pour élèves de CM1-CM2 à l’aide de grands modèles de langue via ingénierie de prompt.
- Laura NORESKAL. 1.09.2018-14.12.2022 Erreurs dans les phrases coordonnées au sein des rédactions universitaires : typologie et détection (thèse sur contrat doctoral d’établissement, projet ECRI+, co-dirigée avec Marianne DESMETS)
- Hyun Jung Kang. 1.09.2016-28.01.2021 Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus. (bourse d’études de gouvernement coréen)
- Hélène Flamein. 1.10.2015-10.12.2019 Étude de la perception d’une ville. Repérage automatique, analyse et visualisation. (thèse sur contrat doctoral d’établissement)
- Sandra Cestic. 1.09.2013-11.03.2019 Perception du bruit et de la température en milieu professionnel. Outils et méthodes de la linguistique de corpus pour améliorer les environnements de travail. (thèse CIFRE)

2024- Co-responsable du pôle DAM du laboratoire MoDyCo
2020- Membre du conseil du laboratoire MoDyCo

2020- Responsable du Master TAL, Université Paris Nanterre
2017-2020 Directrice du département Sciences du Langage, Université Paris Nanterre

Publications HAL-SHS
Déroulez la liste des publications dans chaque groupe
133 documents

  • Silvia Adler, Iris Eshkol-Taravella. " Geste " et " démarche " en tant que noms généraux dans le langage médiatique écrit. Revue de Sémantique et Pragmatique, 2012, 31, www.univ-orleans.fr/rsp. ⟨hal-01024277⟩
  • Iris Eshkol. A quelles conditions une taxinomie du lexique est-elle possible en TAL. UR "Poetique théorique et pratique". L'illusion taxinomique, Media graphic, UR "Poetique théorique et pratique", 2012. ⟨hal-01024276⟩
  • Emmanuel Schang, Aurore Boyer-Pelletier, Judith Muzerelle, Jean-Yves Antoine, Iris Eshkol, et al.. Coreference and anaphoric annotations for spontaneous speech corpos in French. DAARC'2011, 8th Discourse Anaphora and Anaphor Resolu1on Colloquium, Oct 2011, Faro, Portugal. 9 pp. ⟨hal-00831414⟩
  • Emmanuel Schang, Judith Muzerelle, Boyer Aurore, Jean-Yves Antoine, Iris Eshkol, et al.. Coreference and anaphoric annotations for spontaneous speech corpora in French.. 8th Discourse Anaphora and Anaphor Resolution Colloquium, Oct 2011, Faro, Portugal. pp.182-190. ⟨halshs-00764786⟩
  • Judith Muzerelle, Anaïs Lefeuvre, Jean-Yves Antoine, Emmanuel Schang, Denis Maurel, et al.. ANCOR, premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. TALN'2013, 20e conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Les Sable d'Olonne, France. pp.555-563. ⟨hal-01016562⟩
  • Denis Maurel, Nathalie Friburger, Jean-Yves Antoine, Iris Eshkol, Damien Nouvel. Cascades de transducteurs autour de la reconnaissance des entités nommées. Revue TAL : traitement automatique des langues, 2011, 52 (1), pp.69-96. ⟨hal-00682805⟩
  • Iris Eshkol-Taravella, Olivier Baude, Denis Maurel, Linda Hriba, Céline Dugua, et al.. Un grand corpus oral « disponible » : le corpus d'Orléans 1 1968-2012. Revue TAL : traitement automatique des langues, 2011, Ressources Linguistiques Libres, 53 (2), pp.17-46. ⟨halshs-01163053⟩
  • Iris Eshkol-Taravella, Denis Maurel, Isabelle Tellier, Nathalie Friburger, Samer Taalab. Annoter ESLO1 par des cascades de transducteurs et par apprentissage automatique. Journée d'étude de l'Atala : Annoter les corpus oraux., 2011, Paris, France. ⟨hal-01048608⟩
  • Iris Eshkol, Isabelle Tellier, Samer Taalab, Sylvie Billot. Etiqueter un corpus oral par apprentissage automatique à l'aide de connaissances linguistiques. 10èmes Journées Internationales d'Analyse statistique des Données Textuelles JADT'2010, Jun 2010, Rome, Italie. pp.1-12. ⟨hal-00460690⟩
  • Isabelle Tellier, Iris Eshkol, Samer Taalab, Jean-Philippe Prost. POS-tagging for Oral Texts with CRF and Category Decomposition. Research in Computing Science, 2010, 46, pp.79--90. ⟨hal-00467951⟩
Autres Publications