Pôle 1 : Modélisation et linguistique fondée sur les corpus

Responsable : Sylvain Kahane

Le pôle est centré sur l’élaboration et la validation de modèles linguistiques dans une démarche bi-directionnelle :
d’une part, en allant des faits attestés dans les corpus vers une modélisation par un traitement (semi-)automatique de données généralement annotées ; d’autre part, en nous intéressant à la démonstrabilité des hypothèses que nous avançons et en testant les prédictions issues des modèles par diverses méthodes :

  • Validation sur corpus, par une analyse qualitative ou quantitative des données et notamment une annotation fine des corpus qui permet aussi bien de tester les modèles que d’extraire les données
    pertinentes à l’élaboration des modèles ;
  • Validation par simulation, par l’élaboration d’un modèle informatique ou mathématique. Ce mode de
    validation rejoint le précédent quand il s’agit d’apprentissage supervisé sur des données annotées.
  • Validation expérimentale, en collaboration avec le pôle « Psycholinguistique ».

L’équipe


Les projets