Pôle 1 : Modélisation et linguistique fondée sur les corpus
Responsable : Sylvain Kahane
Le pôle est centré sur l’élaboration et la validation de modèles linguistiques dans une démarche bi-directionnelle :
d’une part, en allant des faits attestés dans les corpus vers une modélisation par un traitement (semi-)automatique de données généralement annotées ; d’autre part, en nous intéressant à la démonstrabilité des hypothèses que nous avançons et en testant les prédictions issues des modèles par diverses méthodes :
- Validation sur corpus, par une analyse qualitative ou quantitative des données et notamment une annotation fine des corpus qui permet aussi bien de tester les modèles que d’extraire les données
pertinentes à l’élaboration des modèles ;
- Validation par simulation, par l’élaboration d’un modèle informatique ou mathématique. Ce mode de
validation rejoint le précédent quand il s’agit d’apprentissage supervisé sur des données annotées. - Validation expérimentale, en collaboration avec le pôle « Psycholinguistique ».