MoDyCo
Intranet

Chargement Évènements

« Tous les Évènements

  • Cet évènement est passé

Séminaire “Liaison”

20 mars 2015 @ 14 h 00 min - 16 h 00 min

La deuxième séance du séminaire « Liaison » du laboratoire MoDyCo aura lieu le vendredi 20 mars 2015, de 14h00 à 16h00 (salle A407, bâtiment A, Université de Nanterre Paris Ouest La Défense).

Nous aurons le plaisir d’écouter:

Philippe BOULA DE MAREÜIL (Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur, LIMSI), 

“Distribution de la liaison: une analyse à base de traitement automatique de grands corpus de lecture et de parole spontanée”

et

Giulia BARRECA (Université Paris Ouest Nanterre La Défense, Modyco) et George CHRISTODOULIDES (Université Catholique de Louvain) 

“Analyse fréquentielle de la liaison dans le corpus PFC” 

Date : vendredi 20 mars 2015

Heure : 14h00-16h00

Lieu : Laboratoire MoDyCo – Université de Nanterre Paris Ouest – bâtiment A- salle A407

Plan d’accès :

http://www.u-paris10.fr/l-universite/universite-paris-ouest-nanterre-la-defense-344666.kjsp

Page du séminaire:

http://www.modyco.fr/MoDyCo/seminaire-la-liaison.html

Résumés

Philippe BOULA DE MAREÜIL

 

Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur, LIMSI

 

Distribution de la liaison: une analyse à base de traitement automatique de grands corpus de lecture et de parole spontanée

Cette communication sera consacrée à la distribution de la liaison en français à travers le traitement automatique, pour et par la synthèse et la reconnaissance de la parole. D’abord dans un cadre général, je définirai ce phénomène de sandhi en confrontation avec l’élision et l’enchaînement, avant d’aborder la question de savoir comment et quand on fait la liaison, dans une approche traditionnelle. Dans un second temps, j’interprèterai un corpus fermé en comparant le comportement vis-à-vis de la liaison de cinq convertisseurs graphème-phonème entre eux et avec les productions de sujets parlants. Enfin, je présenterai des travaux à base d’alignement automatique sur de grands corpus de lecture et de parole spontanée, utilisant les fréquences lexicales des mots engendrant des liaisons et utilisant les parties du discours (en parole lue). Cette analyse automatisée, dont les résultats rejoignent ceux d’autres études, permet d’apporter un nouvel éclairage sur la variation diaphasique.

 

Giulia BARRECA (Université Paris Ouest Nanterre La Défense, Modyco) et George CHRISTODOULIDES (Université Catholique de Louvain) 

 

Analyse fréquentielle de la liaison dans le corpus PFC 

Des études précédentes (parmi d’autres Delattre 1956 ; Boula de Mareüil et al. 2003) ont souligné la difficulté de prédire les réalisations de la liaison variable malgré les règles établies par les classifications traditionnelles (Delattre 1966 ; Encrevé 1988). À la suite des travaux menés par Laks et Calderone (2014), notre contribution se propose de mener une analyse fréquentielle des contextes morphosyntaxiques (types) de liaison variable à partir des données de parole spontanée (lectures exclues) (1.368.035 tokens) extraites du corpus PFC (Durand et al. 2009), sur lequel nous avons mené un important travail de ré-annotation morphosyntaxique. Les résultats de cette étude non seulement confirme l’existence d’une distribution de Mandelbrot-Zipf des liaisons réalisées parmi l’ensemble des types totaux (Laks et Calderone, 2014), mais aussi bien parmi les seules types de liaison variable. En effet ces données attestent la présence d’une forte idiosyncrasie intra et inter catégorielle de la liaison variable. Seulement 15% des types de liaison variable induisent 80% du total des réalisations. Ces observations suggèrent que l’identification de schémas de construction spécifiques (Bybee, 2005), internes aux différents contextes morphosyntaxiques, pourrait conduire à une caractérisation plus précise de la variabilité des réalisations de la liaison.

 

Au plaisir de vous accueillir.

 

Bernard Laks et Giulia Barreca

Détails

Date :
20 mars 2015
Heure :
14 h 00 min - 16 h 00 min
Catégorie d’Évènement: