Pour vous authentifier, privilégiez eduGAIN / To authenticate, prefer eduGAINeu

6 décembre 2022
Bâtiment Francis Bouygues
Fuseau horaire Europe/Paris

Traitement langue/parole sur LabIA

6 déc. 2022, 15:25
10m
Amphitheatre Rousseau (E.070, Étage 0) (Bâtiment Francis Bouygues)

Amphitheatre Rousseau (E.070, Étage 0)

Bâtiment Francis Bouygues

9 Rue Joliot Curie, 91190 Gif-sur-Yvette

Orateur

Sahar Ghannay (LISN)

Description

Au cours des cinq dernières années, les approches par transfert utilisant les modèles de type Transformers ont récemment permis de réaliser d'importants progrès dans le domaine de la compréhension de la parole. Ces approches deviennent de plus en plus populaires et nécessitent une grande quantité de données et de ressources computationnelles.
La plupart des modèles de langue pré-entraînés ont fait l'objet de nombreuses études en anglais et seulement quelques-uns d'entre eux ont été évalués sur une tâche de compréhension de la parole en français.
Je vous propose d’abord, un tour d'horizon de référence, axé sur l'évaluation de la qualité de treize modèles bien établis basés sur les modèles Transformers sur deux tâches de compréhension de la parole : MEDIA et ATIS-FR.
Je terminerai par une présentation de quelques travaux sur des approches end-2-end.

Documents de présentation