Pour vous authentifier, privilégiez eduGAIN / To authenticate, prefer eduGAINeu

December 6, 2022
Bâtiment Francis Bouygues
Europe/Paris timezone

Traitement langue/parole sur LabIA

Dec 6, 2022, 3:25 PM
10m
Amphitheatre Rousseau (E.070, Étage 0) (Bâtiment Francis Bouygues)

Amphitheatre Rousseau (E.070, Étage 0)

Bâtiment Francis Bouygues

9 Rue Joliot Curie, 91190 Gif-sur-Yvette

Speaker

Sahar Ghannay (LISN)

Description

Au cours des cinq dernières années, les approches par transfert utilisant les modèles de type Transformers ont récemment permis de réaliser d'importants progrès dans le domaine de la compréhension de la parole. Ces approches deviennent de plus en plus populaires et nécessitent une grande quantité de données et de ressources computationnelles.
La plupart des modèles de langue pré-entraînés ont fait l'objet de nombreuses études en anglais et seulement quelques-uns d'entre eux ont été évalués sur une tâche de compréhension de la parole en français.
Je vous propose d’abord, un tour d'horizon de référence, axé sur l'évaluation de la qualité de treize modèles bien établis basés sur les modèles Transformers sur deux tâches de compréhension de la parole : MEDIA et ATIS-FR.
Je terminerai par une présentation de quelques travaux sur des approches end-2-end.

Presentation materials