L'inauguration du mésocentre de Paris Saclay a pour but de présenter à toutes les personnes intéressées de l'université la dynamique en cours autour de l'informatique scientifique, les ressources disponibles et les évolutions prévues. Cette présentation sera illustrée par plusieurs expériences d'utilisateurs.
Cet événement est ouvert à toutes les composantes et toutes les graduate schools de l'université mais l'inscription est obligatoire. Pour s'inscrire, vous devrez vous authentifier en utilisant eduGAIN puis en sélectionnant votre établissement et en utilisant vos crédentiels habituels (par exemple Université Paris Saclay + identifiants ADONIS).
Il sera possible de participer à la réunion en distanciel : les informations de connexion sont disponibles dans le menu Vidéoconférence (vous devez être connecté/authentifié pour y avoir accès).
Quelques exemples d'utilisation du mésocentre
Le Legacy Survey of Space and Time (LSST) de l'observatoire Vera Rubin, a pour objectif d'étudier le ciel plus profondément et plus rapidement qu'aucune autre étude à grand champ à ce jour. À partir de 2024, et pendant ses 10 années d'exploitation, LSST permettra la découverte d'un nombre sans précédent de phénomènes transitoires astrophysiques, ouvrant ainsi une nouvelle ère en astronomie. Parmi plusieurs défis, le taux d'alertes prévu pour LSST sera au moins d'un à deux ordres de grandeur supérieur à celui des relevés menées à ce jour, et les détections se feront sur des objets généralement moins lumineux, ce qui rend impossible le fonctionnement des systèmes d'analyses de données actuellement disponibles. Développé au laboratoire CNRS/IJCLab pour relever ces défis, Fink est un gestionnaire d'alertes (broker) basé sur le cloud computing pour efficacement analyser des grandes masses de données en temps-réel (https://fink-broker.org). Depuis 2019, un prototype est déployé et mis au point dans le cloud de VirtualData, et analyse des données de télescopes précurseurs en temps-réel. L'accès au mésocentre a permis de tester et d'étendre nos compétences sur de nombreuses technologies informatiques issues du big data, tant au niveau calcul distribué, que stockage et base de données. Fin 2022, Fink a collecté et analysé plus de 150 million d'alertes d'origine astrophysique, qui sont à la disposition de la communauté scientifique et en libre accès, et le projet se prépare à déployer sa plateforme de production sur le cloud du Centre de Calcul de l'IN2P3.
Le laboratoire Ecologie, Systématique, Evolution de l’Université Paris-Saclay, CNRS et AgroParisTech traite des composantes de l’écologie évolutive et fonctionnelle à tous les niveaux d’organisation, du moléculaire à l’échelle globale de la planète. A tous ces niveaux, les outils associés aux thématiques du big-data sont maintenant centraux pour mener nos travaux ; cela va de l’analyse et de la comparaison des génomes à des travaux sur l’impact de la composante climatique sur la biodiversité à l’échelle de vastes territoires, l’Europe ou même le monde, avec une résolution spatiale et temporelle toujours plus fine. Les outils mis à disposition au sein de VirtualData sont au centre de nombreux travaux publiés ou en cours.
Quelques exemples d'utilisation du mésocentre
Au cours des cinq dernières années, les approches par transfert utilisant les modèles de type Transformers ont récemment permis de réaliser d'importants progrès dans le domaine de la compréhension de la parole. Ces approches deviennent de plus en plus populaires et nécessitent une grande quantité de données et de ressources computationnelles.
La plupart des modèles de langue pré-entraînés ont fait l'objet de nombreuses études en anglais et seulement quelques-uns d'entre eux ont été évalués sur une tâche de compréhension de la parole en français.
Je vous propose d’abord, un tour d'horizon de référence, axé sur l'évaluation de la qualité de treize modèles bien établis basés sur les modèles Transformers sur deux tâches de compréhension de la parole : MEDIA et ATIS-FR.
Je terminerai par une présentation de quelques travaux sur des approches end-2-end.
La Maison de la Simulation est une unité mixte CEA-CNRS-UPS situé sur le plateau au CEA Saclay. Notre laboratoire est spécialisé dans le domaine du Calcul Haute Performance (HPC) et de la simulation scientifique numérique. Nos recherches et nos développements applicatifs portent entre autres sur l’optimisation des codes, le portage vers les accélérateurs, les futures technologies du HPC, les nouveaux modèles de programmation parallèle, la gestion et le traitement des gros volumes de donnée et la visualisation. Depuis peu, nous nous ouvrons à de nouvelles thématiques connexes que sont le calcul quantique et l’intelligence artificielle pour le calcul scientifique. Dans cette présentation, nous vous ferons découvrir comment Ruche nous aide au quotidien à développer, tester et préparer nos codes et nos bibliothèques aux grands super-calculateurs nationaux et européens.
La plateforme Ruche est un outil essentiel pour la recherche menée au laboratoire EM2C portant sur la mécanique des fluides, les écoulements multi-phasiques, la combustion, la physique du rayonnement et des transferts ou les plasmas. Dans cet exposé, des exemples de travaux réalisés sur cette plateforme seront montrés : calculs parallèles sur des applications réactives turbulentes et traitement de données expérimentales.
Coordonné par la MSH Paris-Saclay, l’équipement SESAME COVADO-SHS se compose d’un ensemble d’outils d’acquisition et de traitement des données, installés dans différents laboratoires en fonction de leurs compétences, et mis à disposition de l’ensemble de la communauté SHS du périmètre saclaysien. Organisé selon les différentes étapes de la chaîne de traitement des données, il devrait permettre une montée en puissance du potentiel de recherche SHS du site, le déploiement de recherches interdisciplinaires, ainsi qu’une réflexion informée, menée dans le cadre d’un séminaire dédié, sur la pratique et les effets des humanités numériques dans les SHS et au-delà de celles-ci. Cet équipement sera complété par la mise en place à la MSH, en lien avec les Très Grandes Infrastructures de Recherche nationales IR* PROGEDO et HumaNum, et avec le Réseau national des MSH (RnMSH), d’une Plateforme Universitaire de Données (PUD) et d’une Plateforme Humanités Numériques. Ces plateformes fonctionneront en synergie avec l’Atelier de la Donnée de l’Université Paris-Saclay, actuellement en trajectoire de labellisation. Les projets développés avec les moyens fournis par cet équipement pourront grandement bénéficier, selon l’évolution des dispositifs, des possibilités de stockage et de traitement de données offertes par le mésocentre.