1 - Établissement ou école: École
nationale de la statistique et de l'administration économique (ENSAE Paris)
2 - Date : Jeudi 11 avril 2024
3 - Public (Matière,
Filières): Tous professeurs intéressés par ce sujet
4 - Nombre de places
offertes : 20
5 - Lieu de la formation
(adresse complète) : ENSAE Paris, 5 Av. Le
Chatelier, 91120 Palaiseau, France
6 - Intitulé du stage: «
Introduction à la théorie statistique de l’apprentissage »
7 - Noms et qualités des
intervenants, adresse de contact:
Jaouad MOURTADA, Professeur de Statistiques à l’ENSAE
et chercheur au CREST, UMR 9194.
Courriel : jaouad.mourtada@ensae.fr
8 - Descriptif - Mots clés
:
L’apprentissage
automatique (« machine learning » en anglais) est un champ d’activité
au cœur de nombreuses technologies contemporaines, comme la reconnaissance
d’images ou le traitement du langage naturel. De manière schématique, l’un des
problèmes centraux en apprentissage consiste à construire une fonction de
prédiction de certains attributs associés à des caractéristiques à partir d’un
jeu de données, constitué de nombreuses paires attribut-caractéristiques. Le
but de cette formation est de proposer une introduction à la théorie mathématique
de l’apprentissage. L’accent sera porté sur le lien entre le problème concret
et sa formalisation, ainsi que sur certains résultats fondamentaux au cœur de
la théorie, de nature probabiliste et combinatoire. Nous indiquerons également
quelques pistes de développements accessibles au niveau classes préparatoires.
9 - Informations pratiques :
Restauration : Oui - Prise en charge par l’école
Possibilité d’hébergement : Offre d’hôtellerie à Massy (prise en charge par le stagiaire)
10 - Prérequis : Notions
de probabilités (variables aléatoires, lois, conditionnement). Aucune connaissance préalable en statistiques n’est requise.
11 -
Programme du Jeudi
11 avril 20249h15 : Accueil.
9h45 – 11h :
Introduction générale. Apprentissage supervisé, classification, régression.
11h – 12h15 :
Minimisation du risque empirique. Compromis approximation-estimation.
12h15 – 13h30 : Pause
déjeuner (prise en charge par l'Ensae).
14h - 15h15 :
Minimisation du risque empirique et convergence uniforme.
15h15 – 16h15 : Dimension
de Vapnik-Chervonenkis.
16h15 – 16h30 : Pause
café.
16h30 – 17h45 :
Prédiction linéaire.