Prédiction de suites individuelles et cadre statistique classique : étude de quelques liens autour de la régression parcimonieuse et des techniques d'agrégation

Cette these s'inscrit dans le domaine de l'apprentissage statistique. Le cadre principal est celui de la prevision de suites deterministes arbitraires (ou suites individuelles), qui recouvre des problemes d'apprentissage sequentiel ou l'on ne peut ou ne veut pas faire d'hypotheses de stochasticite sur la suite des donnees a prevoir. Cela conduit a des methodes tres robustes. Dans ces travaux, on etudie quelques liens etroits entre la theorie de la prevision de suites individuelles et le cadre statistique classique, notamment le modele de regression avec design aleatoire ou fixe, ou les donnees sont modelisees de facon stochastique. Les apports entre ces deux cadres sont mutuels : certaines methodes statistiques peuvent etre adaptees au cadre sequentiel pour beneficier de garanties deterministes ; reciproquement, des techniques de suites individuelles permettent de calibrer automatiquement des methodes statistiques pour obtenir des bornes adaptatives en la variance du bruit. On etudie de tels liens sur plusieurs problemes voisins : la regression lineaire sequentielle parcimonieuse en grande dimension (avec application au cadre stochastique), la regression lineaire sequentielle sur des boules L1, et l'agregation de modeles non lineaires dans un cadre de selection de modeles (regression avec design fixe). Enfin, des techniques stochastiques sont utilisees et developpees pour determiner les vitesses minimax de divers criteres de performance sequentielle (regrets interne et swap notamment) en environnement deterministe ou stochastique.