Updated: Mar 26, 2021

Petit point de langage: le machine learning est aussi appelé "statistical learning". Tout cela pour vous dire que les statistiques et les probabilités vont être cruciales pendant votre année. Mais attention !! Seule une partie de ce domaine nous intéresse, celui qui est à l'intersection entre les statistiques et les probabilités et notamment:
Le concept de variables aléatoires,
Espérance, variance, espérance conditionnelle
Lois de Bernoulli, binomiale, de Poisson et loi normale
Estimation : problème et méthodes de résolution (maximum de vraisemblance)
La loi des grands nombres
le théorème central limite
Le théorème de Bayes
La convergence en probabilité versus la convergence en loi
Le concept de :
Loi de probabilité
Densité d'une variable aléatoire
Fonction de répartition
Fonction caractéristique
Moments d'une variable aléatoire
Quel support je peux utiliser ?
Et bien là , bonne question ! Plusieurs pistes s'offrent à vous:
Assister en candidat libre au cours "Probabilité et Statistiques" du M1 méthodes en Santé Publique de l'université Paris Saclay
Travailler sur le livre "Probability essantials" par Jean Jacod et Philip E. Proter, édition 2003, mais il vous faudra un professeur pour corriger vos exercices
Aller faire un tour sur le chapitre "Random Variables" de la Khan Academy: https://www.khanacademy.org/math/statistics-probability/random-variables-stats-library
Le gros piège
Toute une partie des statistiques ne vous sera pas du tout utile pendant cette année. Voici la liste de ce à quoi il ne faut PAS consacrer du temps:
Problèmes d'estimation
Fluctuations d’échantillonnage
Intervalle de confiance
lois de probabilité (Chi2, Student)
Tous les tests d'hypothèses (Fisher, analyse de variance...)
Puissance statistique
Un gros bon courage à vous !


