Vous êtes intéressé·e par la Data Science et vous cherchez justement une porte d'entrée vers ce domaine en plein essor ? Ce cours d'initiation au machine learning est fait pour vous !
Le machine learning (aussi appelé apprentissage automatique en français) est un outil essentiel des Data Scientists, qui a grandement fait parler de lui ces dernières années de par les applications exceptionnelles qu’il a permises... Une fois que le ou la Data Scientist a effectué son travail de collecte, de nettoyage et d’exploration des données, il peut passer à la partie de modélisation statistique. C’est ce processus que nous allons explorer ensemble dans ce premier cours consacré au machine learning, un ensemble de techniques puissantes permettant de créer des modèles prédictifs à partir de données, sans avoir été explicitement programmées.
Les compétences d’un·e Data Scientist résident non seulement dans sa capacité à traduire les challenges de l’entreprise en problèmes de machine learning, mais aussi dans son agilité à proposer des solutions qui peuvent aider à résoudre ces problèmes de manière performante.
Je vous propose d'aborder cela avec moi, étape par étape, en restant concret et au plus proche des problématiques actuelles que permet de résoudre la Data Science. C'est parti ?
Pré-requis :
Ce cours est un cours d'initiation au machine learning, un domaine au croisement des mathématiques et de l'informatique. Pour en profiter pleinement, n'hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :
- Python pour le calcul numérique que nous utiliserons dans la partie TP du cours (librairie numpy et création de graphes avec pyplot)
- Quelques notions d'algèbre linéaire, telles que manipulation de vecteurs, multiplications de matrices, normes
- Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance
Pour suivre ce cours dans les meilleurs conditions, n'hésitez pas à suivre cette leçon introductive au Machine Learning en vidéo.