Apprentissage automatique I : analyse des mégadonnées et prise de décision
MATH80629

Automne 2021

[Horaire]  [Évaluations]  [Références]  [Cours de l'automne 2020]  [English (by Golnoosh Farnadi)


Professeur: Laurent Charlin

Horaire: Je donne ce cours deux fois cet automne.

Jour/Heure Section Salle de class
Mercredi 8:30am --11:30am J01 (Français) Saine Marketing
Vendredi 8:30am -- 11:30am J02 (Français) Société canadienne des postes

Heure de bureau: mercredi 15h--16h (sur zoom)

Description:
Ce cours porte sur les modèles d'apprentissage automatique (machine learning). En plus des modèles standards, nous étudierons aussi les modèles pour analyser les comportements des utilisateurs ainsi que pour la prise de décision.
Nous étudierons les modèles d'apprentissage automatique pour l'apprentissage supervisé, non supervisé et comment ils peuvent être étendus aux données massives à l'aide de techniques de calcul à grande échelle (p. ex., grappe d'ordinateurs). Nous étudierons en plus des modèles récents pour les systèmes de recommandations ainsi que pour la prise de décision (apprentissage par renforcement).

**Déroulement du cours:** Le cours se donnera en format pédagogie inversée (et aussi ici). C'est une approche pédagogique dans laquelle les étudiants apprennent la matière avant de venir en classe. Le matériel du cours sera donc disponible sous forme de vidéos ou de lectures. Le temps en classe sera réservé pour de la pédagogie plus active par exemple avec des activités comme la résolution de problèmes, les démonstrations et les séances de questions-réponses. De plus, les classes démarreront par un court résumé de la matière de la semaine.

**Niveau mathématique:** Les étudiants doivent avoir une maturité mathématique.

**Niveau de programmation:** Les étudiants devront connaître le langage Python pour suivre ce cours. Si vous ne le connaissez pas, voici quelques options pour l'apprendre. Je recommande fortement la première (HEC CAMS) ou la seconde (Data Camp).

  1. Cours. HEC CAMS propose des cours d'introduction à Python en septembre (en français). Vous pouvez vous inscrire ici: inscriptions CAMS
  2. Cours en ligne. DataCamp. Étudiez les chapitres 1 à 3 du cours Introduction to Python (utilisez le lien que je vous ai envoyé pour accéder aux chapitres 2 et 3).
  3. Voici le tutoriel que j'ai utilisé en 2018: Fall 2018 tutorial (en anglais). Bien que je conseille plutôt les deux premières options, celle-ci peut vous donner une idée du niveau minimal souhaitable pour le cours.

En plus, un tutoriel sur l'apprentissage automatique utilisant le Python sera offert à la semaine 4 du cours.



Horaire Hebdomadaire

  1. M.09/01, V.09/03. Introduction au cours et rappels mathématiques. [diapos fr]
  2. M.09/08, V.09/10. Les fondements de l'apprentissage automatique
  3. M.09/15, V.09/17. Modèles d'apprentissage supervisé
  4. M.09/22, V.09/24. Python pour la programmation scientifique et pour l'apprentissage automatique [Séance pratique]
    • Le tutoriel à suivre est ici, Solutions.
    • Je vous recommande de démarrer le tutoriel cette semaine avant le cours et de le terminer pendant le cours.
  5. M.09/29, V.10/01. Réseaux de neurones et apprentissage profond
  6. M.10/06, V.10/08. Réseaux de neurones récurrents et réseaux de neurones à convolutions
  7. M.10/13, V.10/15. Apprentissage Non supervisé
  8. 10/18. Semaine d'étude (pas de cours)
  9. M.10/27, V.10/29. Rencontre en équipe à propos du projet
  10. M.11/03, V.11/05. Calcul parallèle pour données massives
  11. M.11/10, V.11/12 Systèmes de recommandations
  12. M.11/17, V.11/19 Prise de décision séquentielle I
  13. M.11/24, V.11/26 Prise de décision séquentielle II
  14. M.12/01, V.12/03 Présentations des projets


Évaluations

  1. Devoir (20%)
    • Date de remise: autour de mi-octobre.
  2. Projet (30%)
  3. Présentation du projet (10%)
  4. Examen final (30%)
    • Date: 16 décembre, Heure: 9:00h-12:00h,
    • Matière à examen: tout ce que l'on a vu en classe ainsi que les lectures obligatoires
    • Examens précédents: Automne 2018 (en anglais), Automne 2020
  5. Quiz (10%).
      3 ou 4 Quiz à travers le semestre.


Références

  1. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition Hastie, Trevor, Tibshirani, Robert, Friedman, Jerome, 2009 [ESL]
  2. Deep Learning. Ian Goodfellow, Yoshua Bengio and, Aaron Courville. [DL]
  3. Reinforcement Learning : An Introduction Hardcover. Richard S. Sutton, Andrew G. Barto. A Bradford Book. 2nd edition [RL-Sutton-Barto]
  4. Machine Learning. Kevin Murphy. MIT Press. 2012. [ML-Murphy]
  5. Recommender Systems Handbook, Ricci, F., Rokach, L., Shapira, B., Kantor, P.B. 2011. [RSH]
  6. Data Algorithms : Recipes for Scaling Up with Hadoop and Spark 1st Edition. Mahmoud Parsian. O'Reilly. 2015 [DA]
  7. Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython. Wes McKinney. O'Reilly. 2012 [PDA]
  8. Pattern Recognition and Machine Learning. Christopher Bishop. 2006 [PRML]
  9. Advanced Analytics with Spark. O'Reilly. Second Edition. 2017