Rendez-vous la plateforme : https://github.com/MaximeForriez/Sorbonne-M1-Analyse-de-donnees


Serveur Discord : https://discord.com/channels/1374590487884992602/1374590488358813729 (toutes les informations du cours s'y trouveront)


L'objectif du cours est de proposer une initiation à l'analyse des données (géographiques) tout en vous formant à quelques outils professionnels indispensables. Après une rapide présentation des outils, Git et Docker, et du langage de programmation Python, vous êtes en autonomie. Vous devez lire les informations disponibles sur la plateforme GitHub du cours afin de pouvoir réaliser un exercice impliquant le traitement de données en Python. L'ensemble est pensé de manière progressive et de sorte que vous puissiez choisir entre trois parcours :

  1. Débutants : manipulation et découverte des statistiques univariées ;
  2. Intermédiaires : manipulation et découverte des statistiques univariées et bivariées ;
  3. Confirmés : manipulation et découverte des statistiques univariées, bivariées et multivariées.


Bien que les statistiques soient fondamentales, le parcours vise surtout à vous faire acquérir un niveau autonome dans le langage de programmation utilisé, et surtout de vous proposer de réaliser des codes que vous pourrez réutiliser dans vos propres travaux ou dans d'autres disciplines du master G.A.E.D.

Pour terminer, le cadre est professionnalisant. Vous manipulez un peu Docker ce qui vous permet d'avoir une configuration standard de Python identique pour tout le monde, peu importe votre système d'exploitation chez vous ou à l'université. Vous manipulez surtout un outil indispensable dans le monde professionnel de la donnée : Git avec la plateforme GitHub. Cela se traduit par un usage de recherche des informations (cf. le cours) et un usage de votre propre dépôt pour me remettre votre travail final. Au-delà de la note, l'objectif est de créer un portfolio que vous pourrez également exploiter lors d'une recherche de stage ou d'emploi. De plus, vous pouvez aller au-delà du dépôt en découvrant des notions de Git beaucoup plus avancées.

Le cours essaye de s'adapter au maximum à vos objectifs individuels, car vos profils, notamment dans les connaissances mathématiques de base, sont très hétérogènes. Il espère que contourner le problème des mathématiques par un langage de programmation vous permettra de mieux appréhender les analyses de données, indispensables dans le monde actuel des données massives.


P.S. Le contenu n'est pas encore complet.

  • Il manque les P.D.F. des séances, car GitHub transcrit de manière aléatoire les équations codées en LaTeX rendant certaines pages illisibles.
  • Il manque quelques exercices. Néanmoins, vous pouvez commencer à travailler dès la semaine prochaine.
  • Il manque de nombreux éléments dans le formulaire mathématique. Ils s'ajouteront au fur et à mesure du semestre. Les éléments disponibles sont les éléments essentiels pour comprendre la partie mathématique du cours.