Rendez-vous la plateforme : https://github.com/MaximeForriez/Sorbonne-M1-Analyse-de-donnees
Serveur Discord : https://discord.com/channels/1374590487884992602/1374590488358813729 (toutes les informations du cours s'y trouveront)
L'objectif
du cours est de proposer une initiation à l'analyse des données
(géographiques) tout en vous formant à quelques outils
professionnels indispensables. Après une rapide
présentation des outils, Git et Docker, et du langage de programmation
Python, vous êtes en autonomie. Vous devez lire les informations
disponibles sur la plateforme GitHub du cours afin de pouvoir réaliser un
exercice impliquant le traitement de données en Python. L'ensemble est
pensé de manière progressive et de sorte que vous puissiez choisir
entre trois parcours :
- Débutants : manipulation et découverte des statistiques univariées ;
- Intermédiaires : manipulation et découverte des statistiques univariées et bivariées ;
- Confirmés : manipulation et découverte des statistiques univariées, bivariées et multivariées.
Bien
que les statistiques soient fondamentales, le parcours vise surtout à vous faire acquérir un niveau autonome dans le langage de programmation
utilisé, et surtout de vous proposer de réaliser des codes que vous pourrez réutiliser dans vos propres travaux ou dans d'autres
disciplines du master G.A.E.D.
Pour
terminer, le cadre est professionnalisant. Vous manipulez un
peu Docker ce qui vous permet d'avoir une configuration standard de
Python identique pour tout le monde, peu importe votre système
d'exploitation chez vous ou à l'université. Vous manipulez surtout un outil indispensable dans le monde
professionnel de la donnée : Git avec la plateforme GitHub. Cela se
traduit par un usage de recherche des informations (cf. le cours) et un usage de votre propre dépôt pour me remettre votre travail
final. Au-delà de la note, l'objectif est de créer un portfolio que vous
pourrez également exploiter lors d'une recherche de stage ou d'emploi.
De plus, vous pouvez aller au-delà du dépôt en découvrant des notions de
Git beaucoup plus avancées.
Le cours essaye de s'adapter au maximum à vos objectifs individuels, car vos profils, notamment dans les connaissances mathématiques de base, sont très hétérogènes. Il espère que contourner le problème des mathématiques par un langage de programmation vous permettra de mieux appréhender les analyses de données, indispensables dans le monde actuel des données massives.
P.S. Le contenu n'est pas encore complet.
- Il manque les P.D.F. des séances, car GitHub transcrit de manière aléatoire les équations codées en LaTeX rendant certaines pages illisibles.
- Il manque quelques exercices. Néanmoins, vous pouvez commencer à travailler dès la semaine prochaine.
- Il
manque de nombreux éléments dans le formulaire mathématique. Ils
s'ajouteront au fur et à mesure du semestre. Les éléments disponibles
sont les éléments essentiels pour comprendre la partie mathématique du
cours.
- Enseignant: Maxime Forriez