Enregistrez le fichier initulé "Notebook Base_OCR+NER" sur votre ordinateur avec le lien ci-dessous (en passant si besoin par par clic droit, enregistrer la cible sous par ex.)
Importez ce notebook "Base_OCR+NER" dans Google Colab. NB: cette fonctionnalité est accessible par le menu fichier de Google colab
Enregistrez le fichier "Données pour OCR + NER (il prendra la forme d'un dossier compressé "data.zip")
En cliquant dans la partie gauche de l'interface sur l'icône représentant un dossier, puis sur l'icône montrant une flèche vers le haut importez data.zip
Le code informatique est regroupé dans des cellules que vous pouvez "lancer" en cliquant sur le bouton Play.
Motivation de l'utilisation de ce code :
Le but est d'identifier les différentes étapes de traitement
Les questions servent à alimenter votre réflexion sur les transformations dans les données
Les exercices vous permettent de faire des analogies et de retrouver du code déjà vu
NB: après le import spacy il faut ajouter la ligne suivante si elle n'y est pas :
!python -m spacy download fr_core_news_lg
Ceci permet de charger le modèle de langue pour le français