Résumé de section

    • Démarrer

      1. Enregistrez le fichier initulé "Notebook Base_OCR+NER" sur votre ordinateur avec le lien ci-dessous (en passant si besoin par par clic droit, enregistrer la cible sous par ex.)
      2. RDV sur https://colab.research.google.com/

      3. Importez ce notebook "Base_OCR+NER" dans Google Colab.  NB: cette fonctionnalité est accessible par le menu fichier de Google colab
      4. Enregistrez le fichier "Données pour OCR + NER (il prendra la forme d'un dossier compressé "data.zip")
      5. En cliquant dans la partie gauche de l'interface sur l'icône représentant un dossier, puis sur l'icône montrant une flèche vers le haut importez data.zip

      Le code informatique est regroupé dans des cellules que vous pouvez "lancer" en cliquant sur le bouton Play.

      Motivation de l'utilisation de ce code :

      • Le but est d'identifier les différentes étapes de traitement
      • Les questions servent à alimenter votre réflexion sur les transformations dans les données
      • Les exercices vous permettent de faire des analogies et de retrouver du code déjà vu

      NB: après le import spacy il faut ajouter la ligne suivante si elle n'y est pas :

      !python -m spacy download fr_core_news_lg

      Ceci permet de charger le modèle de langue pour le français

      Cf document ci-dessous pour les autres problèmes identifiés