Séance 3 - Quelques propriétés statistiques des données textuelles et leur application
Résumé de section
-
-
Déposez un document PDF (2-3 pages) où vous analyserez les différences de fréquence (en français puis en anglais) entre les mots de :
- 20.000 lieues sous les mers VS 5 semaines en ballon + Voyage au centre de la terre
- 5 semaines en ballon VS + 20.000 lieues sous les mers Voyage au centre de la terre
- Voyage au centre de la terre VS 5 semaines en ballon + 20.000 lieues sous les mers
Vous comparerez ces sous-corpus grâce à l'onglet Keyword d'Antconc pour répondre aux questions suivantes :
- Quels sont les 20 mots les plus spécifiques de chaque livre (dans les deux langues)
- Que nous disent-ils de la façon dont les livres sont construits ?
- Observez vous des différences entre les résultats obtenus sur le français et sur l'anglais ?
Utilisez des graphiques ou captures d'écran de Antconc pour appuyer vos analyses.