Extraire les données en datajournalisme

Formations courtes
Approfondissement
1 jour - 7 heures
Apprendre à récupérer des données disséminées dans un site, intégrées dans un document PDF ou une image scannée.

En partenariat avec:
wedodata

Objectifs

  • Apprendre à récupérer des données disséminées dans le cadre d'un projet de datajournalisme.
  • Extraire ces données quel que soit leur format.

Pour qui ?

Journalistes, tous producteurs de contenus digitaux dans le cadre d'un projet de datajournalisme travaillant dans des structures publiques.

Prérequis

Maîtriser le tableur.

Homologations

Programme

Programme de la formation

Extraire depuis un site web

  • Découvrir Outwit: se familiariser avec ce logiciel qui permet de récupérer des informations et des données de manière structurée puis les transformer et les stocker.
  • Fonctions d'import depuis Google spreadsheet.
  • Utiliser Kimono: se familiariser avec le data scraping.

Extraire depuis un PDF

  • PDF to Excel, pdftables, etc.
  • Découvrir Tabula.

Extraire depuis un scan, une image

  • S'initier aux logiciels OCR.
  • Extraire les données en appliquant les règles déontologiques.

Nombreux exercices et cas pratiques

S'inscrire en ligne

Extraire les données en datajournalisme
Ref
4610218
Tarif
700€ HT

Prochaines sessions

Le choix de la session vous sera demandé lors de votre inscription.