Extraire la donnée en datajournalisme

Formations courtes
Approfondissement
1 jour - 7 heures
Paris
Apprendre à récupérer des données disséminées dans un site, intégrées dans un document PDF ou une image scannée.

Objectifs

  • Apprendre à récupérer des données disséminées dans le cadre d'un projet de datajournalisme.
  • Extraire ces données quel que soit leur format.

Pour qui ?

Journalistes, tous producteurs de contenus digitaux dans le cadre d'un projet de datajournalisme.

Prérequis

Maîtriser le tableur.

Homologations

Programme

Programme de la formation

Extraire depuis un site web

  • Découvrir Outwit: se familiariser avec ce logiciel qui permet de récupérer des informations et des données de manière structurée puis les transformer et les stocker.
  • Fonctions d'import depuis Google spreadsheet.
  • Utiliser Kimono: se familiariser avec le data scraping.

Extraire depuis un PDF

  • PDF to Excel, pdftables, etc.
  • Découvrir Tabula.

Extraire depuis un scan

  • S'initier aux logiciels OCR.

Nombreux exercices et cas pratiques

S'inscrire en ligne

Extraire la donnée en datajournalisme
Ref
4610217
Tarif
690€ HT

Prochaines sessions

Paris
Prochaines sessions
07 nov. 2017
07-11-2017