Le numérique rebat les cartes du journalisme - épisode 2/3
Le journalisme de données
De la collecte à la scénarisation de larges bases de données pour en extraire de l’information compréhensible par tous, cette technique génère de nouveaux défis.
De la collecte à la scénarisation de larges bases de données pour en extraire de l’information compréhensible par tous, cette technique génère de nouveaux défis.
Une étude des chercheurs de l’université de San Diego (1) a montré qu’un foyer américain est exposé, en moyenne, à 100 000 mots par jour. Dans un monde que le numérique a rendu hyper-mnésique, nous sommes submergés par des flots d’informations. L’enrichissement et la prolifération des sources d’information (blogs, agrégateurs, médias pure-players, consommation simultanée de plusieurs médias, etc) a ouvert la porte à l’infobésité et à la mal-info.
En cela, il s’inscrit pleinement dans la tradition journalistique consistant à aller chercher de l’information brute pour la présenter de manière adéquate au public. Seulement, il envisage différemment le rôle médiateur du journaliste. Le journalisme de données s’adresse d’abord à l’intelligence visuelle du public, et non à son intelligence verbale. Pour cela, il peut prendre la forme de bases de données enrichies, d’infographies interactives, de timelines (2) et de cartes rich-media (3) , d’applications interactives, etc.
Traditionnellement, l’unité de base de l’activité journalistique est l’article (story) ; avec le journalisme de données, la base de données s’impose comme élément premier. Le commentaire et la narration sont secondaires, les données chiffrées priment. Là où les journalistes traditionnels pensaient en terme de récit, de signature, de titraille, de chapeau et d’accroche, il s’agit de rendre visible les mêmes phénomènes mais à travers le langage des nombres, des bases de données, de l’infographie, de la cartographie et autres visualisations. « Newspapers need to stop the story-centric worldview », enjoignait déjà en 2006 le journaliste américain Adrian Holovaty, précurseur dans ce domaine
Le journalisme de données ne fait pas uniquement appel à l’intelligence visuelle du visiteur, il travaille également sur la cinétique et l’interaction. Les exemples les plus réussis de journalisme de données présentent des visualisations interactives, autorisant l’internaute à jouer avec les données, à les manipuler, à se les approprier. Plongé dans une posture active, l’usager appréhende et mémorise plus facilement l’information : il peut rechercher dans une base, zoomer sur une carte, personnaliser une infographie, paramétrer les données à comparer, apporter ses propres données, etc.
Le journalisme de données répond aussi aux besoins grandissants de personnalisation de l’information. La délinéarisation, la fragmentation, voire l’individualisation, de la consommation d’information sont désormais caractéristiques des usages du Web. Pour y répondre, l’information à la carte s’impose. En bâtissant des interfaces graphiques pour accéder aux bases de données, le journalisme de données permet non seulement de proposer un aperçu de gros volumes de données, d’en faire jaillir le message essentiel, mais il offre aussi à l’usager la possibilité d’interroger n’importe quelle partie de cette base de données, de la rendre accessible et compréhensible instantanément : choix du zoom, délimitation de la zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation. Une application de journalisme de données peut alors répondre à toutes les attentes particulières des internautes.
Le succès de ces « data centers » de la presse locale américaine révèle une caractéristique du journalisme de données : il permet d’atteindre le micro-local, il autorise une granularité de l’information sans précédent. Les communautés de voisinage sont toujours intéressées par ces toute petites informations, qui ne valent pas la peine d’être mentionnées dans un journal local, mais qui peuvent répondre à la question « pourquoi la sirène a-t-elle sonné dans mon quartier ? ». Au niveau hyperlocal, le journalisme de données peut ainsi générer de la proximité entre les rédactions et les communautés d’habitants pour lesquelles elles travaillent.
Si ces contenus attirent l’audience, s’ils procurent une « expérience d’information » véritablement remarquable, ils peuvent devenir des écrins publicitaires particulièrement prisés, d’autant plus que les bases de données sont de puissants outils de fidélisation des visiteurs. Les éditeurs ont là toutes les cartes en main pour négocier des partenariats publicitaires rémunérateurs.
Les éditeurs pourraient ainsi tenter de faire payer les internautes puisque ces contenus offrent une réelle valeur ajoutée, puisqu’ils représentent un vrai service en rendant compréhensible rapidement de gros volumes d’information, et puisqu’il est difficile de leur trouver des substituts dans les blogs ou les agrégateurs. Reste à tester la disponibilité à payer des consommateurs d’information en ligne(12) .
Plus globalement, le journalisme de données peut aussi être considéré comme une vitrine de la marque-média, comme un outil de communication des éditeurs à destination tant de leur public que de leurs annonceurs. Dans l’univers français des grands sites d’informations, où les contenus différenciants sont rares, les premiers à proposer du journalisme de données acquerront immanquablement une image de précurseurs.
Par ailleurs, si les éditeurs consentent à s’éloigner de leur cœur de cible traditionnel, le journalisme de données peut leur ouvrir de nouveaux marchés. Si des journalistes consacrent du temps et des moyens à la collecte de données, il ne semble pas inconcevable de tenter de les revendre. Des bases de données inédites et à forte valeur ajoutée pourraient intéresser des acteurs du secteur économique, du domaine marketing ou de l’univers de l’éducation. Par exemple, une marque média crédible aurait toute légitimité à proposer des bases de données thématiques aux étudiants pour leurs révisions, à des directeurs financiers, de nouvelles visualisations des données clés de leur secteur d’activité.
Dernière piste à explorer : le canal de distribution. Quel est le meilleur support de consultation des visualisations interactives ? Est-ce l’ordinateur personnel ? Les tablettes tactiles ? Des bornes dans les lieux publics ? L’exemple de l’agence de presse spécialisée dans la finance Bloomberg est intéressant à méditer. Bloomberg rend disponible via un terminal propriétaire une mine d’informations : bases de données, tableaux historiques, liens sélectionnés, courbes descriptives des tendances du marché, frises chronologiques, etc. Ce service de mise à disposition de données est intégré dans le terminal, loué pour 1 800 euros par mois, ce qui représente une source de revenus plus que confortable. Tous les éditeurs n’ont, bien sûr, pas vocation à se lancer dans le hardware, par exemple. A la différence de la consultation de contenus sur un navigateur, la consultation via les applications natives réduit le papillonnement du public d’un site à l’autre et offre une expérience ergonomique ou esthétique décuplée. Non seulement cela renforce l’attention du consommateur d’information, mais cela permet aussi d’instaurer un péage à l’entrée des contenus.
ARTICLES
Cette étude a été menée par Sara Quinn auprès de 600 Américains. Trois versions d’une même collecte d’informations sur la grippe aviaire ont été testées : la première était un texte narratif, la deuxième un texte narratif avec des graphiques, et la troisième ne comportait aucune structure narrative mais des tableaux, des chiffres, des cartes, etc. D’après Sarah Quinn, non seulement la dernière version facilitait le plus la rétention d’information, mais elle attirait également davantage les lecteurs. La chercheuse reconnaît cependant que les résultats de son test ne peuvent être extrapolés à tous les sujets. La narration reste appropriée pour des sujets plus subjectifs. Via P. BELLEROSE, Les lecteurs sont plus attentifs sur le Web, infopresse.com, 3 mars 2008,
Le site d’information hyper local du Washington Post, le Loudoun Extra, avait les chiffres de la délinquance, les résultats sportifs, ceux des écoles, etc. Entre mars et octobre 2007, les bases de données du site ont enregistré 7,2 millions de pages vues. Le site du quotidien régional Cincinnati Enquirer a aussi commencé en 2007 à poster des bases de données : statistiques des agressions sexuelles, plaintes pour tabagisme, gains aux casinos de l’Ohio River, prix de l’immobilier, boîtes de croquettes pour chien rappelées par leur fabricant, etc. Le jour de son ouverture au public, le Data Center du Cincinnati Enquirer a enregistré plus de 67 000 pages vues, soit deux fois plus de trafic que les galeries photos les plus populaires du site. Sur ces bases de données, le nombre moyen de pages vues par visite avoisinait 11,5, suggérant une audience impliquée et intéressée par les contenus qu’elle y trouvait. Six mois après son lancement en décembre 2006, le Data Universe du site de l’Asbury Park Press comptabilisait plus de 40 millions de pages vues. La base de données la plus populaire, concernant les salaires des employés fédéraux, a été vue 4 millions de fois en moins de trois mois. Via S. BUTTRY, Databases help you become the source for answers, newspapernext.org, 13 august 2007.
Le projet ActuVisu ambitionne de renouveler le traitement de l’actualité grâce à la visualisation de données. Projet de fin d’étude d’une équipe d’étudiants du master Management des médias de Sciences Po Rennes et de l’Ecole des Hautes Etudes des Technologies de l’Information et de la Communication (HETIC Paris), ce site interactif entièrement dédié à la visualisation de l’information a été lancé en juin 2010. Pour information, l’auteur de cet article est à l’origine du projet ActuVisu.
La toute nouvelle équipe de data-journalistes du site Owni, emmenée par Nicolas Kayser-Bril, teste également depuis quelques mois de nouvelles façons de faire vivre et parler les données, via des applications et des mashups, via du crowdsourcing et de l’enquête. en matière de journalisme de données.
Pour plus de détails voir la très bonne synthèse de Didier Frochot sur les-infostratèges.com et l’étude de la jurisprudence par Bernard Lamon. Deuxième point : le droit des producteurs de bases de données. Lorsque la création d’une base de données nécessite un investissement financier, humain et matériel substantiel, le droit des producteurs reconnaît au créateur un droit de protection analogue à celui de l’auteur sur son œuvre.
Enfin, l’ouverture des données repose avant tout sur un enjeu d’accessibilité. Certes, de nombreuses données chiffrées sur des organismes publics ou privés sont aujourd’hui accessibles. Cependant, bien souvent ces données sont inutilisables car perdues au milieu de fichiers pdf, éparpillées entre des masses de documents aux formats disparates et peu malléables : en définitive, les données sont rarement structurées