La datavisualization, ou visualisation de données, est en plein essor. Elle accompagne le développement du marché communément appelé “Big Data”, ou données massives.

La datavisualization propose une représentation visuelle interactive des données, et fait émerger par le graphisme et les interactions-utilisateur des faits, des tendances, indécelables autrement.

Elle permet donc une compréhension d’un très large flots de données dont la simple lectures et l’analyse sont rendues impossibles de part la quantité de données en jeu.

La visualisation des données se veut une solution pour de nombreux secteurs :

  • Finance
  • Banque
  • Internet
  • Télécom
  • Vente
  • Services publics
  • Marketing

Tous les secteurs qui ont accumulé un large stock de données et qui continuent de le faire, sont des clients de la datavisualisation. Ces données peuvent être de tous ordres : logs de sites internet, historique de vente, données comportementales, données textuelles, données statistiques, géographiques, économiques, sociales, … Leur dénominateur commun est la quantité et / ou la complexité de l’information.

Les raisons d’un boom :
la numérisation massive des données

Internet fait émerger ce nouveau marché pour différentes raisons. Le réseau est :

  • il est producteur de données : historique de fréquentation de sites, de suivi comportementales d’internautes, données produites par les consommateurs sur les réseaux sociaux, forums, avis, votes, notes, …
  • il est stockeur de données : grâce aux clouds, ces données peuvent être rassemblées.
  • il est diffuseur de données : les services publics se lancent dans l’Open Data pour des raisons de transparence mais aussi parce que la technologie le permet.
  • il est l’interface de données : à partir d’interface utilisateurs dédiées, il est possible de créer des interactions qui vont permettre au public de manipuler les représentations visuelles pour y chercher des informations.

Par ailleurs, le design informatique a évolué pour une part vers plus de technicité : l’émergence de standards visuels (open font, web, css, html, svg) et de langages de programmation accessibles (javascript, python, php) à des non programmeurs, ont contribué à créer une génération de “techno-designers” qui ont su associer à un sens du design très pointu une connaissance forte et précise des contraintes techniques. Au graphique bureautique créé sous Excel répond les travaux des designers sous Processing.

L’émergence du Big Data

La notion de “big data” n’a de cesse de se développer et de prendre corps au sein des entreprises. L’idée est que l’ensemble des données produites sur plusieurs années, par des milliers, voire des millions de consommateurs, si elle peut être analysées, offrent l’opportunité d’être encore plus efficace dans la vente de nouveaux produits ou la création de nouveaux services. C’est la victoire du quantitatif statistiques sur le qualitatif.

La crise économique mondiale renforce cette idée : les décisions stratégiques de entreprises, comme les décisions d’investissements des groupes financiers, doivent pouvoir se justifier : il ne suffit pas de donner ses conclusions, il faut désormais les démontrer et offrir aux décideurs suffisamment de granularité pour qu’ils donnent leur aval sur les orientations stratégiques.

Par ailleurs, les scandales financiers et politiques, les escroqueries internationales, les groupements terroristes, le blanchiment d’argent à échelle internationale, exigent une expression totale de la transparence : les données qui régissent les systèmes, qui les tracent, ou qui sont générées par eux, se doivent d’être à la disposition du plus grand nombre. L’effet Big Brother est réciproque : si les marchés, les entreprises, les politiques obtiennent un grand nombre d’informations sur les consommateurs ou les électeurs, les citoyens peuvent par ailleurs s’équiper d’outils Open Source et exiger l’accès à toutes sortes de données pour vérifier la probité des élites gouvernantes.

Une source de création d’emplois

La datavisualization sera à l’origine de la création de très nombreux emplois à forte valeur ajoutée. Ces métiers d’ingénierie de l’information sont un atout primordial pour un pays. En effet, il ne s’agit pas seulement de créer un nouveau service dans le secteur tertiaire mais cela donne un avantage stratégique pour un pays, une entreprise, ou une ONG.

Certains de ces métiers existent déjà mais il faut les adapter à la double notion de “Big Data” et de “Data visualization” qui impliquent de reconsidérer les pratiques.

Le captage

Ce sont les métiers permettant la collecte d’information. Cela va de l’administrateur réseau qui configure le serveur Apache pour récupérer l’historique de navigation des visiteurs d’un site, au technicien qui pose une caméra à reconnaissance de formes pour compter le nombre de passants devant une vitrine et leur comportement, en passant par le gestionnaire d’une boutique enregistrant ses ventes et ses clients, ou encore le service public faisant œuvre de référencement et de collecte d’information.

Les agrégations

Ils analysent la données et la qualifient. Ils déterminent des catégories, valident la cohérence de l’information et mettent au format ou normalisent l’information qui sera traitée.

La modélisation statistique

Ils proposent des représentations et des modalités d’interrogations de la base de données créées. Ils valident les choix de représentations, et dénoncent les biais d’interprétation possibles.

Le data-design

Ils programment et designent les représentations visuelles, définissent des interactions d’exploration des données, créent des interface utilisateur pour interroger et visualiser les données.

Le consulting

Ils interprètent l’information visuelle et recommandent des orientations stratégiques.

 Des offres nouvelles à créer

 Le logiciel Desktop

Propose un logiciel pour développer ses propres applications d’analyses de données.

 Le Saas

Propose des outils en ligne pour simplifier la production des graphiques. Selon l’abonnement, il est possible de stocker plus ou moins de données ou d’accéder à des représentations plus ou moins complexes.

Le studio de data-design

Récupère des données déjà traitées et analysées et propose une représentation visuelle infographique plaisante. Activité qui ressort du domaine de la communication. La problématique n’est pas d’accéder à de la connaissance mais à communiquer un message par le biais d’une infographie.

Le consulting

Propose une stratégie pour la mise en œuvre d’une politique de traitement, analyse et représentation des larges données. Le principe est d’aider une DG à mettre en place des outils d’aide à la décision.

Le data-minage

Récupère les informations dont dispose l’organisation, analyse les données et les représente pour aider l’organisation à prendre des décisions.

Journalisme de données

Récupère des données, habituellement publiques, les structure, puis les présente (data-design) mais aussi les analyses et les les explique.