Big data ? Ce n’est pas donné ! - Numéro 436
01/06/2013
Considérez-vous le big data comme l’amorce de la quatrième révolution industrielle ?
Raphaël Fétique : Le big data est une part intégrante de la troisième révolution industrielle au sens de Jeremy Rifkin (la société des nouvelles technologies de l’information et de la communication). Je ne vois pas de révolution dans l’avènement du big data. Le point de bascule a vraiment eu lieu lors du passage de l’analogique au numérique, grâce au génie de Claude Elwood Shannon, l’Einstein des TIC. Depuis les années 1970, la digitalisation du monde est en marche à un rythme qui ne cesse d’accélérer. La technologie est là ; la vraie rupture et le changement seront son utilisation par tout un chacun pour optimiser nos interactions. Le changement sera principalement, selon moi, culturel.
Êtes-vous un acteur de cette révolution et dans quelle mesure ?
R. F. : Au quotidien, aux côtés de nos clients, moyennes et grandes entreprises de tous secteurs, nous nous efforçons d’expliquer comment mieux collecter, interpréter et exploiter intelligemment les données à des fins économiques. Venant du monde du digital, nous sommes naturellement des plus enclins à faire embrasser ce changement à nos clients : le numérique est un des plus grands pourvoyeurs de données pour les entreprises.
Comment, dans l’océan de données numériques, détecter celles ayant une valeur certaine ? Trop de données tue-t-il les données ?
R. F. : Modéliser le monde est possible, collecter toute l’information est possible, mais inutile. En effet, le stockage et le traitement auraient un coût exorbitant pour un intérêt très limité. Pour avancer sereinement dans le big data, il faut accepter de modéliser, c’est-à-dire de simplifier. L’exemple classique est celui de la prévision météorologique. Capter toutes les données et les retraiter pour calculer la météo du lendemain serait inefficace, puisque le temps de calcul serait supérieur à vingt-quatre heures. N’importe qui scrutant le ciel aurait l’information avant ! Les prévisions météorologiques se fondent par conséquent sur des modèles plus ou moins précis. Il s’avère que la loi de Pareto s’applique assez bien dans le monde de la modélisation : 20 % des causes expliquent 80 % des conséquences. Il convient donc d’avoir une démarche raisonnable, pariant sur la diversité de l’information avec des granularités temporelles limitées : plutôt qu’un relevé de température toutes les secondes, il est préférable d’avoir une mesure toutes les heures mais sur soixante ans, ce qui représente en stockage le même nombre d’octets mais a une valeur bien supérieure.
Naturellement, il apparaît que la connaissance des phénomènes qu’on étudie est primordiale pour définir la bonne stratégie de collecte de données : l’adaptation du périmètre de collecte (garantissant la diversité des données) et de la granularité de l’information (nombre de points collectés) doit être faite par un expert du phénomène mesuré et à modéliser. A Converteo, nous sommes des spécialistes du marketing et du digital : c’est notre expertise qui nous rend légitimes et qui nous permet de cibler les données pertinentes et de valeur.
Le big data est-il destructeur d’emplois, comme il est créateur d’emplois nouveaux ?
R. F. : Le big data, en 2013, est avant tout un terme utilisé par les éditeurs de solutions technologiques. A court terme, il créera nécessairement de l’emploi dans le secteur du logiciel. En parallèle, les entreprises auront besoin de ressources pour mettre en place ces projets, et exploiter les données. Ceux qu’on appelle les data scientists, capables de faire le lien entre la donnée et son utilisation à des fins économiques, seront demain des compétences clés dans les entreprises. Si on considère la nature des décisions qui seront prises grâce au big data, elles seront mieux informées, plus rapides et plus efficientes économiquement.
Les décisions viseront à améliorer la performance des entreprises et devraient contribuer à créer de l’emploi. Mais ne soyons pas dupes : elles pourront également entraîner des choix du département RH difficiles. Le big data ne fera qu’accélérer le processus de destruction créatrice cher à Schumpeter. Il n’est au fond qu’un outil. Le vrai sujet concerne les motivations de son utilisateur. Le responsable reste décideur in fine : il est simplement mieux informé.
Fondamentalement, la digitalisation du monde, de par l’automatisation inhérente qu’elle implique, peut également détruire certains emplois non qualifiés. Il n’y a pas si longtemps, des personnes étaient employées à ressaisir des bons de commande papier dans des systèmes informatiques. Aujourd’hui, entre reconnaissance de caractère ou utilisation des interfaces web pour remplacer le bon de commande papier, cette tâche n’a plus d’intérêt. Il faut réfléchir au moyen de retrouver des postes à faible valeur ajoutée, alors que l’industrie de la donnée numérique est une industrie d’ingénieurs et d’experts. Il y a potentiellement une bascule, d’emplois peu qualifiés vers des emplois très qualifiés.
Toute révolution s’accompagne de peur, peur de l’inconnu, peur de la complexité. Comment transformer « l’apocalypse des données » en paradis ?
R. F. : Dans le monde du marketing, je ne chercherai pas à être rassurant. C’est une discipline qui historiquement nécessite le travail conjoint de littéraires créatifs et de profils plus à l’aise avec les chiffres. Ceux qui ont un profil analytique appellent aujourd’hui de leurs vœux l’avènement du big data. Les autres, naturellement, vont devoir se mettre en question, intégrer ces dimensions ou changer de métier.
Pour les data scientists qui occuperont une place si importante à l’avenir, les problématiques sont de deux natures. D’abord l’expertise du métier : plus on connaît les phénomènes qu’on étudie, plus on comprend les quantités qu’on manipule (ne pas diviser des choux par des carottes), et moins on perd de temps avec des données inutiles. Ensuite, la compréhension technique : il faut savoir comment les données sont collectées, nettoyées et retraitées, pour sereinement les analyser, au risque, sinon, de raisonnements biaisés par des outils mal étalonnés ou des règles de retraitement arbitraires. Le paradis des données, pour des esprits analytiques, est d’avoir de la donnée « propre » à exploiter, avec des outils de data visualisation compatibles… L’enfer serait de passer des jours à réconcilier des données sans jamais les analyser.
Toutes les entreprises sont-elles sur un pied d’égalité, ont-elles la même maturité face aux nouveaux enjeux ?
R. F. : Non, toutes ne sont certainement pas sur un pied d’égalité. Une jeune entreprise va partir d’une feuille blanche : c’est une excellente chose, pour inscrire la data au cœur de la stratégie et des processus. Elle n’aura toutefois aucune profondeur historique de données. Une entreprise existant depuis plusieurs décennies, elle, aura des données, pas obligatoirement les bonnes, ni de bonne qualité, mais avec de la profondeur historique. En revanche, elle n’aura certainement jamais fait la démarche de valoriser ces données. Elle n’aura souvent pas une culture orientée « data », mais plutôt ce que j’appelle « OPGS » : l’opinion du plus gros salaire y triomphe.
Toutes les entreprises ne sont donc pas égales, ne serait-ce que pour des raisons de processus, de culture d’entreprise, de bases de données existantes ou d’outils en place. Tous les secteurs seront affectés par le big data, mais pas tous au même niveau. Alors qu’un pure player internet peut difficilement faire l’économie du big data, le coiffeur du coin de la rue devrait pouvoir vivre encore un moment sans trop se préoccuper du sujet.
Big data est-il annonciateur d’une économie à plusieurs vitesses ?
R. F. : Tous les secteurs ne sont pas exposés de la même manière, et certains métiers continueront à reposer sur des bases assez intuitives. L’économie a déjà plusieurs vitesses : comment comparer un mandataire automobile, qui écoule pour plusieurs centaines de millions d’euros de véhicules, avec une petite concession artisanale ? Le big data sera surtout un outil des industries de volume, les industries de masse, car pour construire un modèle statistique il faut du volume. Au-dessous d’un certain volume d’affaires, les gains apportés par le big data ne couvriront pas les dépenses engagées. Il ne faudrait pas que le traçage, le retraitement, le stockage et l’analyse mettent des entreprises en difficulté.
Comment favoriser la « culture de la donnée » ?
R. F. : La culture d’entreprise est très souvent créée et alimentée, consciemment ou non, par son management au plus haut niveau. Si les dirigeants ont une vision très intuitive et pas du tout analytique de leur affaire, il est impossible – par expérience – de créer une culture de la donnée. La culture de la donnée est principalement une question du département ressources humaines. Il faut enrichir toutes les strates de l’entreprise avec des personnes qui ont soif de données. On pense souvent à la logistique, aux techniques de l’information, au marketing, mais les ventes ou les RH sont des départements ou l’utilisation de la donnée est balbutiante.
A court terme, les profils analytiques doivent évangéliser l’entreprise. Il leur faut convaincre et persuader, travailler le fond et la forme. Le fond, en menant rapidement des projets pilotes peu ambitieux mais avec un sûr retour sur rentabilité. La forme, en rendant la « data » jolie et accessible : par des communications percutantes et du storytelling (mise en récit), plutôt que l’envoi de tableaux denses et austères. La donnée doit conduire à l’action, il faut donc vulgariser et donner envie. La presse utilise ainsi de plus en plus d’infographie, pour rendre accessibles des données riches ou complexes.
Le marketing va-t-il retrouver ses lettres de noblesse ?
R. F. : Je l’espère. En tant qu’ingénieur, j’ai été attiré par le marketing, car c’est une science molle mais rationnelle. On l’a trop souvent prise pour ce qu’elle n’est pas, ou pas seulement, à savoir une discipline de créativité et de communication. Hier, seules les grandes entreprises pouvaient se permettre de mener des études qualitatives ou quantitatives. L’avènement d’Internet permet aussi de collecter des données sur les clients à moindre coût. Il permet donc aux marketeurs de petites ou grandes entreprises de partir de la base : la data.
La révélation de l’informaticien américain Edward Snowden sur la surveillance des communications numériques en est-elle une pour les experts du big data ?
R. F. : Il y a eu récemment une table ronde sur le big data avec des directeurs de marketing. Dans la salle quelqu’un a demandé si, avec les outils logiciels en mode SaaS (c’est-à-dire disponibles « en nuage » et utilisables à la demande) ou dans le cadre de collaborations avec des agences, l’entreprise conservait une copie des données (par exemple les données de messagerie – adresses valides, ouvertures, clics…) et ce qu’il advenait des données en fin de contrat (propriété, effacement...). Aucun des directeurs présents n’a pu répondre et tous ont reconnu qu’obnubilés par les questions techniques et d’analyse, cet aspect leur avait un peu échappé.
La propriété des données est un sujet dont les experts du big data ont conscience, mais trop peu insistent sur son caractère impérieux ! Pour ma part, je savais que tout serveur informatique sur le territoire américain pouvait faire l’objet d’une saisie par un juge mandaté pour cela. Que la NSA (National Security Agency) ait un accès direct sans aucun contrôle populaire, même indirect par des voies démocratiques ou judiciaires, est nettement plus inquiétant.
Quels dangers redoutez-vous pour les libertés individuelles ?
R. F. : Le fait que des Etats puissent demander à des entreprises privées l’accès à des données sans commission rogatoire relève de pratiques totalitaires. Après le traumatisme du 11 septembre 2001, le fait que cet événement ait eu lieu aux Etats-Unis n’est pas surprenant mais très préoccupant. Les principaux sites internet, les plus grosses entreprises mondiales, sont américaines ou ont des locaux aux Etats-Unis.
En tant que client de ces entreprises, je crains assez peu l’utilisation qu’elles pourraient faire en interne de ces données : une réduction, une offre personnalisée ? Ma crainte concerne l’échange de données non contrôlées entre entreprises (un assureur cherchant à augmenter ma cotisation qui récupérerait des informations sur le fait que j’ai fait des recherches sur certains syndromes du cancer…) ou avec un Etat qui pourrait prendre des mesures plus inquiétantes – je pense par exemple au programme de surveillance des internautes en Lybie, sous prétexte de surveillance des pédophiles, qui a abouti à des arrestations sommaires.
Il convient plus que jamais d’éclairer le consommateur et le citoyen, pour qu’il comprenne les enjeux et fasse respecter ses droits. Le marketing peut très bien vivre de données anonymes et ne collecter que les données des clients qui acceptent la collecte, en contrepartie de recommandations, de conseils et de promotions.