La prédictibilité
La nouvelle frontière des business numériques est celle de la prédictibilité. Lorsque tu postais tes photos, Marc L***, et que tes amis ou toi-même les commentaient, au fond l’on pouvait juste déduire avec la fréquence de tes posts qui tu étais et ce que faisais. Désormais, l’intelligence des concepteurs de service couplée à celle des machines permet d’aller beaucoup plus loin dans l’exploitation de tes traces numériques. Il devient possible d’anticiper tes besoins avant de te les suggérer. Comme si, en arrivant au supermarché du coin, ton panier t’attendait, plein de ce que tu allais acheter. Tout à la fois fascinant et effrayant.
Comment cela fonctionne-t-il ? Prenons une situation simple, celle où l’on peut se connecter à l’internet à partir de trois points d’entrée : un ordinateur fixe {f}, un ordinateur mobile {m} que l’on appelle smartphone, et un objet connecté {o} (voiture, maison, brosse à dent, bracelet, etc.). Ensuite, il y a un usage associé à chaque point d’entrée. S’agissant de {f} et {m} ce sont bien évidemment les usages les plus populaires et chacun selon ses préférences, privilégie le courriel, un site d’information, un site de média social, la météo, la rencontre, la vente aux enchères, l’achat. Bref c’est ici l’attention que l’on accorde à l’internet qui contraint l’usage. Concernant {o}, l’usage est pour le moment plus limité et se réduit à l’objet. La self-quantification et les métriques personnelles ou encore l’optimisation d’une consommation sont aujourd’hui les fonctions les plus classiques. Toutefois, des objets agrégeant plus de possibilités apparaissent et l’iWatch est un bon exemple. Cela signifie, qu’en jouant le rôle de plateforme, ces objets ont d’ores et déjà agrégé des fonctions et quasiment fait disparaître les objets à fonctions uniques.
Alors résumons : l’usage du numérique c’est un point d’entrée et un usage que l’on va répéter autant de fois que l’on va se connecter à l’internet. Donc, Marc L***, ta vie numérique en équation c’est ceci : une séquence de signes cabalistiques.
Lundi : 6h30, {o1,u1}, 7h {m,u1,u2,u3}, 7h30, {o2,u1}, 7h45, {o3,u1}, 7h47, {m,u4}, et puis à 9h tu arrives à ton bureau {f,…….}, etc.
À 6h30 lundi, ton thermostat connecté s’est mis en route, sur 18 deg, tes enfants n’étaient pas là. À 7h, ton smartphone a sonné, assez mécaniquement tu as enchainé une séquence site d’information, twitter et courriel. À 7h30, ta machine à café connectée s’est mise en route. Une tasse, tu confirmes que tu es seul. A 7h45, tu te brosses les dents, l’information remonte à ton smartphone. 2mn ce n’est pas suffisant. Enfin, à 7h47, ton smartphone te rappelle ton rendez-vous de 9h.
Bref, nous pourrions pousser ce raisonnement très loin et comprendre assez vite que la masse de données produite est infiniment dénombrable. L’intelligence humaine et les algorithmes d’apprentissage (machine learning) ne sont alors là que pour identifier des patterns ou des régularités dans ces séquences de comportements. D’abord chez un seul usager puis en croisant les usagers. Ainsi, si tous les lundis la séquence est exactement la même, il suffit d’un lundi où les choses seront différentes pour inférer que tu ne travailles pas, que tu es souffrant, que tu es en vacances Marc L***. Tu n’auras rien dit à personne mais ton hyper-connectivité omni-canal va permettre d’affiner la probabilité de ton état. Par ailleurs, si dans la séquence quelque chose vient à manquer alors l’objet ou l’ordinateur peut notifier ce manque. Ça, c’est la prédiction de contenu. Plus les séquences sont continues, autrement dit plus l’on se connecte longtemps ou régulièrement et plus il est théoriquement possible, par fouille intelligente des données, de faire ressortir un ou des patterns. Notons qu’une séquence totalement aléatoire reste un pattern remarquable.
Il y a une deuxième façon d’envisager la prédictibilité, c’est celle des proximités entre les usagers. Marc L***, tu ne connais pas Marie S*** Mais l’algorithme qui quantifie ta vie numérique a remarqué que Marie S*** présentait bien des similitudes avec toi. Levée à la même heure, même thermostat connecté, usage pathologique et matinal de twitter, etc. Autrement dit, la suggestion que peut faire le système n’est plus celle liée à ta séquence, mais à celle d’un ou d’un grand nombre d’individus qui possèdent des séquences semblables à la tienne. C’est exactement comme cela que fonctionne Amazon lorsqu’il suggère un achat (prédiction de contenu et prédiction par proximité), Netflix fonctionne selon la même intelligence. La publicité reciblée (
retargeting) et plus généralement tout le
retargeting marketing fonctionnent selon cette logique algorithmique. Réinjecter dans une séquence de navigation des comportements observés et conservés en mémoire. Recevoir un courriel en t+1 conditionnellement à ce que l’on a fait en t ou quelqu’un jugé statistiquement proche a fait. Recevoir une publicité en t+1 en fonction du site visité en t ou ici encore en fonction d’un comportement jugé statistiquement proche. Notons que tout ceci repose sur des mathématiques d’un haut niveau (informatique, statistique, graphe et probabilité) et qu’une forme d’ « école française » en la matière, s’exprime pleinement en ce moment dans des secteurs très techniques du web (publicité programmatique,
Real Time Bidding,
analytics,
retargeting,
clustering,…). Et ce,
jusque dans la Silicon Valley.
Au fond, plus les plateformes qui offrent des services possèdent une audience forte et des données d’usage et plus elles peuvent affiner leur prédiction. Et, peu ou prou, tous les acteurs du numérique cherchent aujourd’hui à exploiter et qualifier des données d’usages au gré des Data Scientists ou des Web Analysts qu’ils arrivent à recruter. Jusqu’à pouvoir anticiper les besoins ? Oui, bien sur.