BLOG | Focus sur la Real-World Data : Bienvenue dans un monde réel plus intelligent !

12/02/2020

Par Laurent Barot

L'innovation n'est pas une fin en soi. Mais seules les entreprises qui sauront proposer des services disruptifs resteront dans le peloton de tête de leur secteur d'activité.

Les autres risquent de voir leur part de marché décliner et, à terme, disparaître. Fort de ce principe de réalité, la capacité à imaginer et proposer de nouveaux services 'disruptifs' reste un défi, pour la plupart des entreprises.

Les GAFAM ont ainsi su bénéficier de l'avancée des technologies (en y contribuant massivement), en particulier, des progrès spectaculaires de l'intelligence artificielle en transformant ces innovations en services consommables via le Cloud. La mise au point de ces services basés sur des algorithmes de Machine Learning, Deep Learning est rendue possible grâce au volume gigantesque de données dont ils (les GAFAM) disposent : pages web, images, vidéos, données de navigation... Ces gisements de données constituent la matière première indispensable à l’entraînement des réseaux de neurones à la base de la plupart des algorithmes d’Intelligence Artificielle. C’est, par exemple, le cas des services de Natural Language Processing utilisés par les assistants personnels tels Alexa, Google Home.

En revanche, pour la plupart des entreprises même si les algorithmes sont maintenant disponibles, les données, elles, n'existent pas toujours !

Alors comment se doter de telles données ? Les Real World Data constituent la voie royale pour produire ces nouvelles sources, à savoir :

  • Privilégier des données mesurant des grandeurs physiques
  • Utiliser les objets connectés (IoT) pour capter ces mesures et produire les données associées

Un article récent d’Harvard Business Review illustre ce principe 'using machine learning to turn massive data streams produced by industrial operations into insights'.

Passer de l'ère de la Meta Data à la Real World Data !

La plupart des SI des entreprises sont conçus pour gérer des méta-données : via des référentiels, des bases de données relationnelles conservant les données exploitées par applications métier, des ERP... Les données manipulées sont discrètes et de type 'clé / valeur'.

La disruption discutée ici commence par celle de la nature des données envisagées.

La folie des grandeurs… physiques !

En effet, une valeur nouvelle et considérable peut naître de l'exploitation des données, mesurant des grandeurs physiques inhérentes à l'activité propre de chaque entreprise telles que :

  • Enregistrements de signaux physiques (ondes lumineuses et sonores) : vidéos, sons, images. Demain, les champs électriques et magnétiques.
  • Espace/temps : position (GPS), horodate, vitesse, accélération, distance...
  • Environnement : température, humidité, taux de CO2...
  • Humaines : tension artérielle, glycémie, poids...

Les innovations récentes (reconnaissance faciale, langage naturel, eSanté, voitures autonomes, amélioration de la performance énergétique...) exploitent ces Real World Data.

La Real World Data, plus vraie que nature grâce à l’IoT

Les objets connectés constituent la réponse à cette problématique de capture de ces 'Real World Data'. Le marché foisonne de capteurs de données spécialisés : Wearables pour la e-santé, capteurs et drones pour l’agriculture 4.0, puces RFID et beacons pour les Smart Cities...

Les données collectées présentent des caractéristiques bien différentes des méta-données : plus temps réel, plus massives, moins « structurées » (au sens méta-données). Cette révolution numérique génère de gros volumes de données distribuées, dynamiques et variées. Leur exploitation passe par une révolution des SI traditionnels via la mise en oeuvre de solutions de type : Data PipeLine, DataHub,… des acronymes inspirés de l'industrie du pétrole.

De l'IA au service métier en passant par l'IoT Edge… Proposer des services encore plus « intelligents »

La troisième phase de ce processus d'innovation consiste à tirer parti de ces 'Real World Data’ pour les transformer en services à valeur ajoutée.

Cela requiert de l'expertise métier pour identifier les patterns ou caractéristiques à reconnaitre dans le flux de données. La valeur reste basée sur le métier, au coeur de l'activité de l'entreprise ! Ouf, l'humain reste clé pour quelques temps encore dans la création de valeur !

Ces patterns serviront à entraîner les réseaux de neurones des IA ou mettre au point les algos de machine learning, par exemple. Des start-up (Cogito tech., Mitghy.ai) se sont ainsi spécialisées dans l'élaboration de ces modèles (ou patterns), comme le taggage d'images pour faciliter la reconnaissance de formes spécifiques.

L'algorithme entrainé dans le cloud est ensuite déployé dans les objets connectés : Les algorithmes ainsi entraînés peuvent alors être intégrés au SI pour être proposés en tant que service à valeur ajoutée. Et pour boucler la boucle (les mécanismes auto-référencés sont souvent porteurs intrinsèquement de valeur !), ces mêmes algos entraînés peuvent être déployés dans les objets connectés (IoT Edge) : pour traiter les données au plus proche de la source, prendre les décisions en temps réel sans dépendre des latences réseau (alertes, alarmes), économiser de la bande passante et répondre aux exigences de sécurité et de confidentialité.

Cette révolution de la 'Real World Data’ n'est pas sans soulever des questions d'éthique et de confiance dans les algorithmes et modèles de machine learning utilisés. Ces derniers doivent pouvoir expliquer pourquoi ils ont pris la décision qu'ils ont prise. Le métier de Data Scientist doit ainsi évoluer pour être à même de construire de tels modèles de machine learning au sein des entreprises. Mais la question de confiance reste posée. Au-delà de l’utilisation d’outils pour aider à la détection de ‘biais’ tels AI Fairness 360, à quand un serment d'Hippocrate pour les Data Scientists nouvelle génération ?