Big-Data
L’information, bientôt systématiquement récoltée et analysée à l’échelle planétaire ? En anglais, Big Data signifie littéralement “grosses données” ou encore “mégadonnées”, que l’on peut traduire par grande quantité de données ; mais grande à quelle échelle ?
Tout simplement colossale ! Hors de portée des bases de données classiques et encore plus des outils informatiques destinés à les gérer… Pour analyser le phénomène et son enjeu, il faut comprendre que les données en question proviennent de tous les secteurs d’internet, flux de communications compris !
Selon IBM, spécialiste de l’exploitation des grands volumes de données, nous générons chaque jour sur Internet près de 3 trillions d’octets de données, et 90% de ces mêmes données sont récentes (moins de deux ans.) Et encore, n’est-ce là qu’une estimation basse, ces chiffres étant en constante progression, notamment à cause de l’internet des objets IoT en expansion rapide qui promet de doubler, voire de tripler, ces chiffres déjà difficiles à appréhender globalement…
Réseaux sociaux, publications en ligne, transactions commerciales, courriels, caméras de surveillance, signaux GPS, mémoire cache des navigateurs, échanges sur les réseaux peer to peer, ces données intéressent certaines grandes entreprises, notamment les GAFAM, mais aussi les programmes de recherches des universités et, bien sûr, les gouvernements…
C’est que les usages potentiels sont nombreux, particulièrement au niveau commercial.
En effet, s’il devenait possible d’analyser, en temps quasi réel, le contenu des réseaux sociaux par exemple, ont pourrait facilement connaître l’impact d’un produit, le taux de satisfaction des clients, ou encore remédier à un dysfonctionnement avant même que le service après-vente ne soit contacté…
Scientifiquement, on pourrait aussi, analyser, toujours en temps réel, l’impact d’une hausse du tarif de l’électricité sur les habitudes des consommateurs en collectant sélectivement les données des compteurs électriques d’une région donnée…
Au niveau gouvernemental enfin, on pourrait détecter une fraude à large échelle en ayant une vue directe de toutes les transactions commerciales effectuées sur l’ensemble du Net à un instant précis ou sur une période plus longue. Ou encore, prévoir un mouvement massif de foule, sa direction et son objectif, en analysant, toujours en temps réel, les messages échangés sur Instagram, Twitter ou Facebook, voire en collectant les données de positionnement des smartphones et bientôt des automobiles connectées qui peuvent signaler avec précision chaque utilisateur sur une carte…
Toutefois, si les applications envisagées sont très nombreuses (et parfois inquiétantes) collecter et traiter de telles quantités de données nécessite des logiciels d’un nouveau type (des systèmes de fichiers distribués comme Hadoop des bases de données gigantesques (NoSQL, Apache Cassandra, etc.) et leurs interpréteurs, notamment.
Sans oublier l’infrastructure informatique idoine, très coûteuse à mettre en place, composée de milliers de serveurs capables de stocker de telles masses d’informations, et les supercalculateurs pour les exploiter, car, actuellement, on capte beaucoup plus de données que l’on ne peut en traiter !
Le Big Data est donc un enjeu colossal réservé aux gouvernements et aux très grandes entreprises, du moins au départ, car rien n’interdit d’imaginer la vente des données récoltées ou pire encore, des résultats agrégés à la demande…
Pour certains, l’exploitation à grande échelle de ces données représente LE défi informatique de la prochaine décennie. Il alimentera en données de nouveaux outils scientifiques de compréhension sociale, de marketing et de communication générale d’une portée inédite.
Pour d’autres, la récolte d’une telle masse d’informations globales, qui concernent tous les secteurs de nos vies, mais surtout les recoupements possibles, menace gravement la vie privée des individus… Dans ce dernier cas (que l’on ne peut malheureusement exclure) le Big Data rimerait alors fâcheusement avec le sinistre Big Brother du prémonitoire 1984 de George Orwell.