jeudi 25 juillet 2013

Big Data: 2) Applications et enjeux

Mais au fait qu'est ce que le Big Data ?
Quand on parle de Big Data on parle souvent des 3 V qui le caractérisent :
  • Volume : de grandes quantités de données,
  • Variété : des données de nature [très] différentes,
  • Vélocité : une capacité à traiter de gros volumes de données en peu de temps.
Certains rajoutent aussi:
  • Véracité : est-ce que ces données sont fiables?
  • Visibilité : les données doivent être interprétables « facilement » par un être humain.
Au cours de ces 2 dernières années on considère que 90 % des données existantes d'aujourd'hui, ont été créées. Il y a donc une croissance exponentielle du volume de données, et ça n'est que le début.

La plupart des données ne sont pas structurées, c'est à dire qu'elles ne sont pas stockées dans des bases de données relationnelles. Ces données sont par exemple dans les pages des sites internet, dans des fichiers de logs, de son, des images, des courriels,... Les formats sont donc de nature très diverse. Environ 80 % des données d'une entreprise ne sont pas structurée. Il faut donc des outils spécifiques pour gérer ces données, notamment des systèmes de gestion de bases de données NoSQL.

Avec le Big Data, on peut mesurer l'impact d'une publicité sur Twitter en fonction des messages échangés. On peut même détecter des tendances de fond en analysant les échanges des internautes sur les réseaux sociaux. IBM appelle ça le « social sentiment index » qu'on traduit par « indice d'opinion sur les réseaux sociaux». C'est ainsi qu'IBM a annoncé cette année que le steampunk deviendrait très tendance en 2014-2015 (http://www.slate.fr/lien/67421/steampunk-tendance-majeure-ibm). De cela découlera une offre marchande liée à cette thématique.

Si on peut détecter des tendances de marché, on peut aussi sonder de façon discrète une population. C'est ainsi que l'équipe du président Obama a utilisé le Big Data pendant sa campagne présidentielle. Elle a mesuré l'impact de ses interventions, des publicités sur la télévision, pour déterminer les actions à mener, comme aller faire une réunion publique dans une ville donnée.

On connaît déjà le ciblage de l'offre par des publicités sur Internet, en fonction des articles, des sujets que vous avez recherchés. On sera à l'avenir encore plus précis. Par exemple, vous dites sur les réseaux sociaux que vous vous intéressez à un produit. Et voilà qu'en passant devant un magasin vous recevez un SMS qui vous propose une promotion sur cet article chez ce commerçant.

Aujourd'hui les données peuvent se revendre une fois rendues anonymes, ou être mises à disposition gratuitement (open data). Elles peuvent aussi être mises à disposition d'un tiers, dans une certaine mesure, si vous avez donné votre accord.

On analyse de plus en plus de façon automatique ce qui se passe dans les centres d'appels dont les conversations. On peut même analyser les émotions pour détecter la satisfaction du client. Une des prochaines étapes sera l'analyse de la vidéo en temps réel pour mesurer le comportement des personnes. Par exemple dans un supermarché pour valider l'efficacité d'une disposition sur une gondole, ou encore pour envoyer un SMS à une personne qui entrerait dans une zone dangereuse.

Faut-il sombrer pour autant dans la paranoïa? Big Brother et Big Data sont ils synonymes? Si certains organismes comme la CNIL sont là pour garantir nos droits, il peut néanmoins y avoir des dérives. Rappelons nous quand même que nous étions déjà surveillé (vous vous souvenez d'Echelon et de l'analyse automatique des courriels sur gmail?). En fait la question qui est posée est aussi celle de l'intention.

Les possibilités d'applications du Big Data sont donc très nombreuses et beaucoup restent à inventer. Elles sont à la fois enthousiasmantes, et parfois un peu effrayantes quant aux multiples dérives possibles. Une chose est sûre, dans les années à venir on aura de plus en plus besoin de compétences dans ce domaine.

Quelques liens intéressants pour aller plus loin :
http://www.conseilwebsocial.com/index.php/2013/reseau-social-et-big-data/
La prévision d'IBM sur le steampunk: http://www-03.ibm.com/press/us/en/pressrelease/40120.wss

Je suis allé à la conférence Big Data de l'école de commerce de Grenoble. Très intéressant! Il y a même des vidéos de la conférence:
http://entreprisedigitale.wordpress.com/

mercredi 24 juillet 2013

Big Data: 1) Ces capteurs qui nous surveillent

Le nombre de capteurs intelligents connectés à un réseau augmente très rapidement. Cela va des systèmes RFID (qui peuvent remplacer le code barre), aux appareils utilisant le GPS (mobiles, ordinateurs de bords de nos voitures), en passant par les webcams et caméras de surveillance, aux systèmes divers qui remontent des données environnementales comme la température, l'hygrométrie, la consommation en eau, en gaz ou en électricité.

Songez qu'il va se vendre près de 4 milliard de puces RFID dans le monde cette année (http://www.planetoscope.com/electronique/1482-production-mondiale-de-puces-rfid.html). En 2011 la commission européenne tablait déjà sur 50 milliard de systèmes connectés en 2020.

Récupérer ces données générées par ces capteurs en temps réel peut présenter un réel intérêt, par exemple en vue d'une optimisation de l'utilisation des ressources (électricité, eau, ...), ou d'une facturation plus exacte avec les compteurs intelligents. Évidemment c'est d'abord pour l'obtention d'un bénéfice que l'on envisage le déploiement de tels appareils.

Un compteur électrique intelligent comme le linky d'ERDF (http://www.erdfdistribution.fr/Linky/), peut savoir en temps réel ce que vous consommez, et du coup de façon plus subtile, on peut deviner les pièces utilisées dans votre logement, les périodes où vous êtes absent ou bien si vous  dormez. Cela peut aller plus loin encore puisque des pirates peuvent couper l'électricité, savoir ce que vous regardez à la télé (cf http://www.cnetfrance.fr/news/compteurs-intelligents-bientot-un-mouchard-chez-vous-39787429.htm).

Dès aujourd'hui on est capable de savoir qui est présent dans un espace délimité pour peu que les portables utilisent le GPS, ou simplement le réseau mobile (GSM). La précision étant nettement supérieure avec le GPS. D'ailleurs certains sites proposent de géolocaliser un mobile connu.

On peut donc sérieusement se poser la question du respect de notre vie privée, de notre liberté, mais aussi de la confiance que l'on accorde aux autres, et de notre complicité, car de plus en plus nous dévoilons d'information.

Depuis longtemps la surveillance des personnes est possible dans une certaine mesure, avec les caméras aux distributeurs de billets, les informations de transactions de carte bleue par exemple, mais seul un nombre très restreint de personnes y avait accès.

Hors depuis quelques années, nous assistons à un changement d'échelle. Le nombre de personnes pouvant avoir accès à une information remontée par un capteur intelligent est beaucoup plus grand. De plus les possibilités sont considérablement accrues grâce à l'explosion du nombre de capteurs de toutes sortes, aux capacités de stockage des données qui ne cessent de croître, et aux outils qui permettent de traiter et d'analyser ces flux en temps réel.

Bref nous sommes déjà dans l'ère du Big Data, et pour la plupart nous ne le savions pas!
A suivre dans le prochain article...
 

Quelques sources intéressantes pour aller plus loin:
http://fr.wikipedia.org/wiki/Compteur_intelligent

Localiser un portable ou un ordinateur:
http://www.commentcamarche.net/faq/29153-localiser-un-telephone-portable
http://www.localiserun-portable.com/
http://preyproject.com un exemple de projet freemium pour localiser votre PC ou votre portable.