lien externe

Boule de cristal du CRIM, édition 2012

Envoyez-nous un courriel

Regards sur le Big Data

 
La nouvelle édition du colloque « La Boule de cristal » avait lieu au siège social de l’Association d’aviation civile internationale, à Montréal, le mardi 15 mai 2012. Au fil des conférences présentées lors de cet événement, un sujet était mis de l’avant : le Big Data. Comment peut-on l’intégrer à nos pratiques ou en faire la gestion? Retour sur quelques-unes des conférences ayant alimenté les discussions.
 
Le Big Data, c’est un grand volume de données qui sont générées rapidement, dans une grande variété de formats, et qui sont conservées sur une longue durée. « Aujourd’hui, on a besoin d’outils pour collecter rapidement ces informations, pour les stocker et pour les communiquer vite et bien », remarque Philippe Nieuwbourg, analyste chez Decideo, lors de sa présentation « Défi Big Data : au-delà de gérer un large volume de données ». Pour lui, l’étude de cette croissance énorme de données mérite d’être observée de manière disruptive : « Il ne faut pas se mettre de barrière, il ne faut pas prendre de décision tout de suite. On doit plutôt rester agile, en se préparant à un grand changement dans nos entreprises, car le Big Data se fera chez vous, demain, et cela, avec ou sans vous! ».
 
« Data is the New Oil », rappellera, d’ailleurs, Stephen Gold, directeur mondial de la mise en marché des solutions Watson chez IBM, en introduction à sa conférence « Putting IBM Watson to Work ». « Seules,  les données ont peu de valeur. C’est lorsqu’on les transforme, qu’on les raffine, qu’ils prennent toute leur importance », explique-t-il. La montée en force du Big Data a d’ailleurs amené la montée, tout aussi forte, de l’analytique, question de les comprendre, de les forer. « Dans tout cela, le défi est aussi de replacer ces informations dans le contexte de notre vie quotidienne ».
 
Par ailleurs, il estime que cette montée devra aussi être accompagnée de l’émergence de systèmes informatiques intelligents et capables d’apprendre. « Si vous demandez à un système standard ce qu’est deux plus deux, il vous répondra quatre. Un système intelligent, lui, évaluera la question, son sens, sont contexte, tentera d’arriver à une série de probabilités avant de répondre. Et cette approche est beaucoup plus riche et plus utile pour nos sociétés. On s’assure que les réponses données auront un sens dans le contexte où on les aura posées », continue M. Gold. Il a rappelé que c’est d’ailleurs la philosophie qui a mené au développement du superordinateur Watson, qui dans ce contexte, illustre bien les possibilités offertes par cette analytique de haute performance dans des domaines comme la santé, l’administration publique ou l’économie.
 

Repenser les transports

 
Un des contextes d’applications du Big Data serait assurément la sphère des transports, selon Claude Garneau, conseiller stratégique, Géomatique et iSociété, chez Fujitsu. « Dans le futur, on rêve que les déplacements physiques soient éliminés. Le résultat actuel de cette quête, c’est le télétravail, qui, malgré un impact positif, ne peut pas régler les problèmes de transports pour beaucoup de corps de métiers », explique-t-il, lors de sa conférence « Les systèmes de transports intelligents : une solution incontournable ». En ce sens, pour lui, l’information concernant les déplacements doit être disponible, afin que les décideurs soient en mesure d’en faire l’adéquation, l’analyse, bref, de la mettre au profit du citoyen de la ville et de ses déplacements.
 
On espère ainsi permettre à la sphère urbaine de faire des gains en matière de sécurité routière, de confort et de fluidité. « Et en plus, toute pratique intelligente vise a priori une bonification environnementale », poursuit M. Garneau. Ces pratiques permettraient également de renverser les impacts négatifs de la congestion : perte de productivité, diminution du nombre d’heures de travail productives, hausse des risques d’accident de la route, trop grande consommation d’essence. « Le Big Data permettra la diversification des outils existants, la création d’applications qui permettront d’information les citoyens sur les conditions de circulation, le développement d’outils d’analyse de l’information. Avec cela, on peut déjà commencer à parler de transports intelligents : il y a une multitude de sources de données, provenant d’une multitude de sources, qui pourront permettre d’alimenter les déplacements futurs! ».
 

Gérer le Big Data

 
Une bonne partie des données arrivera aux utilisateurs dans un contexte où ces informatiques ne sont pas structurées. Individuellement, elles proviendront en bonne partie de documents produits grâce à des logiciels de traitement de texte, ou encore de courriels, de fils Twitter, de blogues ou encore des médias sociaux. Alors que certaines informations seront en format texte, d’autres seront plutôt des contenus audio ou vidéo. « Comment peut-on l’utiliser? Il faut d’abord identifier ces données, puis les convertir dans un format sur lequel nous sommes en mesure de travailler, puis y développer une structure », explique Christine Connors, présidente de TriviumRLG, dans sa conférence « Getting Started With Unstructured Data ».
 
Pour bien creuser ces données, il s’agit également, voire même surtout, d’avoir un objectif, un but. « On doit chercher à accomplir une tâche grâce à ces données. Si ce n’est pas le cas et qu’on s’y lance, il y a de bonnes chances qu’elles s’effondrent sur nous. Il ne faut pas s’attaquer aux données non structurées simplement pour le plaisir de le faire! ». Et cela, tout particulièrement dans un contexte où les données privées et les données publiques peuvent également être combinées en entreprise pour des fins d’analyse et d’évaluation.
 
Évidemment, ce tri d’information représente un grand défi, selon Thierry Hubert, président-directeur général de Darwin Ecosystem. « Il ne faut jamais oublier qu’on est beaucoup plus équipé à scanner qu’à lire », dira-t-il dans sa conférence « Consuming Data in the Age of Information Overload ». Selon lui, il faut également se questionner quant à l’approche qu’on prendra pour ordonner ce chaos d’information et départager l’information utile de l’inutile. « Qui devrait décider, qui a raison? L’humain ou la machine? Si on a une vision trop linéaire du chaos, on passe à côté d’opportunités », souligne-t-il. Il rappelle d’ailleurs que « la machine est au service de la décision humaine » et que, parallèlement, pour bien trier l’information, il faut « favoriser la perspective plutôt que le détail », ce que, dans bien des cas, la machine est incapable de faire.
 

Et la vie privée?

 
Dans tout cela, il n’en reste pas moins que la question de la vie privée continue de se poser. Et, pour Charles Nouyrit, président-directeur général de MyID.is Certified, cela concerne autant l’information qui sera rendue publique par les administrations publiques, à travers notamment des systèmes de données ouvertes, qu’en ce qui concerne l’information que les utilisateurs eux-mêmes rendent publiques au fil des médias sociaux. « On trouve ces informations publiques, poussées par les gouvernements, par l’entreprise, par l’individu. Il y a un endroit où elles se croisent toutee, où elle peuvent être analysées et, selon le contenu qui fut poussé, elles peuvent permettre de cataloguer un individu », prévient-il dans sa conférence « Protection de la vie privée et Big Data, comptabilité ou non? ».
 
Tout en reconnaissant l’intérêt, le potentiel et la nécessité du Big Data, il craint ainsi que certains groupes se lancent trop rapidement dans la libération des données, sans penser aux conséquences. « L’anonymisation des données est vitale et je crains que les données qui sont libérées par les gouvernements ne soient pas suffisamment "anonymisées" considérant que les outils utilisés pour les analyses peuvent être extrêmement efficaces. En ce sens, est-il possible, aujourd’hui, de prévenir la dé-anonymisation des données? Actuellement, ces données ne peuvent être utiles ou parfaitement anonymes, mais en aucun cas les deux en même temps ».
 

Une recette pour creuser le Big Data

 
En fin de journée, Alistair Croll, analyste principal chez Bitcurrent, a proposé dans sa conférence « Big Data : Towards the Quantified Society », une approche pour appréhender cet univers. Dès le départ, il suggère de commencer en ayant en tête la finalité de son opération : « Dans un mode axé sur l’information, nous existons dans l’information. Le problème n’est plus de trouver les réponses, le problème est plutôt de bien poser les questions ». Pour bien réussir à mener un processus de prise de décision, aujourd’hui, il faut également, selon lui, remplacer les opinions par des données. « Dans un monde axé sur l’information, nous écoutons les faits », souligne-t-il.
 
Et, enfin, il estime qu’il faut aussi envisager les choses en fonction du « possible », plutôt que de la négative ou de l’affirmative. M. Croll voit ainsi dans la négative, la sphère scientifique. « Le non, c’est la science qui demande à voir les données et à obtenir des preuves et qui a beaucoup de difficulté à réaliser des actes de foi ». Inversement, l’affirmative est, pour lui, l’excès de croyance, un besoin de trop peu de preuves pour mener ces actes de foi. Ainsi, le « possible » est le lien entre ces deux extrêmes capable d’utiliser les faits et de les rechercher, capable d’être créatif et de réaliser des actes de foi. « Pour réussir, dans un monde axé sur l’information, il faut être à la fois affirmatif et négatif. Les leaders de demain sauront, ainsi, envisager la sphère du possible ».