
De nombreuses organisations prétendent être data driven ou data centric, utilisant ces termes de manière vague et interchangeable. Mais les deux ne sont pas identiques et ont des significations bien différentes.
Data driven vs data centric
Pour une organisation ou une entreprise, être data driven signifie être pilotée par les données. C’est avant tout un état d’esprit qui implique de prendre des décisions stratégiques sur la base d’une analyse des données et des informations.
Être data centric, c’est bien plus que cela. Les entreprises qui le sont considèrent les données comme des actifs à part entière, proprement catalogués. La gouvernance des données vient établir un cadre organisationnel et des règles afin de supporter l’ensemble des projets liés aux données.
Architectures data centric
Être data centric, c’est aussi adopter une architecture centrée sur les données, pensée comme un ensemble robuste capable de servir toute l’entreprise dans la durée. Elle est sécurisée, fiable et surtout évolutive en termes de volumes et d’usages.
Ces dernières années, les techniques issues du big data ont apporté de nouveaux styles d’architectures – data lake, data hub, data mesh – permettant de répondre à quasiment n’importe quelle problématique.
Initialement développées par les géants du web pour faire face à des volumes sans cesse croissants, ces techniques sont à présent de plus en plus utilisées en informatique de gestion en entreprise alors que les volumes y restent relativement faibles. Et pour cause, elles apportent de nouvelles fonctionnalités. La plus intéressante étant sans doute l’évolutivité de l’espace de stockage que l’on peut agrandir indéfiniment grâce au cloud. Ainsi, finis les silos de données : on peut désormais les avoir dans un espace unique et les rapprocher sans limites et sans compromis de performance.
Bénéfices de l’approche data centric
De ce fait, une entreprise data centric a un avantage indéniable sur ces concurrents car elle peut très rapidement traiter toutes les données qui sont à sa disposition.
Par exemple, en cas de guerre, de pandémie ou de catastrophe naturelle… Un industriel doit pouvoir réorganiser très rapidement sa chaîne logistique. Et cela, il peut le faire grâce à l’approche data centric qui maintient à sa disposition toutes les données possibles et imaginables avec une qualité maîtrisée.
À l’opposé, une entreprise qui ne l’est pas met des jours, voire des semaines à répondre à des questions dont la rapidité de réponse peut être vitale.
Devenir data centric est donc un enjeu considérable au 21e siècle ; mais comment y parvenir ?
Devenir data centric
Les quatre ingrédients d’une organisation data centric sont :
- Alignement de la stratégie numérique avec les objectifs de l’entreprise
- Architecture des données évolutive et prenant en compte l’innovation de la science des données (data science en anglais)
- Gouvernance des données
- Reporting et visualisation des données
Alignement de la stratégie numérique avec les objectifs de l’entreprise
Une transition vers un modèle data centric demande un alignement des objectifs de l’entreprise avec la stratégie numérique.
Avant de réaliser cet alignement, il faut identifier les besoins stratégiques de l’entreprise pour que la technologie puisse y répondre. La stratégie numérique doit satisfaire les exigences définies par les différents métiers de l’entreprise.
En rendant les données accessibles et utilisables par tous ses collaborateurs, une entreprise data centric a l’avantage de pouvoir changer sa stratégie numérique à tout moment pour survivre aux évolutions de la conjoncture.
Architecture des données et data science
Une fois les stratégies alignées, une entreprise doit les mettre en pratique et commencer à tirer profit de ses données.
Elle doit construire une architecture des données qui place la data au cœur des opérations, comme nous l’avons expliqué plus haut.
Depuis quelques années, le cloud a considérablement facilité de telles architectures et pour cause : il permet de s’affranchir des limites d’un système d’information traditionnel sur site (on-premises en anglais) qui sont un espace de stockage finis, des investissements figés et le manque de flexibilité.
Le cloud permet de sous-traiter la gestion des infrastructures et leur évolution à un fournisseur dont c’est la spécialité. Les trois leaders mondiaux que sont Amazon, Microsoft et Google sont généralement considérés comme un gage de stabilité à long terme.
Ainsi, les data architects disposent de toutes les briques dont ils ont besoin pour se concentrer sur la conception d’une architecture data centric évolutive.
Il en découle généralement une capacité d’ingestion, de stockage, de traitement et d’utilisation des données. Toutefois, sans une coordination efficace avec les métiers, ces moyens techniques seraient largement inefficients. C’est à la gouvernance des données de répondre à ces exigences.
Gouvernance des données
La gouvernance des données établit les besoins humains, techniques et organisationnels nécessaires pour avoir des données de confiance qui permettent de dénicher de nouvelles opportunités ; mais aussi de faire baisser le coût en data management, tout en réduisant les risques sécuritaires et réglementaires.
Reporting et visualisation des données
La finalité – et pas la moindre – est bien souvent des rapports et visualisation des données qui vont permettre de piloter l’entreprise en prenant les meilleures décisions à un instant t.
Lorsque les entreprises commencent à s’intéresser aux données, elles les voient souvent comme un amas de chiffres indiscernables. Elles ont besoin de comprendre les différentes façons de présenter les données dans un format visuel. La plupart des décisionnaires ne sont en général pas des spécialistes des données ou des statisticiens. C’est pourquoi il est nécessaire d’utiliser des outils de visualisation des données.
Les logiciels de visualisation des données tracent les données pour les présenter dans un format plus compréhensible : diagrammes, graphiques, cartographies… Les business intelligence managers créent des tableaux de bord (dashboards en anglais), des rapports et des visuels qui s’adaptent à plusieurs audiences au sein de l’organisation.
Conclusion
L’évolution naturelle vers l’approche data centric est la conséquence de la concurrence croissante entre les entreprises. Les très fortes évolutions techniques de ces dernières années l’ont largement accéléré. De plus, le cloud est quasiment une condition sine qua non de sa réussite. Néanmoins, elle doit obligatoirement inclure l’alignement avec la stratégie de l’entreprise, soutenu par une gouvernance des données durable.