Le data Warehouse, une définition et une mise en pratique

Un entrepôt de données ou, pour l’exprimer dans sa version anglophone, un data warehouse, est la concentration en un seul endroit de toutes les informations utiles à la prise de décision pour une entreprise. C’est un outil particulièrement utile pour toutes les sociétés qui se doit d’être mis en place dès la création. La fonction du data warehouse n’est pas de produire de l’information mais il s’appuie sur les différentes sources, que ce soient les données externes ou données internes ; L’objectif ici est de rende ces dernières simples d’accès pour bâtir des analyses d’activités.

Le data warehouse en pratique

Si son objectif est d’organiser les données transactionnelles pour que les personnes concernées y aient accès rapidement et de manière synthétique, il emmagasine les informations jugées stratégiques pour l’entreprise dans une même base de données qui se doit d’être particulièrement sécurisée. Via cet outil, il sera possible au dirigeant ou au décisionnaire de construire des reportings et par exemple des tableaux de bord de suivi de l’activité.

Pour que cela fonctionne, il faut donc pouvoir procéder à la collecte de données issues de sources hétérogènes comme :

  • Les Ressources humaines,
  • La production,
  • La comptabilité,
  • Le contrôle de gestion,
  • Des éléments financiers,
  • Des éléments marketing,
  • Des bases de données interconnectées,
  • Des tableurs Excel, Oracle, du XML, des données issues de serveurs (nécessairement présents sur le territoire français !)

Ce qui implique, d’un point de vue technique aussi, une forte rationalisation de l’information.

Comment procéder à la normalisation pour votre entreprise ?

Pour commencer, il faut pouvoir définir les données nécessaires pour analyser les processus, les indicateurs, les sources d’informations, etc. Ensuite, il s’agit de rationaliser l’entrepôt de données (data Warehouse) pour les rendre exploitables :

On normalise à ce titre le nom des champs (un même mot veut dire la même chose), on crée des index pour permettre un classement par thèmes, on supprime les doublons inutiles, on harmonise les données par tailles et formats, on prévoit des niveaux d’agrégation (les priorités).

Dans une étape suivante, il s’agira de créer les tables de correspondance permettant de lier entre eux les outils qui n’ont rien en commun afin de mettre en relation des informations a priori non liées directement entre elles. Aujourd’hui, avec l’ère de l’informatique, les professionnels mettent en place des api (des interfaces de programmation).

Dernière étape : Organiser les traitements pour la collecte et la présentation des données à des fins d’analyse. Ici, il est possible d’avoir une re-codification de donnée, un filtrage et la validation des données en vue du maintien de la cohérence de l’ensemble, une synchronisation permettant d’intégrer simultanément des valeurs constatées à des dates différentes, une certification pour rapprocher les données des systèmes de l’entreprise.

De nombreuses solutions intégrées existent sur Internet, pensez à prendre le temps d’analyser l’ensemble des besoins de l’entreprise. Il existe par exemple des solutions parfaites pour la gestion comptabilité mais peu applicables avec d’autres évolutions technologiques, notamment celles liées à la vente sur Internet.

Laissez un commentaire