La qualité de données est aujourd’hui, plus que jamais, au coeur des préoccupations des entreprises. Dans un univers où le Big Data a de plus en plus d’importance, les données de qualité valent de l’or. Cependant, il y a encore beaucoup de travail : selon une enquête menée en novembre 2016 pour Experian*, 92% des entreprises n’ont pas confiance en leurs données. Pour ces mêmes entreprises, la part moyenne des données estimées comme erronées seraient de 27% ! Comment les DSI font-elles face à ces problématiques ? Quelles sont les méthodes mises en œuvre ? Éléments de réponses…
Gouvernance des données : les pratiques aujourd’hui
Les données sont précieuses : ce sont elles qui permettent d’avoir des insights pertinents pour l’élaboration et le suivi de la stratégie. Les entreprises en ont aujourd’hui totalement conscience. Grâce à l’évolution des technologies, les volumes de données amassées croissent de façon exponentielle. On collecte des données partout, tout le temps. Mais on s’interroge trop tard sur leur pertinence ou leur validité…
Les processus de gestion des données établis dans les entreprises, lorsqu’ils sont formalisés, ne sont pas toujours adaptés aux nouveaux enjeux liés au data management. Pour 41% des entreprises à travers le monde, il est en effet difficile d’obtenir une cohérence dans les processus de data management à travers les différents services (toujours selon l’étude “Données et Entreprises en 2017 : un diagnostic complet” pour Experian).
Le problème est que plus nous passons du temps à obtenir une donnée de qualité, grâce à des vérifications multiples et chronophages, plus cette donnée perd de sa valeur. De plus, à la DSI, vous le savez mieux que quiconque : tout ne peut pas être contrôlé (voir notre article “Excel : pièce maîtresse du shadow IT”). La diversité des applications gérant les données s’accroît d’années en années et les goulots d’étranglements au sein du SI sont de plus en plus nombreux. La solution est donc de mettre en place une politique de qualité de données préventive, à la source.
Et si vous élargissiez le périmètre ?
Plutôt qu’attendre l’erreur fatale qui coûtera des dizaines de milliers d’euros à l’entreprise et dont la DSI sera désignée responsable, mieux vaut traiter le problème à la racine. Les efforts se portent sur les applications connectées au SI : CRM, ERP, logiciel de trésorerie ou de gestion de stocks. Malheureusement, ces logiciels sont très souvent alimentés par des fichiers type Excel dont la production échappe à votre contrôle. Par exemple, combien de processus d’import via ETL échouent à cause de problèmes de qualité de données dans des fichiers Excel source ? Suivant le célèbre adage “Garbage in / Garbage out”, vous aurez beau superviser vos applications dans le détail, si les données entrantes à la base sont mauvaises, vous ne pourrez pas améliorer la situation globale.
Il serait donc bénéfique d’étendre votre périmètre d’action à ces fichiers d’alimentation en début de processus. Ainsi, vous pourriez réduire considérablement les erreurs tout au long de la chaîne. La solution définitive serait donc de connecter ces processus à votre système d’information afin de garantir la qualité des données tout au long de leur cycle de vie.
Grâce à des solutions comme Gathering Tools, il est possible de remplacer des processus réalisés sous Excel par une application très légère tout en préservant l’apparence et les fonctionnalités du processus existant. L’utilisateur n’est pas affecté par les changements et vous gagnez en sécurité et contrôle des données. Vous pouvez éditer des règles techniques qui, par exemple, empêchent l’envoi d’un fichier si les informations qu’il contient sont erronées. Il est également possible de mettre en place des workflow de validation afin d’ajouter un contrôle qualité manuel avant l’intégration des données. /
A une époque où la valeur d’une entreprise dépend de plus en plus de la valeur de ses données, où les organisations sont de plus en plus nombreuses à se doter d’un Chief Data Officer (CDO), la gouvernance des données va devenir l’un des enjeux phares des DSI. Il faut donc repenser les flux dans l’optique d’une gestion de la qualité de données à la source. Heureusement, il n’est pas toujours nécessaire d’investir dans des solutions à plusieurs centaines de milliers d’euros, dont l’implémentation prend des années car elles exigent une transformation radicale des processus d’entreprise. Grâce à Gathering Tools, vous faites rentrer dans votre périmètre des données jusque là inaccessibles, rapidement et efficacement !
* http://www.experian.fr/ressources/actualites/cp-livre-blanc-donnees-et-entreprises-en-2017.html
/