Aller plus loin que le tableur

Vous êtes vous déjà arrivé de naviguer, perdu, entre 20 tableurs excel, liés entre eux, avec des macros obscures créées par un employé qui a quitté la société il y a plusieurs années ?

Connaissez-vous ce sentiment, mélange de peur-panique et d’agacement profond quand le stagiaire a décalé une colonne de 3 cases, démolissant ainsi la structure entière des données de vos beaux tableurs ? Vous souvenez-vous de la dernière fois où vous avez cherché une information dans vos tableurs, une information que vous deviez calculer, sans savoir comment ni où chercher ? Peut-être avez-vous également connu cette lassitude et cette pénibilité de devoir générer de nouvelles figures pour des Powerpoint ou des rapports, en maudissant à mi-voix ce satané tableur qui ne fait pas ce que vous voulez. Peut-être même avez-vous en mémoire le jour où Steve de la compta a déplacé un fichier sur le serveur, cassant toute la chaîne de données, et rendant tous vos beaux tableaux hors service jusqu’à l’identification et la résolution du problème…

Vous avez sans doute fait une tête un peu comme ça, partagé entre la panique et la résignation :

Femme interrogative devant son ordinateur

Visage d’une crise naissante à cause d’une mauvaise politique de gestion des données

 

Reconnaître les symptômes

Ces souvenirs, ces sensations, sont le signe que votre gestion des données n’est pas adaptée à leur quantité et encore moins à vos besoins. Dans une entreprise, les données doivent être au service du décisionnel, et ne surtout pas être un fardeau pour l’employé ou pire encore : un danger pour l’entreprise. Combien d’heures partent ainsi en fumée chaque année à gérer des données non homogènes, dispersées, sales ? Combien d’argent est-il perdu parce que l’information n’était pas disponible tout de suite ? Sans doute trop. Rassurez-vous, cette situation n’est ni figée ni insoluble.

Ne vous méprenez pas, je ne critique pas les tableurs. Je ne mets même pas en doute leur efficacité dans un cadre donné. Simplement, ils ne correspondent pas à l’usage que vous avez de vos données. C’est comme planter un clou avec une poêle à frire : ça fonctionne, mais ce n’est pas fait pour, et il risque d’y avoir des dommages collatéraux. Pareillement, il ne vous viendrait pas à l’idée de réaliser vos flyers et vos affiches sous Paint. La gestion des données doit ainsi être abordée de la même façon que la comptabilité. Alors qu’il est possible pour une toute petite société de faire sa comptabilité soi-même, il devient indispensable de passer par des logiciels et des entreprises spécialisés dès que les flux financiers sont un peu plus conséquents. C’est la même chose pour les données.

Les problèmes des tableurs

Pourquoi les tableurs ne sont-il plus adaptés à partir d’un certain point ? Premièrement, ils ne constituent pas un mode de stockage pérenne. Dès qu’un tableur est modifiable, les utilisateurs peuvent altérer la structure des données voire les données elles-même. Voire même le tableur entier, d’ailleurs… Or, les données sont vitales pour le fonctionnement de l’entreprise. Deuxièmement, un tableur nécessite généralement de saisir les données manuellement, ce qui est à la fois une perte de temps colossale et un risque de saisie erronée.  Troisièmement, les tableurs ont cet inconvénient que tous les utilisateurs ont accès aux mêmes données. Cela pose des problème de confidentialité. Quatrièmement, les tableurs produisent souvent des graphiques de piètre qualité, de type limité. Difficile par exemple de faire une carte avec un tableur. Difficile aussi d’avoir des figures homogènes, vectorisées, et professionnelles à communiquer dans les rapports ou les présentations. Enfin, les tableurs ne permettent pas de traiter les données de façon satisfaisante en termes statistiques. Les données des tableurs sont en effet en général sous-exploitées.

Comment organiser ses données de manière efficace, sûre, et professionnelle ?

1. Stockage

Le stockage des données doit être indépendant du traitement des données. C’est primordial. Les données doivent être archivées, à l’abri, sur des serveurs sécurisés redondants avec un système de versionning pour éviter toute perte. Elles doivent-être structurées dans des bases qui peuvent être relationnelles (SQL) ou pas (noSQL). Il n’est pas aberrant de créer des bases séparées lorsque les données n’ont aucun lien entre elles.

2. Saisie et aggrégation

La saisie des données dans les bases de données doit être automatisée au maximum. Lorsqu’elle est automatisée, la saisie est systématique, fiable, et instantanée. Cela évite beaucoup de problèmes. La contrepartie est qu’il faut maintenir l’automatisation. Lorsque la saisie est manuelle, l’utilisateur ne doit pouvoir ajouter/modifier que ce qu’il doit ajouter/modifier. Il est inutile et dangereux que l’utilisateur ait accès à tout. Cela passe par la conception d’interfaces de saisie accessible par un système de login et de hiérarchie de login. Ainsi, il est très facile de cloisonner l’accès à l’information, et de gérer les droits en lecture/écriture des données.

3. Séparer les process

La production de figures et le monitoring doivent être séparés du stockage et de la saisie des données.  Pourquoi séparer le monitoring de l’agrégation et du stockage des données ? Vous avez sans doute déjà essayé de modifier des figures sur des tableurs au contenu très rempli. Le tableur devient instable et inaccessible pour tout le service. Lorsque l’on cloisonne les tâches, le processus qui s’occupe de produire les figures effectue d’abord une copie locale des données dont il a besoin, et seulement de celles dont il a besoin. Le processus peut alors travailler sur cette copie sans impacter le stockage et l’agrégation en aucune façon.

4. Des Solutions professionnelles

Des outils spécialisés doivent être utilisés pour la production de figures professionnelles et la réalisation de dashboard. Citons par exemple le langage R et son package Shiny, ou le langage Python et le package Dash. A ce stade, il est souvent judicieux de passer par une entreprise spécialisée. Encore une fois, de la même manière qu’il est naturel d’externaliser sa maintenance informatique et sa comptabilité dans un souci de compétences et de qualité, il est logique d’externaliser son analytique. Les données bien structurées, sécurisées et fiables constituent alors un terrain de jeu infini pour le Data Scientist. Il lui est possible de répondre à n’importe quelle question soutenue par vos données. Par exemple, il est tout à fait possible de calculer mathématiquement et très précisément des prévisions sur les futures ventes, etc, et de pouvoir ainsi les communiquer de façon crédible.

Cerise sur le gâteau, avec des données bien structurées, un bon Data Scientist ou une société spécialisée pourra même vous implémenter des modèles de machine learning et des IA personnalisés. Cela garantie un pilotage pointu de votre entreprise.

En résumé

Si vous ne deviez retenir qu’un message de ce billet, le voici : n’hésitez pas à délaisser vos tableurs pour une approche plus structurée et efficace de vos données. C’est certes un investissement en temps et en argent, mais les bénéfices en termes de sécurité, de confort, et d’efficacité sont incommensurables.

Si vous vous reconnaissez dans ce post, et que vous voulez aller au delà du tableur pour un pilotage serein et efficace de votre entreprise, n’hésitez pas à nous contacter. Nous nous ferons un plaisir de vous accompagner.