A l’heure actuelle, le Big Data est plus qu’un buzzword. Cet ensemble de stratégies pour traiter efficacement les données est déjà mis en place dans de nombreux secteurs de l’économie : banques, assurances, industrie manufacturière, e-commerces, vente au détail, etc. Ces stratégies permettent aux sociétés qui les emploient d’être beaucoup plus performantes et de prendre moins de risques. C’est bien pour cela que le marché du Big Data connaît une croissance annuelle de 10 % et est estimé à $84 Mia d’ici 2026 (Big Data Vendor Revenue and Market Forecast, 2011-2026).
Pourtant, les solutions techniques pour mettre en place ces stratégies data restent en général obscures pour le grand public et nécessitent l’intervention de spécialistes de la data. En effet, une bonne stratégie data implique de connaître des frameworks tels Hadoop et Spark, des suites d’agrégation de flux, des solutions de cloud, des langages de programmation dédiés, des librairies pour l’analyse de données, en plus de solides compétences en statistiques et en visualisation et vulgarisation scientifiques.
Les entreprises qui veulent amorcer leur transition data se retrouvent donc devant une situation déroutante : elles savent qu’elles doivent mettre en place une stratégie et des solutions data pour s’aligner avec la concurrence et rester compétitives, mais la tâche est très complexe : par où commencer ? Que doit-on analyser ? Pourquoi ? Comment ? Avec qui ? Nombre d’entreprises ont ainsi raté leur transition data et perdu d’énormes sommes d’argent au passage.
Dans ce billet, nous vous présentons les options disponibles pour une société qui veut entamer sa transition data, ainsi que la meilleure stratégie à adopter pour réussir cette transition.

Par où commencer ?

Le premier bon réflexe à avoir lorsqu’on veut mettre en place une stratégie data efficace consiste à s’entourer de personnes compétentes en matière d’analyse de données. De nouveaux métiers ont émergé, tels que data scientist, data analyst, data architect, etc. Les compétences peuvent être transversales, et nous aborderons cette thématique plus en détail dans un prochain billet. Un bon expert en data saura dire les avantages, mais aussi les limites de chaque analyse de données : méfiez-vous si l’on vous propose une solution clé en main qui permet de faire du prédictif en un simple clic.

Afin de s’entourer des bonnes personnes, il existe deux solutions initiales : embaucher une équipe data ou faire appel à une société de consulting.

Embaucher

Embaucher un data scientist ou une équipe de data science paraît une bonne option a priori : «J’ai besoin de mettre en place une stratégie data, donc j’embauche des gens compétents». On fait alors face à un nouveau problème : quelles compétences chercher, pour quoi faire, à quel prix ?
Il est vraiment très difficile de savoir quel collaborateur recruter lorsque l’on ne connaît rien à l’analyse de données, et il n’est pas rare que les entreprises n’embauchent pas les meilleurs profils.
Il est également important de comprendre qu’une bonne analyse de données doit se placer dans une vision stratégique et être pilotée de manière centrale, tout en impliquant une bonne communication entre les différents services de l’entreprise, car il est indispensable d’allier la connaissance de la data à la connaissance du terrain. La transition data est un changement de vision globale de l’entreprise, qui deviendra data-centrée. Nous reviendrons sur ce point essentiel plus loin dans ce billet.
Qu’en est-il de l’option freelance ? Les freelance sont en général des gens très qualifiés, en particulier sur Malt, et sont une bonne option pour réaliser un projet que l’équipe data déjà en place n’a pas le temps de faire. Néanmoins, cette solution n’est pas adaptée à la situation que nous traitons dans ce billet, c’est-à-dire une entreprise qui veut mettre en place une stratégie data.

Faire appel à une société de consulting

Que l’idée finale soit d’embaucher une équipe data ou d’externaliser l’analyse de données, il est judicieux de faire appel à une société de consulting. Les consultants sont en général très bons, il faut néanmoins se méfier de certaines agences low-cost, surtout si l’on n’a pas de grandes connaissances d’analyse de données. Un bon service de consulting permet de comprendre la qualité des données déjà existantes dans l’entreprise, ce que l’on peut en faire, comment on doit les structurer, etc. A la suite de ce diagnostic initial, l’entreprise peut mettre en place les stratégies préconisées, pour ensuite passer à l’analyse des données à proprement parler. Pour ce faire, elle peut soit embaucher une équipe data compétente, en sachant maintenant quels profils embaucher et quoi leur faire analyser, soit choisir d’externaliser l’analyse de données, ou encore faire un mélange des deux, par exemple en ayant une équipe data qui implémente un logiciel BI ou un modèle prédictif poussé.

Quelle solution choisir pour l’analyse de données ?

Une entreprise doit savoir quel type d’analyse elle veut effectuer avant de choisir une solution particulière, surtout concernant les logiciels à disposition sur le marché. Avant tout, il faut savoir si on veut faire de l’analyse descriptive ou prédictive (ou les deux).
De quoi s’agit-il ? Les analyses descriptives informent sur ce qu’il s’est passé et permettent d’avoir un aperçu de l’activité de l’entreprise (par exemple : au 1er trimestre 2018, 60 % de mon chiffre d’affaire provenait de clients âgés de 45 à 55 ans et habitant en zone urbaine ). Les analyses prédictives prévoient ce qu’il va se passer dans le futur (par exemple : dans la semaine qui suit, par rapport à ce que disent les capteurs,cette machine de la chaîne de production a 69 % de chances de tomber en panne). Une catégorie particulière d’analyse prédictive est appelée analyse prescriptive : elle prédit l’effet de décisions futures et recommande des actions en conséquence pour prendre les meilleures décisions.
Actuellement, plus de 80 % des analyses de données d’entreprise sont de type descriptif, bien que la puissance des analyses prédictives fait que leur utilisation croît plus vite que celle des analyses descriptives (croissance estimée à 13 % d’ici 2021, source Forbes).
Nous allons voir quelle solution est la mieux adaptée à quel type d’analyse de données.

Analyses descriptives

Bien que certaines analyses descriptives puissent être faites grâce à des logiciels de type CRM, la meilleure solution consiste le plus souvent à se tourner vers un logiciel de Business Intelligence (BI). Chacun des logiciels sur le marché a ses forces spécifiques : robustesse des serveurs, jolie visualisation, prise en compte de différents formats de données, etc. Ces logiciels sont un premier pas vers la mise en place d’une gestion d’entreprise data-centrée qui permet de prendre des décisions avec une vue objective, immédiate et quasiment exhaustive des indicateurs pertinents.

Il est important de noter que les logiciels de BI livrés clé en main sont incapables de délivrer des analyses prédictives, car ils permettent de visualiser des variables mais ne permettent pas de comprendre les relations mathématiques entre ces variables.

Analyses prédictives

L’analyse prédictive permet de répondre à des questions de type : « si j’augmente de x % le budget publicitaire pour le produit A, de combien les ventes de ce produit augmenteront-elles? », et ce pour chaque produit. Pour ce faire, il faut construire un modèle mathématique, qui ne peut répondre qu’à une question avec un jeu de données précis, dans une contexte précis.
C’est pour cela qu’il est impossible de faire des analyses prédictives avec un logiciel clé en main : ces analyses doivent être adaptées au jeu de données, au contexte et à la problématique de chaque entreprise.
Les meilleures analyses prédictives se basent sur des méthodes de type Machine Learning, que nous traitons de manière détaillée dans ce billet. Il faut des compétences avancées en analyse de données et en traitement de données réelles pour créer de bons modèles prédictifs, c’est pourquoi ce sont souvent des équipes externes de spécialistes pointus qui sont mandatés pour ce type d’analyse (sauf dans certaines grandes entreprises, mais nous sortons ici du cas d’une entreprise qui amorce sa transition data).
Il existe néanmoins des logiciels appelés model builders qui permettent de « faire du machine learning » de façon quasi automatisée. En gros, on spécifie au logiciel les données d’entrée et la valeur qu’on va prédire, et le logiciel se charge tout seul de construire le modèle mathématique qui va bien. Bien qu’ils nécessitent une expertise en data science, ces outils sont vraiment impressionnants quand ils sont bien utilisés. Mais si ces logiciels sont très performants pour construire un modèle à partir des données qu’on leur donne, ils occultent complètement toute la partie de prétraitement des données, qui est essentielle. À tel point que dans les compétitions Kaggle (une plateforme de compétition en data science), les vainqueurs appuient sur 2 leviers : le prétraitement des données et l’optimisation des hyper-paramètres des modèles. Pour l’instant, les model builders manquent encore de l’ingéniosité des data scientists.

Adopter une vision d’entreprise data-centrée

Pour qu’une entreprise réussisse sa transition data, il faut qu’elle ait une vision complète de la stratégie data et qu’elle adopte un mode de fonctionnement data-centré. Attention, trop souvent ce terme inquiète, car on aurait naturellement tendance à opposer la data aux êtres humains, alors que les deux ne peuvent pas être dissociés (voir notre billet sur le Dataïsme à ce sujet). Une bonne stratégie data ne va pas remplacer un bon vendeur ou un responsable marketing par des data scientists, mais au contraire c’est en alliant l’expérience du terrain, de l’entreprise, du marché, à une bonne analyse de données, que chacun va ressortir gagnant et que l’entreprise aura réussi sa transition.

Le meilleur moyen de mettre en place une stratégie data efficace est d’avancer pas à pas, en étant accompagné de bout en bout, afin que tous les collaborateurs de l’entreprise profitent de ce pas en avant. Plutôt que de mettre en place une infrastructure énorme, avec un changement de paradigme absolu qui peut être difficile à appréhender à la fois par la direction et les collaborateurs, nous conseillons d’opérer progressivement.
Il faut commencer par se poser la question : « Quel est notre challenge aujourd’hui ? À quelle question dois-je répondre rapidement ? ». La nature du problème peut être très variée, telle qu’une diminution des volumes de ventes, des problèmes pour acheter les matières premières au bon moment afin d’avoir un bon rapport prix d’achat-stock, l’impossibilité de prévoir des pannes qui surviennent dans la chaîne de production et qui se répercutent en délais importants, etc.. La mise en place d’une solution data doit toujours avoir lieu pour répondre à une problématique, et pas juste “parce qu’il faut faire de la data”, sinon on prend le risque d’investir de grandes sommes d’argent pour un résultat décevant.
Une fois le problème défini, l’entreprise peut se faire accompagner pour le formuler en termes mathématiques et établir un diagnostic des données disponibles ou à acquérir pour pouvoir répondre à la question. Pour cette étape, il est important que les collaborateurs concernés par la démarche soient impliqués dans le processus. Pour un modèle d’analyse prédictive, plus on a de retours d’expérience et de compétences, plus les données prises en compte seront pertinentes et plus le modèle sera précis.

Ensuite, pour les analyses de type prédictif, il s’agit de construire les modèles mathématiques et de les enrober dans une interface logicielle facilement compréhensible et utilisable par le service concerné : comptabilité, marketing, production, etc. Le logiciel peut être déployé en ligne ou directement dans l’entreprise.

Ce processus peut durer plusieurs mois, et permet à l’entreprise de se familiariser avec un modèle data-centré de la gestion d’entreprise. Une fois qu’un problème a été réglé grâce à l’analyse de données, un autre problème peut être abordé. Ainsi petit à petit, une solution data complète se met en place dans l’entreprise de manière concrète et efficace.

En bref

Pour amorcer sa transition data, il est important qu’une entreprise se fasse conseiller et bénéficie d’un suivi à 360°, et cela qu’elle décide d’embaucher une équipe de spécialistes data ou d’externaliser ses données.
Avant de faire quoi que ce soit, il faut savoir à quelle question on veut répondre, quelles sont les données à disposition et si elles permettent de répondre à la question posée. Si ce n’est pas le cas, définir quelles sont les données manquantes.
Pour les analyses descriptives, l’entreprise peut opter pour un logiciel de Business Intelligence en complément ou non de l’embauche d’une équipe data.
Pour les analyses prédictives, qui sont plus complexes d’un point de vue mathématique, il n’est pas possible d’utiliser des logiciels clé en main et l’entreprise devra faire appel à des spécialistes qui créeront les modèles mathématiques appropriés pour chaque problématique.

S’il n’y avait qu’un point à retenir, c’est de commencer par un problème précis, formulé de façon claire, et d’essayer d’y répondre grâce à l’analyse de données. Et d’opérer ainsi jusqu’à ce que l’entreprise soit mature en terme d’analyse de données.
L’erreur à éviter absolument, c’est une transition trop brusque vers le « tout data », qui peut se révéler inefficace, paralysante pour les collaborateurs et très onéreuse.