Prédire et prévenir les démissions par l'algorithmie
Le client est une PME-ETI dans un secteur où la main-d’œuvre représente son premier poste de dépense. Ses opérations dépendent d’une forte disponibilité en temps et en effectifs. Il s’agit d’un secteur où le turn-over est élevé, avec un absentéisme fréquent, et une dépendance opérationnelle à la capacité à recruter et à retenir des salariés avec peu ou sans qualifications.
L’idée du client était d’exploiter les capacités de l’IA et des algorithmes afin d’anticiper et de prévenir les démissions.
L’organisation cible était la suivante :
- obtenir une prédiction fiable, avec six mois de préavis, de la probabilité qu’un salarié n’acte sa démission :
- si le salarié représentait un potentiel au sein de l’entreprise, anticiper la maturation de son projet d’évolution hors du Groupe en identifiant sa trajectoire professionnelle et lui offrant des perspectives de progression (par exemple, management ou adaptation de la rémunération) ;
- si le salarié ne présentait pas ces perspectives, commencer à pourvoir au recrutement de son remplaçant en anticipant un tuilage ou en minimisant la période de vacance sur le poste.
La pertinence du déploiement d’une solution numérique doit être objectivée. Pour ces raisons, nous avons déterminé plusieurs métriques de performance (KPI) pour garantir l’impact de la nouvelle organisation aidée de l’algorithme :
- évolution du taux de turn-over ;
- évolution des sommes dévolues au recours à l’intérim ;
- évolution des indicateurs de mal-être au travail (taux d’absentéisme et d’arrêts maladie).
Pour ce faire, nous sommes partis des bases de données disponibles dans le logiciel RH (SIRH), ainsi que des données de gestion opérationnelle extraites du logiciel interne de gestion (ERP). Les clauses prévues dans le contrat de travail, ainsi que les notifications réglementaires prévues par le RGPD, permettaient la mise en œuvre de ce cas d’usage au sein de l’entreprise.
Antérieur à l’adoption de la loi européenne sur l’IA (AI Act), ce projet relèverait aujourd’hui d’un « système d’IA à haut risque », nécessitant la mise en œuvre de garanties supplémentaires par l’employeur, qui ne seront donc pas détaillées ici.
Deux types de technologies ont été mises en œuvre pour démultiplier la valeur ajoutée du client :
- un traitement statistique intelligible, permettant d’identifier les grandes tendances et d’offrir de premiers enseignements autour de mesures structurelles à mettre en place au sein de l’organisation (arbre décisionnel, ou white box) ;
- un apprentissage automatique (machine learning), dont le raisonnement reste opaque (black box), mais permettant à la machine de prédire de manière beaucoup plus fiable la probabilité d’une démission, permettant la mise en œuvre de mesures individuelles.
Ces études se sont portées sur deux périmètres de données, avec des objectifs bien distincts :
- le périmètre total des données détenues par l’entreprise, y compris des données sur la base desquelles aucune décision ne peut être prise en raison de leur caractère discriminatoire (par exemple, l’âge ou l’identité de genre), mais pouvant aider à éclairer le comportement et la prise de décision de salariés :
- en matière d’étude en black box , un algorithme entraîné sur des critères discriminatoires ne pouvait en aucun cas être déployé, puisqu’il aurait été impossible à l’employeur de démontrer que la prise de décision ne reposait pas, ne serait-ce qu’en partie, sur des critères discriminatoires.
- Mais l’absence de capacité à prédire efficacement la perspective d’une démission avec cette base de données exhaustive excluait, de facto, la capacité à prédire avec une base de données filtrée de ces critères discriminatoires.
- Le périmètre exfiltré des critères à caractère discriminatoire, permettant a priori la mise en œuvre des préconisations avec la white box et la black box, mais avec une capacité prédictive que l’on anticipait comme moins efficace.
Les conclusions et leurs conséquences sur le terrain
La black-box n’a pas su offrir une capacité prédictive concluante sur le périmètre des données restreintes : concrètement, la variable la plus prédictive était la durée moyenne du contrat, ce qui n’offrait donc pas d’enseignements intéressants pour une prise de décision individualisée.
Sur les données complètes, en revanche, l’algorithme a su prédire avec un degré de fiabilité de 90 % la perspective de démission dans les six mois, ce qui aurait permis la mise en œuvre d’une alerte des RH de proximité, et la mise en œuvre des mesures appropriées. Néanmoins, l’étude statistique de ces préconisations a montré surtout un décalage fort entre deux groupes de salariés distincts sur un critère discriminatoire – à savoir celui de la nationalité. Les salariés ne possédant pas la nationalité d’un pays de l’Union européenne avaient tendance à rester plus longtemps sur leur poste, même sans compensation. La mise en œuvre de mesures d’incitations à rester se serait donc adressée, en priorité, à des salariés européens, ce qui aurait constitué, de manière structurelle, une discrimination indirecte au sens du code pénal.
La white box, sur le périmètre des données restreintes, a permis de mettre en lumière les priorités structurelles sur certains postes. En particulier, et sans surprise, les profils les plus difficiles à recruter, en raison d’une tension marquée sur le marché de l’emploi, ont permis d’identifier une forte corrélation entre le temps de trajet et la démission prématurée.
Ce problème a pu être adressé rapidement, par la mise en place d’une technique de rapprochement par « chaises musicales » (algorithme d’optimisation sous contrainte), générant une rétention moyenne de +7 points sur ces profils en particulier.