Comment un éditeur juridique a optimisé son processus d’identification de décisions de procès similaires grâce au NLP ?

Le contexte

StarClay accompagne la filiale française d’un groupe mondial leader de l’édition juridique de solutions d’information et de données d’analyses pour les professionnels du droit et du chiffre. Notre mission, trouver des solutions de Data Science et de Machine Learning afin d’améliorer et d’optimiser l’offre de service existante et apporter des solutions toujours plus innovantes à ses clients.

Pour chaque jugement rendu par un juge, il peut exister une version annotée de la décision de justice. L’annotation consiste en un résumé du raisonnement utilisé par le juge pour arriver à sa conclusion, souvent complété par quelques commentaires du juge sur l’importance de certains arguments.

Ces annotations sont précieuses pour l’identification des décisions, mais elle reste coûteuse en effort humain. Notre objectif est donc de concevoir un outil permettant d’automatiser l’identification des décisions similaires à une décision de procès. Et de le rendre accessible à notre client.

La solution Starclay

StarClay a conçu une solution de traitement par NLP des décisions de justice en s’appuyant sur l’indexation sémantique latente (LSI), l’allocation de Dirichlet latente (LDA), et la représentation en vecteurs avec doc2vec.

Les feedback

Réussites

Un premier modèle a été déployé avec succès sous la forme d’un conteneur Docker complété par un framework de création d’API Python fastapi.

Objectifs futurs

Forts de ce premier succès, l’éditeur et StarClay poursuivent maintenant l’exploration de ce premier modèle et visent à l’améliorer sa pertinence et ses performances en le faisant évoluer vers un modèle en Deep Learning utilisant les réseaux neuronaux siamois (Siamese NN).