Intelligence Artificielle et le Natural Language Processing (NLP)

Les technologies de NLP (Natural Language Processing), qui s’appuient sur l’Intelligence Artificielle, améliorent aujourd’hui la façon dont les humains et les machines communiquent entre eux. L’équipe d’OpenStudio s’intéresse particulièrement à ce sujet à travers un projet d’Open Science : l’Atlas des Synergies Productives.

Qu’est-ce que le Natural Language Processing (NLP) ?

Le Natural Language Processing (NLP), ou Traitement Automatique du Langage Naturel (TALN), est une branche de l’intelligence artificielle donnant la capacité aux machines de comprendre, générer ou traduire le langage humain tel qu’il est écrit et/ou parlé. La dernière génération des technologies de NLP s’appuie sur des réseaux de neurones artificiels ou de simples modèles de machine learning statistiques. Les technologies de NLP se divisent  en deux grands domaines :

En matière de NLU, il est important de préciser que la compréhension du langage naturel peut s’opérer via une analyse syntaxique ou une analyse sémantique. L’analyse syntaxique, c’est l’analyse du langage en fonction des règles grammaticales, elle s’applique à un groupe de mots et non aux mots individuels. Tandis que l’analyse sémantique est le processus permettant de comprendre le sens ou la logique d’un énoncé, elle permet de comprendre le sens et interpréter les mots, les signes et la structure des phrases.

Natural Language Processing

Quels sont les avantages du Natural Language Processing (NLP) ?

Utiliser des technologies de NLP présente plusieurs avantages :

  • La traduction automatique de textes. Des applications comme Google Translator ou DeepL par exemple peuvent traduire des textes entiers sans intervention humaine, après les avoir au préalable analysés et modélisés via une traduction automatique statistique (Statistical Machine Translation).
  • L’analyse des sentiments ou « Opinion Mining » qui vient identifier les informations subjectives d’un texte pour extraire l’opinion de l’auteur. Cela permet par exemple de mesurer le niveau de satisfaction des clients vis-à-vis des produits ou services fournis par une entreprise ou un organisme.
  • L’analyse des comportements d’achat au service des spécialistes du marketing. Ces derniers utilisent le NLP pour rechercher des personnes qui sont susceptibles d’effectuer un achat. Ils s’appuient dans ce cas-ci sur le comportement des internautes sur les sites, les réseaux sociaux et les requêtes aux moteurs de recherche.
  • La gestion de tâches standards (renseigner des clients sur des produits ou services, répondre à leurs questions, etc.) via des chatbots ou d’autres agents conversationnels. Ceux-ci sont utilisés par plusieurs canaux tels que des applications et plateformes de messagerie.
  • L’organisation, la structuration et la catégorisation d’un ensemble de textes grâce à un classificateur de texte.
  • La reconnaissance de caractères permettant l’extraction d’informations de reçus, factures, chèques etc.
  • La correction automatique de texte pour ne laisser passer aucune faute d’orthographe.
  • La production de résumés automatiques courts, précis et fluides de textes longs.

Pourquoi OpenStudio s’intéresse au NLP ?

Chez OpenStudio, le NLP est principalement utilisé pour résoudre des problèmes de divergence des taxonomies de nomenclature rencontrés dans le cadre de l’Atlas des Synergies Productives. Ces nomenclatures (de produits ou d’emplois par exemple) sont en effet parfois très différentes et il n’existe pas toujours de tables de transition ni d’experts connaissant la manière d’établir des correspondances entre différents éléments de ces nomenclatures. Nous avons donc recours au plongement lexical ou word embedding en anglais. C’est une méthode d’apprentissage qui repose sur la manipulation de chaînes de mots en les transformant en des vecteurs de n-éléments et en calculant leur distance dans un espace vectoriel défini par ces mêmes vecteurs. Ainsi, les mots n’auront pas le même encodage selon le contexte où ils se trouvent.

OpenStudio est également en discussion avec un certain nombre d’acteurs privés et publics afin de concevoir des solutions de type chatbots NLP.

De manière plus générale, c’est plutôt les aspects NLU (Natural Language Understanding en anglais) ou  Compréhension du Langage Naturel en français qui sont utilisés aujourd’hui chez OpenStudio en matière de NLP.