Intelligence Artificielle et le Natural Language Processing (NLP)
Qu’est-ce que le Natural Language Processing (NLP) ?
Le Natural Language Processing (NLP), ou Traitement Automatique du Langage Naturel (TALN), est une branche de l’intelligence artificielle donnant la capacité aux machines de comprendre, manipuler, générer ou traduire le langage humain sous la forme d’un texte ou d’un discours oral. Le Natural Language Processing s’appuie ainsi sur trois disciplines : l’IA, l’informatique et la linguistique. La dernière génération des technologies de NLP utilisent des réseaux de neurones artificiels ou des modèles de machine learning statistiques pour traiter de grandes quantités de données linguistiques.
- Les technologies de NLU (natural language understanding) qui donnent la possibilité de saisir le sens d’une langue et d’un discours dans son contexte et d’interpréter les intentions d’un humain derrière son texte ou ce qu’il dit ;
- Les technologies de NLG (natural language generation) qui génèrent des textes ou un contenu oral à la manière d’un humain.
En matière de NLU, il est important de préciser que la compréhension du langage naturel peut s’opérer via une analyse syntaxique ou une analyse sémantique. L’analyse syntaxique, c’est l’analyse du langage en fonction des règles grammaticales, elle s’applique à un groupe de mots et non aux mots individuels. Tandis que l’analyse sémantique est le processus permettant de comprendre le sens ou la logique d’un énoncé, d’interpréter les mots, les signes et la structure des phrases.
Les NLP sont en capacité de réaliser diverses tâches telles que :
- La classification des textes
- L’analyse des sentiments
- La traduction automatique
- La reconnaissance vocale
- L’extraction d’informations
- La réponse aux questions
Quels sont les avantages du Natural Language Processing (NLP) ?
Le NLP facilite et améliore les interactions entre la machine et l’humain à travers de nombreuses applications. Grâce au NLP, les moteurs de recherche, les assistants virtuels, les chatbots, les outils de correction orthographique, et l’analyse de données textuelles à grande échelle, sont beaucoup plus performants.
Quelques exemples d’applications concrètes du NLP :
- La traduction automatique de textes avec des applications comme Google Translator ou DeepL traduisent des textes entiers sans intervention humaine, après les avoir au préalable analysés et modélisés via une traduction automatique statistique (Statistical Machine Translation).
- L’analyse des sentiments ou « Opinion Mining » identifie les informations subjectives d’un texte pour extraire l’opinion de l’auteur. C’est un excellent moyen de mesurer le niveau de satisfaction des clients vis-à-vis des produits ou services fournis par une entreprise ou un organisme, et donc de l’améliorer.
- L’analyse des comportements d’achat au service des spécialistes du marketing. Ces derniers utilisent le NLP pour rechercher des personnes qui sont susceptibles d’effectuer un achat. Ils s’appuient dans ce cas-ci sur le comportement des internautes sur les sites, les réseaux sociaux et les requêtes aux moteurs de recherche.
- La gestion de tâches standards (renseigner des clients sur des produits ou services, répondre à leurs questions, etc.) via des chatbots ou d’autres agents conversationnels. Ils sont utilisés sur des canaux divers, tels que des applications et plateformes de messagerie.
- L’organisation, la structuration et la catégorisation d’un ensemble de textes grâce à un classificateur de texte.
- La reconnaissance de caractères pour l’extraction d’informations de reçus, factures, chèques etc.
- La correction automatique de texte pour ne laisser passer aucune faute d’orthographe.
- La production de résumés automatiques courts, précis et fluides de textes longs.
Dans quel contexte OpenStudio se sert du Natural Language Processing ?
OpenStudio s’est rapidement intéressé au NLP dans le cadre de son projet de recherche sur l’Atlas des Synergies Productives. Le NLP a été d’une grande utilité pour résoudre des problèmes de divergence des taxonomies de nomenclature. Ces nomenclatures (de produits ou d’emplois par exemple) sont en effet parfois très différentes et il n’existe pas toujours de tables de transition ni d’experts connaissant la manière d’établir des correspondances entre différents éléments de ces nomenclatures. Nous avons donc recours au plongement lexical ou word embedding en anglais. C’est une méthode d’apprentissage qui repose sur la manipulation de chaînes de mots en les transformant en des vecteurs de n-éléments et en calculant leur distance dans un espace vectoriel défini par ces mêmes vecteurs. Ainsi, les mots n’auront pas le même encodage selon le contexte où ils se trouvent.
Nous utilisons aussi des technologies relatives au NLP pour des solutions destinées à nos clients. OpenStudio travaille entre autres sur un projet de recherche pour de la classification de documents. Après avoir testé d’autres modèles qui classifiaient les documents en se basant sur leur structure, nous avons choisi d’opter pour le NLP qui analyse cette fois le contenu textuel pour classifier les différents types de documents. Le modèle utilisé pour réaliser ce projet de recherche est un modèle de classification de texte de type “Camembert” (version française de BERT, un modèle de classification de texte pré-entraîné).
Pour un autre client, nous avons conçus un assistant virtuel à l’écriture de scénarios. Pour les différentes fonctionnalités de l’outil, nous avons testé différentes technologies, notamment plusieurs algorithmes d’intelligence artificielle. Parmi ceux-ci, nous avons par exemple eu besoin d’un modèle de NLU (Compréhension du langage naturel) pour l’analyse des sentiments sur les lignes de dialogue. À travers l’utilisation du NLU, l’objectif est de voir si les données textuelles ont plutôt une tonalité bienveillante, heureuse, drôle, ou si, au contraire, nous sommes sur quelque chose de violent, agressif, etc. L’enjeu derrière est de vérifier s’il y a une cohérence dans le prorata des sentiments et s’ ils évoluent de manière appropriée.
OpenStudio est également en discussion avec un certain nombre d’acteurs privés et publics afin de concevoir des solutions de type chatbots s’appuyant sur le NLP, toujours dans le cadre d’une approche sur-mesure et en privilégiant des technologies open source.
Vous avez un projet impliquant l’utilisation de NLP ? Notre équipe se tient à votre disposition pour échange et vous conseiller sur votre future solution.