Objectifs du Projet

Comment lutter efficacement contre les fraudes à l’identité sur internet ? C’est le défi relevé par l’équipe IA d’OpenStudio. L’objectif de notre service est de vérifier si les informations données par l’utilisateur lors de son inscription via le formulaire d’un site sont bien celles mentionnées sur la pièce justificative d’identité téléchargée. Il a également pour mission de confirmer ou non l’authenticité de cette pièce d’identité.

Solutions

Pour répondre à cette problématique, nous avons mis à contribution plusieurs technologies d’IA, notamment un réseau de neurones OCR pré-entrainé pour traiter les images des pièces d’identité scannées (carte d’identité, passeport et permis).

Nous pouvons ainsi comparer les informations écrites sur cette image avec celles indiquées lors d’une inscription en ligne.

Nous avons ensuite fait appel à différents algorithmes pour repérer les éventuels défauts (points clefs, couleurs, contours, distances entre les caractères, …) de la pièce envoyée et vérifier qu’il ne s’agit pas d’un faux.

Le service est accessible via une API et peut être appelé en utilisant plusieurs entrées (nom, prénom, date de naissance, etc…).

Actuellement notre technologie est capable de traiter 70% des documents scannés (dont des documents abîmés, cornés, froissés, non aplatis, mauvaise qualité de photo …) et nos premiers tests nous permettent d’envisager un taux de réussite supérieur à 90% grâce à la mise en place d’un apprentissage par réseau de neurones supervisés de type Unet.

Technologies utilisées

  • API écrite en langages Python
  • Analyse d’images : Bibliothèque open source OpenCV (CV2 pour python) OCR
  • OCR open source Tesseract et easyocr (réseaux de neurones ocr pré entraîné)
  • Algorithme Jaro winkler pour la distance entre deux chaînes de caractères.
  • Algorithmes Kaze, ORB et BRISK de détection de motifs et points clefs
  • Algorithmes CANNY pour la détection des contours
  • Algorithme RANSAC (RANdom SAmple Consensus)