Bruno Goutorbe : L’Intelligence Artificielle, un outil indispensable à la croissance de Cdiscount (Interview)

Publié le jeudi 11 mars 2021 à 07:09 , mis à jour le jeudi 11 mars 2021
7 mins
Bruno Goutorbe, responsable data science chez C-Discount a une parfaite connaissance de toutes les applications d'intelligence artificielle au sein de la marketplace.

Après 10 ans passés dans l’enseignement et la recherche, entre la France et le Brésil, Bruno Goutorbe rejoint les rangs de Cdiscount en 2015. Il commence d’abord comme Data scientist avec un travail spécifique sur les moteurs de recherche et systèmes de recommandation, puis au fil du développement du leader français du e-commerce, Bruno Goutorbe devient le manager de plusieurs équipes de data scientists au sein de l’entreprise bordelaise. Cdiscount est l’exemple type d’un e-commerce particulièrement mature sur le sujet de l’Intelligence Artificielle, des méthodes dont il ne pourrait plus se passer aujourd’hui. Bruno Goutorbe nous explique comment l’IA s’est vite rendue indispensable au fonctionnement de la marketplace.

On ne présente plus Cdiscount qui est aujourd’hui le leader français du e-commerce, avec environ 9 millions de clients par an. La taille atteinte par Cdiscount nous laisse imaginer que l’intelligence artificielle est devenue un outil indispensable à la poursuite de sa croissance ? 

Oui, tout à fait, il y a des cas d’usages de l’IA dont on ne pourrait plus se passer aujourd’hui chez Cdiscount. L’exemple le plus flagrant qui me vient à l’esprit, c’est l’utilisation de l’IA sur notre moteur de recherche, qui va permettre de sélectionner automatiquement les produits qu’il faut montrer au client en fonction de sa recherche initiale. On va prendre en compte les données liées au comportement des autres clients qui ont fait le même type de recherche par le passé : leurs achats, les produits sur lesquels ils ont cliqué, etc, afin de comprendre au mieux ce que le client à l’instant pourrait souhaiter trouver. À partir de là on va appliquer des méthodes d’IA pour essayer de comprendre ce que veulent les gens qui utilisent le moteur. C’est un exemple parmi d’autres d’applications de l’IA indispensables aujourd’hui pour nous. 

Depuis combien de temps Cdiscount investit sur l’IA et qu’a-t-elle apporté à l’entreprise ?

Cdiscount collecte de manière efficace ses données dans toute leur volumétrie depuis 2012, quand la plateforme Big data a été mise en place. Les premiers cas d’usages d’IA qui se basent sur cette donnée ont été mis en place fin 2014, début 2015, un peu avant mon arrivée. Il est difficile de chiffrer précisément les apports de l’IA, on fait un maximum de tests A/B pour essayer de mesurer ce qu’apportent les améliorations de méthodes d’IA par rapport à une situation sans l’IA, on mesure des incréments, mais cela reste compliqué à calculer. Ceci-dit, selon nos estimations, on parle de plusieurs points du volume d’affaires (VA). Ce qu’on a coutume de dire, c’est qu’il y a plus de 50 % du VA , qui passe par une composante dans laquelle l’IA intervient. 

Vous parliez du moteur de recherche sur lequel l’IA est très utilisée, mais vous avez sans doute d’autres exemples d’applications de l’IA déjà intégrées chez Cdiscount ?

Oui c’est le premier exemple qui me soit venu à l’esprit mais on a en effet beaucoup de sujets autour de l’IA. Je pense notamment aux systèmes de recommandation, il s’agit en fait des carrousels qu’on peut voir défiler sur la page et qui suggèrent d’autres produits susceptibles de nous intéresser. C’est le même type d’algorithmes popularisés par Netflix. Lorsque vous regardez un film sur la plateforme, Netflix va vous recommander d’autres films en fonction de ce que les autres abonnés, qui ont regardé ce même film, ont aimé d’autres. 

Toutes les semaines on a pas loin d’un million de produits qui nous sont soumis par les vendeurs de la marketplace, et que nous devons ranger dans des catégories : […] on a donc des applications d’IA qui nous permettent d’automatiser ce travail qui serait bien trop chronophage pour être fait manuellement.


Ensuite en back-end, l’IA intervient autour du catalogue de produits, c’est-à-dire pour organiser, rationaliser, nettoyer nos catalogues d’offres de produits. On a 100 millions de produits actifs accessibles depuis le moteur de recherche, donc forcément il y a des références aux qualités assez hétérogènes, c’est pourquoi on a cherché à construire un système d’évaluation automatique de la qualité d’une fiche produit. L’intelligence artificielle va nous permettre de déterminer si la fiche produit est bien remplie, écrite en bon français, si cette offre est au bon prix par rapport au marché, etc… En parlant de prix, on a aussi de l’IA pour établir le prix optimal d’un produit en fonction des prix des concurrents, de leur élasticité, etc…
Ensuite, toutes les semaines on a pas loin d’un million de produits qui nous sont soumis par les vendeurs de la marketplace, et que nous devons ranger dans des catégories : est-ce qu’il s’agit d’un bureau, d’un instrument de musique, d’un lave-vaisselle,… on a donc des applications d’intelligence artificielle qui nous permettent d’automatiser ce travail qui serait bien trop chronophage pour être fait manuellement.

L’offre de produits sur le site de Cdiscount est pléthorique. Sans l’aide de l’IA, la classification des articles serait interminable.


On peut aussi évoquer le paiement à crédit. Nous avons un système de paiement en 4 fois qui est assez apprécié, et grâce à l’IA on a des scores de solvabilité pour savoir si on peut proposer le paiement en 4 fois à un client, en fonction des caractéristiques de sa commande. C’est un peu le même principe que les scores de crédit effectués par les banques, sauf que là c’est fait en direct sur chaque commande. On a également de l’intelligence artificielle pour détecter les « bots » qui scrollent régulièrement notre site pour regarder nos prix, notre catalogue, et qui biaisent nos chiffres de trafic de vrais clients. Avec l’aide de l’IA on peut détecter des comportements qui ne sont pas « humains ».  Toujours concernant le trafic, on a aussi des briques d’intelligence artificielle pour être le plus visible possible, notamment sur Google, et faire venir le plus de monde possible sur notre site. 

Vous utilisez une large palette d’applications de l’IA qui ont un rapport direct avec le site Cdiscount en lui-même, mais est-ce que vous l’utilisez aussi sur d’autres parties de la chaîne, comme la logistique par exemple ? 

Oui effectivement sur la logistique l’IA est très impliquée mais plutôt avec des partenaires externes. Il y a beaucoup de choses liées à la robotique, avec des entrepôts complètement automatisés, et en interne nous sommes moins spécialisés sur tout ce qui est relatif à la robotique. En revanche, nous avons intégré dans notre équipe un collaborateur qui fait une thèse de mathématiques sur des méthodes de prévision des ventes afin de mieux gérer les approvisionnements. Si on est capable de mieux cibler les ventes, on pourra optimiser les stocks d’approvisionnements et de sécurité.

« […] la majorité des applications d’IA que j’ai évoquées n’impliquent pas les données personnelles du client. »

Au niveau du traitement des données personnelles de vos clients, avez-vous une démarche éthique ? 

Oui tout à fait, on a une démarche éthique mais dans tous les cas on se doit de respecter les normes RGPD qui ont été très précisément définies récemment par la CNIL. Nous sommes au cœur des discussions que nous pouvons avoir avec notre Data protection officer, puisque toutes les semaines on échange pour se tenir au courant des évolutions autour de ces règlements RGPD et du traitement des données personnelles, afin d’être totalement conforme. Ceci-dit, la majorité des applications d’IA que j’ai évoquées n’impliquent pas les données personnelles du client. En fait, beaucoup de ces applications utilisent ce que font les gens sur notre site de manière agrégée et synthétique, afin d’établir des statistiques sur lesquelles on va se baser pour recommander un produit. Les caractéristiques personnelles des clients ne sont pas prises en compte, donc cela reste complètement anonyme finalement. Après, évidemment, on pourra envoyer des suggestions de produits par mail à nos clients en fonction de ce qu’ils ont déjà acheté ou simplement regardé par le passé, mais ce sont des pratiques qui sont très encadrées par la RGPD.

Pour continuer sur la question de l’éthique, j’ai lu que Cdiscount avait mis en place un comité data éthique, c’est moins votre sujet, mais vous pouvez peut-être nous dire quelques mots sur ce comité ?

Oui en effet, je suis moins impliqué à ce niveau-là, je serai moins précis mais je peux observer les échanges qui sont faits avec cette cellule qu’on pourrait définir comme éthique ou juridique, et qui demande régulièrement d’être vigilant sur certains points. Je sais par exemple que cela passe par de la modération des requêtes sur le moteur qui peuvent être considérées comme discriminantes, des requêtes sexistes ou à caractère raciste. Au-delà de ça il y a toute une modération active sur les produits qu’on vend pour faire attention à ne pas inclure des produits offensants dans notre catalogue. Il y a des algorithmes d’IA qui ont d’ailleurs été testés pour reconnaître automatiquement ce genre de produits polémiques, afin de les retirer de la vente de manière proactive. 

Comment procédez-vous pour rester en veille et tenter de détecter les innovations en IA qui seront utiles au développement de Cdiscount dans un futur plus ou moins proche ? 

C’est difficile de savoir quels seront les sujets du futur par définition, mais on essaie de garder une veille active sur les méthodes, les modèles à l’état de l’art, sur ce qui se fait ailleurs, chez d’autres entreprises ou dans d’autres pays. Récemment nous avons échangé avec nos homologues d’un site e-commerce en Pologne qui est assez mature sur tous ces sujets, on a pu voir quelles étaient leurs bonnes pratiques. Chaque année on accueille aussi beaucoup de stagiaires qui testent pour nous des méthodes à l’état de l’art, sur lesquelles on a envie de creuser pour voir s’ il y a du potentiel derrière. On a aussi des thèses comme je vous le disais, qu’on encadre et qu’on co-finance. C’est tout un ensemble d’actions qui sont mises en place pour maintenir un niveau de veille constant. 

« […] ce qu’on appelle « intelligence artificielle » dépend de chaque époque en fonction de ce qui est défini comme une tâche complexe. »

Nous avons parlé de l’IA de manière précise avec toutes ses applications pour le e-commerce qui sont déjà utilisées par Cdiscount, mais plus généralement quelle serait votre définition de l’IA ? 

Je n’aime pas beaucoup ce terme d’Intelligence Artificielle….

C’est une réponse qui revient souvent derrière cette question…

Oui sans doute parce que c’est un terme qui est revenu à la mode dernièrement, alors que cette discipline existe depuis très longtemps finalement. Si on reprend la définition établie dans les années 50, on parle d’intelligence artificielle lorsqu’une tâche de haut niveau effectuée par une machine donne l’illusion d’avoir été réalisée par un humain. Mais tout est relatif, jouer aux dames était considéré comme une tâche de haut niveau à l’époque, et un ordinateur qui jouait à ce jeu impliquait de l’IA selon les critères des années 50. Aujourd’hui personne ne considérerait le jeu de dames comme de l’IA, donc ce qu’on appelle « intelligence artificielle » dépend de chaque époque en fonction de ce qui est défini comme une tâche complexe. C’est pour cela que je n’aime pas beaucoup ce terme d’IA. Finalement, notre activité, la data science, c’est de l’exploitation de grands volumes de données par l’ensemble de méthodes statistiques, mathématiques que nous avons à disposition. Ces méthodes mathématiques  regroupent un spectre assez large, cela part des statistiques basiques à des méthodes bayésiennes, en passant par le machine learning et le deep learning. On pourrait dire que l’IA regroupe toute cette panoplie de méthodes mathématiques qui vont faire parler les volumes de données et en extraire de la valeur. En fait, on fait tout simplement des mathématiques plus ou moins avancées.