Modélisation des productions industrielles françaises

Publié le 04 mars 2021
6 minutes de lecture
Milling - Image de Mastars sur Unsplash

La Commission Européenne publie depuis 1995 des statistiques de production par pays et par type de produit. La liste de ces produits industriels est nommée liste PRODCOM.

La Commission fournit à la fois un fichier annuel au format XLS et un outil de consultation des données en ligne.

Nous nous intéressons aux fichiers XLS qui se présentent sous la forme de 5 onglets.

Fichier XLS des productions européennes

Pour chacun des 3919 types de produits PRODCOM, nous retrouvons les volumes dans différentes unités (onglet « Sold Value ») et le montant en euro associé (onglet « Value »). Ceci permet de calculer un prix unitaire pour chaque type de produit. Un onglet dédié aux prix unitaires (onglet « Unit Value ») contient les prix unitaires détaillés par pour chacun des 35 pays.

Certaines données sont confidentielles et ne sont pas présentes dans le fichier. En enlevant de la liste les codes dont les valeurs ne sont pas indiquées il nous reste 2617 codes produits.

En parallèle, nous avons accès aux données françaises de la liste PRODFRA, construite suite à l’étude annuelle EAP, et se présentant sous la forme de deux fichiers : l’un dans la nomenclature PRODFRA et l’autre dans la nomenclature CPF4/5.

Productions françaises au format CPF4/5

Préparation des données de production

A partir des fichiers XLS, nous voulons générer un fichier CSV des productions françaises en euros par année.

Préalablement selon l’année que l’on analyse, il est nécessaire de corriger les montants en € courants en tenant compte du taux d’inflation fourni par l’Insee sur la période pour obtenir des montants en € constants.

Comme la liste des produits PRODCOM varie d’une année sur l’autre, il faut également utiliser les tables de conversions disponibles sur le site Eurostat entre les différentes versions de la liste.

Connaître la typologie des établissements en France

Nous souhaitons mettre en perspective les montants de production avec la typologie des établissements la même année. On va rechercher si une corrélation existe entre les effectifs cumulés des établissements d’un secteur d’activité donné et la production de certains biens.

Pour connaître le tissu industriel français nous nous tournons vers la base SIRENE qui contient la liste des établissements français depuis 1973 ainsi que certaines caractéristiques telles que le secteur d’activité et la tranche d’effectif. La base SIRENE contient les ouvertures et fermetures des établissements, nous permettant de reconstruire la liste des établissements actifs à une date donnée. De même pour les modifications de tranche d’effectifs.

L’effectif cumulé que nous calculons est en réalité une approximation car nous ne connaissons pas les effectifs précis des établissements, mais uniquement des tranches d’effectifs. Nous considérons comme effectif associé à un établissement la moyenne de la tranche qui lui est associée, par exemple pour la tranche « de 20 à 49 salariés » nous retenons la valeur 20 + ((49 - 20) / 2) soit 34,5.

Liste des produits associés à un secteur d’activité

Il existe deux tables de correspondance permettant de passer d’une nomenclature de secteurs d’activités à une nomenclature de produits :

En réalité la correspondance NAF Rev. 2 vers CPF Rev. 2.1 n’est disponible qu’au format pdf et nécessite un traitement pour en extraire une table de correspondance exploitable, que nous vous livrons ci-dessous.

Plusieurs « chemins » nous permettant d’obtenir une liste de produits à partir d’une liste d’activités :

  • NAF rev. 2 → NACE Rev. 2 → [ ISIC (CITI) Rev. 4 ⟷ CPC Rev. 2.1 ] ← HS 2017 (HS4) ← NC ← PRODCOM
  • [ NAF Rev. 2 ⟷ CPF Rev. 2.1 (CPF6) ] ← CPA Rev. 2.1 ← PRODCOM
  • [ NAF Rev. 2 ⟷ CPF Rev. 2.1 (CPF6) ] ← PRODFRA
  • [ NAF Rev. 2 ⟷ CPF Rev. 2.1 (CPF4/5) ]

A noter que la correspondance « NAF rev. 2 → NACE Rev. 2 → [ ISIC (CITI) Rev. 4 ⟷ CPC Rev. 2.1 ] ←CPA Rev. 2.1 ← PRODCOM » n’est pas possible car il n’existe pas de correspondance « CPC Rev. 2.1 ⟷ CPA Rev. 2.1 ».

Les correspondances suivantes sont requises :

OrigineDestinationType de relation (Source Insee)Méthode
NACE Rev. 2CITI Rev.4relation par emboîtement (hiérarchie : seuls des liens « 1 à 1 » ou « 1 à n » sont possibles)Table de correspondance
ISIC Rev. 4CPC Rev. 2.1relation de type activités-produits (correspondance : changement de concept)Table de correspondance
CPA Rev. 2.1PRODCOM 2019relation par emboîtement (hiérarchie : seuls des liens « 1 à 1 » ou « 1 à n » sont possibles)Extraire tous les PRODCOM dont les 6 premiers chiffres sont identiques au code CPA
NACE Rev. 2NAF Rev. 2relation par emboîtement (hiérarchie : seuls des liens « 1 à 1 » ou « 1 à n » sont possibles)Extraire tous les NAF dont les 4 premiers chiffres sont identiques au code NACE
NAF Rev. 2CPF Rev. 2.1relation de type activités-produits (correspondance : changement de concept)Document PDF de correspondance
CPF Rev. 2.1CPA Rev. 2.1identitéCodes identiques
Détail des correspondances à calculer

Grâce à ces tables de correspondances, nous pouvons d’ores et déjà convertir les données d’effectifs des établissements français dans les nomenclatures NACE et ISIC, puis convertir les données de production en CPA/CPF.

Pour limiter les erreurs associées aux conversions de nomenclatures, il paraît logique de privilégier la conversion [ NAF Rev. 2 ⟷ CPF Rev. 2.1 ] ← CPA Rev. 2.1 ← PRODCOM (car en outre, la conversion entre CPF et CPA n’en est pas réellement une puisque les nomenclatures sont identiques dans leur version 2.1).

Nous pouvons également travailler sur les données en CPF4/5 issues de l’étude EAP française, mais dans ce cas nous serons limités dans la précision (4 ou 5 chiffres seulement pour la nomenclature des produits soit 230 classes différentes).

Toutefois chaque méthode présente des avantages, en fonctions des traitements ultérieurs souhaités. Par exemple, si nous nous intéressons aux importations et exportations, nous aurions intérêt à passer sur le système harmonisé (HS) et donc à utiliser le premier « chemin ».

Nous pouvons maintenant calculer de nouvelles tables de productions (en euros), mais cette fois-ci classées selon l’activité de l’établissement.

Construction d’une table de correspondance pondérée

Notre but est de pondérer la table de correspondance obtenue précédemment de telle sorte qu’on puisse associer à chaque code d’activité de la nomenclature NACE Rev. 2 une liste de produits PRODCOM et leur pourcentage de représentation.

Connaissant le montant de la production par code NAF et le montant de la production de chaque produit associé à un code NAF (selon la nomenclature CPF/CPA), il nous est maintenant possible de déterminer le « poids » de chaque produit et ainsi de déterminer les produits fabriqués par un établissement en fonction de son secteur d’activité.

Généralisation du modèle et mesure du maillage productif local

A partir des effectifs cumulés des établissements français classés par code NAF ainsi que du montant total des productions françaises la même année, toujours classées par code NAF, nous pouvons calculer un indice de productivité par salarié pour chaque code NAF. Nous pouvons calculer ainsi un niveau de production théorique en euro en connaissant les effectifs d’un établissement.

Nous sommes en mesure de définir une production théorique associée à un établissement (quel produits et pour quel montant de production) et donc de réaliser les mêmes calculs pour un espace productif donné en fonction des établissements qui le composent. On peut ainsi calculer la production associée à un territoire.

Les travaux de Harvard sur les parentés productives proposent une visualisation des espaces productifs dans lesquels les types de produits sont regroupés par proximité de savoir-faire.

Représentation pondérée de l’espace productif du Territoire d’Industrie Loire-Jeune-Loire à partir du modèle de Harvard.

Puisque nous pouvons mesurer la production associée à un territoire à partir des établissements qui s’y trouvent, nous pouvons dans le modèle d’espace productif de Harvard.

  • Les produits « grisés » sont des types de produits qui sont absents du territoire (non produits sur le territoire de façon significative),
  • les produits « colorés » sont des types de produits fabriqués sur le territoire, dans ce cas la taille est proportionnelle à l’importance de ce type de produit.

Découvrez notre Atlas des Synergies Productives : L’IA au service de l’Écologie Industrielle et Territoriale.

Retrouvez nos travaux autour de l’Atlas des Synergies Productives dans notre livre « Intelligence Artificielle : La Révolution de l’Industrie 4.0 » disponible en version numérique et papier.