Le processus de production de la base de données comporte trois briques principales de traitements

(1) L'intégration des données : réception, contrôles, mises au format

(2) Redressements : synchronisation (correction de la non-réponse totale)

(3) Codification des causes de décès

L'intégration des données : réception, contrôles, mises au format

Avant intégration dans la base de données de travail, des contrôles de cohérence sont réalisés sur toutes les données structurées (sexe, date de décès, date de naissance, communes et case cochées...)des certificats (papier uniquement, les contrôles sur les certificats électroniques se font au moment de la collecte) en comparant les informations du certificat entre elles (date de décès supérieure ou égale à la date de naissance par exemple) et à celles du B7 lorsqu'il est reçu. Si une incohérence est détectée, des corrections sont réalisées soit de façon automatique, soit manuellement au travers d'une application avec interface permettant de comparer l’image du certificat à sa retranscription numérique et au B7. 

Redressements - Synchronisation

Il s'agit d'un alignement avec les données de décès issues de l'Etat civil, produites et maintenues par l'Insee. 

L'objectif est de compléter les trous de collecte (décès dont le volet médical n'a pas été reçu par l'Inserm) par des observations avec valeurs manquantes (cause inconnue) et de supprimer les doublons (deux volets médicaux reçus pour le même décès). Il y a aussi un objectif de correction et d'enrichissement des variables socio-démographiques. 

En pratique, la méthode combine une identification au Répertoire national d'identification des personnes physiques et des appariements sur les variables communes entre le volet médical du certificat de décès et le BEC avis de décès (date et lieux de décès et de naissance, sexe et numéro d'acte), avec relâche successive des contraintes. Ces appariements garantissent la confidentialité des données traitées car il n'y a pas de partage d'information sur les causes de décès d'un côté, et les noms des défuns de l'autre. Ces alignements se font tous les mois en date de réception, puis chaque année en date d'événement. 

Iris est un système automatique qui permet de coder plusieurs causes de décès et de choisir la cause sous-jacente du décès.

Le CépiDc de l’Inserm a été l'un des pays fondateur, avec l'Italie, la Hongrie et la Suède, de ce programme de codage automatique compatible avec la Classification internationale des maladies (CIM) et avec les systèmes de codages utilisés par la plupart des autres pays.

cf courrier des statistiques N12