La reconnaissance d'entités médicales à partir du langage naturel est un problème omniprésent dans le domaine médical, avec des applications allant du codage d'acte médical à l'analyse de données de santé numériques pour la santé publique. Il s'agit cependant d'une tâche complexe nécessitant généralement l'intervention d'un expert humain, ce qui la rend coûteuse et longue. Les progrès récents de l'intelligence artificielle, en particulier dans le domaine de l'apprentissage profond, ont permis aux machines de prendre des décisions efficaces sur un certain nombre de problèmes complexes, avec l'exemple notable des modèles de séquence neuronale et de leurs applications performantes dans le traitement du langage naturel. Ils nécessitent cependant une quantité considérable de données pour apprendre, ce qui est généralement leur principal facteur limitant. Cependant, le CépiDc détient une base de données exhaustive des certificats de décès à l'échelle nationale française, représentant plusieurs millions d'exemples en langage naturel fournis avec leurs entités médicales codées avec la CIM-10. Cet article présente l'application de modèles de séquences neuronales profondes à la reconnaissance d'entités médicales à partir de texte en langage naturel rédigé sur les certificats de décès.

Pour en savoir plus...