cours / présentation

EMOIS Nancy 2011 - Codage automatisé : ontologie médicale construite par fouille de textes.

Titre : Codage automatisé : proposition d’une méthode utilisant une ontologie médicale construite par fouille de textes. Résumé : Le codage automatisé est devenu un enjeu médico-économique majeur. Deux étapes clés peuvent être individualisées parmi les méthodes proposées dans la littérature : une pr...

Date de création :

18.03.2011

Auteur(s) :

Grégoire FICHEUR

Présentation

Informations pratiques

Langue du document : Français
Type : cours / présentation
Niveau : enseignement supérieur, formation continue, enseignement supérieur, enseignement supérieur
Durée d'exécution : 20 minutes 20 secondes
Contenu : vidéo
Document : video/mp4
Poids : 87.01 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource

Résumé

Titre : Codage automatisé : proposition d’une méthode utilisant une ontologie médicale construite par fouille de textes. Résumé : Le codage automatisé est devenu un enjeu médico-économique majeur. Deux étapes clés peuvent être individualisées parmi les méthodes proposées dans la littérature : une première consiste à fabriquer une terminologie médicale, une seconde à construire une ontologie agrégeant ces termes en concepts par la formalisation de liens logiques. Chacune de ces étapes peut être réalisée à dire d’expert et/ou par fouille de textes. Nous proposons une méthode entièrement automatisée pour réaliser ces deux étapes, l’ontologie finalement obtenue devant permettre de formaliser une relation simple entre des expressions et le codage selon la 10è Classification Internationale des Maladies (CIM-10). Méthodes : Nous utilisons des courriers hospitaliers en français (texte libre) issus de 8610 séjours pour lesquels nous disposons également du codage des diagnostics selon la CIM-10. Nous retenons 201 codes différents (codes présents plus de 30 fois). Tout d’abord, nous construisons une terminologie médicale par la recherche de motifs séquentiels au sein des courriers puis un filtre est appliqué. Ensuite nous réalisons, pour chaque code, une étape de sélection des expressions clés par fouille statistique de données. Nous fixons deux seuils de significativité permettant d’identifier d’une part les synonymes du libellé du code décrit et d’autre part les expressions appartenant à la symptomatologie de la pathologie ainsi codée. Résultats : Nous obtenons une terminologie comprenant plus de 60 000 expressions médicales. L’étape de fouille statistique de données associe à chaque code 14 synonymes et 45 symptômes (valeurs médianes). Nous disposons notamment des variants orthographiques couramment utilisés dans les courriers hospitaliers. Discussion/Conclusion : L’ontologie ainsi obtenue et son intérêt dans la construction de règles de prédiction du codage sont évaluées. La généralisation à davantage de diagnostics requiert l’utilisation d’un nombre plus élevé de séjours hospitaliers. Notre méthode n’est dépendante ni de la langue ni de la classification utilisées. Intervenant : FICHEUR Grégoire (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France). Conférence enregistrée lors des journées EMOIS 2011 à Nancy. Session : systèmes d’informations. Modérateurs : Régis BEUSCART (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France) , Sandra GOMEZ (ATIH - Lyon). Réalisation, production : Canalu U/3S, CERIMES. SCD Médecine.

"Domaine(s)" et indice(s) Dewey

  • Traitement des données. Informatique (004)
  • Statistiques (310)
  • Sciences médicales. Médecine (610)

Domaine(s)

  • Généralités
  • Informatique
  • Informatique
  • 310
  • Santé publique environnement et société
  • Santé et médical
  • Santé

Intervenants, édition et diffusion

Intervenants

Fournisseur(s) de contenus : Canal-U/Sciences de la Santé et du Sport, CERIMES

Diffusion

Cette ressource vous est proposée par :Canal-U - accédez au site internet

Document(s) annexe(s)

Fiche technique

Identifiant de la fiche : 6820
Identifiant OAI-PMH : oai:canal-u.fr:6820
Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas
Entrepôt d'origine : Canal-U

Voir aussi

UNIT
UNIT
24.05.2004
Description : La protéomique désigne l’étude de toutes les protéines exprimées à partir d’un génome. Ce champ d’investigation est immense, et nécessite des outils adaptés à l’ampleur du travail. Des outils dans lesquels la composante informatique est toujours essentielle.
  • protéome
  • codage de protéine
  • identification par spectrométrie
  • fouille de données
  • étiquette peptidique
  • fuscia
Canal-U
Canal-U
18.03.2011
Description : Titre : Comment choisir un algorithme d’identification de cas de cancers incidents dans le Programme de Médicalisation des Systèmes d’Information (PMSI) ? Une analyse formelle des concepts sur les données du PMSI et du registre du cancer du sein de l’Isère. Résumé : L’utilisation du PMSI pour l’ ...
  • PMSI
  • fouille de données
  • cancer du sein
  • EMOIS Nancy 2011
  • algorithmes
  • ECD
  • valeurs prédictives positives
  • VPP