Une approche pour la sélection de variables stables : application à l’encodage des diagnostics secondaires
ans cet article, nous proposons une approche pour sélectionner des variables stables dans le contexte de prédiction des diagnostiques secondaires en partant d’une base de données médico-économique, en l’occurrence le PMSI. Les résultats de prédiction se présentent sous forme de guides pour l’activit...
Saved in:
| Published in | Technique et science informatiques: TSI Vol. 37; no. 1-6; p. 39 |
|---|---|
| Main Authors | , , , , |
| Format | Journal Article |
| Language | French |
| Published |
Paris
Lavoisier
2020
|
| Online Access | Get full text |
| ISSN | 0752-4072 2116-5920 |
| DOI | 10.3166/tsi37-0002 |
Cover
| Summary: | ans cet article, nous proposons une approche pour sélectionner des variables stables dans le contexte de prédiction des diagnostiques secondaires en partant d’une base de données médico-économique, en l’occurrence le PMSI. Les résultats de prédiction se présentent sous forme de guides pour l’activité d’encodage des diagnostiques secondaires dans les départements d’information médicale (DIM). L’approche que nous proposons dans ce papier consiste à exploiter les paradigmes ensemblistes sur les sources de données réduites et équilibrées pour déduire un ensemble stable et fiable de variables utiles à la prédiction. Cet ensemble est construit de façon très indépendante par rapport à l’échantillon de données utilisé pour l’apprentissage du modèle. La qualité des variables est déduite en fonction de la qualité de prédiction des algorithmes de ML. L’évaluation de notre approche sur les données de PMSI montre le réel intérêt de cette proposition et ouvre le débat sur l’application de ces méthodes à ces sources de données très rarement exploitées par la communauté scientifique. |
|---|---|
| Bibliography: | ObjectType-Article-1 SourceType-Scholarly Journals-1 ObjectType-Feature-2 content type line 14 |
| ISSN: | 0752-4072 2116-5920 |
| DOI: | 10.3166/tsi37-0002 |