Nous avons obtenu des données de 10826 patients dans la base de données multi-hôpital Massachusetts General Brigham (MGB) Healthcare, qui se compose de patients d'hôpitaux universitaires et communautaires, qui ont eu une infection au COVID-19 au cours de la période de mars et avril 2020. Un total de 3713 sur des 10 826 patients testés positifs pour le SRAS-CoV-2 ont visité un service d'urgence. Nous avons évalué les patients en fonction des données démographiques, des médicaments à domicile, des antécédents médicaux, des caractéristiques cliniques et des valeurs de laboratoire comme décrit dans le tableau supplémentaire 1. Nous avons exclu les patients qui avaient une ou plusieurs variables dépendantes (de résultat) manquantes et nous avons imputé les données manquantes pour indépendant (prédicteur). ) variables. Après avoir exclu les patients pour lesquels les informations sur les résultats manquaient (c.-à-d. Les informations sur l'admission et la mortalité aux USI), 3597 patients sont restés. Pour la validation temporelle, nous avons extrait les données de la base de données de soins de santé du MGB pour les patients qui ont été testés positifs pour le SRAS-CoV-2 entre mai et août 2020. Au cours de cette période, 1754 des 8013 personnes positives pour le SRAS-CoV-2 ont visité l'urgence. De même, après avoir exclu les patients avec une variable dépendante / de résultat manquante (tableau supplémentaire 1), un total de 1711 patients est resté.

Après avoir imputé les données de variables indépendantes manquantes, les caractéristiques de base de 3597 patients dans l'ensemble de données de formation sont énumérées dans le tableau 1. La population globale de l'étude comprenait 48,7% de femmes et l'âge médian était de 55 ans. Le nombre de patients admis à l'unité de soins intensifs dans les 5 jours et décédés dans les 28 jours suivant la visite à l'urgence était de 486 (13,5%) et 344 (9,6%), respectivement. L'ensemble de données de validation temporelle comprenait des patients de distribution similaire d'âge ≥ 50 ans (X2 (4, N = 3073) = 7,7, p= 0,1), sexe (X2 (1, N = 5308) = 0,63, p = 0,43) et race (X2 (1, N = 5308) = 2,48, p = 0,11), mais l'IMC était significativement différent (X2 (2, N = 5308) = 13,8, p = 0,001) (tableau supplémentaire 6). Sur les 1711 patients qui ont visité l'urgence, 146 (8,5%) ont été admis aux soins intensifs et 78 (4,5%) sont décédés du COVID-19.

Comparaison des performances des modèles de prédiction - validation croisée

Nous avons évalué 18 algorithmes d'apprentissage automatique appartenant à 9 grandes catégories, à savoir ensemble, processus gaussien, linéaire, bayes naïfs, voisin le plus proche, machine à vecteurs de support, arborescence, analyse discriminante et modèles de réseau de neurones Fig.1.

un B Diagrammes à barres représentant les scores F1 des modèles de prédiction d'admission et de mortalité aux USI. Les barres d'erreur indiquent l'écart type par rapport à la moyenne. L'analyse statistique a été réalisée à l'aide de la méthode progressive en deux étapes du test de Benjamini, Krieger et Yekutieli qui contrôle le taux de fausses découvertes (FDR) lors de la comparaison multiple. p- le style de valeur est une progression géométrique -