La pandémie COVID-19 a affecté plus de 18 millions d'individus et causé près de 700000 décès dans le monde au 3 août 2020.1 Un tableau de bord interactif basé sur le Web pour suivre le COVID-19 en temps réel.

Bien que le virus causal du syndrome respiratoire aigu sévère coronavirus 2 (SRAS-CoV-2) cible principalement le système respiratoire, 2

Caractéristiques cliniques de la mortalité par COVID-19 : développement et validation d'un modèle de prédiction clinique

  • Guan WJ
  • Ni ZY
  • Hu Y
  • et coll

Caractéristiques cliniques de la maladie à coronavirus 2019 en Chine.

3

  • Richardson S
  • Hirsch JS
  • Narasimhan M
  • et coll

Présentation des caractéristiques, des comorbidités et des résultats parmi 5700 patients hospitalisés pour COVID-19 dans la région de New York.

les complications dans d'autres systèmes organiques (p. ex., cardiovasculaire, neurologique et rénal) peuvent également contribuer au décès de la maladie. L'expérience clinique a montré jusqu'à présent une hétérogénéité substantielle dans la trajectoire de l'infection par le SRAS-CoV-2, allant des patients asymptomatiques à ceux présentant des formes de maladie légères, modérées et sévères avec de faibles taux de survie.2

  • Guan WJ
  • Ni ZY
  • Hu Y
  • et coll

Caractéristiques cliniques de la maladie à coronavirus 2019 en Chine.

3

  • Richardson S
  • Hirsch JS
  • Narasimhan M
  • et coll

Présentation des caractéristiques, des comorbidités et des résultats parmi 5700 patients hospitalisés pour COVID-19 dans la région de New York.

Notamment, la prédiction précise des résultats cliniques pour les patients dans ce spectre de présentations cliniques peut être difficile. Ce problème présente un défi énorme pour le pronostic et la gestion des patients atteints de COVID-19, en particulier au sein des épicentres de la maladie qui doivent trier un volume élevé de patients. Par conséquent, une prédiction précise de la mortalité par COVID-19 et l'identification des facteurs contributifs permettraient de mettre en place des stratégies ciblées chez les patients présentant le risque de décès le plus élevé. et ont été traités dans plusieurs hôpitaux et lieux ambulatoires du Mount Sinai Health System à New York, NY, États-Unis, couvrant différents arrondissements de la ville. Nous visions à utiliser plusieurs algorithmes de classification basés sur l'apprentissage automatique4Introduction à l'apprentissage automatique.

développer des modèles capables de prédire avec précision la mortalité due au COVID-19. Nous avons cherché à identifier les caractéristiques cliniques qui ont le plus contribué à cette prédiction. Une meilleure compréhension des facteurs prédictifs du COVID-19 est cruciale pour le développement de systèmes de soutien pour la prise de décision clinique qui peuvent mieux identifier les personnes présentant un risque de mortalité plus élevé et éclairer les interventions visant à réduire le risque de décès.

Recherche en contextePreuve avant cette étude

Nous avons recherché dans PubMed et son référentiel LitCovid associé des publications en anglais depuis la création de la base de données jusqu'au 10 mai 2020, en utilisant les termes "coronavirus", "COVID-19", "mort", "mortalité" et "prédiction". Les études que nous avons identifiées se sont généralement concentrées sur un petit ensemble de caractéristiques cliniques, de facteurs de risque ou de petites cohortes pour étudier ou prédire la mortalité due au COVID-19, qui pourraient ne pas saisir suffisamment la nouveauté et la complexité de la maladie. Ces études ont également utilisé des méthodes analytiques relativement simples, qui pourraient ne pas modéliser adéquatement les difficultés inhérentes aux données (p. Ex., Caractéristiques colinéaires ou non pertinentes, relations non linéaires entre caractéristiques et mortalité, bruit et données manquantes). Ces facteurs limitent probablement la capacité des travaux existants à prédire avec précision la mortalité.

Valeur ajoutée de cette étude

Nous avons analysé les données cliniques d'une grande cohorte de patients atteints de COVID-19 traités dans un système de santé majeur desservant un épicentre mondial de COVID-19 (New York City, NY, États-Unis) afin d'identifier des modèles de prédiction de la mortalité due au COVID-19. Le nouveau modèle que nous avons développé était basé sur trois caractéristiques cliniques (âge, saturation minimale en oxygène pendant la rencontre et milieu de soins de santé de la rencontre avec le patient) et prédit avec précision le risque de mortalité dans deux cohortes de validation (aire sous la courbe des caractéristiques de fonctionnement du récepteur de> 0 · 90).

Implications de toutes les preuves disponibles

Nous présentons ici une analyse de prédiction de mortalité COVID-19 très robuste, dérivée du travail avec le plus grand nombre de patients et des caractéristiques cliniques à ce jour. Notre grande cohorte et les méthodes analytiques rigoureuses que nous avons utilisées confèrent à notre étude deux avantages majeurs par rapport aux études précédentes: notre modèle de prédiction fonctionne mieux que ceux proposés précédemment, et depuis que nous avons commencé avec un large ensemble de caractéristiques cliniques, celles que nous avons identifiées comme les plus fortement associés à la mortalité sont plus objectifs et précis. Après validation dans d'autres populations du système de santé, notre modèle pourrait être mis en œuvre en milieu clinique pour permettre un pronostic et une gestion améliorés du COVID-19.

Méthodes

Conception de l'étude et population

Dans cette étude de développement et de validation de modèle de prédiction, nous avons utilisé des données anonymisées de dossier médical électronique (DME) de patients avec un diagnostic confirmé de COVID-19 qui avaient été traités dans le système de santé Mount Sinai, entre le 9 mars et le 6 avril 2020. Le Mount Sinai Health System est un réseau de huit hôpitaux et de plus de 400 cabinets ambulatoires couvrant la zone métropolitaine de New York (annexe p 4). Un diagnostic de COVID-19 a été déterminé par des tests de laboratoire cliniques positifs basés sur une PCR pour le SRAS-CoV-2.Les données ont été stockées en interne et gérées par l'entrepôt de données Mount Sinai. Après anonymisation et suppression des informations de santé protégées, les données ont été diffusées dans un format délimité par du texte à des fins de recherche.

Les données au niveau des patients ont été collectées pour les analyses initiales de notre étude. Tous les patients avec un diagnostic confirmé de COVID-19 et une visite hospitalière ou ambulatoire (y compris la télésanté) au système de santé Mount Sinai pendant la période d'étude ont été inclus. Toutes les données collectées et tous les événements survenus pendant la période pendant laquelle des soins médicaux ont été fournis au patient pendant la visite ont été définis comme une rencontre. Une rencontre comprenait toutes les données collectées et les événements survenus au cours de la période pendant laquelle des soins médicaux ont été fournis au patient pendant la visite ou le séjour à l'hôpital. Les données cliniques initiales recueillies lors de la rencontre avec le patient ont été considérées comme les données à la présentation. Ces données comprenaient des variables démographiques, telles que l'âge, le sexe et l'appartenance ethnique, et des comorbidités, telles que le diabète et l'asthme, définies par la présence de codes de dixième révision de la Classification internationale des maladies correspondants qui étaient actifs sur la liste des problèmes de DME du patient au début de la rencontre. Ces données ont été auto-déclarées par les patients ou enregistrées dans le dossier médical par les prestataires de soins de santé lors des rencontres médicales actuelles et antérieures.

Les patients ont également déclaré que leur tabagisme était actuel, jamais, passé ou passif (le passif a été inclus dans une catégorie étant donné les effets potentiels sur la santé de la fumée secondaire5US Centers for Disease Control and Prevention Effets sur la santé de la fumée secondaire. Atlanta GA: US Centers pour le contrôle et la prévention des maladies.

). Les variables relatives à la valeur la plus élevée ou la plus basse enregistrée de ce type (c.-à-d. La température corporelle la plus élevée et le niveau de saturation en oxygène le plus bas) pendant la rencontre ont été désignées comme maximum ou minimum. Notamment, les ensembles de données téléchargés à une date fixe (p. Ex., Le 6 avril) ne comprenaient que les données recueillies jusqu'à la veille de cette date (p. Ex., Le 5 avril), et n'incluaient donc aucune donnée de suivi des patients de ces cohortes au-delà de ces Rendez-vous. L'ensemble final de caractéristiques et de variables, qui ont été harmonisés dans les différents centres médicaux du Mount Sinai Health System, sont énumérés et définis dans l'annexe (p 5). L'issue de la mortalité prédite dans ce travail était définie comme positive si un patient atteint de COVID-19 décédait au cours de sa rencontre avec le système de santé à la date actuelle (c'est-à-dire le 5 avril 2020). Si un patient n'avait pas atteint le résultat (décès) au moment où les données étaient obtenues, son résultat était marqué comme négatif (vivant).En vertu d'un accord avec l'Institutional Review Board (IRB), qui est un précurseur et distinct de notre étude, le Mount Sinai Data Warehouse a publié des données cliniques anonymisées de tous les patients atteints de COVID-19 qui avaient ou étaient traités dans le système de santé Mount Sinai. au système de santé du mont Sinaï (pas au public). Étant donné que des données anonymisées ont été utilisées, le consentement du patient n'a pas été sollicité.

Ensembles de données

Nous avons téléchargé les données au niveau des patients le 6 avril pour la période du 9 mars au 5 avril 2020, et cet ensemble de données a été divisé de manière aléatoire, sans remplacement sur la base d'une distribution uniforme, en deux groupes de patients indépendants représentant 80% de l'échantillon à développer. du modèle de prédiction de la mortalité (c.-à-d. ensemble de données de développement) et 20% pour un ensemble de données de test rétrospectif (appelé ensemble de données de test 1). La date d'acquisition des données a été choisie pour inclure une cohorte aussi grande que possible dans l'ensemble de données de développement du modèle de prédiction. Ces données ont été prétraitées pour résoudre les problèmes de qualité, tels que les entrées répétées pour tous les patients, les valeurs manquantes excessives dans toutes les caractéristiques et l'absence de normalisation des caractéristiques continues (figure 1; les détails sont dans l'annexe [p 2]).

Discussion

Nous avons appliqué des algorithmes d'apprentissage automatique aux données cliniques et démographiques de patients atteints de COVID-19 d'un grand système de santé de la région métropolitaine de New York pour développer et tester un modèle de prédiction de mortalité qui a montré une grande précision (score AUC de 0 · 91) lorsqu'il est appliqué à des ensembles de données de test des données rétrospectives et prospectives des patients. Ce modèle de prédiction de la mortalité 3F était basé sur trois caractéristiques cliniques: l'âge, la saturation minimale en oxygène et le type de rencontre avec le patient (patients hospitalisés ou ambulatoires et rencontres de télésanté). Compte tenu de l'hétérogénéité de la présentation clinique et de l'évolution de la maladie observée chez les patients atteints de COVID-19,2

  • Guan WJ
  • Ni ZY
  • Hu Y
  • et coll

Caractéristiques cliniques de la maladie à coronavirus 2019 en Chine.

3

  • Richardson S
  • Hirsch JS
  • Narasimhan M
  • et coll

Présentation des caractéristiques, des comorbidités et des résultats parmi 5700 patients hospitalisés pour COVID-19 dans la région de New York.

les facteurs qui contribuent le plus à la mortalité ne sont pas toujours évidents, ce qui rend les soins et la prise en charge de ces patients difficiles dans des contextes aux ressources limitées en soins de santé. Nos travaux montrent que l'entrée de trois paramètres cliniques hautement accessibles pour un patient - l'âge, la saturation minimale en oxygène et le type de rencontre avec le patient - dans un algorithme XGBoost automatisable a le potentiel de classer avec précision les patients comme susceptibles de vivre ou de mourir. Nous reconnaissons que la validation externe de notre modèle de prédiction dans d'autres populations est la prochaine étape du développement du modèle. Si une telle validation montre que notre modèle fonctionne bien dans plusieurs populations, nous envisageons que l'incorporation de notre modèle de prédiction de mortalité automatisable dans le flux de travail de soins cliniques d'un patient atteint de COVID-19 pourrait produire un signe vital supplémentaire qui est évalué régulièrement lors de la rencontre d'un patient. Les équipes cliniques pourraient utiliser les résultats du modèle de prédiction tout au long de la rencontre avec les patients pour signaler les personnes à haut risque de décès afin qu'elles puissent rapidement concentrer le traitement et l'attention sur ces personnes afin de prévenir les décès.Une grande force de cette étude est qu'elle était basée sur des données récentes. données provenant de milliers de patients atteints de COVID-19 dans un épicentre mondial de la pandémie (New York), ce qui aboutit à des résultats très pertinents pour la pandémie actuelle. Les résultats sont basés sur des analyses d'apprentissage automatique rigoureuses alimentées par un échantillon robuste de patients atteints d'une infection par le SRAS-CoV-2 confirmée en laboratoire et montrent le potentiel de ces méthodes pour identifier les facteurs prédictifs de la mortalité en milieu clinique. L'application de l'apprentissage automatique a permis d'identifier des modèles de prédiction basés sur l'algorithme XGBoost.11XGBoost: un système évolutif de boosting d'arborescence. Actes de la 22e conférence internationale ACM SIGKDD sur la découverte de connaissances et l'exploration de données.

Ces modèles de prédiction ont fonctionné avec une grande précision (scores AUC de 0 · 91–0 · 94) dans deux ensembles de données de validation indépendants de patients atteints de COVID-19. En outre, le modèle 3F, qui était basé uniquement sur les trois caractéristiques identifiées, a fait presque aussi bien que le modèle 17F, qui était basé sur toutes les caractéristiques, qui avait un niveau de valeurs manquantes utile pour la prédiction. Cette découverte indique que des prévisions de mortalité précises peuvent être obtenues à partir d'un modèle plus parcimonieux, facilitant une mise en œuvre plus efficace dans les environnements cliniques après une validation approfondie dans d'autres ensembles de données et systèmes de santé.L'âge et la saturation minimale en oxygène pendant la rencontre étaient les caractéristiques les plus prédictives non seulement pour le XGBoost. algorithme, mais pour les quatre modèles de prédiction de la mortalité testés, mettant l'accent sur la pertinence épidémiologique et clinique de ces caractéristiques. Depuis le début de la pandémie de COVID-19, la vieillesse a été reconnue comme un facteur de risque de pires issues.12Caractéristiques et leçons importantes de l'épidémie de coronavirus 2019 (COVID-19) en Chine: résumé d'un rapport de 72314 cas du Centre chinois de contrôle et de prévention des maladies.

13

  • Mehra MR
  • Desai SS
  • Kuy S
  • Henry TD
  • Patel AN

Maladie cardiovasculaire, traitement médicamenteux et mortalité dans le COVID-19.

Dans l'État de New York, États-Unis, les patients âgés de 60 ans et plus représentaient près de 85% de tous les décès dus au COVID-19 au 2 septembre 2020, 14 COVID-19 tracker: décès.

et de même, des taux de mortalité plus élevés parmi les personnes des groupes d'âge plus âgés que dans les groupes d'âge plus jeunes ont été observés dans d'autres points chauds du COVID-19 à travers les États-Unis.15

  • Bhatraju PK
  • Ghassemieh BJ
  • Nichols M
  • et coll

COVID-19 chez des patients gravement malades dans la région de Seattle - série de cas.

De plus, la présentation clinique fondamentale des patients atteints de COVID-19 pendant la pandémie a été des symptômes respiratoires associés à l'hypoxie, conduisant souvent à une insuffisance respiratoire ultérieure et nécessitant une assistance respiratoire, une oxygénation extracorporelle de la membrane, ou les deux.16

  • Prekker ME
  • Brunsvold ME
  • Bohman JK
  • et coll

Planification régionale pour l'allocation d'oxygénation extracorporelle de la membrane pendant le COVID-19.

Notre découverte selon laquelle la valeur minimale de saturation en oxygène d'un patient lors de sa rencontre était la caractéristique prédictive la plus forte de la mortalité est conforme aux observations épidémiologiques mondiales selon lesquelles l'insuffisance respiratoire est la caractéristique la plus courante de maladie grave et de décès chez les patients atteints de COVID-19.17

  • Chen T
  • Wu D
  • Chen H
  • et coll

Caractéristiques cliniques de 113 patients décédés atteints d'une maladie à coronavirus 2019: étude rétrospective.

18

  • Grasselli G
  • Zangrillo A
  • Zanella A
  • et coll

Caractéristiques de base et résultats de 1591 patients infectés par le SRAS-CoV-2 admis aux USI de la région de Lombardie, en Italie.

En plus de l'âge et de la saturation en oxygène, le type de consultation avec les soins de santé (hospitalisation vs ambulatoire et télésanté) a été identifié comme une caractéristique hautement indicative dans le modèle de prédiction de la mortalité 3F. Cette découverte reflète le fait que les patients atteints de COVID-19 présentant des symptômes plus graves sont plus susceptibles d'avoir leur première rencontre à l'hôpital que dans un cadre ambulatoire comme premier point de contact. De plus, bien qu'elle ne soit pas la caractéristique la plus prédictive, la température corporelle maximale pendant la rencontre était une caractéristique de premier rang identifiée par le prédicteur aléatoire de la mortalité forestière. Bien que la fièvre soit un symptôme et un signe courants du COVID-19, les patients peuvent ne pas toujours présenter une augmentation de la température corporelle et la fièvre peut se développer plus tard au cours de l'évolution de la maladie.2

  • Guan WJ
  • Ni ZY
  • Hu Y
  • et coll

Caractéristiques cliniques de la maladie à coronavirus 2019 en Chine.

19Caractéristiques cliniques du COVID-19 en Chine.

Conformément à cette observation, ces prédicteurs de mortalité ont identifié la température corporelle maximale pendant la rencontre, plutôt que la température corporelle lors de la présentation, comme un élément de classification principal. Plusieurs autres études ont été publiées sur l'investigation des facteurs affectant la mortalité due au COVID-19. Certains chercheurs ont effectué des analyses d'association statistique des caractéristiques individuelles des patients et des facteurs de risque avec la mortalité, bien que sur de petites cohortes (20

  • Ruan Q
  • Yang K
  • Wang W
  • Jiang L
  • Chanson J

Prédicteurs cliniques de la mortalité due au COVID-19 basés sur une analyse des données de 150 patients de Wuhan, Chine.

21 Évolution clinique et facteurs de risque de mortalité des patients adultes hospitalisés atteints de COVID-19 à Wuhan, Chine: une étude de cohorte rétrospective.

22

  • Gao L
  • Jiang D
  • Wen XS
  • et coll

Valeur pronostique du NT-proBNP chez les patients atteints de COVID-19 sévère.

23

  • Du R-H
  • Liang L-R
  • Yang C-Q
  • et coll

Prédicteurs de mortalité chez les patients atteints de pneumonie COVID-19 causée par le SRAS-CoV-2: une étude de cohorte prospective.

Une autre petite étude de cohorte a utilisé des méthodes de sélection de caractéristiques linéaires et de développement de modèles de prédiction pour identifier les cas graves de COVID-19, avec une AUC de 0 · 853 dans une cohorte de validation de 165 patients.24 Un outil pour prédire précocement la maladie à coronavirus grave 2019 (COVID-19 ): une étude multicentrique utilisant le nomogramme des risques à Wuhan et Guangdong, Chine.

Certaines autres études ont commencé à exploiter les données cliniques de plus grandes cohortes de plusieurs centaines de patients pour prédire la mortalité et d'autres résultats du COVID-19.25

  • Wynants L
  • Van Calster B
  • Collins GS
  • et coll

Modèles de prédiction pour le diagnostic et le pronostic de l'infection au COVID-19: revue systématique et évaluation critique.

Une force relative de notre étude est que nous avons utilisé une large cohorte de patients et des combinaisons systématiques de méthodes d'apprentissage automatique pour développer un modèle de prédiction de la mortalité plus précis et informatif. En particulier, l'ensemble comparativement plus grand de variables prédictives par rapport aux études précédentes et la méthode de sélection par élimination des caractéristiques récursives que nous avons utilisées dans notre étude ont fourni une opportunité d'identifier automatiquement des ensembles précis et parcimonieux de variables et de modèles de prédiction. En raison de la taille de la cohorte et des méthodes de prédiction utilisées, ces ensembles de données et modèles étaient susceptibles de mieux fonctionner que les méthodes précédemment proposées pour ce problème.Les méthodes basées sur l'apprentissage automatique sont conçues pour passer au crible de grandes quantités de données structurées ou non structurées pour découvrir des connaissances exploitables sans biais d'hypothèses biomédicales 4 Introduction à l'apprentissage automatique.

26

  • Cléophas TJ
  • Zwinderman AH

L'apprentissage automatique en médecine - un aperçu complet.

Dans cette étude, nous avons utilisé cette puissance de l'apprentissage automatique, en particulier pour la sélection de fonctionnalités7

  • Guyon I
  • Weston J
  • Barnhill S
  • Vapnik V

Sélection de gènes pour la classification du cancer à l'aide de machines à vecteurs de support.

et classification, 4Introduction à l'apprentissage automatique.

développer des modèles de prédiction précis et parcimonieux de la mortalité due au COVID-19 à partir de données cliniques et démographiques structurées. En particulier, nous avons constaté que le XGBoost11XGBoost: un système évolutif de boosting d'arborescence. Actes de la 22e conférence internationale ACM SIGKDD sur la découverte de connaissances et l'exploration de données.

l'algorithme a produit les modèles de prédiction les plus précis. XGBoost est un algorithme de prédiction sophistiqué qui construit un ensemble d'arbres de décision en se concentrant de manière itérative sur des sous-ensembles plus difficiles à prédire des données d'apprentissage. En raison de sa conception systématique basée sur l'optimisation, cet algorithme a montré des performances supérieures dans les applications de modélisation prédictive impliquant des données structurées, algorithme 27XGBoost: qu'elle règne longtemps ! Vers la science des données.

28XGBoost, une des meilleures méthodes d'apprentissage automatique sur Kaggle, a expliqué. KD Nuggets.

ce qui est cohérent avec nos observations. Notre étude avait plusieurs limites. Bien que nos ensembles de données soient probablement les plus importants qui aient été utilisés pour prédire la mortalité par COVID-19, les caractéristiques cliniques dont nous disposions étaient limitées à celles collectées systématiquement lors des rencontres à l'hôpital. Bien que nous ayons pu développer des modèles de prédiction précis à partir de ces données limitées en utilisant notre cadre d'apprentissage automatique, le développement de modèles de prédiction encore meilleurs devrait être possible en utilisant un ensemble plus riche de fonctionnalités. À l'avenir, le développement de modèles de prédiction plus précis de la mortalité par COVID-19 et d'autres résultats devrait être possible via l'intégration de données multimodales collectées auprès des patients. Ces données comprennent les données démographiques, les comorbidités, les mesures de tests de laboratoire, les signes vitaux, l'imagerie thoracique, les notes cliniques et les données omiques, et peuvent être intégrées dans des modèles de prédiction à l'aide de techniques telles que les ensembles hétérogènes29

  • Wang L
  • Loi J
  • Murali TMN
  • Pandey G

Intégration de données à travers des ensembles hétérogènes pour la prédiction de la fonction des protéines.

et l'apprentissage en profondeur.30

  • Ching T
  • Himmelstein DS
  • Beaulieu-Jones BK
  • et coll

Opportunités et obstacles pour un apprentissage profond en biologie et en médecine.

Les données de notre étude étaient également limitées dans plusieurs autres aspects. Premièrement, même si nos ensembles de données de développement et de validation étaient plus grands que les études précédentes, certains d'entre eux étaient de petite taille. Plus précisément, l'ensemble de données de test 2 comprenait seulement 249 patients, avec seulement 25 patients décédés. Deuxièmement, nos ensembles de données ne représentent qu'un instantané dans le temps et les résultats en matière de mortalité peuvent changer dans des délais différents. Par exemple, les ensembles de données de test 1 et 2 contenaient des données de patients atteints de COVID-19 qui ont eu des rencontres dans notre système de santé pendant la période du 9 mars au 5 avril 2020 et le 6 avril 2020. La modification de ces plages de dates aurait pu modifier leurs les taux de mortalité. Des changements similaires pourraient également se produire pour les valeurs de caractéristiques variant dans le temps comme la saturation minimale en oxygène. Des facteurs comme ceux-ci pourraient avoir affecté nos résultats de prédiction. Enfin, bien que notre jeu de données de développement, notre jeu de données de test 1 et notre jeu de données de test 2 aient été générés de manière aussi systématique et sans biais que possible, des différences significatives existaient entre eux en termes de valeurs de caractéristiques et de taux de mortalité.Une limitation clé des indices cliniques inclus dans les jeux de données. inclure l'uniformité des données dérivées du DME. Par exemple, bien que la saturation minimale en oxygène lors des rencontres ait été identifiée comme un prédicteur clé de la mortalité, les limites inhérentes à l'interprétation de ces données doivent être notées, telles que l'indisponibilité de la quantité d'oxygène supplémentaire administrée au moment de l'enregistrement et de l'acquisition. les limitations connexes, telles que les lectures inférieures au seuil de précision de l'appareil de surveillance (par exemple, l'appendice aidera dans ces modifications et applications.L'application d'approches d'apprentissage automatique aux données d'une large cohorte de patients atteints de COVID-19 a permis d'identifier des modèles de prédiction précis et parcimonieux de la mortalité. Après une validation approfondie dans d'autres ensembles de données et systèmes de santé, ces résultats basés sur des données pourraient aider les cliniciens à mieux reconnaître et prioriser les soins des patients les plus à risque de décès.

Pour le code source voir https://github.com/SBCNY/Clinical-predictors-of-COVID-19-mortality

GP, SBu, RI et ASY ont conçu l'étude. ASY et Y-cL ont géré et analysé les données. SBo a fourni une expertise clinique. GP, SBu et RI ont supervisé les travaux. Tous les auteurs ont interprété les résultats. GP, SBu, RI et SBo ont écrit le manuscrit, qui a été approuvé par tous les auteurs.

SBo, RI, SBu et GP ont reçu des fonds de recherche des National Institutes of Health (NIH) des États-Unis. GP a également reçu un financement de l'Agence d'activités de projets de recherche avancée en intelligence. SBo a également reçu un financement de Mount Sinai Genomics. RI a également reçu des fonds de recherche de la US Food and Drug Administration et du Département de la Santé de l'État de New York. Tous les autres auteurs ne déclarent aucun intérêt concurrent.