La pandémie actuelle de COVID-19 a eu un impact particulièrement dur sur les villes. Ici, nous fournissons une caractérisation approfondie de l'incidence et de la mortalité des maladies, ainsi que de leur dépendance vis-à-vis des couches démographiques et socio-économiques de Santiago, une ville très ségréguée et la capitale du Chili. Nos analyses montrent une forte association entre le statut socio-économique et les résultats du COVID-19 et la capacité de santé publique. Les personnes vivant dans des municipalités à faible statut socio-économique n'ont pas réduit leur mobilité pendant les périodes de verrouillage autant que celles des municipalités plus riches. Les volumes de tests ont peut-être été insuffisants au début de la pandémie dans ces endroits, et les taux de positivité des tests et les délais de test étaient beaucoup plus élevés. Nous trouvons une forte association entre le statut socio-économique et la mortalité, mesurée soit par les décès attribués au COVID-19, soit par les décès excessifs. Enfin, nous montrons que les taux de mortalité par infection chez les jeunes sont plus élevés dans les municipalités à faible revenu. Ensemble, ces résultats mettent en évidence les conséquences critiques des inégalités socio-économiques sur les résultats en matière de santé.

La pandémie de maladie à coronavirus 2019 (COVID-19) est une crise de santé publique en cours. Alors que de nombreuses études ont décrit la transmission du SRAS-CoV-2 - le virus qui cause le COVID-19 - en Amérique du Nord, en Europe et dans certaines régions d'Asie (1–5), la caractérisation de la pandémie en Amérique du Sud a reçu moins d'attention, malgré l'impact sévère dans de nombreux pays pendant la saison hivernale de l'hémisphère sud. Bien que les cas confirmés de COVID-19 soient une mesure de santé publique importante pour estimer le niveau de propagation des infections causées par le SRAS-CoV-2, ils peuvent ne pas être un indicateur fiable de l'incidence en raison des biais dus au comportement de recherche de santé au niveau de la population, les capacités de surveillance et la présence d'individus asymptomatiques dans les régions (6). Les analyses des décès liés au COVID-19 ainsi que de la surmortalité fournissent une image alternative et potentiellement moins biaisée de l'intensité de l'épidémie (7, 8). Cela est en partie dû au fait que les biais de vérification peuvent être moins prononcés pour les décès que pour les cas confirmés, car les personnes décédant du COVID-19 sont plus susceptibles d'avoir présenté des symptômes graves et donc plus susceptibles d'avoir été documentées comme des cas positifs au COVID-19 par la santé. systèmes de surveillance. Les données sur les décès par âge peuvent également aider à expliquer l'hétérogénéité de la charge de COVID-19 et des décès attribuables au COVID-19 dans différents pays (9). Cependant, le rôle d'autres facteurs, tels que le statut socio-économique - qui est corrélé à l'accès aux soins de santé - sur la mortalité et la charge de morbidité, reste une question ouverte particulièrement importante (10) pour les villes présentant des disparités économiques importantes.

Le statut socio-économique détermine l'incidence du COVID-19 et la mortalité associée à Santiago, Chili

Ici, nous avons analysé l’incidence et la mortalité attribuées à l’infection par le SRAS-CoV-2 et son association avec le statut démographique et socio-économique dans la zone métropolitaine urbaine de la capitale du Chili, connue sous le nom de «Grand Santiago». Contrairement à de nombreux autres pays, le Chili a mis en place un système de notification remarquablement complet et a rendu publics de nombreux ensembles de données clés. Pour comprendre les variations spatiales de la charge de morbidité, nous avons estimé les excès de décès et les taux de mortalité par infection dans cette zone urbaine. Pour comprendre les disparités dans le système de soins de santé, nous avons analysé la capacité de dépistage et les retards dans les municipalités. Nous démontrons ensuite de fortes associations de ces indicateurs de santé avec des facteurs démographiques et socio-économiques. Ensemble, nos résultats montrent que les disparités socio-économiques expliquent une grande partie de la variation des décès et de la sous-déclaration du COVID-19, et que ces inégalités affectent de manière disproportionnée les jeunes.

Association entre le statut socio-économique et la dynamique de la maladie

La région du Grand Santiago est composée de 34 municipalités - définies comme ayant plus de 95% de sa superficie urbanisée - et compte près de 7 millions d'habitants. Alors que ce centre urbain représente 36% de la population du pays, il a signalé 55% des cas confirmés de COVID-19 et 65% des décès attribués au COVID-19 avant la semaine épidémiologique 36 (fin août 2020). Le statut socioéconomique (SES) des municipalités varie considérablement, Vitacura ayant la valeur la plus élevée (SES = 93,7) et La Pintana la plus faible (SES = 17,0; Fig.1A), et cette différence se reflète dans l'impact de la pandémie pendant l'hémisphère sud de l'hiver 2020. L'incidence maximale à Vitacura était de 22,6 cas hebdomadaires pour 10 000 individus à la mi-mai, tandis que La Pintana a signalé un maximum de 76,4 cas hebdomadaires pour 10 000 individus au cours de la première semaine de juin (Fig. 1B). Comme le montrent les Fig. 1C et Fig. S1, les décès attribués au COVID-19 suivent un schéma temporel similaire (mais décalé) au nombre de cas de COVID-19 signalés. Par exemple, le taux le plus élevé de 4,4 décès hebdomadaires pour 10 000 personnes est observé à San Ramon, une municipalité avec un SSE de 19,7, tandis que Vitacura a signalé un maximum de 1,6 décès hebdomadaire pour 10 000 en juin. Ces inégalités sociales ont un impact sur les taux de mortalité globaux du COVID-19, comme le montre la figure 1D.

Fig. 1 Statut socio-économique, cas et décès de COVID-19, et données de mobilité dans le Grand Santiago.(UNE) Les municipalités qui font partie du Grand Santiago sont colorées en fonction de leur statut socio-économique (SSE), où un score inférieur indique un SSE plus faible. (B) Cas de COVID-19 normalisés en fonction de la taille de la population par municipalité. Les municipalités sont triées par SES en commençant par celle qui a le SES le plus élevé en haut. (C) Les décès attribués au COVID-19 sont normalisés en fonction de la taille de la population par municipalité. (ré) Taux de mortalité attribués au COVID-19 ajustés selon l'âge et son association avec le SSE. Les points et les moustaches représentent respectivement la médiane et les intervalles de confiance à 95%, reflétant l'incertitude sur la population standard utilisée pour la pondération. (E) Réduction journalière de la mobilité par commune colorée par sa valeur SES. (F) Réduction moyenne de la mobilité pendant la période de verrouillage complet et son association avec SES. Les centres urbains et les centres d'affaires, Santiago et Providencia respectivement, ont connu une réduction de la mobilité plus importante que prévu sur la seule base de leur profil socio-économique.

Les changements dans la mobilité humaine - un indicateur de la distance physique - pendant les périodes de verrouillage suivent une tendance similaire. À l'aide d'indicateurs de mobilité humaine, déduits de données de téléphonie mobile anonymisées obtenues à partir de la Facebook Data for Good Initiative, nous montrons que les deux communes au statut socio-économique le plus élevé ont affiché une réduction de la mobilité jusqu'à 61% pendant le verrouillage complet (vert foncé, Fig. 1E), par rapport à ceux dont le SSE est le plus bas, qui, en moyenne, ont réduit leur mobilité à 40% pendant cette période (rose foncé, figure 1E). Cette relation entre les réductions de mobilité et le SSE était présente pendant toutes les périodes de temps considérées pour cette étude (Fig. 1F) et soutient l'hypothèse selon laquelle les habitants des régions les plus pauvres ne peuvent pas se permettre de rester chez eux pendant les confinements. Notre résultat est cohérent avec les analyses des quartiers de la ville de New York (11) et avec les conclusions d'autres études menées à Santiago qui utilisaient différentes mesures socio-économiques et de mobilité (12–14).

La reconstruction épidémique révèle une dynamique de transmission précoce

Afin d'examiner le biais éventuel présent dans les données d'incidence, nous avons reconstruit les infections au SRAS-CoV-2 au fil du temps en mettant en œuvre une méthode appelée MAP de mortalité régularisée (RmMAP). RmMAP calcule en retour les nombres d'infections les plus probables compte tenu de la séquence temporelle des décès, de la distribution du début à la mort et du taux de mortalité par infection ajusté par la démographie (IFR). La figure 2A montre les résultats de ce processus d'inférence, où les reconstructions de notre approche et d'autres méthodes sont capables de capturer le principal pic observé en mai et juin, avec une estimation du nombre d'individus infectés 5 à 10 fois plus grande que la valeurs rapportées.

Fig. 2 Cas inférés et tests rapportés réalisés pour la région du Grand Santiago.(UNE) Cas déduits et signalés au fil du temps. Pour nos reconstructions RmMAP, nous avons considéré la distribution log-normale du début à la mort décrite dans (38) et deux estimations IFR stratifiées selon l'âge, une du bateau de croisière Diamond Princess (39) et une autre d'une étude de séroprévalence en Espagne (40). À titre de comparaison, nous présentons également des reconstructions basées sur la méthode Covidestim (41), et par la mise à l'échelle du nombre de cas par les estimations de sous-déclaration obtenues avec la méthode de Russell et al. (42). (B) Association entre le test quotidien moyen et le SES au début du pic. Le pic précoce est défini comme les cas signalés entre le 03/08 et le 04/09. (C) Cas signalés pour 10 000 par municipalité au début du pic. (ré) Test par 10 000 par municipalité au début du pic. (E) Cas déduits obtenus à partir du modèle RmMAP-Espagne pour 10 000 par commune au début du pic. Pour les panneaux C-E, l'enregistrement d'au moins un décès confirmé ou attribué au COVID-19 pour cette semaine particulière est mis en évidence avec des cases pleines et en pointillés respectivement.

Les reconstructions révèlent également des différences importantes dans le nombre d'infections inféré en mars 2020, le mois au cours duquel le virus a été introduit au Chili par des voyageurs provenant de municipalités riches. Nous avons analysé le nombre de tests réalisés entre le 8 mars et le 9 avril, et avons trouvé un nombre significativement plus élevé de tests réalisés dans les communes à SES élevé (Fig. 2B), en particulier pendant les deux premières semaines de mars (Fig. 2D). En outre, un pic précoce de cas signalés n'a été observé que dans les municipalités à SSE élevé à la mi-mars (figure 2C), malgré le fait que plusieurs décès dus au COVID-19, qui sont retardés par rapport à l'infection de plusieurs semaines, ont été signalés. dans les communes à faible SSE au cours de la même période. Ces résultats suggèrent qu'une première vague d'infections s'est produite au cours du mois de mars et s'est rapidement propagée dans le reste de la ville sans être capturée par les dénombrements officiels. Nos estimations RmMAP au niveau de la municipalité appuient cette affirmation, car elles capturent un volume élevé d'infections précoces dans la plupart des municipalités (figure 2E), un scénario qui s'écarte largement des chiffres officiels (figure 2C).

Pour valider davantage l'hypothèse d'une sous-déclaration précoce dans les communes à faible SSE, et pour statuer que ces premières estimations d'activité ne sont pas un artefact de notre méthode, nous avons réalisé des expériences sur un modèle élémentaire synthétique de deux pics de tailles différentes séparés dans le temps ( matériel supplémentaire). Ces expériences confirment que RmMAP est capable de récupérer ce phénomène bimodal, alors que d'autres méthodes échouent à le faire; ils sur-lissent le vrai signal et le pic précédent n'est généralement pas récupéré. Ce signal précoce de sous-déclaration suggère que les schémas de mortalité et de tests observés dans le Grand Santiago s'expliquent en partie par un échec précoce des systèmes de santé à informer la population avec une conscience situationnelle suffisante de l'ampleur réelle de la menace (15).

Les décès excédentaires correspondent aux décès attribués au COVID-19

Les décès excessifs - définis comme la différence entre les décès observés et attendus - peuvent fournir une mesure de l'impact réel de la pandémie sur la mortalité en quantifiant les décès directs et indirects liés au COVID-19 (7, 8, 16). Nous avons estimé les décès attendus pour 2020 en ajustant un modèle de processus gaussien (17) aux données historiques de mortalité des vingt dernières années, et les avons utilisés pour identifier l'augmentation de la mortalité pendant la pandémie, en contrôlant la croissance démographique et la saisonnalité. Comme le montre la figure 3A, le nombre de décès observés entre mai et juillet 2020 est supérieur à 1,73 [1.68, 1.79] fois la valeur attendue, avec un pic dépassant 2110 décomptes de décès au cours de la semaine épidémiologique 24 (première semaine de juin 2020) par rapport à une valeur attendue de 802 décès et un nombre moyen de décès de 798 entre 2015 et 2019.

Fig. 3 Excès de décès et son association avec des facteurs démographiques et socio-économiques.(UNE) Décès observés (ligne bleue foncée continue) dans le Grand Santiago par rapport aux décès prévus pour 2020 (ligne bleue claire continue et ses intervalles de confiance ombrés en couleur plus claire), en utilisant un modèle de régression de processus gaussien construit avec des données historiques de mortalité de 2000 à 2019 (en pointillés lignes bleues). Les valeurs contiennent toutes les causes possibles de décès. (B) Tendances spécifiques à l'âge des décès observés par rapport aux décès prévus pour 2020. (C) Décès liés au COVID-19 et décès excessifs. Les décès confirmés par COVID-19 sont affichés en vert clair, tandis que les décès attribués au COVID-19 sont affichés en vert foncé. Les décès excessifs correspondent à la différence entre les décès observés et prévus. (ré) Comparaison des décès excédentaires et des décès attribués au COVID-19 par municipalité colorée par le SSE et normalisée en fonction de la taille de la population. (E) Moyenne mensuelle des scores Z des décès observés entre avril et juillet par groupe d'âge. Les scores Z correspondent aux écarts-types par rapport aux valeurs attendues. (F) Décès historiques dus à la grippe et à la pneumonie (lignes pointillées turquoise) et au cancer (lignes pointillées roses) par rapport aux décès observés en 2020 (lignes pleines).

En comparant le nombre de décès par âge en 2020 avec les prévisions de notre modèle, nous observons des tendances frappantes. Bien que les personnes de moins de 40 ans aient un taux de mortalité globalement plus faible que celles des groupes plus âgés comme prévu, elles présentent toujours une augmentation de près de deux fois le nombre total de décès avec un pic des décès observés survenant 2 semaines plus tôt que pour les personnes plus âgées. de plus de 60 ans (Fig. 3B). Pour les groupes d'âge de 40 à 60 ans, de 60 à 80 ans et de plus de 80 ans, les décès observés sont respectivement 2,8, 3,2 et 2,4 fois plus élevés que prévu. Même si le groupe d'âge de 80 ans et plus présente les valeurs de mortalité attendues les plus élevées pour 2020, le groupe qui comprend les personnes âgées de 60 à 80 ans affiche le nombre hebdomadaire le plus élevé (936 au cours de la semaine épidémiologique 24), le plus grand écart par rapport aux valeurs prédites et le les valeurs les plus élevées de décès en excès (645 décès de plus que prévu, figure 3B).

Les décès attribués au COVID-19 pour toute la région du Grand Santiago diminuent avec les intervalles crédibles de décès excessifs jusqu'à la fin juin, lorsque les décès attribués augmentent à des taux encore plus élevés que les décès en excès, ce qui suggère que la sous-déclaration des décès attribués au COVID-19 est peu probable (Fig. 3C). Les décès confirmés par COVID-19 - ceux avec un test SARS-CoV-2 confirmé par PCR - suivent un schéma temporel similaire, et la différence entre les décès confirmés et attribués au COVID-19 diminue vers la fin août, ce qui indique une amélioration de la capacité de test. Ce schéma est cohérent par rapport aux décès normalisés selon la taille de la population pour chaque municipalité (figure 3D), qui montre également que les décès attribués au COVID-19 sont plus élevés que les décès en excès dans la plupart des cas. Les anomalies des décès observés par rapport aux décès prévus pour 2020 dans les différents groupes d'âge montrent également une association négative significative avec le statut socio-économique, à l'exception du groupe des 80 ans et plus (figure 3E), suggérant un fardeau de mortalité plus élevé dans les municipalités à faible SSE, indépendamment de leur âge. composition. En outre, les deux municipalités dont le SSE était supérieur à 80 (Las Condes et Vitacura) avaient des scores z d'une ampleur beaucoup plus petite (à l'exception du groupe d'âge le plus âgé), ce qui indique que les schémas de mortalité ne s'écartaient pas beaucoup de ce à quoi on aurait pu s'attendre. sur une année normale chez les personnes de moins de 80 ans.

Bien que l'observation selon laquelle les décès attribués au COVID-19 sont plus élevés que les décès supplémentaires estimés puisse être contre-intuitive (Fig. 3D), elle peut indiquer la présence de changements dans les schémas de mortalité globaux dus à d'autres causes, y compris un nombre inférieur de décès dû à la réduction dans la mobilité. En outre, des nombres inférieurs de décès ont été signalés pour des maladies infectieuses respiratoires telles que la grippe et la pneumonie, et le cancer en juillet et août 2020 par rapport à la période 2015-2019 (figure 3F). L'évolution de la mortalité due aux maladies respiratoires peut s'expliquer par une saison grippale douce dans l'hémisphère sud au cours de l'hiver 2020 (18), ce qui est cohérent avec notre observation selon laquelle beaucoup moins de cas de virus respiratoires ont été détectés au Chili au cours de la saison 2020 ( matériel supplémentaire). Une diminution du nombre de décès attribués au cancer peut être expliquée par le déplacement de la mortalité (19, 20), mais des analyses supplémentaires doivent être menées pour établir cette hypothèse. D'autres explications des changements dans la mortalité toutes causes confondues devraient également tenir compte des changements possibles des causes externes et comportementales de la mortalité. Nous n'observons pas une contribution substantielle de ces causes (voir les documents supplémentaires, ainsi que des analyses détaillées supplémentaires).

Plus de tests avec des temps d'attente plus courts dans les zones riches

Pour mieux comprendre les conséquences d'un test précoce insuffisant, nous avons mené une analyse plus approfondie des différentes mesures de test au niveau de la municipalité. Nous avons d'abord examiné la capacité de test mesurée en tant que taux de positivité hebdomadaire, la fraction de tests positifs pour le SRAS-CoV-2. Nos résultats montrent que le signal de positivité a suivi le cours de l'épidémie, atteignant un pic aux périodes d'incidence la plus élevée entre mai et juillet, et suggérant un système de santé très saturé pendant cette période dans toute la ville (Fig.4A). Une forte association négative entre la positivité et le SSE (Fig. 4B) dénote en outre des difficultés d'accès aux soins de santé qui sont encore plus prononcées dans les municipalités à faible SSE. Malgré les changements dans les taux de positivité au fil du temps, cette métrique de test était également significativement corrélée avec le nombre de cas (Fig. 4C) et le nombre de décès (Fig. 4D).

Fig. 4 Capacité de test et temps d'attente.(UNE) Positivité au fil du temps. La positivité est définie comme la proportion de tests PCR qui sont positifs une semaine donnée. (B) Association entre la positivité moyenne et le SES. (C) Association entre positivité et nombre hebdomadaire de cas pour 10 000. (ré) Association entre le nombre global de décès ajusté selon l'âge pour 10 000 et la positivité moyenne sur la même période. (E) Association entre les tests quotidiens moyens pour 10 000 et le SES. (F) Association entre tests pour 10 000 et décès pour 10 000. (g) Actualité au fil du temps. La rapidité est définie comme la proportion de tests PCR qui apparaissent dans les archives publiques dans la semaine suivant l'apparition des symptômes. Deux semaines en juin (ombrées en gris) ont été exclues de l'analyse en raison d'incohérences dans les données, ce qui a conduit à des estimations de retard peu fiables. (H) Association entre l'actualité moyenne et le SES. (je) Association entre la rapidité et le nombre hebdomadaire de cas pour 10 000. (J) Association entre le nombre global de décès ajusté selon l'âge pour 10 000 et la ponctualité moyenne. (K) Association entre opportunité et positivité. Les points sont représentatifs des données hebdomadaires par commune. (L) Association entre tests par décès (ajusté selon l'âge) et SES. Les figures avec différentes couleurs de points illustrent la valeur SES selon la référence présentée en (A).

Nos résultats sur le nombre de tests effectués montrent une association assez paradoxale avec le SSE et la mortalité. Plusieurs mois après le début de l'épidémie, l'association positive précoce entre les tests par habitant et le SES (figure 2B) s'est inversée (figure 4E), ce qui indique une amélioration de la capacité de test au fil du temps, de sorte que davantage de tests ont été effectués dans les zones les plus touchées. De même, le nombre de tests a commencé à être corrélé positivement avec les décès (Fig. 4F), ce qui suggère que le nombre de tests sont de puissants prédicteurs de la mortalité.

Nous avons également analysé la capacité de test en estimant les délais d'obtention des résultats de test. Nous avons déduit la distribution du délai entre l'apparition des symptômes et le rapport des résultats, à partir de laquelle nous avons obtenu la proportion de cas qui sont rapportés publiquement dans la semaine suivant l'apparition des symptômes ou la rapidité (21). Comme le montre la figure 4G, la ponctualité suit une évolution temporelle similaire à celle des tests de positivité en mai et une partie de juin, mais dans la direction opposée. Cette métrique est associée au SSE, ce qui suggère que les municipalités à faible SSE obtiennent en moyenne leurs résultats de test plus tard que celles à SSE élevé (figure 4H). La rapidité est également corrélée négativement avec le nombre de cas (Fig. 4I), le nombre total de décès (Fig. 4J) et avec la positivité (Fig. 4K). En regardant les tests par décès, une métrique qui peut être utilisée comme un indicateur fidèle de la capacité de test (22), nous observons une corrélation positive avec le statut socio-économique (Fig.4L), indiquant que les disparités de test ont persisté pendant l'épidémie, avec un faible SSE les zones les plus touchées. Dans les documents supplémentaires, nous discutons plus en détail des associations entre nos mesures et le nombre de cas.

Le taux de mortalité par infection dépend du statut socio-économique

En l'absence d'enquêtes sérologiques, une inférence directe d'un taux de mortalité par infection (IFR) est difficile. Le degré de vérification dépend de nombreux facteurs, y compris les capacités de test et la probabilité d'avoir des infections symptomatiques. De plus, contrairement aux décès, les informations sur l'âge des cas déclarés ne sont pas disponibles au niveau de la municipalité, ce qui rend cette inférence plus difficile. Pour surmonter ces obstacles et pour avoir des estimations de l'IFR, nous avons mis en œuvre un modèle bayésien hiérarchique qui considère la relation entre les décès, les cas observés et les infections réelles selon le lieu, le temps et le groupe d'âge. Nous avons d'abord estimé le taux de létalité des cas (TFC) en attribuant le nombre total de cas en groupes d'âge d'une manière simple qui projette la distribution globale par âge des cas à des données démographiques particulières de la municipalité (figure 5A, voir les documents supplémentaires pour plus de détails). À l'exception du groupe d'âge le plus âgé, le taux de létalité montre une association négative avec le statut socio-économique. De même, nos estimations IFR résultantes une fois corrigées pour la sous-estimation affichent un schéma similaire (Fig. 5B) mais d'un ordre de grandeur inférieur aux estimations CFR. Nous avons ensuite regroupé les municipalités en quatre catégories de tailles similaires et les avons étiquetées comme étant une catégorie socio-économique faible, moyenne-basse, moyenne-élevée et élevée. En comparant le rapport IFR entre les catégories SES faible et élevé, les résultats montrent un taux de mortalité par infection significativement plus élevé dans le groupe SES bas chez les personnes de moins de 80 ans (Fig. 5C). Les groupes d'âge 60-80 et 40-60 présentent un IFR qui est 1,4 et 1,7 fois plus élevé respectivement dans la catégorie à faible SSE, par rapport à la catégorie à SES élevé. La différence est encore plus prononcée dans la tranche d'âge la plus jeune (0-40 ans), qui montre des valeurs d'IFR 3,1 fois plus élevées pour les communes au statut socio-économique le plus bas. Dans l'ensemble, ces résultats sont en ligne avec les analyses des décès excédentaires présentées dans la figure 3E. Le manque d'association entre IFR et SES dans la tranche d'âge la plus âgée peut être attribué à une espérance de vie plus faible (23), qui est en fait prise en compte dans l'estimation du SES (voir les méthodes pour plus de détails) et que les personnes âgées pourraient être, en général, assez en meilleure santé pour survivre jusqu'à cet âge.

Fig. 5 Inférence des taux de mortalité par cas et par infection selon l'âge et le statut socio-économique.(UNE) Estimations du taux de létalité des cas (TFC) par âge et SSE basées sur une simple attribution des cas aux groupes d'âge. Nos estimations de CFR ont été validées par la plateforme officielle ICOVID (www.icovidchile.cl/) qui a confirmé que 119 des 136 CFR observés se situaient dans nos intervalles de confiance. Les CI sont dérivés d'une procédure bootstrap décrite dans les documents supplémentaires. (B) Taux de mortalité par infection inféré (IFR) par âge et SSE en utilisant notre ensemble de modèles bayésiens hiérarchiques, ainsi que les intervalles crédibles associés. (C) Ratio IFR entre la catégorie socio-économique faible et élevée par groupe d'âge. Quatre catégories socio-économiques ont été définies en fonction des quantiles de SSE : faible, moyen-faible, moyen-élevé et élevé.

Discussion

Afin de comprendre le véritable fardeau du COVID-19, il est essentiel de prendre en compte les facteurs démographiques et socio-économiques et leurs conséquences sur la réponse de santé publique. Ici, nous avons analysé les données de la capitale du Chili, une ville très ségréguée. Nos résultats concordent avec la littérature récente sur les risques sanitaires inégaux à l'échelle mondiale, qui a mis en évidence à quel point les populations socialement et économiquement défavorisées sont plus vulnérables au fardeau des épidémies (24, 25). De plus en plus de preuves suggèrent que de telles différences se sont également manifestées dans le contexte de la pandémie de COVID-19 (26, 27). Étant donné que les voies modulant ces résultats différentiels ne sont pas bien comprises, des comptes complets sont nécessaires de toute urgence (28), afin de pouvoir planifier des stratégies de santé publique plus résilientes et socialement responsables avant les futures pandémies. Au Chili, des études récentes ont suggéré un lien entre le SSE et l'efficacité des interventions non pharmaceutiques telles que les ordonnances au domicile (12, 13, 29). Notre travail explore plus en détail ce sujet en fournissant une perspective holistique sur la façon dont l'interaction entre les facteurs comportementaux, sociaux, économiques et de santé publique module l'hétérogénéité observée de l'incidence des infections et de la mortalité. Parallèlement aux principaux résultats, nous avons également introduit plusieurs innovations méthodologiques. Notre méthode bayésienne pour l'inférence conjointe des taux de mortalité par infection et de la sous-déclaration est une nouvelle contribution dans ce domaine. Nous montrons qu'il n'est peut-être pas nécessaire d'avoir des ensembles de données épidémiologiques complets (ici, l'âge) pour tirer des inférences valides, tant que l'espace des solutions est suffisamment limité par des priors significatifs et une structure démographique.

Nos résultats montrent un lien étroit entre les facteurs socio-économiques et démographiques avec les résultats du COVID-19 et la capacité de test du COVID-19 à Santiago. Cette association se manifeste par une boucle de rétroaction renforçante, comme le soulignent nos résultats. Premièrement, notre analyse de la mobilité humaine indique que les municipalités à faible statut socio-économique respectaient moins les ordonnances de maintien à la maison, peut-être parce que les personnes des régions à faible SSE sont incapables de travailler à domicile, ce qui les expose à un risque de maladie plus élevé. Deuxièmement, nos analyses ont révélé une sous-déclaration des infections dans les zones à faible revenu au début de l'épidémie. Étant donné que des mesures de santé publique ont été prises en réponse au nombre de cas nominaux, ces lieux étaient sous-préparés, avec une mauvaise réponse des soins de santé qui a entraîné une augmentation du nombre de décès. Troisièmement, les anomalies de la surmortalité globale sont plus élevées dans les régions à faible SSE, en particulier chez les personnes de moins de 80 ans, ce qui suggère que les municipalités les plus vulnérables ont été les plus durement touchées. Quatrièmement, les analyses des taux de positivité des tests, de la rapidité et des tests par décès indiquent un déploiement insuffisant des ressources pour la surveillance épidémiologique. Des taux de positivité plus élevés dans les centres de soins de santé suggèrent le besoin de tests et de détection plus importants. Dans le même temps, un délai d'exécution plus lent des résultats des tests peut entraîner un plus grand potentiel de transmission, car même de petits retards entre l'apparition des symptômes, les tests et l'isolement final, entravent considérablement la capacité des systèmes de santé publique à contenir l'épidémie (30). Enfin, les taux de mortalité par infection étaient plus élevés dans les municipalités à faible SSE, en particulier chez les jeunes.

Nous proposons deux explications complémentaires de l'association entre le taux de mortalité par infection et le statut socio-économique. Premièrement, un IFR plus élevé peut refléter un accès limité aux services de santé pendant la pandémie, et la forte association entre le nombre de tests par décès et le SES étaye cette affirmation. Nous montrons également dans des documents complémentaires que les zones Sud et Ouest (sur la base de la répartition de la couverture sanitaire) ont 4 fois moins de lits pour 10000 habitants et 4 fois moins d'inscrits dans le système de santé privé que la zone Est, qui contient toutes les communes SES de 60 ou plus. Étonnamment, plus de 90% des décès attribués au COVID-19 dans la zone Sud et Ouest se sont produits dans des endroits autres que les établissements de santé, contre 55% dans l'Est. Deuxièmement, les communautés plus vulnérables peuvent connaître une prévalence plus élevée des comorbidités (31) associées à des présentations plus graves de COVID-19. Les habitants des municipalités à faible SSE sont plus susceptibles d'être en surpoids et de vivre dans des conditions de surpeuplement (matériel supplémentaire), facteurs qui peuvent en fin de compte exposer ces populations à un risque de maladie plus élevé. L'interaction de ces deux explications peut conduire à une forte disparité entre les différents groupes socio-économiques.

Nos résultats doivent être considérés à la lumière des limites suivantes. Les données sur la mobilité des téléphones mobiles sont susceptibles d'être biaisées en raison des différences de possession de téléphones mobiles dans différents groupes démographiques. Bien que les données de mobilité de Facebook puissent être biaisées de cette manière, nos résultats sont cohérents avec d'autres études à Santiago qui ont utilisé différentes mesures socio-économiques et de mouvement. [see (12–14) and supplementary materials]. Nos méthodes reposent sur plusieurs hypothèses. Les estimations RmMAP rétro-calculées reposent sur un choix de la distribution de l'infection à la mort et supposent que l'IFR ne change pas avec le temps et que les estimations de la surmortalité dépendent du choix d'un noyau. Nos estimations IFR sont dérivées d'un modèle bayésien complexe et sont basées sur des hypothèses concernant les taux de notification et la répartition par âge des infections. Des analyses de sensibilité approfondies suggèrent que nos résultats sont stables aux écarts par rapport à ces hypothèses (documents supplémentaires).

Pour conclure, cette étude met en évidence les conséquences majeures des disparités en matière de santé dans une ville très ségrégée et propose de nouvelles méthodologies, qui tiennent compte des données incomplètes, pour étudier la charge de morbidité infectieuse et la mortalité dans d'autres contextes.

Matériels et méthodes

Données

Statut socioéconomiqueNous définissons l'indice de statut socio-économique (SES) comme SES = 100 - SPI, où SPI est l'indice de priorité sociale (ou " Indice de Prioridad Social " en espagnol) estimé pour 2019. L'indice SPI varie entre 0 et 100, et a été rapport annuel depuis 1995 par le Ministère chilien du développement social et de la famille. La valeur SPI indique la priorité de chaque municipalité pour les programmes sociaux du gouvernement régional, et par conséquent, les municipalités à faible SSE ont une priorité sociale plus élevée. L'indice SPI pondère également trois composantes: (i) le revenu et la pauvreté, (ii) l'accès et la qualité de l'éducation, et (iii) les facteurs de santé tels que l'accès aux soins de santé et l'espérance de vie. Pour chaque composant, les valeurs sont standardisées sur une échelle commune de 0 à 100, où la valeur 100 représente la pire situation relative (priorité la plus élevée) et 0 la meilleure situation (la moins prioritaire).

COVID-19[feminineFin janvier 2020, le gouvernement chilien a déterminé que tous les cas suspects de COVID-19 doivent être notifiés de manière obligatoire et immédiate à l'unité d'épidémiologie sanitaire respective et au ministère de la Santé, via le formulaire spécifique sur la plateforme EPIVIGILA. En plus des cas suspects identifiés dans les établissements de santé, le gouvernement a également mis en place un programme de dépistage actif de surveillance pour identifier les cas asymptomatiques et pré-symptomatiques. Les critères pour le dépistage actif sont: i) les personnes qui n'ont pas encore été identifiées comme étant confirmées ou suspectées de COVID-19 ou (ii) vivant dans des zones vulnérables, et (iii) les personnes qui vivent dans des institutions depuis longtemps comme des prisons, maisons de retraite médicalisées, le Service national des mineurs, entre autres. Symptoms onset dates are reported by the patient to a physician, in the case that the person attended a health institution, or by the volunteers that are conducting surveillance in the community through a survey.

The Chilean Ministry of Science, Technology, Knowledge, and Innovation has made possible the access to aggregated data collected through the EPIVIGILA platform, which are available in the format of multiple reports. These reports also contain data on population projections for 2020, testing, positivity, and other metrics used in the study. One of the reports tracks the number of cases whose onset of symptoms started at a given epidemiological week, for each municipality. Given that they are published twice a week (typically Monday and Friday), we were able to analyze the history of such reports to estimate the delays. Timeliness is thus defined as the probability of getting a retrospective delay smaller than 7 days, based on the Monday’s reports. More details can be found in the supplementary materials.

MortalityThe Vital Statistics System in Chile is continuous, mandatory, and centralized. It is composed of the Civil Registry and Identification Service (CRIS), the National Institute of Statistics, and the Ministry of Health through the Department of Health Statistics and Information (DHSI). When a person dies, a medical death certificate is generated by the CRIS and distributed to health institutions. The mortality database is built with the death certificates, which are subjected to a rigorous validation process, to guarantee the reliability and validity of the information. The DHSI standardizes the clinical terms in the format of the International Statistical Classification of Diseases (ICD-10). Since March 2020, the DHSI has implemented the recommendations of the WHO for coding the deaths resulting from COVID-19. In this study, confirmed COVID-19 deaths correspond to deaths in which the virus has been identified with a positive PCR test and have been coded as U07.1. Similarly, attributed COVID-19 deaths correspond to deaths in which the virus was not identified but clinically diagnosed as probable or suspected COVID-19 case, and have been coded as U07.2.

Human movementFacebook’s Data for Good has provided access to their Geoinsights portal in response to COVID-19 crisis, from where it is possible to obtain aggregated data of their users (32). These data sets are anonymized and contain information of Facebook users that have a smartphone with the location services enabled. The movement vector from tile i to j (with i ≠ j) at time t is defined as the transition from the modal location i at the preceding 8-hour bin to the modal location j in the current 8-hour bin. Facebook also provides a baseline value, defined as the average number of users who transit from tile i to j at a given day of week and time of day during a baseline period. The baseline period corresponds to the 45 days prior to the initiation of the movement data for that particular location (for Chile, the data collection was initialized on 03/25/2020). Using this data set, we calculated the percentage change compared to baseline for each i to j transition at a given 8-hour period, and then estimated the average percentage change for each municipality and epidemiological week. We only used the starting location (municipality) for the average percentage change estimation. The size of the side of the tile is approx. 2.4 km.

T,I∼Poisson∑sTt−sIs(1)where Ts=PT=s is the probability that the onset-to-death equals s days. Estimates of I maximizing Eq. 1 can be obtained with an expectation maximization algorithm (6, 33–35), but the outcome is typically unstable (36). RmMAP overcomes this issue by adding a quadratic penalty to the log-likelihood. The iterations of RmMAP write as

I^new=14λ1+8λIold−1(2)Isnew=I^snew1∑tTt−s∑tDtTt−s∑s′Tt−s′I^s′new(3)By scaling the final series Inew by the inverse IFR we obtain the inferred values of infected individuals over time. A detailed discussion of this method along with sensitivity analysis and comparison with existing methodology are presented in the in the supplementary materials.

Estimation of excess deathsWe used Gaussian Processes (GP) regression (17) to estimates excess deaths for 2020. GPs can be understood as an infinite dimensional Bayesian regression : in the finite dimensional case one fits yi=∑iwixi+ϵi where ϵi are Gaussian independent identically distributed errors, xi are covariates and wi coefficients sampled from a prior pw. Likewise, with GPs we fit yi=fxi+ϵi where f is a function sampled from a prior over functions pf. GPs are appealing because the level of complexity is automatically adjusted by the complexity of data, and because they are computationally tractable.

Priors over f are specified through a kernel K, which encodes the correlational structure of data so that Kx,x′ is simply the prior covariance between fx and fx′. K depends on a finite number of unknowns θ (so K=Kθ) that have to be inferred as well.

We used a GP to account for both long-term trends in mortality as well as seasonality. As in (17), we consider kernels of the formKθ=Kθ1+Kθ2(4)where Kθ1 is an exponential kernel representing the long-term variation, and is given byKθ1x,x′=θ12exp−(x−x′)22θ22(5)and Kθ2 is a periodic times exponential kernel representing seasonal variation

Kθ2x,x′=θ32exp−(x−x′)22θ42−2sin2πx−x′θ52(6)We considered an additional source of unstructured randomness through the term ϵi∼N0,σ2. We performed Bayesian inference (MCMC) over the joint distribution parameters θ,σ2 and death counts for each time period of the 2020 year, based on 2000-2019 all-cause mortality data and suitable priors for the parameters. In the supplementary materials we comment on more specific aspects, and provide an extensive evaluation of our model.

Infection fatality ratesWe deployed a hierarchical Bayesian joint model for reporting rates (and hence, IFR) per age group (a taking values 0 – 40, 40 – 60, 60 – 80 and 80 +) and municipality m, collapsing over the temporal dimension. We infer the number of infected individuals (and hence, IFR) based on reported cases C, positivity rates over time (t, month), and municipality, and total and COVID-19 attributed deaths D. The main appeal of this framework, is that although most of the components are not identifiable (e.g. if reporting rates and true cases are both unknown, the same observed case counts can be achieved by multiplying both by the same factor) (37), we can borrow from better known quantities (e.g. rough estimates of prevalence, reporting, etc) to enhance identification while propagating the appropriate levels of uncertainty over the parameters.

Specifically, the reporting rate rm,t links to the observed positivity rates posm,t (in log-scale) through a logistic-linear relation (with parameters β), and we have include random effects ϵm,t to represent unobserved causes of reporting

logitrm,t=β0+β1×posm,t+ϵm,t(7)Total infections by municipality and age Im,a are a fraction pm of the total population Pm,a, i.e.

Im,a∼BinomialPm,a,pm(8)An implicit assumption in Eq. 8 is the existence of an underlying municipality-specific proportion infected pm so that on each age group, the number of infected people is (on average) pm×Pm,a. We also assumed the following relation for pmlogitpm=p0+μm(9)where p0 represents a baseline of the proportion infected and μm is a municipality-specific random effect.

We use parameters γm,t∈0,1 to represent the temporal spread of infections; ∑tγm,t=1 so that Im,a,t=γm,tIm,a. Infections, cases, attributed deaths and age-stratified population sizes are linked through a cascade of binomial models. We relate infections, cases and reporting rates through

Cm,t∼BinomialIm,t,rm,t(10)Infection fatality rates IFRm,a relate to infections and deaths through another binomial modelDm,a∼BinomialIm,a,IFRm,a(11)where the IFRs follow a stratified logistic-linear relation with socioeconomic status (SES) and age mediated by parameters α, η, δ :

logitIFRm,a=α0+α1+ηa×SESm+δa(12)A comprehensive explanation of this hierarchical Bayesian methodology, including a discussion of its assumptions and several sensitivity analysis and robustness check to misspecification of our assumptions appear in the supplementary materials.

References and Notes

  1. ↵F. S. Lu, A. T. Nguyen, N. B. Link, J. T. Davis, M. Chinazzi, X. Xiong, A. Vespignani, M. Lipsitch, M. Santillana, Estimating the cumulative incidence of COVID-19 in the United States using four complementary approaches. medRxiv 2020.04.18.20070821 [Preprint]. 7 August 2020;.doi :10.1101/2020.04.18.20070821
  2. medRxiv 2020.06.06.20120857 [Preprint]. 9 June 2020;.doi :10.1101/2020.06.06.20120857

  3. ↵J. M. Feldman, M. T. Bassett, The relationship between neighborhood poverty and COVID-19 mortality within racial/ethnic groups (Cook County, Illinois). medRxiv 2020.10.04.20206318 [Preprint]. 6 October 2020;.doi :10.1101/2020.10.04.20206318
  4. ↵A. Carranza, M. Goic, E. Lara, M. Olivares, G. Y. Weintraub, J. Covarrubia, C. Escobedo, N. Jara, L. J. Basso, The social divide of social distancing : Shelter-in-place behavior in Santiago during the COVID-19 pandemic. SSRN 3691373 [Preprint]. 12 September 2020;.doi :10.2139/ssrn.3691373
  5. ↵M. Lipsitch, M. Santillana, “Enhancing situational awareness to prevent infectious disease outbreaks from becoming catastrophic” in Global Catastrophic Biological Risks, T. V. Inglesby, A. A. Adalja, Eds. (Current Topics in Microbiology and Immunology, vol. 424, Springer, 2019), pp. 59–74.
  6. 2006), vol. 2.

  7. ↵Y. Li, E. A. Undurraga, J. R. Zubizarreta, Effectiveness of localized lockdowns in the COVID-19 pandemic. medRxiv 2020.08.25.20182071 [Preprint]. 30 March 2021;.doi :10.1101/2020.08.25.20182071
  8. ↵P. Maas et al. in Proceedings of the 16th International Conference on Information Systems for Crisis Response and Management, València, Spain, May 19-22, 2019 (ISCRAM Association, 2019), vol. 19, p. 3173.
  9. ↵P. P. B. Eggermont, V. N. LaRiccia, V. LaRiccia, Maximum Penalized Likelihood Estimation (Springer, 2001), vol. 1.
  10. ↵M. H. Chitwood, M. Russi, K. Gunasekera, J. Havumaki, V. E. Pitzer, J. A. Salomon, N. Swartwood, J. L. Warren, D. M. Weinberger, T. Cohen, N. A. Menzies, Reconstructing the course of the COVID-19 epidemic over 2020 for US states and counties: results of a Bayesian evidence synthesis model. medRxiv 2020.06.17.20133983 [Preprint]. 6 April 2021;.doi :10.1101/2020.06.17.20133983
  11. ↵G. Mena, P. Martinez, A. Mahmud, P. Marquet, C. Buckee, M. Santillana, Socioeconomic status determines COVID-19 incidence and related mortality in Santiago, Chile. Zenodo (2021);.doi :10.5281/zenodo.4699403
  12. R. L. White, in Instrumentation in Astronomy VIII, D. L. Crawford, E. R. Craine, Eds. (International Society for Optics and Photonics, 1994), vol. 2198, pp. 1342–1348.
  13. A. C. Miller, L. Hannah, J. Futoma, N. J. Foti, E. B. Fox, A. D’Amour, M. Sandler, R. A. Saurous, J. A. Lewnard, Statistical deconvolution for inference of infection time series. medRxiv 2020.10.16.20212753 [Preprint]. 20 October 2020;.doi :10.1101/2020.10.16.20212753
  14. M. Titsias, in Proceedings of the Twelfth International Conference on Artificial Intelligence and Statistics, D. van Dyk, M. Welling, Eds. vol. 5 of Proceedings of Machine Learning Research (PMLR, 2009), pp. 567–574.
  15. R. E. Barlow, Ed. Statistical Inference Under Order Restrictions: The Theory and Application of Isotonic Regression (Wiley Series in Probability and Mathematical Statistics, no. 8, Wiley, 1972).
  16. 2015), vol. 140.

  17. D. Fisman, S. J. Drews, A. Tuite, S. O’Brien, Age-specific SARS-CoV-2 infection fatality and case identification fraction in Ontario, Canada. medRxiv 2020.11.09.20223396 [Preprint]. 12 November 2020;.doi :10.1101/2020.11.09.20223396
  18. M. Plummer et al. in Proceedings of the 3rd International Workshop on Distributed Statistical Computing (Vienna, Austria, 2003), vol. 124, pp. 1–10.
  19. A. Wilson, R. Adams, in Proceedings of the 30th International Conference on Machine Learning (PMLR, 2013), pp. 1067–1075.

Acknowledgments: We would like to thank Marc Lipsitch, Oliver Stoner, Nick Link, Patricio Vargas, Jorge Perez, and Alonso Silva for insightful comments. We thank the Chilean Society of Intensive Medicine (SOCHIMI) and the School of Medicine of the Finis Terrae University (Chile) for making it possible to obtain the data on deaths recorded in health facilities. Funding : G.E.M was partially supported by a Harvard Data Science Initiative fellowship, P.P.M. by U54GM088558, C.O.B. by Schmidt futures award, and M.S by R01GM130668. The content is solely the responsibility of the authors and does not necessarily represent the official views of the National Institutes of Health. Author contributions: G.E.M. and P.P.M. designed the study, conducted the analyses, and wrote the manuscript. A.S.M. and P.A.M assisted with the analyses and conceptualization. C.O.B. and M.S. designed and oversaw the study. All authors edited the manuscript. Competing interests: The authors declare no competing interests. Data and materials availability : Socioeconomic status data are available at www.gob.cl/documentos/metropolitana. COVID-19 data are available at https://github.com/MinCiencia/Datos-COVID19 in the format of multiple reports. Mortality data are available at https://deis.minsal.cl. Mobility data are available upon request at https://dataforgood.fb.com. All code and data to reproduce the figures in the main text are available at Zenodo (43). This work is licensed under a Creative Commons Attribution 4.0 International (CC BY 4.0) license, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited. To view a copy of this license, visit https://creativecommons.org/licenses/by/4.0/. This license does not apply to figures/photos/artwork or other content included in the article that is credited to a third party; obtain authorization from the rights holder before using such material.