Cette section présente le modèle épidémiologique et la procédure d'estimation des paramètres du modèle à partir des données rapportées. L'estimation des paramètres est réalisée en minimisant une densité log-postérieure avec une technique de descente de gradient. L'échantillonnage bootstrap est utilisé pour tester la sensibilité des paramètres ainsi que pour fournir des intervalles de confiance à 90 %40.

Le modèle épidémiologique

Le modèle de type SEIR considéré ici tient compte de la gravité de la maladie, de la tranche d'âge, du sexe et de la répartition géographique de certains groupes ou populations prédéfinis. Pour simplifier, nous reportons l'inclusion de la dépendance du sexe et de la localisation (spatiale) à la fin de la présente section. Un numéro n des tranches d'âge est supposée, chacune représentée par l'exposant (i = 1, ldots, n ) et répartie en sept catégories épidémiques: sensible ( (S ^ i )), exposée mais pas encore infectieuse ( ( E ^ i )), infectieux dans des conditions bénignes ( (I ^ i_M )), infectieux dans un état grave ou hospitalisé ( (I ^ i_H )), infectieux dans un état critique ou dans une unité de soins intensifs (USI), désigné par (I_I ^ i ), récupéré ( (R ^ i )) et décédé ( (D ^ i )). Suivant10, nous supposons que les formes suivantes sont des synonymes: en état grave et hospitalisé. Il en va de même pour les formes de dans des conditions critiques et en USI. Chaque individu dans les deux premiers compartiments infectieux, légèrement infectieux (M) et hospitalisé (H), peut guérir, mourir ou développer une maladie plus grave. Les personnes en soins intensifs ne peuvent que guérir ou mourir.

Pour décrire le modèle, nous introduisons la notation suivante : Définir le vecteur

ldots

( mathbf {I} _M ) ( mathbf {I} _I ) Définissez également le produit tensoriel :

x_2y_2

Ensuite, le modèle épidémiologique peut s'écrire :

mathbf {S} : left ( beta _M mathbf {I} _M + beta _H mathbf {I} _H + beta _I mathbf {I} _I right) text {

(1)

sigma mathbf {E} text {

(2)

left ( nu _M + mu _M + gamma _M right) : mathbf {I} _M text {

(3)

gauche ( nu _H + mu _H + gamma _H right ) : mathbf {I} _H text {

(4)

left ( nu _I + mu _I right) : mathbf {I} _I text {

(5)

} end {aligné} $$

(6)

} end {aligné} $$

(7)

Une représentation schématique du modèle dans les équations. (1) - (7) est illustré à la Fig.1.

Représentation schématique du modèle épidémiologique décrit par les équations. (1) - (7).

Les matrices ( beta _M ), ( beta _H ) et ( beta _I ) contiennent les paramètres de transmission pour les individus infectieux dans les classes bénignes, hospitalisées et USI, respectivement. Ces paramètres dépendent du temps et, s'ils sont bien calibrés, peuvent être utilisés pour évaluer l'efficacité des mesures de confinement, pour vérifier les changements dans le schéma de transmission ou pour suivre l'impact de la suspension d'un verrouillage. Il est important de mentionner que, en fonction des informations disponibles, des hypothèses simplificatrices sur la structure de telles matrices doivent être faites. Dans notre étude, ( beta _M ), ( beta _H ) et ( beta _I ) prennent la forme suivante :

(8)

end {aligné} $$

(9)

( beta

(dix)

( tilde {I} _H ) et ( tilde {D} ) sont les séries chronologiques des rapports quotidiens sur les nouvelles infections, hospitalisations et décès, respectivement. De plus, ( tau _M ) est le temps moyen de début d'hospitalisation et ( tau _D ) est le temps moyen entre l'hospitalisation et le décès. Nous posons ( tau _M = 1 ), en se rapprochant de la valeur médiane trouvée dans28, et le paramètre ( tau _D ) est mis à ( tau _D = 1 ), obtenu empiriquement dans les tests numériques. Notez que nous ne considérons pas les courbes des rapports quotidiens des admissions aux soins intensifs car ces données ne sont pas disponibles dans l'ensemble de données de New York.

Y compris le sexe dans le modèleLe COVID-19 affecte différemment les hommes et les femmes. Selon la tranche d'âge, le taux de létalité est beaucoup plus élevé chez les hommes15,16. Pour prendre en compte la variance sexuelle dans le modèle, les paramètres de transmission ( ( beta _M ), ( beta _H ) et ( beta _I )) sont généralisés. La matrice de transmission pour la classe légère prend la forme suivante :

end {aligné} $$

(11)

où ( beta _M ^ F ) et ( beta _M ^ M ) sont les matrices de transmission pour les tranches d'âge définies ci-dessus pour les individus de sexe féminin et masculin, respectivement. Les matrices de transmission ( beta _H ) et ( beta _I ) ont la forme ( beta _H = a beta _M ) et ( beta _I = b beta _M ).

Notons que la transmission entre les sexes est prise en compte par la valeur moyenne de la transmission à l'intérieur des sexes. Intuitivement, cela signifie qu'une personne de sexe féminin qui maintient une distance sociale avec d'autres femmes continuera également de telles mesures de confinement avec des individus de sexe masculin. Cette hypothèse s'applique également aux hommes.

Y compris les informations géographiquesLa surveillance et la prévision de la propagation de la maladie et l'efficacité des mesures d'endiguement dans les grandes régions, telles que les zones métropolitaines, les États et les pays, sont des tâches difficiles. Une répartition hétérogène de la population et des différences dans la mise en œuvre des restrictions sociales peuvent conduire à des dynamiques de maladie assez différentes selon les lieux. De plus, les personnes se déplaçant entre les régions peuvent provoquer de nouvelles vagues d'infection. Ainsi, pour tenir compte de ces aspects, un modèle épidémiologique doit inclure la répartition géographique de la population. Un certain nombre d'approches ont été proposées, et une revue à ce sujet peut être trouvée dans20. En particulier, des modèles de type SEIR ont été utilisés à plusieurs reprises pour décrire la dynamique des maladies infectieuses humaines, y compris des informations géographiques. Par exemple, 23,25 décrivent la dynamique du COVID-19 dans les comtés des États-Unis et en Italie, respectivement.

Inclure la répartition géographique de la population dans le modèle décrit par les équations. (1) - (7), nous agrandissons les matrices de transmission. En indexant chaque site considéré par (l = 1, ldots, m ), soit ( beta _M ^ l ), ( beta _H ^ l ), et ( beta _I ^ l ) être les matrices de transmission correspondantes. Ensuite, la matrice de transmission pour les individus légèrement infectieux dans le modèle devient:

end {aligné} $$

matrice avec toutes les entrées égales à un et (c_l = min _ {i j} ) pour le l-ème emplacement. Les matrices de transmission pour les autres classes infectieuses sont similaires.

Ce choix de la matrice qui représente le mélange de populations infectieuses de différents endroits permet de simplifier le modèle, réduisant considérablement le nombre d'inconnues, facilitant le calibrage. De plus, la structure du modèle est basée sur les données en ce sens qu'elle dépend des informations actuelles et reflète donc plus précisément le comportement de la population sous différentes mesures de confinement.

Lorsqu'il s'agit de zones étendues, telles que des États et des pays, il est important de prendre en compte la distance entre les emplacements dans le modèle en utilisant des fonctions exponentielles, gaussiennes ou de loi de puissance20. En raison de l'interdépendance de New York et de ses arrondissements, nous préférons estimer les composantes de la matrice de transmission à partir des données rapportées.

Procédure d'estimation

Pour simplifier, nous commençons par présenter la procédure d'estimation du modèle sans sexe ni dépendance géographique. De plus, les données sur les nouvelles infections, les nouvelles hospitalisations et les nouveaux décès publiées par les autorités de New York n'incluent pas le sexe ou les tranches d'âge. Ainsi, nous utilisons cette version plus simple du modèle, où ( beta ^ M = beta

(12)

theta _0) ).

Nous estimons la proportion initiale d'individus infectieux légers dans chaque tranche d'âge comme suit:

ldots 0}[p_1

0} ) est un scalaire et (p_i ) est la fraction de population d'individus infectieux dans le je-th tranche d'âge. Cette dernière est estimée à partir des données du recensement. Ainsi, le vecteur des paramètres à estimer prend la forme suivante :

0},beta

(13)

(9). Le coefficient de transmission dépendant du temps ( beta

  • 1.

    Supposons que ( beta

  • 2.

    Estimer ( beta

    (14)

  • (l = 1, ldots, m ), désigne l'ensemble des rapports pour le l-ème emplacement. Pour chaque l, soit ( theta ^ l ) et ( beta ^ l

    (15)

    Le coût de calcul de l'estimation de ce modèle varie avec le nombre m des sites considérés. Sur la base des ressources de calcul disponibles, pour les grands m, il peut être utile de simplifier le modèle en réduisant le nombre de tranches d’âge ou en fusionnant les emplacements dans des zones plus vastes, réduisant ainsi la dimension du modèle.

    Nous avons implémenté la solution du modèle et les procédures d’estimation dans MATLAB (The MathWorks, Inc. Natick, USA). Le code est disponible sur demande. L’optimisation de la densité postérieure a été réalisée par l’algorithme généraliste basé sur le gradient LSQNONLIN de la boîte à outils d’optimisation de MATLAB.