La nouvelle pneumonie coronarienne (COVID-19) est un syndrome de détresse respiratoire causé par un nouveau type de coronavirus. La maladie a commencé à éclater à Wuhan, en Chine, à la fin de 2019, et est officiellement entrée dans la phase de pandémie mondiale en avril 2020. Jusqu'à présent, elle est toujours en phase de pandémie dans un certain nombre de pays.1-3 Jusqu'à présent, le nombre cumulé de décès dus au COVID-19 dans le monde a atteint 1 870 000. Le COVID-19 est la cause directe des troubles politiques et économiques mondiaux actuels.

D'un point de vue épidémiologique, une caractéristique importante du COVID-19 est qu'une proportion considérable de la population peut se transformer longtemps en un état de maladie asymptomatique ou bénigne après avoir été infectée par le virus, tandis qu'une petite proportion entre rapidement dans un état modéré ou sévère. stade.4 Ce phénomène de différences de population suggère fortement que la sensibilité du COVID ‐ 19 est influencée par des facteurs génétiques. Comprendre la base génétique de la sensibilité au COVID-19 est d'une grande importance pour la prévention de la maladie, le typage moléculaire, le pronostic et le traitement.

Preuve de l'implication fonctionnelle du gène CAT dans la sensibilité du COVID-19 : Qian : 2021 : The FASEB Journal

Cependant, jusqu'à présent, il n'y a eu que deux études d'association pangénomique (GWAS) sur COVID-19.5, 6 L'une d'elles de Kachuri et al a comparé les génotypes de 676 individus avec des tests SARS-CoV-2 positifs et 1334 avec des tests négatifs au niveau du génome, et a trouvé la variation génétique sur le EHF gène montrant une association significative avec les résultats des tests. Un autre GWAS d'Ellinghaus et al a considéré 1610 patients sévères comme cas et 2205 patients bénins ou personnes en bonne santé comme témoins, et a constaté que des variantes génétiques dans LZTFL1 et ABO les gènes étaient significativement associés à la gravité du COVID-19. Les conceptions des deux études étaient en fait très différentes en ce que la première de Kachuri et al se concentrait sur la sensibilité au COVID-19 et la seconde d'Ellinghaus et al se concentrait sur le pronostic du COVID-19. Bien que ces deux études n'aient pas été très strictes dans la sélection des échantillons de contrôle, les résultats positifs ont fourni une référence importante pour notre compréhension de la sensibilité au COVID-19 et du pronostic. Quant au mécanisme par lequel ces locus positifs affectent la sensibilité et le pronostic du COVID-19, il n'est pas encore clair. Nous avons ensuite analysé bioinformatiquement les gènes de risque potentiels associés à la sensibilité et au pronostic du COVID-19.

Nous avons trouvé les gènes régulés par ces variants par l'intermédiaire de cis ‐ eQTL et cis ‐ meQTL agissant. Nous avons en outre effectué une analyse de réseau d'interaction protéique, une analyse de localisation intracellulaire et une analyse de corrélation d'expression génique pour ces gènes potentiellement fonctionnellement liés. Les résultats ont montré que les variantes génétiques sur EHF réguler l'expression de son voisin CHAT gène via le cis ‐ eQTL agissant. Il y avait des preuves significatives que la CAT et la protéine de liaison à la protéine S liée au SRAS-CoV-2 interagissent les unes avec les autres. Les résultats de localisation intracellulaire ont montré que CHAT protéines et ACE2 les deux existent dans la membrane cellulaire et dans la zone extracellulaire. De plus, l'expression de ces trois gènes a montré une corrélation positive significative dans les poumons. Sur la base de ces résultats, nous proposons une hypothèse selon laquelle CHAT joue un rôle intermédiaire crucial dans l'efficacité de liaison de l'ACE2, affectant ainsi la sensibilité au COVID-19.

2 PREUVES SUPPORTIVES

Nous avons commencé par les annotations fonctionnelles des résultats positifs des deux GWAS. Ceux-ci comprenaient le EHF rs286914 significativement associé à la sensibilité du COVID ‐ 19 6 et du LZTFL1 rs11385942 et ABO rs657152 significativement associé au pronostic du COVID-19.5 Bien que l'un des GWAS6 soit une pré-impression, il a également jeté les bases d'une recherche de suivi. Le rs286914 est une variante intronique de EHF sur le chromosome 11 et l'allèle A de ce SNP était associé à un risque accru de test viral respiratoire positif (OR = 1,52, tableau S1). L'allèle A du projet 1000 génomes a montré une grande différence de fréquence entre les principaux continents avec des modèles montrant des fréquences plus élevées en Afrique (AFR 38,20%), en Amérique (AME 33,72%) et en Europe (30,82 EUR), mais des fréquences plus faibles en Asie de l'Est (EAS 12,20%) et Asie du Sud (SAS 15,24%, figure 1A). Les Kachuri GWAS ont été menés chez les participants à la biobanque britannique. En conséquence, les variantes génomiques à haute fréquence dans ces populations sont plus susceptibles d'être détectées. Dans ce cas, la variante était plus rare chez les Asiatiques. Cependant, ce n'est que le reflet de la malédiction du gagnant. Nous avons étudié plus en détail les bases de données eQTL7 et meQTL existantes, 8 et avons constaté que rs286914 (EHF) est un cis ‐ eQTL du CHAT gène à environ 140 kbp en amont et un cis-meQTL de cg18414381 sur le EHF gène dans le sang périphérique (tableaux 1 et 2, NeQTL = 5311, NmeQTL = 4170). Rs286914 peut également être l'eQTL de CHAT dans le tissu rénal (P =.08,//mulinlab.org/qtlbase/). Ce résultat insignifiant pourrait s'expliquer en partie par une taille d'échantillon insuffisante (N = 166). Jusqu'à présent, aucune corrélation significative entre rs286914 et CHAT a été observée dans d'autres tissus, y compris les poumons. À l'avenir, la taille de l'échantillon doit être élargie pour vérifier davantage leur corrélation dans d'autres tissus, en particulier dans les poumons. Cette découverte a suggéré un rôle fonctionnel de rs286914 sur l'expression de CHAT alors qu'il n'affecte pas nécessairement directement l'expression de EHF car rs286914 n'est pas un cis-eQTL significatif de EHF et le cis ‐ meQTL est très courant dans le génome.9, 10

A, Répartition globale de la fréquence du génotype du rs286914 dans EHF; (B) Distribution globale de la fréquence du génotype du rs657152 dans ABO; (C) : Distribution globale de la fréquence du génotype de rs11385942 dans LZTFL1; (D) Réseaux d'interaction génique créés dans GeneMania pour EHF et CHAT. Les gènes de la requête ont été analysés (cercles rayés) et ont en outre généré automatiquement leurs gènes en interaction (cercles non rayés). La couleur des lignes reliant les gènes désigne les types d'interaction (matériaux supplémentaires). La taille du cercle indique l'importance du gène dans les interactions spécifiques tandis que la largeur des lignes indique le poids de l'interaction entre les gènes (tableau S2). E, corrélation de CHAT, ACE2, et EHF expression génique parmi les 6 meilleurs tissus de la base de données GTEx (tableau S6)

TABLEAU 1.

Cis ‐ eQTL des SNP associés à la sensibilité au COVID ‐ 19 et au pronostic dans le sang périphérique

SNP

EA

CHR

Gène

eQTL

Gène

Distance (kbp)

Bêta

Valeur P

FDR

rs286914

UNE

11p13

EHF

CHAT

140

−4,78

1.74E-06

rs11385942

Géorgie

3p21.31

LZTFL1

rs657152

UNE

9q34.2

ABO

GBGT1

100

−5,00

5.72E-07

TABLEAU 2.

Cis ‐ meQTL des SNP associés à la sensibilité au COVID ‐ 19 et au pronostic dans le sang périphérique

SNP

EA

CHR

Gène

cis ‐ meQTL

CpG

Gène

Distance (kbp)

Bêta

se

Valeur P

rs286914

UNE

11p13

EHF

cg18414381

EHF

0,013

0,001

4,88E ‐ 113

rs11385942

Géorgie

3p21.31

LZTFL1

rs657152

UNE

9q34.2

ABO

cg11879188

ABO

−0,059

0,001

cg13506600

ABO

−0,035

0,001

cg21160290

ABO

−0,150

0,002

cg22535403

ABO

−0,117

0,001

cg24267699

ABO

−0,037

0,001

cg07241568

ABO

−0,010

0,000

3.13E ‐ 176

cg12020464

ABO

0,031

0,001

1.46E ‐ 133

cg06818865

ABO

−0,019

0,001

8.20E ‐ 119

cg13531387

0,019

0,001

2.11E ‐ 111

cg14271713

0,008

0,000

4.66E ‐ 101

cg00878953

0,007

0,000

2.26E ‐ 79

cg13952840

−0,009

0,001

2.14E ‐ 40

cg13963044

C9orf7

190

−0,034

0,003

2.03E ‐ 39

cg14440550

ABO

0,019

0,001

4.15E ‐ 38

cg13660174

SURF4

90

−0,010

0,001

1.16E ‐ 36

cg03474926

RALGDS

100

−0,004

0,000

6.19E-30

cg18089000

GBGT1

80

−0,007

0,001

1.45E-27

cg14653977

GBGT1

80

−0,009

0,001

1.64E-27

cg01169778

GBGT1

80

−0,005

0,001

2.69E-18

cg13980863

0,003

0,000

1,54E ‐ 17

cg13850847

ABO

−0,006

0,001

1,84E ‐ 15

cg00339415

OBP2B

40

0,007

0,001

5.95E-15

cg13040392

0,011

0,002

1,36E-11

Nous avons examiné la littérature à la recherche de preuves soutenant les liens fonctionnels entre ces deux gènes (CHAT et EHF) et les maladies respiratoires. CHAT est régulée à la baisse dans le cancer du poumon11 et l'asthme12 et favorise l'apoptose des cellules cancéreuses du poumon non à petites cellules en accélérant la dégradation de la cavéoline-1.13 En même temps, CHAT avait un effet protecteur sur la fibrose pulmonaire 14 et protégeait les cellules épithéliales pulmonaires de l'apoptose induite par le peroxyde d'hydrogène, 15 soutenant que CHAT joue un rôle important dans le développement des maladies du système respiratoire. CHAT a également un effet anti-inflammatoire significatif qui régule la production de cytokines dans les globules blancs, protégeant ainsi les cellules alvéolaires des dommages oxydatifs et inhibant la réplication du SRAS-CoV-2,16 soulignant son utilité potentielle dans le traitement du COVID-19 ou autres maladies graves liées à l'inflammation du système respiratoire. L'observation que le EHF la variante rs286914 est un eQTL de CHAT, ainsi que le manque de support de la littérature pour un rôle fonctionnel de EHF dans les maladies pulmonaires, y compris le COVID-19, confirme notre hypothèse selon laquelle rs286914 sur le EHF peut affecter le COVID-19 via des effets régulateurs sur l'expression de CHAT.

L'étude GWAS d'Ellinghaus et al a révélé que les individus porteurs du ABO rs657152 Un allèle a montré des symptômes respiratoires plus graves après l'infection (OR = 1,39, tableau S1).5 Il n'y a pas de différence évidente dans la fréquence de rs657152 entre les continents (figure 1B). De plus, nous avons constaté que ABO rs657152 est un cis ‐ eQTL important régulant l'expression de GBGT1 dans le sang périphérique, situé à environ 80 kb en amont de ABO (P = 5,72e-7, tableau 1). Pendant ce temps, rs657152, en tant que cis ‐ meQTL dans le sang périphérique, est significativement associé au niveau de méthylation de 23 sites de méthylation à proximité (tableau 2). Cette région couvre plusieurs gènes (ABO, C9orf7, SURF4, RALGDS, GBGT1 et OBP2B). Jusqu'à présent, il n'y a aucune preuve de la littérature soutenant que ces gènes jouent un rôle important dans les maladies du système respiratoire. En outre, rs657152 n'a pas été observé comme eQTL ou meQTL dans les poumons.

Ellinghaus et al ont également découvert que rs11385942, situé dans la région intron du LZTFL1, était significativement associée au pronostic du COVID-195 (OR = 2,11, tableau S1). L'allèle de risque du projet 1000 génomes a montré une grande différence de fréquence entre les principaux continents avec des modèles montrant des fréquences plus élevées en Asie du Sud (SAS 29,55%), mais des fréquences plus faibles en Europe (8,05 EUR), en Afrique (AFR 5,30%), en Amérique ( AME 4,61%) et Asie de l'Est (EAS 0,5%, figure 1C). Le rs11385942 n'était pas un eQTL ou un meQTL significatif dans le sang périphérique et le poumon. Compte tenu de la littérature et des bases de données existantes, nous n'avons pas trié une chaîne claire de preuves expliquant les associations génétiques observées (rs657152 et rs11385942) avec le pronostic du COVD-19.

Ensuite, nous avons utilisé GeneMANIA17 pour étudier les interactions protéine-protéine entre EHF et CHAT. Cette analyse a identifié un réseau fonctionnel composé de 22 gènes. Fait intéressant, le ACE2 gène, codant pour le récepteur de la protéine SARS-CoV-2 S, 18 a été identifié dans ce réseau ayant une interaction au niveau de la protéine avec CHAT (Figure 1D, tableau S2). A noter, parmi les 163599 gènes de 9 organismes, ACE2 avait des interactions directes protéine-protéine avec seulement 6 gènes, dont CHAT (Figure S1, tableau S3). L'analyse de localisation intracellulaire19, 20 a montré que CHAT et ACE2 les protéines existent à la fois dans la membrane cellulaire et dans la zone extracellulaire, ce qui montre clairement que l'interaction pourrait avoir un impact sur la capacité d'invasion cellulaire de la protéine S (tableau S5). Aucune interaction directe au niveau des protéines n'a été trouvée entre EHF et ACE2. Ce résultat confirme davantage notre hypothèse selon laquelle rs286914 (EHF) comme eQTL de CHAT peut affecter l'efficacité de liaison de ACE2 et la protéine SRAS-CoV-2 S par CHAT, affectant ainsi la sensibilité du COVID-19.

Il n'y a pas d'interaction protéine-protéine entre les ABO et d'autres gènes où se trouvent les variants associés au pronostic COVID-19 et le site de méthylation (GBGT1, C9orf7, SURF4, RALGDS, OBP2B). Comme illustré dans le diagramme de réseau, plusieurs gènes avaient le même domaine protéique, réalisant peut-être les mêmes fonctions (Figure S2, Tableau S4). On ne sait toujours pas pourquoi les individus du groupe sanguin A avaient un pronostic COVID-19 plus sévère que ceux du groupe sanguin O.21

Nous avons effectué une analyse de corrélation pour l'expression de EHF, CHAT et ACE2 basé sur les données d'expression génique de 49 tissus de la base de données GTEx (https://commonfund.nih.gov/GTEx/)22. Ces 3 gènes ont été exprimés simultanément dans 40 tissus différents dont le poumon (tableau S6). Dans 30 tissus différents dont le poumon, les niveaux d'expression de ces 3 gènes ont montré des corrélations significatives pour au moins une paire après correction de Bonferroni (P