La nouvelle pneumonie coronarienne (COVID-19) est un syndrome de détresse respiratoire causé par un nouveau type de coronavirus. La maladie a commencé à éclater à Wuhan, en Chine, à la fin de 2019, et est officiellement entrée dans la phase de pandémie mondiale en avril 2020. Jusqu'à présent, elle est toujours en phase de pandémie dans un certain nombre de pays.1-3 Jusqu'à présent, le nombre cumulé de décès dus au COVID-19 dans le monde a atteint 1 870 000. Le COVID-19 est la cause directe des troubles politiques et économiques mondiaux actuels.
D'un point de vue épidémiologique, une caractéristique importante du COVID-19 est qu'une proportion considérable de la population peut se transformer longtemps en un état de maladie asymptomatique ou bénigne après avoir été infectée par le virus, tandis qu'une petite proportion entre rapidement dans un état modéré ou sévère. stade.4 Ce phénomène de différences de population suggère fortement que la sensibilité du COVID ‐ 19 est influencée par des facteurs génétiques. Comprendre la base génétique de la sensibilité au COVID-19 est d'une grande importance pour la prévention de la maladie, le typage moléculaire, le pronostic et le traitement.
Cependant, jusqu'à présent, il n'y a eu que deux études d'association pangénomique (GWAS) sur COVID-19.5, 6 L'une d'elles de Kachuri et al a comparé les génotypes de 676 individus avec des tests SARS-CoV-2 positifs et 1334 avec des tests négatifs au niveau du génome, et a trouvé la variation génétique sur le EHF gène montrant une association significative avec les résultats des tests. Un autre GWAS d'Ellinghaus et al a considéré 1610 patients sévères comme cas et 2205 patients bénins ou personnes en bonne santé comme témoins, et a constaté que des variantes génétiques dans LZTFL1 et ABO les gènes étaient significativement associés à la gravité du COVID-19. Les conceptions des deux études étaient en fait très différentes en ce que la première de Kachuri et al se concentrait sur la sensibilité au COVID-19 et la seconde d'Ellinghaus et al se concentrait sur le pronostic du COVID-19. Bien que ces deux études n'aient pas été très strictes dans la sélection des échantillons de contrôle, les résultats positifs ont fourni une référence importante pour notre compréhension de la sensibilité au COVID-19 et du pronostic. Quant au mécanisme par lequel ces locus positifs affectent la sensibilité et le pronostic du COVID-19, il n'est pas encore clair. Nous avons ensuite analysé bioinformatiquement les gènes de risque potentiels associés à la sensibilité et au pronostic du COVID-19.
Nous avons trouvé les gènes régulés par ces variants par l'intermédiaire de cis ‐ eQTL et cis ‐ meQTL agissant. Nous avons en outre effectué une analyse de réseau d'interaction protéique, une analyse de localisation intracellulaire et une analyse de corrélation d'expression génique pour ces gènes potentiellement fonctionnellement liés. Les résultats ont montré que les variantes génétiques sur EHF réguler l'expression de son voisin CHAT gène via le cis ‐ eQTL agissant. Il y avait des preuves significatives que la CAT et la protéine de liaison à la protéine S liée au SRAS-CoV-2 interagissent les unes avec les autres. Les résultats de localisation intracellulaire ont montré que CHAT protéines et ACE2 les deux existent dans la membrane cellulaire et dans la zone extracellulaire. De plus, l'expression de ces trois gènes a montré une corrélation positive significative dans les poumons. Sur la base de ces résultats, nous proposons une hypothèse selon laquelle CHAT joue un rôle intermédiaire crucial dans l'efficacité de liaison de l'ACE2, affectant ainsi la sensibilité au COVID-19.
2 PREUVES SUPPORTIVES
org/qtlbase/). Ce résultat insignifiant pourrait s'expliquer en partie par une taille d'échantillon insuffisante (N = 166). Jusqu'à présent, aucune corrélation significative entre rs286914 et CHAT a été observée dans d'autres tissus, y compris les poumons. À l'avenir, la taille de l'échantillon doit être élargie pour vérifier davantage leur corrélation dans d'autres tissus, en particulier dans les poumons. Cette découverte a suggéré un rôle fonctionnel de rs286914 sur l'expression de CHAT alors qu'il n'affecte pas nécessairement directement l'expression de EHF car rs286914 n'est pas un cis-eQTL significatif de EHF et le cis ‐ meQTL est très courant dans le génome.9, 10
A, Répartition globale de la fréquence du génotype du rs286914 dans EHF; (B) Distribution globale de la fréquence du génotype du rs657152 dans ABO; (C) : Distribution globale de la fréquence du génotype de rs11385942 dans LZTFL1; (D) Réseaux d'interaction génique créés dans GeneMania pour EHF et CHAT. Les gènes de la requête ont été analysés (cercles rayés) et ont en outre généré automatiquement leurs gènes en interaction (cercles non rayés). La couleur des lignes reliant les gènes désigne les types d'interaction (matériaux supplémentaires). La taille du cercle indique l'importance du gène dans les interactions spécifiques tandis que la largeur des lignes indique le poids de l'interaction entre les gènes (tableau S2). E, corrélation de CHAT, ACE2, et EHF expression génique parmi les 6 meilleurs tissus de la base de données GTEx (tableau S6)
TABLEAU 1.
Cis ‐ eQTL des SNP associés à la sensibilité au COVID ‐ 19 et au pronostic dans le sang périphérique
SNP
EA
CHR
Gène
eQTL
Gène
Distance (kbp)
Bêta
Valeur P
FDR
rs286914
UNE
11p13
EHF
CHAT
140
−4,78
1.74E-06
0
rs11385942
Géorgie
3p21.31
LZTFL1
rs657152
UNE
9q34.2
ABO
GBGT1
100
−5,00
5.72E-07
0
TABLEAU 2.
Cis ‐ meQTL des SNP associés à la sensibilité au COVID ‐ 19 et au pronostic dans le sang périphérique
SNP
EA
CHR
Gène
cis ‐ meQTL
CpG
Gène
Distance (kbp)
Bêta
se
Valeur P
rs286914
UNE
11p13
EHF
cg18414381
EHF
0,013
0,001
4,88E ‐ 113
rs11385942
Géorgie
3p21.31
LZTFL1
rs657152
UNE
9q34.2
ABO
cg11879188
ABO
−0,059
0,001
0
cg13506600
ABO
−0,035
0,001
0
cg21160290
ABO
−0,150
0,002
0
cg22535403
ABO
−0,117
0,001
0
cg24267699
ABO
−0,037
0,001
0
cg07241568
ABO
−0,010
0,000
3.13E ‐ 176
cg12020464
ABO
0,031
0,001
1.46E ‐ 133
cg06818865
ABO
−0,019
0,001
8.20E ‐ 119
cg13531387
0,019
0,001
2.11E ‐ 111
cg14271713
0,008
0,000
4.66E ‐ 101
cg00878953
0,007
0,000
2.26E ‐ 79
cg13952840
−0,009
0,001
2.14E ‐ 40
cg13963044
C9orf7
190
−0,034
0,003
2.03E ‐ 39
cg14440550
ABO
0,019
0,001
4.15E ‐ 38
cg13660174
SURF4
90
−0,010
0,001
1.16E ‐ 36
cg03474926
RALGDS
100
−0,004
0,000
6.19E-30
cg18089000
GBGT1
80
−0,007
0,001
1.45E-27
cg14653977
GBGT1
80
−0,009
0,001
1.64E-27
cg01169778
GBGT1
80
−0,005
0,001
2.69E-18
cg13980863
0,003
0,000
1,54E ‐ 17
cg13850847
ABO
−0,006
0,001
1,84E ‐ 15
cg00339415
OBP2B
40
0,007
0,001
5.95E-15
cg13040392
0,011
0,002
1,36E-11
Nous avons examiné la littérature à la recherche de preuves soutenant les liens fonctionnels entre ces deux gènes (CHAT et EHF) et les maladies respiratoires. CHAT est régulée à la baisse dans le cancer du poumon11 et l'asthme12 et favorise l'apoptose des cellules cancéreuses du poumon non à petites cellules en accélérant la dégradation de la cavéoline-1.13 En même temps, CHAT avait un effet protecteur sur la fibrose pulmonaire 14 et protégeait les cellules épithéliales pulmonaires de l'apoptose induite par le peroxyde d'hydrogène, 15 soutenant que CHAT joue un rôle important dans le développement des maladies du système respiratoire. CHAT a également un effet anti-inflammatoire significatif qui régule la production de cytokines dans les globules blancs, protégeant ainsi les cellules alvéolaires des dommages oxydatifs et inhibant la réplication du SRAS-CoV-2,16 soulignant son utilité potentielle dans le traitement du COVID-19 ou autres maladies graves liées à l'inflammation du système respiratoire. L'observation que le EHF la variante rs286914 est un eQTL de CHAT, ainsi que le manque de support de la littérature pour un rôle fonctionnel de EHF dans les maladies pulmonaires, y compris le COVID-19, confirme notre hypothèse selon laquelle rs286914 sur le EHF peut affecter le COVID-19 via des effets régulateurs sur l'expression de CHAT.
L'étude GWAS d'Ellinghaus et al a révélé que les individus porteurs du ABO rs657152 Un allèle a montré des symptômes respiratoires plus graves après l'infection (OR = 1,39, tableau S1).5 Il n'y a pas de différence évidente dans la fréquence de rs657152 entre les continents (figure 1B). De plus, nous avons constaté que ABO rs657152 est un cis ‐ eQTL important régulant l'expression de GBGT1 dans le sang périphérique, situé à environ 80 kb en amont de ABO (P = 5,72e-7, tableau 1). Pendant ce temps, rs657152, en tant que cis ‐ meQTL dans le sang périphérique, est significativement associé au niveau de méthylation de 23 sites de méthylation à proximité (tableau 2). Cette région couvre plusieurs gènes (ABO, C9orf7, SURF4, RALGDS, GBGT1 et OBP2B). Jusqu'à présent, il n'y a aucune preuve de la littérature soutenant que ces gènes jouent un rôle important dans les maladies du système respiratoire. En outre, rs657152 n'a pas été observé comme eQTL ou meQTL dans les poumons.
Ellinghaus et al ont également découvert que rs11385942, situé dans la région intron du LZTFL1, était significativement associée au pronostic du COVID-195 (OR = 2,11, tableau S1). L'allèle de risque du projet 1000 génomes a montré une grande différence de fréquence entre les principaux continents avec des modèles montrant des fréquences plus élevées en Asie du Sud (SAS 29,55%), mais des fréquences plus faibles en Europe (8,05 EUR), en Afrique (AFR 5,30%), en Amérique ( AME 4,61%) et Asie de l'Est (EAS 0,5%, figure 1C). Le rs11385942 n'était pas un eQTL ou un meQTL significatif dans le sang périphérique et le poumon. Compte tenu de la littérature et des bases de données existantes, nous n'avons pas trié une chaîne claire de preuves expliquant les associations génétiques observées (rs657152 et rs11385942) avec le pronostic du COVD-19.
Ensuite, nous avons utilisé GeneMANIA17 pour étudier les interactions protéine-protéine entre EHF et CHAT. Cette analyse a identifié un réseau fonctionnel composé de 22 gènes. Fait intéressant, le ACE2 gène, codant pour le récepteur de la protéine SARS-CoV-2 S, 18 a été identifié dans ce réseau ayant une interaction au niveau de la protéine avec CHAT (Figure 1D, tableau S2). A noter, parmi les 163599 gènes de 9 organismes, ACE2 avait des interactions directes protéine-protéine avec seulement 6 gènes, dont CHAT (Figure S1, tableau S3). L'analyse de localisation intracellulaire19, 20 a montré que CHAT et ACE2 les protéines existent à la fois dans la membrane cellulaire et dans la zone extracellulaire, ce qui montre clairement que l'interaction pourrait avoir un impact sur la capacité d'invasion cellulaire de la protéine S (tableau S5). Aucune interaction directe au niveau des protéines n'a été trouvée entre EHF et ACE2. Ce résultat confirme davantage notre hypothèse selon laquelle rs286914 (EHF) comme eQTL de CHAT peut affecter l'efficacité de liaison de ACE2 et la protéine SRAS-CoV-2 S par CHAT, affectant ainsi la sensibilité du COVID-19.
Il n'y a pas d'interaction protéine-protéine entre les ABO et d'autres gènes où se trouvent les variants associés au pronostic COVID-19 et le site de méthylation (GBGT1, C9orf7, SURF4, RALGDS, OBP2B). Comme illustré dans le diagramme de réseau, plusieurs gènes avaient le même domaine protéique, réalisant peut-être les mêmes fonctions (Figure S2, Tableau S4). On ne sait toujours pas pourquoi les individus du groupe sanguin A avaient un pronostic COVID-19 plus sévère que ceux du groupe sanguin O.21
Nous avons effectué une analyse de corrélation pour l'expression de EHF, CHAT et ACE2 basé sur les données d'expression génique de 49 tissus de la base de données GTEx (https://commonfund.nih.gov/GTEx/)22. Ces 3 gènes ont été exprimés simultanément dans 40 tissus différents dont le poumon (tableau S6). Dans 30 tissus différents dont le poumon, les niveaux d'expression de ces 3 gènes ont montré des corrélations significatives pour au moins une paire après correction de Bonferroni (P