La découverte de l'histoire d'origine du SRAS-CoV-2, le coronavirus responsable de près de 3,9 millions de décès dans le monde, a été largement entravée par le manque d'accès aux informations en provenance de Chine où les cas sont apparus pour la première fois.

Maintenant, un chercheur de Seattle a déterré des fichiers supprimés de Google Cloud qui révèlent 13 séquences génétiques partielles pour certains des premiers cas de COVID-19 à Wuhan, a rapporté Carl Zimmer pour le New York Times.

Un scientifique récupère des séquences de gènes de coronavirus secrètement supprimées l'année dernière à Wuhan

Les séquences ne font pas pencher la balance vers ou loin de l'une des nombreuses théories sur la naissance du SRAS-CoV-2 – elles ne suggèrent pas que le virus a fui d'un laboratoire de haute sécurité à Wuhan, ni ne suggèrent un naturel événement de débordement. Mais ils confirment l'idée que le nouveau coronavirus circulait avant la première épidémie majeure sur un marché de fruits de mer.

En rapport: 14 mythes sur les coronavirus brisés par la science

Afin de déterminer exactement comment et où le virus est originaire, les scientifiques doivent trouver le virus dit progéniteur, celui dont sont issues toutes les autres souches. Jusqu'à présent, les premières séquences sont principalement celles échantillonnées à partir de cas au marché des fruits de mer de Huanan à Wuhan, qui était initialement considéré comme l'endroit où le nouveau coronavirus est apparu pour la première fois fin décembre 2019. Cependant, les cas de début décembre et d'aussi loin que Novembre 2019 n'avait aucun lien avec le marché, indiquant assez tôt dans la pandémie que le virus a émergé d'un autre endroit.

Il y avait un problème persistant avec ces premières séquences génétiques. Ceux des cas trouvés sur le marché comprennent trois mutations qui manquent dans les échantillons de virus provenant de cas qui sont apparus des semaines plus tard en dehors du marché. Les virus manquant ces trois mutations correspondaient plus étroitement aux coronavirus trouvés chez les chauves-souris en fer à cheval. Les scientifiques sont relativement certains que le nouveau coronavirus a en quelque sorte émergé des chauves-souris, il est donc logique de supposer que le géniteur manquerait également ces mutations.

Et maintenant, Jesse Bloom du Howard Hughes Medical Institute de Seattle a découvert que les séquences supprimées – probablement certains des premiers échantillons – étaient également dépourvues de ces mutations. (Bloom est l'auteur principal d'une lettre publiée en mai dans la revue Science exhortant à une enquête impartiale sur les origines du coronavirus, a rapporté Live Science.)

"Ils sont trois étapes plus similaires aux coronavirus de chauve-souris qu'aux virus du marché aux poissons de Huanan", a déclaré Bloom au New York Times. Ces nouvelles données suggèrent que le virus circulait à Wuhan bien avant son apparition sur le marché des fruits de mer, a déclaré Bloom.

« Ce fait suggère que les séquences du marché, qui sont le principal objectif de l'épidémiologie génomique dans le rapport conjoint OMS-Chine … ne sont pas représentatives des virus qui circulaient à Wuhan fin décembre 2019 et début janvier 2020, " Bloom a écrit dans son article téléchargé le 22 juin dans la base de données de préimpression bioRxiv.

Selon Zimmer, il y a environ un an, 241 séquences génétiques de patients atteints de coronavirus avaient disparu d'une base de données en ligne appelée Sequence Read Archive, gérée par les National Institutes of Health (NIH).

Bloom a remarqué les séquences manquantes lorsqu'il est tombé sur une feuille de calcul dans une étude publiée en mai 2020 dans la revue PeerJ dans laquelle les auteurs répertorient 241 séquences génétiques du SRAS-CoV-2 jusqu'à fin mars 2020 ; les séquences faisaient partie d'un projet de l'Université de Wuhan appelé PRJNA612766 et auraient été téléchargées sur Sequence Read Archive. Il a recherché les séquences dans la base de données d'archives et a obtenu le message "Aucun élément trouvé", a écrit Bloom dans l'article bioRxiv, qui n'a pas été évalué par des pairs.

En rapport: 11 (parfois) maladies mortelles qui ont sauté à travers les espèces

Son enquête a révélé que les séquences supprimées avaient été collectées par l'hôpital Aisu Fu et Renmin de l'Université de Wuhan, et une préimpression de la recherche publiée à partir de ces séquences (appelée Wang et al. 2020) a suggéré qu'elles provenaient d'échantillons d'écouvillonnage nasal de patients ambulatoires avec suspecté de COVID-19 au début de l'épidémie.

Bloom n'a trouvé aucune explication sur la raison pour laquelle les séquences avaient été supprimées, et ses courriels aux deux auteurs correspondants pour se renseigner n'ont reçu aucune réponse.

"Il n'y a aucune raison scientifique plausible pour la suppression : les séquences sont parfaitement concordantes avec les échantillons décrits dans Wang et al. (2020a,b)", a écrit Bloom dans bioRxiv. "Il n'y a pas de corrections apportées à l'article, l'article indique que l'approbation des sujets humains a été obtenue et le séquençage ne montre aucune preuve de contamination plasmidique ou d'échantillon à échantillon. Il semble donc probable que les séquences ont été supprimées pour masquer leur existence."

Bloom note plusieurs limites à son étude, principalement que les séquences ne sont que partielles et n'incluent aucune information pour donner une date ou un lieu de collecte clairs – des informations cruciales pour retracer le virus jusqu'à son origine.

Quoi qu'il en soit, Bloom pense qu'un examen plus approfondi des données archivées du NIH et d'autres organisations - et reconstituer les séquences - pourrait aider à brosser un tableau plus clair de l'origine et de la propagation précoce du SRAS-CoV-2, le tout sans avoir besoin de études de terrain en Chine.

En savoir plus sur les séquences supprimées au New York Times.

Publié à l'origine sur Live Science.