Une équipe chinoise a-t-elle « obscurci » les premières séquences de coronavirus ?

Le reportage COVID-19 de Science est soutenu par la Fondation Heising-Simons
Bon nombre des premiers cas de COVID-19 étaient liés à un marché (centre) de fruits de mer à Wuhan, en Chine, mais une nouvelle analyse suggère qu'une souche différente de SRAS-CoV-2 a provoqué des cas précoces ailleurs.
PHOTO : IMAGES KYODO/APDans un monde en manque de données pour clarifier l'origine de COVID-19, une étude prétendant avoir déterré les premières séquences du SRAS-CoV-2 qui étaient délibérément cachées devait déclencher un débat passionné. La semaine dernière, une prépublication du biologiste évolutionniste Jesse Bloom du Fred Hutchinson Cancer Research Center a affirmé que des chercheurs chinois ont échantillonné les virus de certains des premiers patients COVID-19 à Wuhan, en Chine, ont publié les séquences virales dans une base de données des National Institutes of Health (NIH).

, puis plus tard, les informations génétiques ont été supprimées pour "obscurcir leur existence".
Le tollé suscité par la préimpression a conduit le sénateur Josh Hawley (R-MO) à exiger des réponses du NIH sur les raisons pour lesquelles l'agence a accepté de « purger » les données et d'appeler à une enquête sur la question. Même pour certains scientifiques, les travaux de Bloom ont renforcé les soupçons selon lesquels le gouvernement chinois aurait tenté de cacher le début de la pandémie.

«Il s'agit d'une approche créative et rigoureuse pour enquêter sur la provenance du SRAS-CoV-2», explique Ian Lipkin, microbiologiste à la Mailman School of Public Health de l'Université Columbia. "Il y a peut-être eu une suppression active des données épidémiologiques et de séquences nécessaires pour suivre son origine."
Mais les critiques de la préimpression bioRxiv de Bloom appellent son travail de détective beaucoup de bruit pour rien, car les scientifiques chinois ont ensuite publié les informations virales sous une forme différente, et les séquences récupérées peuvent ajouter peu à la chasse à l'origine.

"L'idée que le groupe essayait de cacher quelque chose est ridicule", explique le biologiste évolutionniste Andrew Rambaut de l'Université d'Édimbourg.
Bloom dit qu'il n'a aucun parti pris envers une hypothèse d'origine particulière pour le SRAS-CoV-2, et il convient que les 13 séquences partielles qu'il a récupérées ne résolvent pas si le virus a initialement sauté sur l'homme à partir d'un animal inconnu ou s'il a fui d'une manière ou d'une autre d'une virologie de Wuhan centre. "Je ne pense pas que cela renforce l'hypothèse de l'origine du laboratoire ou de la zoonose."

Le 31 décembre 2019, les autorités sanitaires chinoises ont lié le marché des fruits de mer de Huanan à Wuhan à une épidémie de « pneumonie inexpliquée », mais en un mois, il est devenu clair que bon nombre des premiers cas de COVID-19 n'avaient aucun lien avec le marché. Bloom, qui étudie l'évolution virale, a entrepris d'enquêter sur les premiers cas après un rapport controversé sur l'origine de la pandémie publié en mars par une commission conjointe de chercheurs chinois et étrangers supervisée par l'Organisation mondiale de la santé. Le rapport a jugé « extrêmement improbable » que le SRAS-CoV-2 s'échappe d'un laboratoire ; Bloom a aidé à organiser une lettre très discutée, cosignée par 17 autres scientifiques, critiquant cette conclusion et appelant à une enquête plus approfondie.

Bloom a voulu faire ses propres analyses des virus détectés dans les premiers cas, ce qui l'a conduit à une liste de toutes les séquences du SRAS-CoV-2 soumises avant le 31 mars 2020 à la Sequence Read Archive (SRA), une base de données du NIH. Mais lorsqu'il a vérifié le SRA pour l'un des projets répertoriés, il n'a pas pu trouver ses séquences. En googlant certaines des informations du projet, il a trouvé une étude, dirigée par Ming Wang de l'hôpital Renmin de l'Université de Wuhan, qui avait été publiée en tant que prépublication le 6 mars 2020 sur medRxiv et publiée en juin de la même année dans Small, une revue peu connue de virologues.

Cet article répertorie certains des premiers patients COVID-19 à Wuhan et les mutations spécifiques de leurs virus, mais ne donne pas les données de séquence complètes. D'autres recherches sur Internet ont conduit Bloom à découvrir que la SRA sauvegarde ses informations sur la plate-forme Cloud de Google, et une recherche y a révélé des fichiers contenant certaines des soumissions de données antérieures de l'équipe Wang.
Le Small paper ne mentionne aucune correction aux séquences virales qui pourraient expliquer pourquoi elles ont été supprimées de la SRA, ce qui a conduit Bloom à conclure que « les structures de confiance de la science ont été abusées pour obscurcir les séquences pertinentes à la propagation précoce du SRAS-CoV-2.

à Wuhan. (À la suite des critiques de la préimpression initiale, Bloom a atténué cette phrase et d'autres propos accusateurs.) Bloom reconnaît que les séquences du SRAS-CoV-2 peuvent être dérivées des données du Small paper, mais il dit que la plupart des virologues s'attendent à pouvoir pour télécharger des génomes viraux entiers à partir d'une base de données comme la SRA.

Plusieurs auteurs du Small paper n'ont pas répondu aux demandes de commentaires, mais le NIH a noté la semaine dernière dans un communiqué qu'il avait supprimé les séquences SRA à la demande de l'enquêteur soumettant, qui, selon l'agence, détient les droits sur les données. Bloom a ajouté l'échange d'e-mails du NIH à sa prépublication révisée. « J'ai soumis une version mise à jour de ces données SRA à un autre site Web », lit-on dans un e-mail du 15 juin envoyé au NIH par un chercheur de l'Université de Wuhan dont le nom a été expurgé.

Pourtant, Bloom dit qu'il ne peut trouver les séquences dans aucune autre base de données de virologie.
Bloom affirme que parce que les séquences supprimées manquent de trois mutations observées dans les cas de COVID-19 liés au marché des fruits de mer, les virus des patients analysés par l'équipe de Wang représentent plus probablement un ancêtre SARS-CoV-2. Mais Rambaut dit que les différences soulignées par Bloom sont trop peu nombreuses pour distinguer les «racines» de l'arbre généalogique du SRAS-CoV-2.

Laissant de côté la signification des séquences trouvées par Bloom, la démonstration que les chercheurs peuvent potentiellement trouver de « nouvelles » données sur le SRAS-CoV-2 dans le cloud est une avancée passionnante et peut inciter à des détectives similaires, explique le génomique Sudhir Kumar de l'Université Temple, qui a également analysé les premières séquences du SRAS-CoV-2. "Beaucoup de gens pensent qu'il y a beaucoup plus de données chinoises et qu'ils n'y ont pas accès."