Par Jon Cohen Jun. 23, 2021, 19 :45

Le reportage COVID-19 de Science est soutenu par la Fondation Heising-Simons.

La recherche d'un scientifique sur l'origine de COVID-19 trouve les premières séquences de virus L'équipe chinoise a été supprimée de la base de données du NIH

Dans un monde affamé de nouvelles données pour aider à clarifier l'origine de la pandémie de COVID-19, une étude prétendant avoir déterré les premières séquences du SRAS-CoV-2 qui étaient délibérément cachées devait déclencher un débat passionné. L'article non révisé, rédigé par le biologiste évolutionniste Jesse Bloom du Fred Hutchinson Cancer Research Center, affirme qu'une équipe de chercheurs chinois a échantillonné les virus de certains des premiers patients atteints de COVID-19 à Wuhan, en Chine, a publié les séquences virales dans une base de données américaine largement utilisée. puis quelques mois plus tard, les informations génétiques ont été supprimées pour "obscurcir leur existence".

Pour certains scientifiques, les affirmations renforcent les soupçons selon lesquels la Chine a quelque chose à cacher sur les origines de la pandémie. Mais les critiques de la préimpression, publiés hier sur bioRxiv, disent que le travail de détective de Bloom est beaucoup de bruit pour rien, car les scientifiques chinois ont ensuite publié les informations virales sous une forme différente, et les séquences récupérées ajoutent peu à ce que l'on sait du SRAS-CoV-2 origines.

En rapport

Les séquences, selon Bloom, soutiennent d'autres preuves que la pandémie n'est pas originaire du marché des fruits de mer de Huanan à Wuhan, où le SRAS-CoV-2 a initialement été révélé. Le 31 décembre 2019, les autorités sanitaires chinoises ont lié le marché à une épidémie de « pneumonie inexpliquée », mais un mois plus tard, il était devenu clair que bon nombre des premiers cas n'avaient aucun lien avec l'emplacement. L'article met en évidence trois mutations trouvées dans le SRAS-CoV-2 collectées auprès de patients liés au marché qui ne sont pas dans les séquences déterrées du coronavirus ou de son plus proche parent, que des chercheurs de l'Institut de virologie de Wuhan ont découvert chez des chauves-souris en 2013.

L'affirmation la plus explosive de Bloom, selon laquelle les chercheurs chinois ont supprimé des données, ne manquera pas d'intensifier le débat sur la question de savoir si le virus a initialement sauté sur l'homme à partir d'un animal inconnu ou s'il s'est en quelque sorte fui d'un laboratoire. Bloom dit qu'il n'a aucun parti pris envers une hypothèse d'origine particulière pour le SRAS-CoV-2, et il convient que les séquences virales qu'il a mises en évidence sont une petite pièce d'un grand puzzle inachevé. "Je ne pense pas que cela renforce l'hypothèse de l'origine du laboratoire ou de la zoonose", dit-il. « Je pense que cela fournit des preuves supplémentaires que ce virus circulait probablement à Wuhan avant décembre, certainement, et que probablement, nous avons une image moins que complète des séquences des premiers virus. »

Bloom, qui étudie l'évolution virale, a lancé son étude après un rapport controversé sur l'origine de la pandémie publié en mars par une commission mixte de chercheurs chinois et étrangers organisée par l'Organisation mondiale de la santé (OMS). Bloom a aidé à organiser une lettre très discutée, cosignée par 17 autres scientifiques, qui critiquait le rapport de l'OMS pour avoir jugé "extrêmement improbable" que le SRAS-CoV-2 s'échappe d'un laboratoire. Dans la lettre, publiée le 14 mai dans Science, les auteurs plaidaient pour « un discours scientifique impartial sur cette question difficile mais importante ».

Le rapport de l'OMS s'est fortement appuyé sur des séquences de SRAS-CoV-2 trouvées chez des patients COVID-19 liés au marché, note Bloom. "Je parcourais et essayais de répéter un certain nombre d'analyses du rapport conjoint OMS-Chine", a déclaré Bloom. Cela l'a conduit à une étude répertoriant toutes les séquences du SRAS-CoV-2 soumises avant le 31 mars 2020 à la Sequence Read Archive (SRA), une base de données supervisée par le National Center for Biotechnology Information, une division des US National Institutes of Health ( NIH). Mais lorsqu'il a vérifié SRA pour l'un des projets répertoriés, il n'a pas pu trouver ses séquences.

En googlant certaines informations du projet, il a trouvé une autre étude, dirigée par Ming Wang de l'hôpital Renmin de l'Université de Wuhan, qui a été publiée en tant que prépublication le 6 mars sur medRxiv, et publiée plus tard, le 24 juin, dans Small, une revue plus axée sur les matériaux. et la chimie que la virologie. Cet article répertorie certains des premiers patients de Wuhan COVID-19 et les mutations spécifiques de leurs virus, mais ne donne pas les données de séquence complètes. D'autres recherches sur Internet ont conduit Bloom à découvrir que SRA sauvegarde ses informations sur la plate-forme Cloud de Google, et une recherche y a révélé des fichiers contenant certaines des soumissions de données antérieures de l'équipe de Wang.

L'article de Small ne fait aucune mention des corrections apportées aux séquences virales qui pourraient expliquer pourquoi elles ont été supprimées de la SRA, ce qui a conduit Bloom à conclure dans sa prépublication que "les structures de confiance de la science ont été abusées pour obscurcir les séquences pertinentes à la propagation précoce de SARS-CoV-2 à Wuhan. Bloom affirme que parce que les séquences supprimées manquent des trois mutations observées dans le SRAS-CoV-2 du marché des fruits de mer, les virus que l'équipe de Wang a trouvés représentent plus probablement un ancêtre.

Mais la séquence de ce virus de chauve-souris trouvé en 2013 diffère du SRAS-CoV-2 d'environ 1 100 nucléotides, ce qui signifie que des décennies ont dû s'écouler avant qu'il ne se transforme en coronavirus pandémique – et d'autres espèces pourraient bien avoir été infectées par le virus de la chauve-souris avant lui. fait le saut final dans les gens. Cette grande différence dans les séquences, explique le biologiste évolutionniste Andrew Rambaut de l'Université d'Édimbourg, signifie que les chercheurs ne peuvent pas utiliser quelques mutations comme celles que Bloom met en évidence pour remonter dans le temps et voir les "racines" de l'arbre généalogique du SRAS-CoV-2. arbre.

Bloom dit qu'il a contacté les chercheurs chinois pour leur demander pourquoi ils ont supprimé les données SRA, mais ils n'ont pas répondu. (La science n'a également reçu aucune réponse après avoir envoyé un courrier électronique aux auteurs principaux.) Le NIH a publié aujourd'hui une déclaration disant qu'il avait supprimé les séquences à la demande de l'enquêteur soumettant, qui, selon l'agence, détient les droits sur les données. Le scientifique "a indiqué que les informations sur les séquences avaient été mises à jour, étaient soumises à une autre base de données et souhaitait que les données soient supprimées de SRA pour éviter les problèmes de contrôle de version", a déclaré le NIH (Bloom dit qu'il ne peut trouver les séquences dans aucune autre base de données de virologie qu'il connaît. )

Les chercheurs sont fortement divisés sur la valeur de la résurrection par Bloom des données SRA. "Il s'agit d'une approche créative et rigoureuse pour enquêter sur la provenance du SRAS-CoV-2", déclare Ian Lipkin, microbiologiste à la Mailman School of Public Health de l'Université Columbia. "Les deux points à retenir sont que le virus circulait avant l'épidémie liée au marché des fruits de mer de Wuhan et qu'il y a peut-être eu une suppression active des données épidémiologiques et de séquence nécessaires pour suivre son origine."

Laissant de côté la signification des séquences trouvées par Bloom, la démonstration que les chercheurs peuvent potentiellement trouver de « nouvelles » données dans le cloud est une avancée passionnante, ajoute Sudhir Kumar, qui fait des recherches en génomique à l'Université Temple et a publié sa propre analyse du SRAS précoce. Séquences CoV-2  : « Beaucoup de gens pensent qu'il existe beaucoup plus de données chinoises et qu'ils n'y ont pas accès », dit-il.

D'autres sont déçus. "Jesse fait resurgir des informations qui sont en ligne depuis plus d'un an et prétend que cela prouve une dissimulation", explique Stephen Goldstein, virologue évolutionniste à l'Université de l'Utah. "Je ne comprends pas [his reasoning]. " Le Small paper est simplement une bonne étude qui « est malheureusement passée sous le radar », ajoute-t-il.

Rambaut note que les chercheurs chinois ont soumis leur petit document avant de demander à SRA de supprimer les données. « L'idée que le groupe essayait de cacher quelque chose est une farce », dit Rambaut. « S'ils couvraient quelque chose [up] ils n'auraient sûrement pas soumis le document. … Je n'aime pas les insinuations sur la malversation où [Bloom] n'a aucune connaissance des raisons invoquées par les auteurs de l'article pour supprimer leurs données. »

Un membre de la commission d'origine de l'OMS, Marion Koopmans du Centre médical universitaire Erasmus, note que son rapport souligne la nécessité de trouver plus de données sur les premiers virus en circulation. "C'est bien de voir des données supplémentaires, mais je ne sais pas à quoi cela sert", a déclaré Koopmans, ajoutant que les accusations de la préimpression pourraient nuire aux futures collaborations sur les études d'origine avec des chercheurs chinois. "Le ton de l'intro est à mon avis plutôt suggestif et je souhaite que la science reste à l'écart de cela."

Bloom reconnaît que les chercheurs peuvent reconstituer les séquences de coronavirus à partir des données trouvées dans le Small paper, mais il dit que ce n'est pas la façon la plus courante sur le terrain de mener des analyses évolutives du SRAS-CoV-2. "Personne ne connaissait ces séquences parce que la façon dont les gens trouvent des séquences est d'aller dans les bases de données de séquences et de télécharger les séquences et de les regarder", explique Bloom.

Entrer dans la discussion controversée sur l'origine du SRAS-CoV-2 a un prix, reconnaît-il. "Tant de gens ont des agendas et des idées préconçues sur ce sujet que si vous ouvrez la bouche sur le sujet, quelqu'un va prendre ce que vous avez dit pour soutenir ou rejeter un récit particulier", dit-il. « Donc, les choix sont soit de ne rien dire du tout, ce qui ne me semble pas utile ou productif, ou simplement d'essayer de tirer les conclusions possibles et de les rendre aussi transparents que possible. Peu importe combien les gens aiment [my new study] ou ne l'aime pas, ou est d'accord avec l'interprétation ou en désaccord avec l'interprétation, ils peuvent au moins aller le télécharger et le répéter eux-mêmes.