Les données du gène chinois Covid-19 qui auraient pu aider à la recherche sur une pandémie ont été supprimées de la base de données du NIH

Des chercheurs chinois ont demandé aux National Institutes of Health des États-Unis de supprimer les séquences génétiques des premiers cas de Covid-19 d'une base de données scientifique clé, faisant craindre que les scientifiques étudiant l'origine de la pandémie n'aient pas accès à des informations clés.
Le NIH a confirmé avoir supprimé les séquences après avoir reçu une demande d'un chercheur chinois qui les avait soumises trois mois plus tôt.
« Les enquêteurs qui soumettent détiennent les droits sur leurs données et peuvent demander le retrait des données », a déclaré le NIH dans un communiqué.

La suppression des données de séquençage est décrite dans un nouveau document publié en ligne mardi par

Jesse Bloom,

virologue au Fred Hutchinson Cancer Research Center à Seattle. Le document, qui n'a pas été examiné par des pairs, indique que les données manquantes incluent des séquences d'échantillons de virus collectés dans la ville chinoise de Wuhan en janvier et février 2020 auprès de patients hospitalisés ou soupçonnés d'avoir Covid-19.

Certaines des informations supprimées sont toujours disponibles dans un article publié dans une revue spécialisée, mais les scientifiques recherchent généralement des séquences de gènes dans des bases de données majeures comme celle que gère le NIH, a déclaré le Dr Bloom. Le Dr Bloom a déclaré qu'il était capable de trouver les données supprimées après les avoir recherchées ailleurs en ligne.

Il est peu probable que les séquences manquantes modifient la compréhension actuelle des chercheurs des premières semaines de la pandémie de Covid-19 à Wuhan. Mais le Dr Bloom a déclaré que leur retrait sème le doute sur la transparence de la Chine dans l'enquête en cours sur l'origine de la pandémie.

Certains autres scientifiques ont accepté.

"Cela nous fait nous demander s'il y a d'autres séquences comme celles-ci qui ont été purgées", a déclaré

Vaughn S. Cooper,

un biologiste évolutionniste de l'Université de Pittsburgh qui n'était pas impliqué dans le nouvel article et a déclaré qu'il n'avait pas lui-même étudié les séquences supprimées.

Plus d’un an après le début de la pandémie, les scientifiques débattent toujours des origines de Covid-19. Le WSJ décompose les événements clés dans trois endroits en Chine – un marché de fruits de mer, un laboratoire et une mine – pour reconstituer comment la crise sanitaire mondiale a pu commencer. Photo composite : George Downs

Pour rechercher l'origine de la pandémie, les scientifiques ont besoin d'accéder à des informations qui pourraient faire la lumière sur la façon dont le virus a émergé dans la population humaine et a commencé à se propager. La suppression d'informations d'une base de données peut rendre leur recherche plus difficile, ralentissant potentiellement leurs recherches, tout comme le manque d'accès à d'autres recherches. Une équipe internationale dirigée par l'Organisation mondiale de la santé ainsi que d'autres scientifiques étudient comment la pandémie a commencé.

Selon la déclaration du NIH, le scientifique qui a soumis les séquences a demandé en juin 2020 qu'elles soient supprimées car elles avaient été mises à jour et devaient être publiées dans une autre base de données non spécifiée. L'enquêteur a déclaré qu'il souhaitait que l'ancienne version soit supprimée pour éviter toute confusion, selon le NIH.

Les chercheurs chinois ont initialement soumis les séquences à la base de données du NIH en mars 2020 et ont publié des informations à leur sujet dans un article sur un serveur de préimpression, selon le NIH. L'article décrivait l'utilisation d'une technologie de séquençage avancée pour détecter le SRAS-CoV-2, le virus qui cause Covid-19. Les chercheurs n'ont pas immédiatement répondu à une demande de commentaire.

La Commission nationale chinoise de la santé n'a pas immédiatement répondu à une demande de commentaires.

L'un des défis pour les scientifiques qui étudient l'origine du virus est la rareté des données sur les premiers cas à Wuhan, explique le Dr Bloom dans l'article. Ces données, dit-il, se limitent pour la plupart aux séquences virales obtenues en décembre 2019 auprès d'une douzaine de patients connectés au marché des fruits de mer de Huanan de la ville, le site de la première épidémie connue de Covid-19, et à un petit nombre supplémentaire de séquences collectées avant la fin. janvier 2020.

La suppression des séquences a donné "une image quelque peu faussée des virus circulant à Wuhan au début", a déclaré le Dr Bloom. "Cela suggère que l'une des raisons pour lesquelles nous n'avons pas vu plus de ces séquences est peut-être qu'il n'y a pas eu d'efforts sans réserve pour les faire sortir."

La publication de l'article du Dr Bloom pourrait renforcer les appels à une plus grande collaboration de la Chine dans l'effort mondial pour identifier la source du SRAS-CoV-2.

Un responsable de l'OMS travaillant avec l'équipe internationale qui a préparé le rapport de mars de l'organisation sur les origines du virus a déclaré que l'article du Dr Bloom n'avait pas radicalement modifié la compréhension de l'équipe du début de la pandémie, mais avait renforcé les arguments en faveur d'une analyse plus approfondie du premier Covid- 19 contaminations.

Le Dr Bloom est co-auteur d'une lettre publiée en mai dans la revue Science qui critiquait le rapport de l'OMS et appelait à une enquête plus approfondie sur deux hypothèses principales de l'origine de Covid-19 : que le virus pandémique est entré dans la population humaine après s'échappant d'un laboratoire, ou qu'il a sauté aux humains naturellement à partir d'animaux infectés.

Il a dit qu'il s'était rendu compte que des séquences avaient été supprimées de la base de données Sequence Read Archive du NIH lorsqu'il a lu une analyse par d'autres enquêteurs et a essayé de trouver les séquences lui-même.

Après la découverte, il a passé des matinées et des week-ends à parcourir Internet à la recherche d'autres sources des séquences supprimées et a finalement pu les obtenir et les télécharger. Le Dr Bloom a ensuite contacté le NIH pour demander pourquoi les séquences avaient été supprimées.

Le Dr Cooper, virologue de l'Université de Pittsburgh, a déclaré que les séquences supprimées ne résolvent pas un débat continu sur la question de savoir si la pandémie est issue d'un accident de laboratoire ou d'un débordement animal chez l'homme. "Vous pouvez toujours discuter dans les deux sens", a-t-il déclaré.

Mais l'article du Dr Bloom suggère que d'autres données de séquence précoce pourraient encore émerger, a déclaré

Étang Sergueï,

un professeur de biologie de l'Université Temple avec une expertise sur l'évolution des agents pathogènes viraux.

"Si d'autres séquences étaient révélées, en particulier à partir de points temporels précoces, ou d'échantillons d'archives ailleurs, tout pourrait à nouveau changer", a-t-il déclaré. "Je pense que cela est susceptible d'arriver."

Stephen Goldstein,

un virologue évolutionniste de l'Université de l'Utah qui n'était pas impliqué dans les recherches du Dr Bloom, a déclaré qu'il n'était pas clair si de nouvelles informations pouvaient être tirées des séquences supprimées. "D'un point de vue scientifique, je ne pense pas qu'ils indiquent quoi que ce soit de néfaste", a-t-il déclaré, ajoutant qu'il n'avait pas fait sa propre analyse des séquences.

Les séquences supprimées sont des fragments, et « ce sont les séquences complètes du génome qui ont généralement été les plus informatives », a déclaré

Joël Wertheim,

biologiste de l'évolution à l'Université de Californie à San Diego et auteur d'un article récent sur le début de la pandémie.

Le Dr Bloom dit dans son article que même s'il n'y a pas d'autre enquête internationale, l'approche qu'il a adoptée pourrait être utilisée pour en savoir plus sur l'origine ou la propagation précoce du coronavirus.

"Nous devons vraiment regarder attentivement et voir s'il existe d'autres informations précoces sur les séquences qui n'ont pas été trouvées", a-t-il déclaré. "J'ai l'intention de passer en revue toutes les premières préimpressions que je peux trouver sur le SRAS-CoV-2 et de voir si elles décrivent des données qui ne se trouvent pas dans les bases de données."

—Jérémy Page

contribué à cet article.

Enquêter sur l'origine du Covid-19

Écrire à Amy Dockser Marcus à [email protected], Betsy McKay à [email protected] et Drew Hinshaw à [email protected]

Copyright ©2020 Dow Jones & Company, Inc. Tous droits réservés. 87990cbe856818d5eddac44c7b1cdeb8