Lorsqu'ils lancent un programme de vaccination, les scientifiques ont généralement une compréhension anecdotique de la maladie qu'ils visent à cibler. Lorsque Covid-19 a fait surface il y a plus d'un an, il y avait tellement d'inconnues sur le virus à évolution rapide que les scientifiques ont dû agir rapidement et s'appuyer sur de nouvelles méthodes et techniques pour commencer à comprendre les bases de la maladie.

Les scientifiques de Janssen Research & Development, les développeurs du vaccin Johnson & Johnson-Janssen Covid-19, ont exploité des données du monde réel et, en collaboration avec des chercheurs du MIT, ont appliqué l'intelligence artificielle et l'apprentissage automatique pour aider à orienter les efforts de recherche de l'entreprise vers un vaccin potentiel.

Derrière le développement du vaccin Covid-19

«La science des données et l'apprentissage automatique peuvent être utilisés pour améliorer la compréhension scientifique d'une maladie», déclare Najat Khan, responsable de la science des données et responsable mondial de la stratégie et des opérations chez Janssen Research & Development. «Pour Covid-19, ces outils sont devenus encore plus importants car nos connaissances étaient plutôt limitées. Il n'y avait aucune hypothèse à l'époque. Nous développions une compréhension impartiale de la maladie basée sur des données du monde réel à l'aide d'algorithmes sophistiqués d'IA / ML. »

Dans le cadre de la préparation des études cliniques sur le candidat vaccin principal de Janssen, Khan a lancé un appel à des collaborateurs sur les efforts de modélisation prédictive pour s’associer à son équipe de science des données afin d’identifier les emplacements clés pour mettre en place des sites d’essais. Par le biais de Regina Barzilay, professeur distingué de la MIT School of Engineering pour l'IA et la santé, directeur de la faculté de l'IA pour la clinique Abdul Latif Jameel du MIT pour l'apprentissage automatique en santé, et membre du conseil consultatif scientifique de Janssen, Khan s'est connecté avec Dimitris Bertsimas, les dirigeants de Boeing pour Global Operations Professeur de gestion au MIT, qui avait développé un modèle d'apprentissage automatique de premier plan qui suit la propagation de Covid-19 dans les communautés et prédit les résultats des patients, et l'a amené à devenir le principal partenaire technique du projet.

Delphes

Lorsque l'Organisation mondiale de la santé a déclaré que Covid-19 était une pandémie en mars 2020 et a forcé une grande partie du monde à s'isoler, Bertsimas, qui est également le chef de la faculté d'entrepreneuriat de la clinique Jameel, a réuni son groupe de plus de 25 étudiants au doctorat et à la maîtrise. pour discuter de la manière dont ils pourraient utiliser leurs compétences collectives en apprentissage automatique et en optimisation pour créer de nouveaux outils pour aider le monde à lutter contre la propagation de la maladie.

Le groupe a commencé à suivre leurs efforts sur la plate-forme COVIDAnalytics, où leurs modèles génèrent des informations précises en temps réel sur la pandémie. L'un des premiers projets du groupe consistait à tracer la progression de Covid-19 avec un modèle épidémiologique qu'ils ont développé appelé DELPHI, qui prédit les taux d'infection et de mortalité état par état en fonction de la décision politique de chaque état.

DELPHI est basé sur le modèle standard SEIR, un modèle compartimental qui simplifie la modélisation mathématique des maladies infectieuses en divisant les populations en quatre catégories: sensibles, exposées, infectieuses et rétablies. L'ordre des étiquettes est intentionnel pour montrer les modèles d'écoulement entre les compartiments. DELPHI étend ce modèle avec un système qui examine 11 états possibles pour tenir compte des effets réalistes de la pandémie, par exemple en comparant le temps passé à l'hôpital par ceux qui se sont rétablis de Covid-19 et ceux qui sont décédés.

"Le modèle comporte certaines valeurs câblées, telles que la durée de séjour d'une personne à l'hôpital, mais nous sommes allés plus loin pour tenir compte du changement non linéaire des taux d'infection, qui, selon nous, n'étaient pas constants et variaient selon les périodes et les lieux". dit Bertsimas. «Cela nous a donné plus de flexibilité en matière de modélisation, ce qui a conduit le modèle à faire des prévisions plus précises.»

Une innovation clé du modèle est de capturer les comportements des personnes liées aux mesures mises en place pendant la pandémie, telles que les verrouillages, le port de masques et la distanciation sociale, et leur impact sur les taux d'infection.

«En juin ou juillet, nous avons pu augmenter le modèle avec ces données. Le modèle est alors devenu encore plus précis », explique Bertsimas. «Nous avons également examiné différents scénarios sur la manière dont les différents gouvernements pourraient réagir avec des décisions politiques, de la mise en œuvre de restrictions sérieuses à l'absence de restrictions du tout, et les avons comparés à ce que nous voyions se produire dans le monde. Cela nous a donné la possibilité de faire un éventail de prédictions. L'un des avantages du modèle DELPHI est qu'il effectue des prévisions sur 120 pays et les 50 États américains quotidiennement. »

Un vaccin contre la pandémie d’aujourd’hui

Être en mesure de déterminer où Covid-19 est susceptible de monter ensuite s'est avéré essentiel pour le succès des essais cliniques de Janssen, qui étaient «basés sur les événements» - ce qui signifie que «nous déterminons l'efficacité en fonction du nombre d '« événements »dans notre étudier la population, des événements tels que devenir malade avec Covid-19 », explique Khan.

«Pour mener un essai comme celui-ci, qui est très, très vaste, il est important de se rendre dans les points chauds où nous prévoyons que la transmission de la maladie sera élevée afin que vous puissiez accumuler ces événements rapidement. Si vous le pouvez, vous pouvez exécuter l'essai plus rapidement, mettre le vaccin sur le marché plus rapidement et, surtout, disposer d'un ensemble de données très riche où vous pouvez effectuer des analyses statistiquement solides. »

Bertsimas a réuni un noyau de chercheurs pour travailler avec lui sur le projet, dont deux doctorants du centre de recherche opérationnelle du MIT, où il est membre du corps professoral : Michael Li, qui a dirigé les efforts de mise en œuvre, et Omar Skali Lami. Parmi les autres membres figuraient Hamza Tazi MBN '20, ancien étudiant à la maîtrise en analyse commerciale, et Ali Haddad, chercheur en données chez Dynamic Ideas LLC.

L'équipe du MIT a commencé à collaborer avec Khan et son équipe en mai dernier pour prévoir où la prochaine augmentation de cas pourrait survenir. Leur objectif était d'identifier les points chauds de Covid-19 où Janssen pourrait mener des essais cliniques et recruter des participants les plus susceptibles d'être exposés au virus.

Les essais cliniques devant commencer en septembre dernier, les équipes ont dû immédiatement se mettre en marche et faire des prédictions quatre mois avant le moment où les essais auraient réellement lieu. «Nous avons commencé à nous rencontrer quotidiennement avec l'équipe Janssen. Je n’exagère pas - nous nous sommes rencontrés quotidiennement… parfois pendant le week-end, et parfois plus d’une fois par jour », dit Bertsimas.

Pour comprendre comment le virus se déplaçait dans le monde, les data scientists de Janssen surveillaient et exploraient en permanence les sources de données à travers le monde. L'équipe a construit un tableau de bord de surveillance mondiale qui a extrait des données au niveau du pays, de l'État et même du comté en fonction de la disponibilité des données, du nombre de cas, des hospitalisations et des taux de mortalité et de dépistage.

Le modèle DELPHI intégrait ces données, avec des informations supplémentaires sur les politiques et les comportements locaux, comme si les gens respectaient le port du masque, et faisait des prédictions quotidiennes de l'ordre de 300 à 400. «Nous recevions des retours constants de l'équipe Janssen, ce qui a contribué à améliorer la qualité du modèle. Le modèle est finalement devenu assez central dans le processus des essais cliniques », déclare Bertsimas.

Fait remarquable, la grande majorité des sites d'essais cliniques de Janssen que DELPHI prédisait être des points chauds de Covid-19 ont finalement eu un nombre extrêmement élevé de cas, y compris en Afrique du Sud et au Brésil, où de nouvelles variantes du virus avaient fait surface au moment où les essais ont commencé. Selon Khan, des taux d'incidence élevés indiquent généralement une implication variable.

«Toutes les prédictions faites par le modèle sont accessibles au public, donc on peut revenir en arrière et voir à quel point le modèle est vraiment précis. Il a tenu bon. À ce jour, DELPHI est l'un des modèles les plus précis que la communauté scientifique ait produits », déclare Bertsimas.

«Grâce à ce modèle, nous avons pu disposer d'un ensemble très riche en données au moment de la soumission de notre vaccin candidat», déclare Khan. «Nous sommes l'un des rares essais à disposer de données cliniques en Afrique du Sud et au Brésil. Cela est devenu critique parce que nous avons pu développer un vaccin qui est devenu pertinent pour les besoins d'aujourd'hui, le monde d'aujourd'hui et la pandémie d'aujourd'hui, qui se compose de tant de variantes, malheureusement. "

Khan souligne que le modèle DELPHI a été perfectionné en tenant compte de la diversité, en tenant compte des facteurs de risque biologiques, de la démographie des patients et d'autres caractéristiques. «Covid-19 a un impact sur les gens de différentes manières, il était donc important d'aller dans des régions où nous avons pu recruter des participants de différentes races, groupes ethniques et sexes. Grâce à cet effort, nous avons eu l’un des essais Covid-19 les plus diversifiés à ce jour », dit-elle. «Si vous commencez avec les bonnes données, non biaisées et que vous vous rendez aux bons endroits, nous pouvons en fait changer de nombreux paradigmes qui nous limitent aujourd'hui.»

En avril, le MIT et l'équipe R&D Data Science de Janssen ont été reconnus conjointement par l'Institute for Operations Research and the Management Sciences (INFORMS) comme lauréat du prix 2021 Innovative Applications in Analytics Award pour leurs travaux innovants et très percutants sur Covid-19. Fort de ce succès, les équipes poursuivent leur collaboration pour appliquer leur approche data et leur rigueur technique à la lutte contre d'autres maladies infectieuses. «Ce n'était pas un partenariat de nom uniquement. Nos équipes se sont vraiment rassemblées à cet égard et continuent de travailler ensemble sur divers efforts de science des données tout au long du pipeline », déclare Khan. L'équipe apprécie en outre le rôle des enquêteurs sur le terrain, qui ont contribué à la sélection du site en combinaison avec le modèle.

«Ce fut une expérience très satisfaisante», confirme Bertsimas. «Je suis fier d’avoir contribué à cet effort et d’aider le monde à lutter contre la pandémie.»