Revue Covid by Numbers – comment donner un sens aux statistiques

Parallèlement aux vagues successives d'infection, la pandémie de coronavirus nous a fourni un tsunami de données et de graphiques. Grâce au tableau de bord de Public Health England et aux sites Web tels que Our World in Data, chaque internaute peut accéder à des informations précises et opportunes sur les cas de Covid, les décès, les hospitalisations et les vaccins, ventilés par âge, sexe et lieu.
Cependant, si cette mine d'informations peut être extrêmement précieuse, elle peut aussi causer des problèmes.

Sortis de leur contexte et tournés de manière trompeuse, les chiffres bruts des coronavirus peuvent être une source de désinformation, qui, via les médias sociaux, peut se propager aussi efficacement que le virus lui-même. Un simple fait, tel que l'âge médian des victimes de coronavirus (83) dépassant en fait l'espérance de vie à la naissance au Royaume-Uni (81) peut amener les gouvernements et le public à ne pas prendre Covid aussi au sérieux qu'ils le devraient. (Ayant vécu jusqu'à 83 ans, on s'attendrait normalement à vivre encore plus longtemps - ce qui compte, c'est l'espérance de vie à condition d'avoir atteint cet âge.

)
Les données sur les coronavirus sont comme les ingrédients d'un repas : elles peuvent être combinées de diverses manières, certaines recettes étant plus agréables au goût que d'autres et d'autres activement nocives. La bonne façon de penser n'implique pas des données brutes mais leur analyse via la discipline académique de la statistique. Ici, l'incertitude et le caractère aléatoire inhérents aux chiffres sont reconnus et calibrés, ainsi que les problèmes d'échantillonnage, de décalage, de sous-déclaration et parfois de différences dans les méthodes de mesure.

Il peut y avoir peu de meilleures personnes pour le faire que David Spiegelhalter, ancien président de la Royal Statistical Society, et Anthony Masters, "l'ambassadeur statistique" de la Société. Les lecteurs de leur chronique Observer ne seront pas surpris que dans ce livre, ils donnent une visite guidée claire et extrêmement lisible de la pandémie, principalement du point de vue britannique. Ils présentent des chiffres et des graphiques bien choisis, étayés par des notes de bas de page et des références exhaustives, avec un jargon technique réduit au minimum (bien que plus de détails soient disponibles à l'aide d'un glossaire complet).

Le livre est divisé en sept sections, les quatre premières représentant une séquence commençant par le virus lui-même, en passant par le diagnostic et les cas, jusqu'à la gravité de la maladie, se terminant par les décès. Deux autres sections examinent le rôle des interventions telles que les confinements (en étudiant leur impact sur la maladie, l'économie et la santé physique et mentale) et les vaccins (par exemple, expliquer la différence entre l'efficacité dans les essais et dans le monde réel, fréquence des effets secondaires et justifiant la stratégie britannique basée sur l'âge et l'espacement des doses). La dernière partie examine le rôle clé joué par la modélisation mathématique dans notre réponse au coronavirus, et fait une série de recommandations précieuses au gouvernement et aux journalistes pour un traitement des données plus transparent et une interrogation de la politique basée sur des chiffres.

Les auteurs donnent un compte rendu détaillé et équilibré des subtilités impliquées dans la mesure de l'impact du virus. Par exemple, en discutant des décès, Spiegelhalter et Masters décrivent la question de la déclaration des décès « de » et « avec » Covid, comparent le risque par âge et d'autres facteurs sous-jacents, considèrent la question épineuse de la façon de juger les résultats dans différents pays en fonction de leurs données, et faire des comparaisons entre l'impact de Covid et d'autres événements historiques.
Il aurait été facile pour ce genre de récit basé sur des chiffres de devenir sec et de passer à côté du contexte humain essentiel.

Mais Spiegelhalter et Masters ne présentent jamais le Covid comme une abstraction mathématique, toujours comme une véritable maladie aux conséquences très personnelles. Ainsi, plutôt que de simplement donner des données sur les admissions à l'hôpital, ils relient les chiffres aux effets humains sur les patients et leurs familles, et à l'épuisement des travailleurs de la santé, indiquant clairement que «les statistiques à elles seules ne peuvent pas traduire ces sacrifices».
Ils ne reculent pas devant le fait que les jeunes « ont tant sacrifié tout en étant eux-mêmes à faible risque »De même, ils explorent les données sur les décès par âge, profession, origine ethnique et circonstances médicales, montrant comment les chiffres des gros titres cachent l'impact individuel très inégal du coronavirus.

Ils ne reculent pas devant le fait inconfortable qu'à travers les blocages et autres restrictions, les jeunes « ont tant sacrifié tout en étant eux-mêmes à faible risque ».
Il y a bien sûr un problème concernant le bon moment pour publier un tel livre au milieu d'une pandémie mondiale. En effet, le texte a été finalisé au début de l'épidémie de Delta au Royaume-Uni, ce qui signifie que certains développements récents ne sont pas couverts et que certains des chiffres eux-mêmes peuvent déjà être légèrement obsolètes.

Cependant, alors que les arguments sur les vaccinations, les blocages passés et l'immunité collective font rage, ce livre représente une contribution extrêmement opportune. Il donne non seulement un contexte approprié pour ces discussions, mais suggère également la bonne façon de penser aux événements futurs. Si les journalistes, les politiciens et le public en disposaient tous, alors le débat serait bien mieux informé, avec beaucoup plus de lumière que de chaleur.

Covid by Numbers: Making Sense of the Pandemic With Data est publié par Penguin (10,99 £). Pour soutenir le Gardien et l'Observateur, achetez un exemplaire sur guardianbookshop.com.

Des frais de livraison peuvent s'appliquer.