Les dernières semaines ont vu une épidémie imparable… de statistiques. L'inondation menace de nous submerger tous, mais que signifient tous ces chiffres? Voici huit statistiques que vous pouvez voir, avec quelques avertissements sur la confiance que nous pouvons leur accorder.

1 Le nombre de nouveaux cas chaque jour Cela peut refléter très mal le nombre de personnes effectivement infectées, car cela dépend essentiellement du régime de dépistage – jusqu'au 9 avril, 1,3 million de tests avaient été effectués en Allemagne, contre 317 000 au Royaume-Uni.

2 Le nombre de nouveaux décès chaque jour L'éventail des sources est déroutant. Les annonces quotidiennes doivent être traitées avec prudence car elles n'incluent que les décès à l'hôpital de ceux qui ont été testés positifs pour le coronavirus, et il y a généralement un retard dans la déclaration des décès de quelques jours ou même plus. Par exemple, alors que le 27 mars le gouvernement annonçait que 926 décès de Covid-19 avaient jusqu'à présent eu lieu dans des hôpitaux anglais, le NHS England rapporte désormais que le chiffre réel était de 1 649. L'étalon-or est le nombre de certificats de décès colligés par l'Office for National Statistics: il rapporte au moins 1568 mentions de Covid-19 pour tous les décès jusqu'au 27 mars, mais cela augmentera à mesure que les enregistrements arriveront.

Comment le coronavirus a changé le monde en trois mois – vidéo

3Le nombre total de décès Des graphiques d'accumulation de décès sont présentés lors de la conférence de presse quotidienne du gouvernement, mais ils sont un outil désespéré pour repérer les tendances: nous avons besoin de dénombrements quotidiens pour voir si nous avons atteint un plateau (qui ne sera pas un «pic»). Mais les chiffres quotidiens sont volatils, et ont donc besoin d'un certain lissage pour faire ressortir les tendances sous-jacentes: World in Data utilise une moyenne mobile sur trois jours.

4 numéros enregistré sur une échelle logarithmique Cela aura un axe vertical intitulé 1, 10, 100, 1 000. Celles-ci sont utiles pour comparer les tendances, mais inutiles pour se faire une idée de l'ampleur du problème.

5Prédictions des modèles Les modèles informatiques sont de deux types. La première tente de modéliser l'épidémie elle-même, en faisant des hypothèses simplifiées sur le mécanisme de transmission d'un virus à travers une communauté. Les quantités clés, telles que le nombre de personnes infectées par un cas moyen, sont très incertaines au début d'une épidémie, mais sont affinées à mesure que davantage de données sont recueillies. Ces modèles ont constitué la base pour prédire les conséquences des décisions politiques au Royaume-Uni.

Le deuxième type de modèle est purement empirique, ajustant les courbes aux données observées et faisant de fortes hypothèses sur la forme de la courbe à extrapoler dans le futur. Ces projections doivent être considérées avec une extrême prudence car elles peuvent être extrêmement sensibles à quelques points de données. Le 9 avril, l'organisation américaine IHME a prédit 66 000 morts au Royaume-Uni Covid-19, mais ce chiffre est tombé à 37 000 trois jours plus tard – il est difficile de prendre cette modélisation au sérieux. Les prédictions du modèle devraient toujours reconnaître l'incertitude, bien que cela soit rarement rapporté par les médias.

6 «Décès excessifs» Le nombre de décès supplémentaires qui seront enregistrés au cours de cette période, en raison de Covid-19 ou du verrouillage, est vivement contesté. Des vies seront perdues à cause de la maladie, de la réduction des soins médicaux pour tous, de la violence domestique et des effets du chômage et de la pauvreté; et des vies seront sauvées grâce à moins d'accidents et, en particulier, à une meilleure qualité de l'air. Une fraction (contestée) des personnes décédées serait de toute façon décédée dans l'année à venir, un phénomène connu sous le nom de déplacement de la mortalité ou même de «récolte». Mais l'effet global est difficile à prévoir et les affirmations confiantes doivent être traitées avec scepticisme.

Pourquoi les taux de mortalité par coronavirus sont-ils si différents? – explicateur vidéo

7 Les risques mortels d'infection Celles-ci varient considérablement avec l'âge et la fragilité, tout comme les risques «normaux». En fait, les estimations actuelles pour le grand public (plutôt que pour les professionnels de la santé) semblent remarquablement similaires aux risques auxquels nous sommes confrontés de toute façon chaque année – mais le tout dans quelques semaines.

8 La «précision» d'un test d'anticorps Même des tests d'anticorps apparemment précis peuvent conduire à de nombreuses fausses assurances d'immunité. Mais un test moins précis peut convenir si nous testons un échantillon représentatif pour estimer la proportion d'une population immunisée.

Enfin, il est tentant de lier les statistiques d’un pays aux mesures qu’il a prises pour lutter contre le virus: par exemple, la politique plus souple de la Suède a-t-elle été aussi efficace que le verrouillage? Mais les pays diffèrent à bien des égards: données démographiques de base, conformité et réseaux sociaux, capacité et politique de test, caractéristiques des services de santé, etc. L'ancien Premier ministre Carl Bildt a plaisanté en disant que les Suédois « ont de toute façon une disposition génétique à la distanciation sociale ».

Sylvia Richardson, directrice, Unité de biostatistique du MRC, présidente élue de la Royal Statistical Society; David Spiegelhalter, président, Winton Center for Risk and Evidence Communication