Erreur du taux de base

Une erreur du taux de base fait référence à la tendance à ignorer les informations statistiques pertinentes au profit d’informations spécifiques à un cas. Au lieu de prendre en compte le taux de base ou la probabilité antérieure d’un événement. Pour cette raison, les gens portent souvent des jugements de probabilité inexacts dans des contextes décisionnels. L’erreur du taux de base est également appelée négligence du taux de base ou biais du taux de base ou oubli de la fréquence de base.

Erreur du taux de base

Exemples

Soit une ville d’un million individus présents sur son territoire. Sur ce million (1 000 000) d’individus, 100 sont des délinquants présumés et répertoriés comme tels sur une liste, les 999 900 autres étant présumés non-délinquants. Afin de détecter la présence d’un délinquant sur son territoire, la ville installe des caméras de vidéosurveillance avec un dispositif de reconnaissance faciale automatique : celui-ci doit déclencher une alerte dès lors que le visage filmé est celui d’un des 100 délinquants de la liste. Malheureusement, le dispositif de reconnaissance faciale n’est pas parfait. Supposons qu’il ait un « taux d’erreur de 1 % », ou, plus précisément, que :

sa sensibilité soit de 99 %, soit un taux de 1 % de faux négatifs parmi les vrais délinquants ;
sa spécificité soit de 99 %, soit un taux de 1 % de faux positifs parmi les non-délinquants.
Lorsqu’une alerte se déclenche, quelle est la probabilité que l’on soit en présence d’un délinquant répertorié sur la liste ?

Si l’on raisonne avec « oubli de la fréquence de base », c’est-à-dire en ne retenant que le « taux d’erreur est de 1 % », on répond un peu rapidement qu’il y a 99 % de probabilité que l’individu soit effectivement un délinquant lorsqu’une alerte est déclenchée. Ce qui est erroné. En effet, lorsqu’on comptabilise l’ensemble des alertes, deux situations sont à prendre en compte simultanément :

99 % des délinquants déclenchent l’alerte, soit 99 délinquants sur les 100 de la liste (selon la définition de la sensibilité) ;
1 % des non-délinquants déclenchent l’alerte, soit 9 999 non-délinquants sur 999 900 (selon la définition de la spécificité).

Soit un total de 99 + 9999 = 10 098 alertes. Lorsqu’une alerte se déclenche, la probabilité que l’individu soit effectivement un délinquant est donc de 99 sur 10 098, soit 0,98 % et non de 99 %. Cette probabilité peut être retrouvée par le théorème de Bayes.

Voici un autre exemple.

Pendant la pandémie, nous avons souvent entendu ou lu des statistiques dans l’actualité, telles que « 70 % des patients Covid hospitalisés ont été vaccinés » ou « 7 patients Covid hospitalisés sur 10 sont vaccinés ». À l’époque, beaucoup se demandaient ce que cela impliquait sur l’efficacité du vaccin.

La clé pour interpréter correctement ces informations réside dans le taux de vaccination de base (c’est-à-dire le pourcentage de la population vaccinée). Si une grande proportion de la population est vaccinée et que seule une petite fraction n’est pas vaccinée, nous pouvons nous attendre à un ratio plus élevé d’individus vaccinés par rapport aux individus non vaccinés à l’hôpital.

Supposons par exemple qu’une population soit vaccinée à 99 % et que 51 % des individus infectés aient été vaccinés. L’erreur du taux de base amènerait la plupart des gens à penser que le vaccin n’a aucun effet préventif. Cependant, si le vaccin était inefficace, on s’attendrait à ce qu’environ 99 % des personnes infectées aient été vaccinées.

L’erreur du taux de base a créé l’idée fausse selon laquelle les vaccins sont inefficaces car, dans les populations hautement vaccinées, la majorité des cas de COVID-19 surviennent parmi les personnes vaccinées.

Comment éviter les erreurs du taux de base

Cela est très simple, en plus des statistiques, il faut connaitre le nombre d’individus de chaque population testée. Le plus simple pour éviter une erreur du taux de base est de se fier à une matrice de confusion.

fr_FRFR