Le biais d’information est un type d’erreur qui se produit lorsque les variables clés de l’étude sont mal mesurées ou classées. Les biais d’information peuvent affecter les résultats des études observationnelles ou expérimentales en raison de différences systématiques dans la manière dont les données sont obtenues auprès des différents groupes d’étude. Le biais d’information est également appelé biais de mesure ou erreur de classification.

biais d information biais dinformation

D'où viennent les biais d'information ?

Un biais d’information se produit lorsque les informations utilisées dans une étude sont soit mesurées, soit enregistrées de manière inexacte. Ces mesures peuvent prendre diverses formes, telles que :

  • Réponses aux questionnaires auto-administrés
  • Réponses aux questions d’entretien
  • Mesures physiques
  • Informations dans les dossiers médicaux

Le biais d’information est l’une des sources les plus courantes de biais de recherche . Cela affecte la validité des études observationnelles , ainsi que des expériences et des essais cliniques. Un biais d’information peut survenir lorsque :

L’étude n’est pas réalisée en double aveugle : les chercheurs savent si un participant est affecté au groupe témoin ou au groupe expérimental.

Les chercheurs utilisent différentes méthodes pour évaluer les résultats dans chaque groupe. Par exemple, utiliser des dossiers médicaux pour un groupe et des questionnaires d’auto-évaluation pour l’autre lors de l’étude de l’état de la maladie.

La variable indépendante (par exemple, l’exposition à des substances toxiques) et/ou la variable dépendante (par exemple, le risque de cancer du poumon) sont enregistrées de manière inexacte. Cela peut être dû à des erreurs dans l’enregistrement des antécédents d’un individu, à des définitions différentes de la maladie ou à des critères de diagnostic différents parmi les experts.

Les instruments destinés aux mesures objectives (par exemple le poids) ne sont pas correctement calibrés, les résultats ne sont pas enregistrés correctement ou les données sont commutées pendant la phase de saisie ou de nettoyage des données.

En général, les biais d’information ont tendance à produire des résultats erronés ou des conclusions qui diffèrent systématiquement de la vérité.

Causes

Un biais d’information peut survenir en raison d’une mauvaise classification non différentielle si le groupe expérimental et le groupe témoin sont affectés de la même manière, ou d’une mauvaise classification différentielle si elle affecte davantage un groupe que l’autre. Ici, une mauvaise classification fait référence à la classification d’un individu ou d’un attribut dans une catégorie autre que celle à laquelle il devrait être attribué.

Une erreur de classification non différentielle est causée par des mesures tout aussi inexactes dans tous les groupes d’étude. Cela peut se produire lorsque les participants à l’étude des deux groupes de comparaison ont des difficultés à se souvenir avec précision de quelque chose qui n’est pas objectivement vérifiable, comme les niveaux de consommation d’alcool.

Une mauvaise classification non différentielle a tendance à donner l’impression que les groupes sont plus semblables qu’ils ne le sont réellement. Cela amène également les chercheurs à sous-estimer l’association entre les variables (par exemple, entre la consommation d’alcool et le risque de cancer du poumon).

Une erreur de classification différentielle est causée par une différence de mesure qui existe entre les groupes d’étude, tels qu’un groupe d’étude de cas et un groupe témoin. Étant donné que les participants du groupe de cas possèdent déjà un attribut, tel qu’un problème de santé spécifique, ils peuvent être en mesure de se souvenir d’une exposition antérieure à des facteurs de risque avec plus de précision que le groupe témoin sain.

Une mauvaise classification différentielle peut entraîner une sous-estimation ou une surestimation de l’association entre les variables.

Les types de biais d'information

Le biais d’information est un terme général décrivant les erreurs systématiques dans la manière dont les données sont collectées ou mesurées. Il existe plusieurs types de biais informationnels :

Un biais de rappel se produit lorsque les participants de l’un des groupes d’étude sont capables de mieux se souvenir d’événements ou de comportements passés que ceux de l’autre.

Le biais de l’observateur se produit lorsque les chercheurs connaissent l’ hypothèse étudiée ou savent à quel groupe est affecté chaque participant. Ces informations peuvent influencer la manière dont les chercheurs collectent, mesurent ou interprètent les informations.

Le biais de performance fait référence aux situations dans lesquelles les chercheurs ou les participants à une étude modifient leur comportement ou leurs réponses parce qu’ils sont conscients de la répartition des groupes, c’est-à-dire qu’ils savent qui fait partie du groupe témoin et qui fait partie du groupe de traitement.

La régression vers la moyenne est un phénomène dans lequel une variable qui présente une valeur extrême (valeur aberrante ) lors de sa première mesure (supérieure ou inférieure à la moyenne) aura tendance à être plus proche de la moyenne lors d’une deuxième mesure. La RTM peut amener les chercheurs à croire qu’une intervention ou un traitement est plus efficace qu’il ne l’est réellement.

Biais de rappel

Le biais de rappel a un impact significatif sur la mémoire des individus et les pousse à penser différemment à ce qui s’est passé dans la réalité. Cependant, ce qui se passe dans leur vie les oblige à générer de nouveaux souvenirs en fonction des nouvelles expériences. Les principales causes du biais de rappel sont les suivantes :

Biais de désirabilité sociale

La principale cause du biais de rappel est le biais de désirabilité sociale. De nombreuses personnes modifient l’interprétation de leurs souvenirs pour les rendre plus attrayants et intéressants, pour être désirés par les autres et pour répondre aux attentes sociales. Ils peuvent exagérer ou sous-estimer leur interprétation, provoquant ainsi un biais de rappel.

Limitations du cerveau humain

Une autre cause du biais de rappel est les limites du cerveau humain. Le cerveau est conçu pour contenir une grande quantité de données et d’informations. Cependant, il ne peut parfois pas conserver toutes les informations. Afin d’intégrer de nouvelles informations, il remplace les anciennes données. De plus, les anciennes données peuvent se dégrader et provoquer un biais de rappel.

Biais de rappel sélectif

Certaines personnes se souviennent ou oublient certains événements de la vie en fonction de leurs goûts, de leur pertinence émotionnelle et de leurs préjugés personnels. C’est également une cause de biais de rappel. Les événements qui ont un impact mental ou émotionnel important sont plus susceptibles d’être mémorisés que ceux qui ont un impact faible.

Effet de télescopage

L’effet de télescopage est également une cause de biais de rappel. La plupart des gens oublient la chronologie exacte ou la période des événements. Cependant, lorsqu’ils rapportent, ils compressent ces événements pour les rendre récents ou les étendent dans un passé lointain. Cette incapacité à se souvenir de la chronologie correcte des événements entraîne un biais de rappel.

Problèmes de santé mentale

La mémoire des personnes peut également être affectée par des problèmes de santé mentale particuliers tels que l’amnésie, la maladie d’Alzheimer, le stress ou la dépression. Ces problèmes de santé mentale entraînent des oublis importants chez les personnes. Elles confondent les anciens souvenirs avec les nouveaux lors du rapport. Cela entraîne également un biais de rappel.

« Imaginez une étude visant à comprendre la relation entre l’exposition aux pesticides et le développement de certaines maladies. On demande à tous les participants de l’étude de se souvenir de leur exposition récente aux pesticides.

Lorsque les réponses des personnes malades ont été recueillies, elles se sont facilement souvenues de leur exposition récente aux pesticides car elles étaient plus désireuses de connaître la cause de leur maladie. En revanche, lorsque les réponses des personnes en bonne santé ont été recueillies, elles n’ont pu se souvenir d’aucune exposition récente ou ancienne aux pesticides. »

Biais de l'observateur

Cela se produit généralement lorsqu’un chercheur est conscient de l’objectif et des hypothèses d’une étude et a des attentes quant à ce qui va se passer.

Si un chercheur essaie de trouver un résultat particulier pour étayer l’hypothèse de l’étude ou a une idée prédéterminée de ce que devraient être les résultats, il sera incité à déformer les données pour les rendre plus conformes à ses prédictions.

Ce biais se produit le plus souvent dans les études observationnelles ou tout type de recherche où les mesures sont prises et enregistrées manuellement. Dans les études observationnelles, un chercheur enregistre les comportements ou prend des mesures auprès des participants sans essayer d’influencer le résultat de l’expérience.

Les études observationnelles sont utilisées dans un certain nombre de domaines de recherche différents, plus particulièrement la médecine, la psychologie, les sciences du comportement et l’ethnographie.

« Vous effectuez une étude observationnelle pour étudier les effets d’un nouveau médicament contre les nausées. Le groupe A reçoit le traitement réel avec le nouveau médicament, tandis que le groupe B reçoit un placebo.

Les participants ne savent pas à quel groupe ils appartiennent, mais vous, le chercheur, le savez.

Inconsciemment, vous traitez les deux groupes différemment, en formulant des questions plus négatives à l’égard du groupe B et en faisant remarquer que les membres du groupe A semblent plus énergiques et optimistes. »

Biais de performance

Le biais de performance se produit lorsqu’un groupe de sujets d’une expérience (par exemple, un groupe témoin ou un groupe de traitement) reçoit plus d’attention de la part des chercheurs qu’un autre groupe. La différence de niveau de soins entraîne des différences systématiques entre les groupes, ce qui rend difficile, voire impossible, de conclure qu’un médicament ou une autre intervention a provoqué un effet, par opposition au niveau de soins. Un biais similaire est le biais de vérification, où les résultats sont plus susceptibles d’être trouvés dans les groupes de traitement, car les chercheurs savent quelle personne appartient à quel groupe.

Le biais de performance peut également faire référence au fait que les participants peuvent modifier leurs réponses ou leur comportement s’ils savent dans quel groupe ils sont affectés. Par exemple, si une étude de perte de poids cherche à savoir si un régime riche en protéines fonctionne pour réduire le poids, les participants peuvent augmenter leur apport en protéines. Ce type particulier de biais est également appelé l’ensemble des effets Hawthorne.

Le biais de performance est une menace majeure pour la validité interne. La validité interne est une mesure de la fiabilité de vos résultats, ou de votre degré de confiance dans le fait que le résultat de votre expérience est dû à une seule variable indépendante.

« Si les chercheurs savent qu’un groupe expérimental a reçu un médicament actif, ils peuvent concentrer leur attention sur ce groupe. Les participants pourraient être soumis à des examens plus fréquents et à davantage de tests diagnostiques. Le groupe expérimental pourrait ainsi avoir plus de chances d’obtenir un résultat positif, non pas parce qu’il a reçu un médicament actif, mais parce qu’il a fait l’objet d’une attention plus ciblée. »

Régression vers la moyenne

La régression vers la moyenne peut s’avérer problématique, en particulier dans les études de recherche qui mesurent l’efficacité d’une intervention, d’un programme ou d’une politique.

Elle peut induire les chercheurs en erreur en leur faisant croire qu’une intervention est la cause d’un changement observé, alors qu’en réalité, il s’agit du hasard. Cela est particulièrement évident lorsque les chercheurs se concentrent sur les mesures de personnes, de cas ou d’organisations aux extrêmes, comme les moins performants, les plus instruits ou les plus en mauvaise santé.

La RTM nous montre que, statistiquement, les cas les plus bas sont susceptibles de s’améliorer la deuxième fois, tandis que ceux qui sont à leur apogée auront probablement de moins bons résultats même sans intervention. Comme elle peut fausser les résultats, vous devez prendre en compte la régression vers la moyenne lors de la conception de votre recherche ainsi que lors de l’analyse de vos résultats.

Sinon, vous courez le risque d’attribuer certains résultats à une cause particulière, alors qu’en réalité ils sont très probablement dus au hasard. La régression vers la moyenne se produit lorsqu’un échantillon non aléatoire est sélectionné dans une population et que vous mesurez deux variables imparfaitement corrélées, comme deux mesures consécutives de la pression artérielle.

Plus la corrélation entre les deux variables est faible, plus l’effet du RTM est important.
Plus la valeur de la moyenne de la population est extrême, plus il y a de place pour une régression vers la moyenne.

La régression vers la moyenne peut s’expliquer en considérant, par exemple, que les compétences et les performances sont imparfaitement corrélées en raison du rôle de la chance. Cela peut vous amener à trouver une relation de cause à effet là où il n’y en a pas.

« Vous souhaitez savoir si un cours en ligne à rythme libre peut aider les élèves de collège à combler leurs lacunes en mathématiques. Une école de votre région accepte de participer à l’étude pilote.
Pour savoir quels élèves en ont le plus besoin, vous administrez un test de mathématiques à une classe d’élèves de 8e année. Vous choisissez les 10 % d’élèves les moins performants et les associez au cours en ligne.

Une fois le cours terminé, les 10 % d’élèves les moins performants passent un autre test. Leurs résultats, en moyenne, montrent une amélioration. Le directeur, satisfait du résultat, décide de lancer le cours en ligne pour tous les élèves de 8e année qui ont des résultats inférieurs en mathématiques.

À la fin de l’année, les résultats de ces élèves ne sont pas beaucoup meilleurs que ceux de l’année précédente. Ils ne se sont certainement pas améliorés au degré auquel vous vous attendiez en fonction des résultats des 10 % d’élèves les moins performants.

Le problème ici est la régression vers la moyenne. Parmi les élèves qui ont eu de mauvais résultats au premier test, il y en avait aussi qui n’ont pas eu de bons résultats à cause du hasard : peut-être parce qu’ils n’ont pas bien dormi la nuit précédente, parce qu’ils étaient malades ou stressés. Ces élèves allaient avoir de meilleurs résultats au deuxième test, quelle que soit l’intervention (le programme en ligne). Ils ont donc fait grimper la note moyenne des 10 % les moins performants. »

Comment éviter les biais d'information ?

Le biais d’information découle de l’approche utilisée pour collecter ou mesurer les données dans votre étude. Vous pouvez prendre plusieurs mesures pour minimiser les biais d’information lors de la collecte de données :

  • Vérifiez les informations recueillies à partir de questionnaires d’auto-évaluation ou d’entretiens en les comparant avec des dossiers écrits, tels que des dossiers médicaux.
  • Utilisez le double aveugle , si possible. Assurez-vous que toute personne impliquée dans l’étude n’est pas au courant de l’hypothèse de recherche ni de qui fait partie de quel groupe.
  • Si la mise en aveugle n’est pas possible, développez un protocole pour la collecte, la mesure et l’interprétation des informations.
  • Utilisez des questionnaires standardisés et des instruments correctement calibrés pour garantir la cohérence de la collecte de données.
fr_FRFR