Sampling bias

Un biais d’échantillonnage se produit lorsque certains membres d’une population sont systématiquement plus susceptibles d’être sélectionnés dans un échantillon que d’autres. On parle également de biais de vérification dans les domaines médicaux. Le biais d’échantillonnage limite la généralisabilité des results because it poses a threat to external validity, particularly population validity. In other words, results from biased samples can only be generalized to populations that share characteristics with the sample.

Causes

Your choice of design research or method data collection may result in sampling bias. This type of research bias can occur in both probability and non-probability sampling.

Dans l’échantillonnage probabiliste , chaque membre de la population a une chance connue d’être sélectionné. Par exemple, vous pouvez utiliser un générateur de nombres aléatoires pour sélectionner un échantillon aléatoire simple parmi votre population.

Although this procedure reduces the risk of sampling bias, it cannot eliminate it. If your sampling frame – the actual list of individuals from which the sample is drawn – does not match the population, this can result in a biased sample.

You want to study the levels of procrastination and social anxiety among undergraduate students at your university using a simple random sample. You assign a number to each student in the research participant database, from 1 to 1,500, and use a random number generator to select 120 numbers.

Même si vous avez utilisé un échantillon aléatoire, tous les membres de votre population cible – les étudiants de premier cycle de votre université – n’avaient pas la chance d’être sélectionnés. Votre échantillon ne contient pas toutes les personnes qui ne se sont pas inscrites pour être contactées au sujet de leur participation à la recherche. Cela peut biaiser votre échantillon en faveur de personnes qui souffrent moins d’anxiété sociale et sont plus disposées à participer à la recherche.

A non-probability sample is selected based on non-random criteria. For example, in a convenience sample, participants are selected based on their accessibility and availability.

L’échantillonnage non probabiliste donne souvent lieu à des échantillons biaisés, car certains membres de la population sont plus susceptibles d’être inclus que d’autres.

Vous souhaitez étudier la popularité des aliments à base de plantes auprès des étudiants de premier cycle de votre université. Pour plus de commodité, vous envoyez un sondage à toutes les personnes inscrites aux cours d’introduction à la psychologie de votre université. Ils le complètent tous en échange de crédits de cours.

Since this is a convenience sample, it is not representative of your target population. People taking this course may be more liberal and attracted to plant-based foods than other students at your university.

Types of Sampling Bias

Self-selection bias

People with specific characteristics are more likely than others to agree to participate in a study.
People who seek more thrills are likely to participate in pain research studies. This can skew the data.

Non-response bias

People who refuse to participate or drop out of a study differ systematically from those who participate.
In a study on stress and workload, employees with high workload were less likely to participate. The resulting sample may not vary significantly in terms of workload.

Undercount bias

Some members of a population are insufficiently represented in the sample.
Administering general national surveys online risks overlooking groups with limited Internet access, such as older adults and low-income households.

Survivorship bias

Les observations réussies, les personnes et les objets sont plus susceptibles d’être représentés dans l’échantillon que les observations infructueuses.
In scientific journals, there is a strong publication bias towards positive results. Successful research results are published much more often than unsuccessful results.

Pre-selection or advertising bias

La façon dont les participants sont présélectionnés ou l’endroit où une étude est annoncée peut biaiser un échantillon.
When looking for volunteers to test a new sleep intervention, you may end up with a sample that is more motivated to improve their sleep habits than the rest of the population. As a result, they could have improved their sleep habits regardless of the effects of your intervention.

Healthy User Bias

Volunteers for preventive interventions are more likely to engage in health-promoting behaviors and activities than other members of the population.
Un échantillon participant à une intervention préventive a une meilleure alimentation, des niveaux d’activité physique plus élevés, s’abstient de consommer de l’alcool et évite de fumer plus que la plupart de la population. Les résultats expérimentaux peuvent résulter de l’interaction du traitement avec ces caractéristiques de l’échantillon, plutôt que du simple traitement lui-même.

How to avoid sampling bias

Using careful research design and sampling procedures can help you avoid sampling bias.

Define a target population and a sampling frame (the list of individuals from which the sample will be drawn). Match the sampling frame to the target population as much as possible to reduce the risk of sampling bias.

Make online surveys as short and accessible as possible.

Follow up on non-respondents.

Évitez l’échantillonnage de commodité.

Le suréchantillonnage peut être utilisé pour éviter les biais d’échantillonnage dans les situations où les membres de groupes définis sont sous-représentés (sous-dénombrement). Il s’agit d’une méthode de sélection des répondants dans certains groupes afin qu’ils constituent une part plus importante de l’échantillon que celle de la population.

Une fois toutes les données collectées, les réponses des groupes suréchantillonnés sont pondérées par rapport à leur part réelle de la population afin d’éliminer tout biais d’échantillonnage.

Example of correction

Un chercheur souhaite étudier les opinions politiques de différents groupes ethniques aux États-Unis et se concentrer en profondeur sur les Américains d’origine asiatique, qui ne représentent que 5,6 % de la population américaine. Le chercheur souhaite étudier chaque groupe ethnique séparément, mais également rassembler suffisamment de données sur les Américains d’origine asiatique pour pouvoir tirer des conclusions précises.

Ils rassemblent un échantillon représentatif à l’échelle nationale, avec 1 500 répondants, qui suréchantillonne les Américains d’origine asiatique. La composition aléatoire est utilisée pour contacter les ménages américains, et des échantillons disproportionnellement plus importants sont prélevés dans des régions comptant plus d’Américains d’origine asiatique. Sur les 1 500 personnes interrogées, 336 sont des Américains d’origine asiatique. Sur la base de cette taille d’échantillon, le chercheur peut être sûr de ses conclusions sur les Américains d’origine asiatique.

Une pondération est appliquée pour garantir que les réponses des Américains d’origine asiatique représentent 5,6 % du total. Cela permet d’obtenir des estimations précises de l’échantillon dans son ensemble.