Un biais d’échantillonnage se produit lorsque certains membres d’une population sont systématiquement plus susceptibles d’être sélectionnés dans un échantillon que d’autres. On parle également de biais de vérification dans les domaines médicaux. Le biais d’échantillonnage limite la généralisabilité des results because it poses a threat to external validity, particularly population validity. In other words, results from biased samples can only be generalized to populations that share characteristics with the sample.
Your choice of design research or method data collection may result in sampling bias. This type of research bias can occur in both probability and non-probability sampling.
Dans l’échantillonnage probabiliste , chaque membre de la population a une chance connue d’être sélectionné. Par exemple, vous pouvez utiliser un générateur de nombres aléatoires pour sélectionner un échantillon aléatoire simple parmi votre population.
Although this procedure reduces the risk of sampling bias, it cannot eliminate it. If your sampling frame – the actual list of individuals from which the sample is drawn – does not match the population, this can result in a biased sample.
You want to study the levels of procrastination and social anxiety among undergraduate students at your university using a simple random sample. You assign a number to each student in the research participant database, from 1 to 1,500, and use a random number generator to select 120 numbers.
Même si vous avez utilisé un échantillon aléatoire, tous les membres de votre population cible – les étudiants de premier cycle de votre université – n’avaient pas la chance d’être sélectionnés. Votre échantillon ne contient pas toutes les personnes qui ne se sont pas inscrites pour être contactées au sujet de leur participation à la recherche. Cela peut biaiser votre échantillon en faveur de personnes qui souffrent moins d’anxiété sociale et sont plus disposées à participer à la recherche.
A non-probability sample is selected based on non-random criteria. For example, in a convenience sample, participants are selected based on their accessibility and availability.
L’échantillonnage non probabiliste donne souvent lieu à des échantillons biaisés, car certains membres de la population sont plus susceptibles d’être inclus que d’autres.
Vous souhaitez étudier la popularité des aliments à base de plantes auprès des étudiants de premier cycle de votre université. Pour plus de commodité, vous envoyez un sondage à toutes les personnes inscrites aux cours d’introduction à la psychologie de votre université. Ils le complètent tous en échange de crédits de cours.
Since this is a convenience sample, it is not representative of your target population. People taking this course may be more liberal and attracted to plant-based foods than other students at your university.
Self-selection bias
Non-response bias
Undercount bias
Survivorship bias
Pre-selection or advertising bias
Healthy User Bias
Using careful research design and sampling procedures can help you avoid sampling bias.
Define a target population and a sampling frame (the list of individuals from which the sample will be drawn). Match the sampling frame to the target population as much as possible to reduce the risk of sampling bias.
Make online surveys as short and accessible as possible.
Follow up on non-respondents.
Évitez l’échantillonnage de commodité.
Le suréchantillonnage peut être utilisé pour éviter les biais d’échantillonnage dans les situations où les membres de groupes définis sont sous-représentés (sous-dénombrement). Il s’agit d’une méthode de sélection des répondants dans certains groupes afin qu’ils constituent une part plus importante de l’échantillon que celle de la population.
Une fois toutes les données collectées, les réponses des groupes suréchantillonnés sont pondérées par rapport à leur part réelle de la population afin d’éliminer tout biais d’échantillonnage.
Un chercheur souhaite étudier les opinions politiques de différents groupes ethniques aux États-Unis et se concentrer en profondeur sur les Américains d’origine asiatique, qui ne représentent que 5,6 % de la population américaine. Le chercheur souhaite étudier chaque groupe ethnique séparément, mais également rassembler suffisamment de données sur les Américains d’origine asiatique pour pouvoir tirer des conclusions précises.
Ils rassemblent un échantillon représentatif à l’échelle nationale, avec 1 500 répondants, qui suréchantillonne les Américains d’origine asiatique. La composition aléatoire est utilisée pour contacter les ménages américains, et des échantillons disproportionnellement plus importants sont prélevés dans des régions comptant plus d’Américains d’origine asiatique. Sur les 1 500 personnes interrogées, 336 sont des Américains d’origine asiatique. Sur la base de cette taille d’échantillon, le chercheur peut être sûr de ses conclusions sur les Américains d’origine asiatique.
Une pondération est appliquée pour garantir que les réponses des Américains d’origine asiatique représentent 5,6 % du total. Cela permet d’obtenir des estimations précises de l’échantillon dans son ensemble.