Se rendre chez les gens
Une fois qu’on a terminé l’élaboration de l’échantillon global, soit la taille de l’échantillon total, et fixé le nombre d’entrevues à mener auprès de chaque sous-groupe, la prochaine étape consiste à faire passer les entrevues à l’échantillon.
On peut alors procéder en ayant recours à au moins deux moyens très différents. La principale distinction réside dans le choix entre un échantillonnage aléatoire et un échantillonnage par quotas.
L’échantillonnage aléatoire
Ici, chaque personne dans la population a une chance égale et connue d’être sélectionnée au sein de l’échantillon final. Ceci suppose que l’on connaît la taille de la population. Si cette taille est « n », alors la probabilité qu’une personne soit sélectionnée équivaut à 1/n.
S’il y a une liste de toutes les personnes appartenant à une population donnée, un échantillonnage aléatoire pur voudra dire de choisir au hasard des noms à partir de cette liste jusqu’à ce que le nombre désiré soit atteint. Si l’échantillon comprend des sous-groupes (p. ex. les personnes vivant en milieu urbain ou rural), alors il faudra choisir un nombre X de noms provenant de la liste des personnes vivant en milieu urbain, et un nombre Y de noms provenant de la liste des personnes vivant en milieu rural. Une fois l’échantillon choisi, ensuite il s’agira simplement de rendre visite à ces personnes, de les contacter par téléphone ou de leur envoyer le questionnaire par la poste.
Par ailleurs, même lorsqu’existe une liste comportant le nom de tous les citoyens, procéder à des entrevues en personne à partir d’un échantillonnage aléatoire peut s’avérer extrêmement onéreux. Il est coûteux de déplacer des intervieweurs dans les différents endroits sélectionnés par la procédure de l’échantillonnage aléatoire, sans tenir compte de la distance qui sépare un lieu d’un autre. Ainsi, la plupart des stratégies ayant trait aux entrevues en personne utilisent l’échantillonnage aléatoire en grappes. Ceci signifie que l’on réduit les coûts de déplacement en envoyant un groupe d’intervieweurs vers un lieu sélectionné au hasard afin qu’ils y mènent une série d’entrevues.
L’échantillonnage en grappes est très populaire parce qu’il réduit les coûts, mais aussi parce que très souvent, une liste de noms n’est pas disponible. Plusieurs pays, provinces ou municipalités ne disposent pas d’une telle liste, ou s’ils en ont une, ils refusent de la partager avec un chercheur.
Ainsi, même si on connaît probablement la taille de la population globale et le nombre de personnes résidant dans diverses régions ou appartenant à divers sous-groupes, il se peut qu’il n’y ait aucune liste avec le nom des gens. L’échantillonnage en grappes autour de points d’échantillonnage aide les chercheurs à rejoindre les foyers ainsi qu’à conserver le caractère aléatoire et une probabilité égale de sélection.
Ceci voudra dire la sélection d’une série d’unités primaires d’échantillonnage (UPE). Les UPE sont les plus petites unités à partir desquelles les points finaux d’échantillonnage seront choisis au hasard. Les UPE se composent des plus petites unités géographiques qui soient pour lesquelles il existe des données fiables sur la population (et pour la plupart de sondages, ceci veut dire la population ayant 18 ans et plus). Dans certains comtés disposant de bonnes données sur le recensement, elles peuvent être appelées « zones de recensement ».
Les points finaux d’échantillonnage ne peuvent pas être choisis au hasard à partir de ces UPE parce que celles-ci auront presque toujours des tailles différentes de la population. Même là où il y a des zones de recensement découlant d’un recensement comportant un nombre déterminé de ménages (par exemple au Zimbabwe, chaque zone de recensement compte 100 ménages), le nombre de personnes par ménage variera. Ainsi, il faut pondérer chaque UPE possible en fonction du nombre réel de gens qu’on y retrouve; ainsi, la possibilité de sélectionner un point final d’échantillonnage à partir d’une UPE doit être proportionnelle à la taille de la population réelle de l’UPE.
Dès qu’on a pondéré chaque UPE avec la taille de sa population, les points finaux d’échantillonnage peuvent alors être sélectionnés de manière aléatoire à partir de la liste des UPE. Le nombre réel des points finaux d’échantillonnage sera déterminé par le nombre d’entrevues à mener à chaque point et par la taille totale de l’échantillon. Dans la plupart des sondages, on effectue a de cinq à sept entrevues à chaque point. Conséquemment, si cinq entrevues sont menées à chaque point et la taille de l’échantillon global est de 2500, une liste de 500 points finaux d’échantillonnage doit être sélectionnée au hasard.
À présent, nous savons où nous voulons aller. Par exemple, la production d’une liste pourrait révéler 350 villes de banlieue – certaines des plus peuplées pourraient être sélectionnées plus d’une fois – et 150 districts judiciaires en milieu rural. Les sondeurs chercheront ensuite des cartes pour chacune de ces zones, et sélectionneront au hasard un point dans une ville de banlieue. Ceci peut devenir assez compliqué : par exemple, certains chercheurs appliqueront un transparent comportant des points numérotés et placés de manière aléatoire, puis sélectionneront un nombre au hasard et chercheront la rue sur la carte qui se trouve sous le point numéroté. Et c’est à cet endroit qu’ils enverront les intervieweurs.
À plusieurs endroits, aucune carte digne de ce nom n’existe, ou alors l’échelle des cartes rurales sera si grande qu’elle indiquera seulement l’emplacement des villes, mais non pas les avenues. Dans ce cas, l’on pourrait s’inspirer d’une règle donnée, soit commencer à un point commun, tel qu’une église, une école, un bâtiment municipal ou un abreuvoir.
Dès que les intervieweurs connaissent les points où ils doivent se rendre, ils devraient alors suivre un ensemble de règles leur permettant de sélectionner des maisons, toujours de manière aléatoire, par exemple en se rendant à un point convenu, en faisant face au soleil, en regardant vers l’Est pour ensuite choisir dix maisons, et faire une entrevue à chaque cinquième maison. La règle doit s’appuyer sur l’aspect aléatoire, mais toutes les entrevues doivent se faire de la même façon – l’idée étant que l’intervieweur ne devrait jouer aucun rôle dans le choix du ménage.
La toute dernière étape implique le choix d’un correspondant en chair et en os. Encore une fois, donner à une personne une chance égale d’être sélectionnée exige que les intervieweurs ne parlent pas uniquement aux personnes qui répondent à la porte ou au téléphone. S’ils travaillent avec un échantillon élaboré à partir d’un registre de la population, ils doivent alors s’adresser à la personne dont le nom figure effectivement sur la liste.
Si une telle liste n’existe pas, une fois que les intervieweurs sont à l’intérieur du domicile des gens ou s’ils ont quelqu’un au bout du fil, ils devront faire le recensement du ménage, soit établir une liste des personnes y habitant (et, en général, cela devrait comprendre les citoyens de 18 ans et plus). Ensuite, ils devront choisir un nom au hasard et interviewer cette personne et uniquement celle-ci. Une procédure commune pour choisir cette personne au hasard est de demander le nom de la personne dans le ménage qui a célébré son anniversaire le plus récemment. Dans les régions rurales, il arrive souvent que les gens sont frustrés de ne pas avoir l’occasion de s’exprimer (surtout le chef du ménage, si c’est un homme et qu’il n’est pas sélectionné) et ils peuvent ne pas comprendre la méthode de l’anniversaire. Une bonne façon de démontrer la logique du choix au hasard est de remettre à toutes les personnes admissibles une carte comportant chacune une couleur. Puis, on ramasse les cartes et on demande à quelqu’un dans la maison de piger une carte au hasard : la personne qui avait tenu cette carte précédemment est celle qu’il faut interroger.
Cependant, ce n’est pas à chaque porte où l’on frappe ou lors de chaque coup de fil que l’on donne qu’une entrevue pourra être réalisée avec succès. Dans bien des cas, les gens ne seront pas à la maison, d’autres y seront mais demeureront inaccessibles pour des raisons diverses, et plusieurs personnes refuseront tout simplement de parler aux intervieweurs. Tel qu’indiqué précédemment, autant que possible, il est important que les intervieweurs ne permettent pas aux gens de s’exclure d’eux-mêmes d’un échantillon. Il en est ainsi parce qu’il est possible que les gens soient absents de la maison ou que ceux ne voulant pas participer soient très différents de l’échantillon global. Les personnes qui seront probablement les plus présentes à la maison, particulièrement si les entrevues sont menées durant les jours de semaine, seront des jeunes, des chômeurs, des ménagères et des personnes âgées, et elles pourraient donc constituer un groupe dont le poids serait démesuré au sein de l’échantillon. Par ailleurs, les gens ne désirant pas parler aux intervieweurs ont tendance à démontrer plus de désaffection. Or, il importe qu’ils soient représentés au sein de tout échantillon, particulièrement s’il appert que la désaffection soit liée à un sujet d’intérêt comme le vote.
Les non réponses peuvent devenir problématiques pour le caractère représentatif d’un échantillon. Aux États-Unis, les taux de non réponses ont doublé depuis les années 1950; ils oscillaient de 12 % à 22 % et sont passés à des pourcentages de 30 % à 55 % dans le cas des entrevues en personnes et de 25 % à 35 % dans le cas des échantillons téléphoniques. En Afrique du Sud, lors de sondages menés en 1993 et 1994, les non réponses dépassaient le seuil de 100 % dans certaines communautés conservatrices blanches.
Une méthode que l’on utilise fréquemment pour corriger les non réponses est de pondérer les réponses obtenues en fonction des données connues du recensement. Ainsi, si on n’a pas interrogé un nombre suffisant d’hommes d’âge moyen, leurs réponses pourraient être pondérées à la hausse d’un léger pourcentage. Par exemple, si seulement la moitié du groupe que l’on voulait rejoindre dans l’échantillon a été effectivement rejoint, on multipliera simplement chaque cas par 1,5.
Cependant, ceci est problématique car cela suppose que les personnes n’ayant pas été incluses dans l’échantillon ou ayant refusé de répondre aux questions sont similaires à celles ayant été interrogées par rapport à l’ensemble des attitudes que cherchaient à étudier le sondage. Or, le simple fait que la personne n’était pas à la maison (probablement au travail ou en train de faire des courses) ou qu’elle a refusé de parler à l’intervieweur la rend probablement différente de ces personnes qui étaient à la maison ou qui ont accepté de parler avec l’intervieweur.
Il y a très peu de choses qui peuvent être faites pour minimiser l’incidence des personnes qui refusent de parler. Les intervieweurs doivent recevoir une formation poussée afin d’être aussi courtois que possible. De plus, le questionnaire doit comprendre une introduction qui rende le sondage aussi intéressant que possible pour le répondant, et lui faire savoir toute l’importance que l’on attache à ses opinions. Enfin, les intervieweurs devraient demander s’ils sont venus au bon moment, et si tel n’est pas le cas, accepter de prendre rendez-vous à un meilleur moment alors que le répondant sera libre et pourra consacrer du temps au sondage et se concentrer sur les questions.
Il existe plusieurs façons pour les intervieweurs de minimiser l’incidence des gens absents de la maison. Tout d’abord, ils devraient essayer de faire une grande partie des entrevues le soir et la fin de semaine. Les jours de semaine sont difficiles parce que les travailleurs sont à l’extérieur du domicile; en revanche, les ménagères pourraient être plus libres pour parler. Le pire moment est l’heure du dîner, alors que les gens sont occupés à préparer le repas ou à manger; c’est le moment où ils seront le plus agacés par le dérangement.
En deuxième lieu, les intervieweurs devraient consacrer beaucoup d’attention aux rappels. Par exemple, si la personne sur la liste ou la personne qui est sélectionnée au hasard au moyen de la méthode de l’anniversaire n’est pas disponible, les intervieweurs devraient demander le moment où cette personne est la plus susceptible d’être là et revenir à ce moment pour réaliser l’entrevue. La plupart des firmes de sondage demandent aux intervieweurs de faire au moins deux, voire trois rappels en vue de rejoindre la personne initialement choisie. Certains grands sondages fournissant de l’information sur le marketing dans les médias et sur l’utilisation de produits exigent quatre rappels.
Lorsque l’intervieweur a fait le nombre de rappels exigés et n’a pas eu de succès, à ce moment seulement pourra-t-il « remplacer » la personne initialement choisie par un autre répondant. Plus encore, il ne devrait pas la remplacer par une personne de la même maison. Il devrait plutôt suivre une règle, soit se déplacer de deux ou trois maisons vers la droite ou vers la gauche, ou composer un nouveau numéro en bas ou au-dessus du numéro initial dans la liste téléphonique, et refaire tout le processus.
L’idée est de fournir un effort additionnel pour s’assurer qu’on ne laisse pas les personnes qui seront probablement hors de la maison échapper facilement au sondage, et qu’on ne les remplace pas facilement avec le genre de personnes qu’il est davantage probable de retrouver à la maison.
L’avantage d’un échantillonnage aléatoire est qu’il permet aux chercheurs de bénéficier des lois mathématiques d’échantillonnage aux fins d’extrapoler les résultats de l’échantillon à l’ensemble de la population. Ces lois nous disent que la moyenne de tout échantillon choisi de manière aléatoire aura tendance à être égale à la moyenne de la population globale dont il provient. De manière plus précise, pour toute taille donnée d’un échantillon, ces lois prévoient des formules pour calculer exactement la marge d’erreur afférente à un échantillon; ainsi, pour une taille donnée d’échantillon, l’estimation provenant d’un échantillon sera plus ou moins la vraie moyenne de la population globale 95 fois sur 100. Il en est de même car si un grand nombre d’échantillons étaient choisis, les lois de la probabilité indiquent qu’environ 5 % tomberaient en dehors de la marge normale d’erreur. Cependant, mathématiquement parlant, 95 % des échantillons se retrouveraient près de la moyenne de la population. Plus grand sera l’échantillon, plus étroite sera la différence.
Les quotas
Une méthode alternative est l’échantillonnage par quotas. Ici, l’échantillon global élaboré pour représenter la population globale reprend les traits importants qui la caractérisent. Par exemple, on pourra décider que l’échantillon doit comprendre un pourcentage de gens venant de chaque province et de chaque ville, un certains pourcentage d’hommes, de femmes, de chaque groupe linguistique et de chaque groupe racial. Cependant, la sélection finale du répondant sera laissée à l’intervieweur.
Chaque intervieweur devra respecter un quota dans sa zone, c’est-à-dire une liste du nombre de personnes qu’il doit trouver et interroger et qui satisfont aux différentes catégories démographiques. Par exemple, on pourrait demander à un intervieweur qu’il trouve cinq Africains et six Africaines vivant dans les zones urbaines, ainsi que sept Africains et huit Africaines habitant en zone rurale. Cependant, on ne lui donnera pas d’instruction en ce qui concerne les maisons ou les rues où il doit se rendre, et on ne lui fournira aucun processus aléatoire à suivre. Il devra simplement trouver des personnes répondant aux catégories ciblées.
Puisque les intervieweurs n’ont pas à suivre tous les processus aléatoires décrits ci-dessus, il leur sera plus facile de trouver le nombre désiré de personnes à interroger, et ce, avec des coûts de déplacement bien moins élevés. Pour cette raison, l’échantillonnage par quotas est beaucoup moins coûteux que l’échantillonnage aléatoire.
Toutefois, puisque l’on fait fi de la probabilité égale et connue de l’inclusion qui caractérise l’échantillonnage aléatoire, le principal inconvénient provient du fait que les théories mathématiques de probabilité ne peuvent être appliquées pour extrapoler les résultats issus d’un échantillon par quotas à l’ensemble de la population. Il est possible de calculer la fréquence des réponses provenant d’un échantillon par quotas, mais à proprement parler, il est impossible de déterminer le degré de représentativité de ces résultats eu égard aux véritables valeurs de l’ensemble de la population.