Les visites à domicile
Une fois qu'on a décidé des paramètres généraux de l'échantillon, comme sa grandeur, le nombre d'entrevues à être effectuées dans chaque sous-groupe, etc., l'étape suivante est d'entamer les véritables entrevues. Il y a au moins deux différentes façons de procéder. Il faut décider si on veut un échantillon aléatoire ou un échantillon par contingents.
Échantillon aléatoire
Dans le cas d'un échantillon aléatoire, chaque membre de la population a une chance égale d'être choisi pour l'échantillon final, si l'on présume que l'on connaît la grandeur de la population. Si cette grandeur est « n », la probabilité qu'un individu soit choisi est de 1/n.
Lorsqu'on a une liste de toutes les personnes d'une population donnée, on peut tirer des noms de cette liste jusqu'à ce qu'on atteigne le nombre désiré. C'est ce qu'on appelle l'échantillonnage purement aléatoire. Ou si on stratifie l'échantillon en sous-groupes (par exemple, les personnes urbaines et rurales), on tire alors X noms de la liste urbaine et Y noms de la liste rurale. Une fois qu'on a tiré les noms qui formeront l'échantillon, on leur rend visite, on leur téléphone ou on leur poste le questionnaire.
Même si on possède une liste complète des personnes d'une population donnée, les entrevues personnelles menées à la suite d'un échantillonnage purement aléatoire ont tendance à être très coûteuses. Il faut débourser les frais de déplacements des interviewers à chaque endroit sélectionné par échantillonnage aléatoire et ce, peu importe la distance entre les endroits où ont lieu les entrevues. Par conséquent, la plupart des stratégies d'entrevue utilisées dépendent de l'échantillonnage aléatoire par grappes. Les coûts de déplacements sont donc minimisés puisqu'on envoie un groupe d'interviewers à un seul lieu, sélectionné de façon aléatoire, pour y mener une série d'entrevues.
L'échantillonnage par grappes est grandement utilisé vu qu'il permet la réduction des coûts et parce qu'on n'a pas toujours accès à une liste de noms. Plusieurs pays, provinces ou municipalités ne possèdent pas de telles listes ou, s'ils en ont, refusent de les partager avec des chercheurs. Par conséquent, il est possible de connaître le nombre de personnes dans une population et la répartition de ces personnes dans différentes régions ou différents sous-groupes, sans posséder une liste de noms individuels. L'échantillonnage par grappes aide à se rendre aux résidences individuelles tout en conservant le hasard et une probabilité équitable de sélection.
Ce processus implique ce qu'on appelle des « unités primaires d'échantillonnage » (UPE). Ces dernières sont les plus petites unités dont on tirera, au hasard, les sujets de l'échantillon. Il s'agit en réalité des plus petites unités géographiques qui fournissent des données fiables sur la population (et pour la plupart des sondages, on parle de population âgée de 18 ans et plus). Dans certains comtés où il y a de bonnes données sur le recensement, on peut nommer ces endroits « secteurs de recensement ».
On ne doit pas simplement tirer au hasard des lieux d'échantillonnage finaux à partir des UPE, car celles-ci ont presque toujours une population de taille différente. Le nombre de personnes dans chaque domicile va varier, même si l'on dispose de données basées sur des secteurs de recensement contenant un nombre égal de domiciles (par exemple, au Zimbabwe, les secteurs de recensement ont 100 domiciles chacun). Par conséquent, on doit pondérer chaque UPE potentielle par le nombre de personnes dans chacune de ces unités. La chance de sélectionner un sujet d'une UPE doit être proportionnelle à la population réelle de l'unité.
Une fois qu'on a pondéré chaque UPE selon sa population, on peut ensuite sélectionner les lieux d'échantillonnage finaux. Le nombre final de lieux d'échantillonnage est déterminé par le nombre d'entrevues qu'on veut mener à chaque lieu et par la grandeur totale de l'échantillon. Dans la plupart des sondages, on mène de cinq à sept entrevues à chaque lieu. Par conséquent, si on mène cinq entrevues à chaque lieu et que la grandeur de l'échantillon complet est de 2 500, on doit sélectionner au hasard une liste de 500 lieux d'échantillonnage.
Maintenant, on sait où on veut se diriger. Une liste pourrait énumérer 350 banlieues dont certaines risquent d'être sélectionnées plus d'une fois, et 150 districts judiciaires ruraux. Les chercheurs dans le domaine des sondages devront trouver des cartes de chacune de ces régions pour ensuite choisir au hasard un lieu dans chaque banlieue. Ce processus peut devenir très détaillé, car certains chercheurs superposeront une carte géographique transparente de lieux numérotés, sélectionneront un nombre au hasard et ensuite chercheront la rue sur la carte. C'est là qu'ils enverront finalement les interviewers.
Dans plusieurs régions, il n'y existe aucune bonne carte ou les cartes rurales risquent d'être à si grande échelle qu'elles ne montrent que l'emplacement des villes, mais pas celui des rues dans ces villes. Dans ce cas, on peut décider de partir d'un lieu connu tel qu'une église, une école, un édifice municipal ou un débit public d'eau.
Une fois que les interviewers savent de quel lieu partir, ils peuvent choisir des domiciles au hasard selon certaines règles. Par exemple, ils pourraient se rendre au lieu désigné, faire face au soleil ou à l'est, ensuite se rendre à dix maisons où ils mèneront des entrevues à chaque cinq maisons. Une fois que la méthode de sélection est établie, tous les interviewers doivent la suivre. Le but est que l'interviewer ne joue aucun rôle dans la sélection des domiciles.
La toute dernière étape consiste à rencontrer la personne qui répondra au sondage. L'interviewer doit parler à la personne dont le nom apparaît sur la liste et non à celle qui répond à la porte ou au téléphone.
Si on n'a pas une liste de noms, une fois qu'on est au domicile ou au téléphone, on doit faire l'inventaire des gens âgés de 18 ans et plus qui habitent dans le domicile. Ensuite, on choisit un nom au hasard et on interviewe cette personne seulement. Une méthode de sélection aléatoire populaire consiste à choisir la personne dont l'anniversaire de naissance est le plus récent. Dans les milieux ruraux, les personnes peuvent être navrées du fait de ne pas avoir la chance de s'exprimer (surtout si le chef de famille est un homme et qu'il n'est pas choisi) et elles risquent de ne pas comprendre la méthode de sélection par l'anniversaire. On peut donc leur démontrer la logique derrière la sélection au hasard en distribuant une carte de couleur à chacune des personnes admissibles pour ensuite les recueillir et demander à une des personnes de tirer une carte du paquet au hasard. La personne qui avait eu cette carte dans ses mains au début sera interviewée.
Les visites à domicile et les appels téléphoniques ne seront pas tous des entrevues bien réussies. Plusieurs personnes seront absentes de la maison. D'autres y seront, mais choisiront de demeurer inaccessibles ou refuseront tout simplement de parler. Il est primordial de ne pas permettre aux gens de s'auto-exclure d'un sondage, car les absents et ceux qui refusent de participer auront probablement des opinions fort différentes de ceux qui se retrouvent dans l'échantillon. Les personnes qui sont à la maison, surtout si on mène les entrevues durant les jours de semaine, ont plus de chance d'être des jeunes, des chômeurs, des femmes au foyer et des personnes âgées. Ceux qui refusent de parler aux interviewers ont tendance à s'isoler et on veut que ce genre de personnes soit représenté dans un échantillon, surtout si l'isolement est relié au thème étudié, comme la participation au vote.
L'absence de réponse peut miner le niveau de représentation de l'échantillon. Aux États-Unis, le taux d'absence de réponse a doublé depuis les années 1950, allant de 12 % à 22 % jusqu'à 30 % à 50 % pour les entrevues personnelles et jusqu'à 25 % à 35 % pour les entrevues par téléphone. En Afrique du Sud, le taux d'absence de réponse a atteint les 100% dans certaines communautés blanches en 1993 et en 1994.
Une façon de parer à l'absence de réponse est de pondérer les réponses obtenues selon les statistiques de recensement. Donc, s'il n'y a pas un nombre suffisant d'hommes d'âge moyen qui ont été interviewés, les réponses de ceux parmi cette catégorie qui ont répondu peuvent être pondérées à la hausse d'une fraction quelconque. Par exemple, s'il n'y a que la moitié des réponses dont on a réellement besoin pour notre échantillon, on multiplie le nombre par 1,5.
Cette méthode peut être problématique, étant donné qu'on prend pour acquis que ceux qui ne sont pas inclus dans l'échantillon ou qui ont refusé de l'être ont des attitudes semblables à ceux qu'on a interviewés. Toutefois, le fait que les personnes n'étaient pas à la maison ou qu'elles refusaient de parler signifie probablement qu'elles ont des opinions différentes de celles qui étaient à la maison et qui ont accepté de parler.
Il y a quelques trucs qu'on peut adopter afin de minimiser la fréquence des gens qui refusent de nous parler. Les interviewers doivent être très bien formés à être aussi courtois que possible. Le questionnaire devrait inclure une introduction qui le rend aussi intéressant que possible à la personne qui y répondra. Il devrait également communiquer à la personne l'importance d'émettre ses opinions. L'interviewer devrait demander s'il est venu à un moment opportun et sinon, il devrait offrir de revenir quand la personne sera disponible et qu'elle pourra consacrer un certain temps à se concentrer sur les questions.
On peut essayer de minimiser l'effet de l'absence des gens. On peut effectuer un grand nombre des entrevues le soir et durant la fin de semaine. Les jours de semaine ne sont pas idéaux pour effectuer un sondage, car les personnes sont au travail, mais les femmes au foyer, elles, ont peut-être le temps de parler. Le pire temps semble être à l'heure des repas alors que les gens sont occupés à faire à manger ou qu'ils mangent, et deviennent irrités si on les dérange.
On peut aussi consacrer beaucoup d'attention aux rappels. Si la personne sur la liste ou la personne qu'on a choisie au hasard selon l'anniversaire de naissance n'est pas disponible, on devrait demander quand cette personne sera de retour afin d'obtenir une entrevue avec elle. La plupart des compagnies de sondage exigent que les interviewers fassent au moins deux, même trois rappels, afin de parler à la personne sélectionnée. Certaines grandes compagnies de sondage qui fournissent des renseignements sur les stratégies de commercialisation et l'usage des médias et des produits rappellent les personnes quatre fois.
L'interviewer ne devrait pas substituer une personne avant d'avoir effectué le nombre requis de rappels. De plus, il ne devrait pas remplacer la personne par une autre qui habite dans la même maison. Il doit plutôt suivre une règle telle que celle de se rendre à la deuxième ou troisième maison à la droite ou à la gauche, ou celle de téléphoner au numéro au-dessus ou au-dessous de l'original.
Encore une fois, le but est de faire l'effort de s'assurer que les gens qui ont plus de chance d'être absents du domicile ne soient pas facilement éliminés de l'échantillon ni remplacés par des personnes qui ont plus de chances d'être à la maison.
L'avantage d'un échantillon aléatoire est qu'il nous permet de bénéficier des lois mathématiques d'échantillonnage, qui permettent de généraliser les résultats de l'échantillon à une plus grande population. Ces lois dictent que la moyenne d'un échantillon choisi au hasard a tendance à être équivalente à la population en général. Plus précisément, ces lois fournissent les formules qui permettent de calculer la marge d'erreur exacte de n'importe quel échantillon. On sait que pour un échantillon donné, une estimation de l'échantillon se situera à plus ou moins la marge d'erreur de la moyenne réelle de la population en général, et ce, 95 % du temps. C'est ainsi parce que si on tirait un plus grand échantillon, les lois de probabilité indiqueraient qu'environ 5 % des échantillons se trouvent à l'extérieur de la marge d'erreur normale. Plus l'échantillon est grand, plus la marge d'erreur est étroite.
Méthode par contingents
Une méthode différente est l'échantillon par contingents. Dans ce cas, l'échantillon doit représenter la population selon toutes ses distinctions. Par exemple, l'échantillon comporterait certains pourcentages de chaque province et de chaque ville, d'hommes et de femmes, de chaque groupe linguistique et de chaque groupe ethnique. Toutefois, la sélection finale d'une personne qui répond aux questions, revient à l'interviewer. On donne à ce dernier un quota à atteindre, c'est-à-dire un nombre de personnes dans chaque catégorie démographique, qu'il doit trouver et interviewer. On peut dire à l'interviewer qu'il doit trouver cinq Africains et six Africaines qui habitent dans des milieux urbains, et sept Africains et huit Africaines qui habitent dans des milieux ruraux. Toutefois, on ne dit pas à l'interviewer à quelles maisons se rendre, ni sur quelles rues aller ni quel processus aléatoire suivre. Il doit tout simplement trouver des personnes qui répondent aux critères de chaque catégorie.
Étant donné que les interviewers ne sont pas chargés de tous les processus de sélection au hasard décrits ci-haut, ils peuvent obtenir le nombre de personnes à interviewer plus rapidement et avec des frais de déplacements plus minimes. Ceci rend l'échantillon par quotas plus abordable qu'un échantillon aléatoire.
Toutefois, le plus grand désavantage est qu'on ne peut pas se servir des théories mathématiques de probabilité pour faire des inférences sur la population à partir d'un échantillon par quotas, étant donné qu'on a abandonné la probabilité connue qui caractérise l'échantillon aléatoire. On peut calculer la fréquence des réponses d'un échantillon par quotas, mais on ne peut pas déterminer à quel point ces résultats représentent les valeurs réelles de la population en général.