Les sondages sont utiles lorsqu'on veut obtenir des renseignements au sujet d'un grand nombre de personnes. Il faut parler à un petit nombre de personnes (l'échantillon) et généraliser les résultats à un plus grand nombre de gens (la population). L'échantillonnage est un procédé complexe qui requiert une quantité de statistiques et des ordinateurs. Il est important d'en comprendre la logique de base pour être en mesure de dire à une firme de sondage ce qu'on veut savoir et pour pouvoir vérifier si la firme effectue réellement la tâche voulue.
D'abord, on doit se poser la question suivante : « Je veux savoir quelque chose de quelle population? » Tous les électeurs? Seulement les électeurs potentiels? Seulement les hommes ou seulement les femmes? Seulement les jeunes ou les personnes plus âgées? Seulement les « Noirs » ou les « Blancs »?
L'élaboration d'un échantillon d'une grande population est comparable à la préparation d'une soupe. Lorsque l'on brasse un grand bol de soupe, on n'a qu'à goûter à deux ou trois cuillerées pour avoir une bonne idée de ce que le bol entier goûtera. Bien sûr, on présume que la soupe a été bien brassée et qu'il n'y a aucune possibilité que le sel et les pommes de terre soient collés au fond, ou que l'ail soit sur un seul côté du bol. N'importe laquelle de ces possibilités signifierait que les quelques cuillerées auxquelles on a goûté ne représentent pas tout le bol.
Si le bol est bien mélangé, quelques cuillerées qui sont choisies au hasard vont fournir une bonne idée du goût de la soupe, qu'il s'agisse d'une marmite sur votre cuisinière, d'une marmite contenant des quantités industrielles telles que celles qu'on retrouve dans les restaurants, ou d'une marmite de la grosseur d'un grand pays. Le même nombre de cuillerées fait l'affaire si le bol est bien mélangé. On peut avoir à augmenter légèrement le nombre de cuillerées, mais pas dans la même proportion que la grandeur du bol augmente.
Pourtant, peu de populations sont « bien mélangées » : il y a souvent des groupes dont les attitudes diffèrent beaucoup de celles d'autres groupes (tout comme il y a des ingrédients et assaisonnements qui ne goûtent pas pareil) qui ne sont pas éparpillés au hasard dans la population, mais qui ont tendance à se retrouver dans les mêmes régions, villes ou quartiers.
On veut minimiser la possibilité que l'échantillon oublie ou ne représente pas suffisamment un de ces groupes dans un échantillon choisi au hasard. En effet, en tentant de choisir un échantillon qui représente toute la population (ou le bol de soupe), on va probablement vouloir "stratifier" l'échantillon pour obtenir de petits sous-échantillons de chaque sous-groupe (et ainsi s'assurer qu'on a des sous-échantillons de pommes de terre, de riz et de tomates).
On aurait donc un échantillon qui représente les personnes de toutes les ethnicités et groupes linguistiques, de toutes les régions, qu'ils soient riches ou pauvres, et des milieux urbains et ruraux. Aussi, la grandeur du sous-échantillon doit être proportionnelle à la grandeur du sous-groupe. Par exemple, si la composante rurale d'une population est de 52 %, on doit s'assurer que la composante rurale de l'échantillon soit la même.
Si on a plus que deux sous-groupes, il faut choisir soigneusement la constitution de l'échantillon. Par exemple, un échantillon national en Afrique du Sud pourrait devoir être composé d'un certain nombre de personnes de couleur, de milieux ruraux dans une certaine province de même qu'un certain nombre de personnes africaines et blanches. Cela signifierait qu'il faudrait aussi inclure un certain nombre de personnes de régions métropolitaines de chaque groupe de cette province-là. Comme on peut le constater, cela devient très délicat. Un démographe ou un mathématicien professionnels peuvent aider dans cette tâche.
Dans certains cas, on peut choisir au hasard un sous-échantillon disproportionné. On fait ceci habituellemnt lorsqu'un sous-groupe désiré constitue une très petite proportion de la population voulue. Un échantillon proportionné en Afrique du Sud, par exemple, pourrait consister de seulement 9 % de personnes de couleur et 2 % de personnes de descendance indienne. Si pour des raisons de coût, notre échantillon national n'est que de 2 000 personnes, cela ne laisserait que moins de 200 personnes de couleur et environ 40 Indiens.
Il est possible que vous ne puissiez pas faire d'estimations statistiques en vous basant sur un sous-échantillon de quarante personnes. Même avec deux cents personnes, la marge statistique d'erreur risque d'être si élevée que les prévisions au sujet des électeurs de couleur ne seraient pas très utiles pour élaborer un programme éducatif destiné à ces communautés. Cela devient d'autant plus important si on veut examiner les différences entre les hommes et les femmes, entre les citadins et les campagnards, ou entre les partisans de différents partis, et ce, à l'intérieur des sous-échantillons des personnes de couleur et de descendance indienne. Le nombre de personnes qui participent au sondage dans ces sous-échantillons serait extrêmement petit.
Par conséquent, on pourrait « suréchantilloner » ces petits groupes. Même si on sait qu'un petit groupe ne mériterait que 40 entrevues afin que tout demeure proportionnel, on pourrait décider d'effectuer 100 entrevues afin d'obtenir des renseignements plus fiables. Une fois que les données sont recueillies, on peut corriger la disproportion de notre échantillon en pondérant les 100 entrevues à la baisse appropriée, afin qu'elles représentent la proportion juste de l'échantillon au complet.
La pondération est aussi utile quant à d'autres attributs démographiques pour lesquels les renseignements existent, mais sur lesquels on ne saura pas comment les personnes se classent avant qu'elles n'ouvrent la porte. Par exemple, il se peut que l'on sache combien d'hommes et de femmes il y a dans la population choisie et le nombre de personnes dans chacun des sous-groupes d'éducation. Toutefois, il est possible qu'on ne puisse pas stratifier l'échantillon selon ces traits a priori, car on ne saura pas si les personnes sont des hommes ou des femmes ni quel niveau d'éducation elles possèdent avant qu'elles n'ouvrent la porte.
Une fois que l'échantillon est établi, on n'a qu'à le comparer à la population véritable en tenant compte de la démographie d'où viennent nos renseignements. Ensuite, on doit pondérer de façon appropriée. Supposons qu'on interviewe proportionnellement deux fois autant de femmes qu'il y en a dans la population, il faudrait pondérer à la baisse de moitié chaque femme de l'échantillon, afin de ramener la proportion des femmes dans l'échantillon à la véritable proportion.
L'élaboration d'échantillons est un élément clé pour déterminer le coût d'un sondage. Les échantillons qui nécessitent une proportion élevée de personnes en milieu rural ont tendance à être assez dispendieux, étant donné les coûts relatifs aux déplacements des intervieweurs dans les régions éloignées.
Le fait d'effectuer des sondages en utilisant des échantillons représentatifs à l'échelle nationale requiert une infrastructure et un personnel considérables. Par conséquent, même s'ils sont en mesure de concevoir un projet de telle envergure et d'en analyser les résultats, la plupart des organismes non gouvernementaux vont tout de même retenir des sous-traitants professionnels pour effectuer les entrevues.