Las encuestas son útiles cuando queremos saber sobre un
gran número de personas. La meta es hablar con un número menor de personas
(muestra) y generalizar a un gran grupo de personas (población). El muestreo es
generalmente complejo y usualmente requiere de muchas estadísticas y
computadoras. Pero es importante entender las bases lógicas para comunicar de
una forma inteligente a una compañía que realiza el trabajo de campo lo que se
quiere y para poder revisar de manera adecuada el resultado de ese trabajo.
¿Cuál es la población sobre la que usted quiere saber o
generalizar algo? ¿Sobre todos los votantes, sólo sobre los votantes
potenciales? ¿Acerca de los hombres o las mujeres? ¿Respecto de gente de edad avanzada o de los
jóvenes?
Extraer una muestra de una población grande puede ser
comparado con la elaboración de una sopa. Cuando uno mezcla una olla grande de
sopa, un buen cocinero dirá que con tan sólo dos o tres cucharadas uno puede
darse una idea razonable y confiable del sabor de toda la sopa. Obviamente esto
asume que la sopa ha sido bien mezclada y que, por lo tanto, la sal no se
amontonó en una sola esquina, o que las papas no están todas en el fondo de la
olla, o que el ajo no está solamente en un lado de la olla. Cualquiera de estas
posibilidades significaría que las cucharadas no estarían en la posibilidad de
medir el contenido completo de la olla.
De nuevo, asumiendo una olla bien mezclada, más o menos
el mismo número de cucharadas bien mezcladas nos daría una buena idea del
sabor, sin tener en cuenta si fue hecha en una olla casera o en una olla de
tamaño industrial de las que se usan en los restaurantes. El mismo número de
cucharadas darían lo mismo si la sopa está bien mezclada. La cantidad de
cucharadas deseadas variaría un poco, pero no se incrementaría tan rápido como
el tamaño de la olla.
Empero, muy pocas poblaciones están "bien
mezcladas": generalmente hay grupos (o una clase social) con actitudes que
difieren significativamente del resto de las personas (así como sabemos que hay
vegetales y condimentos diferentes) que no están repartidos al azar entre la
población, sino que tienden a agruparse en ciertas regiones o vecindarios.
Hay que minimizar, lo más que se pueda, la posibilidad de
que la muestra pueda ignorar o minimizar la representación de cualquiera de estos
grupos o estratos en una muestra diseñada como puramente aleatoria. En efecto,
mientras se intenta extraer una muestra que sea representativa de toda la
población (o la olla de sopa), probablemente también se quiera
"estratificar" la muestra y extraer pequeñas sub-muestras de cada uno
de los grupos deseados (asegurándose así de que existen sub-muestras de papas,
arroz y tomates).
Esto significa prestar atención a todos los tipos de
razas y grupos lingüísticos, todas la regiones, pobres o ricas, urbanas o
rurales, que hay que representar. Usualmente estos estratos tienen que ser
construidos de manera que sus tamaños sean proporcionales al tamaño de estrato
de la población real. De esta manera, si el componente rural de la población
deseada es el 52%, el componente rural de la muestra debe ser el mismo.
Ahora bien, una vez que se decide estratificar en más de
dos dimensiones, la selección de la composición de la muestra puede resultar
complicada. Una muestra nacional en Sudáfrica, por ejemplo, puede dictar que se
necesita un número determinado de personas de razas mixtas, personas rurales de
Cabo Oeste y también un número determinado de africanos y personas blancas
rurales, de la provincia. Esto también significa obtener un número de personas
de áreas metropolitanas para cada grupo de esta provincia. Como esto se puede
volver bastante difícil, puede ser que sea necesaria la colaboración de un
demógrafo o un matemático para encontrar la solución.
Sin embargo, en algunas instancias puede ser mejor tener
una muestra aleatoria estratificada desproporcionada. Esto sucede, en general,
cuando un sub-grupo deseado representa una proporción muy pequeña de la
población deseada. En Sudáfrica, por ejemplo, una muestra proporcionada
consistiría en alrededor de un 9% de personas de raza mixta y alrededor de un
2% de personas de origen hindú. Pero si, por razones de costo, la muestra
nacional es sólo de 2,000 personas, esto resultaría en menos de doscientas
personas de raza mixta y alrededor de cuarenta hindús a encuestar.
De todas formas, no es posible basar ningún estimado
estadístico confiable en una sub-muestra de cuarenta personas. Inclusive con
doscientas personas, el margen de error sería tan grande que las proyecciones
respecto a los votantes de raza mixta no ayudarían mucho a guiar un programa de
educación dirigido a estas comunidades. Esto sería aún más complicado si se
quisiera examinar las diferencias entre hombres y mujeres, urbanos y rurales o
quiénes apoyan los partidos, dentro de las sub-muestras de personas de raza
mixta y de ascendencia hindú. El número de personas que hubieran respondido dentro
de estos sub-grupos resultaría demasiado pequeño para que fuera útil.
De esta manera, se puede considerar utilizar una “muestra
sobre dimensionada” de pequeños grupos como estos. En ese caso, sabiendo que
algunos de los pequeños grupos en que se está interesado sólo ameritan cuarenta
entrevistados en una base de proporciones estrictas, se puede decidir
entrevistar a cien personas para obtener una base más confiable de información.
Una vez que todos los datos han sido seleccionados, esta muestra desproporcionada
es corregida "dando un peso" menor a las cien entrevistas en razón de
la tasa apropiada de forma que represente la proporción correcta de la muestra
completa.
Sopesar las muestras también es útil cuando se trata de
otros atributos demográficos importantes de los que ya existe información, pero
que se conocerán hasta que los encuestados abran sus puertas. Es posible que se
conozca, por ejemplo, el número de hombres y mujeres en una población deseada,
y el número de personas de diferentes estratos educativos. Pero quizás no se
pueda estratificar la muestra de acuerdo a estos rasgos a priori, porque
el entrevistador no sabrá, hasta que alguien abra la puerta o conteste el
teléfono, si es hombre o mujer o cuál es su grado de educación.
Una vez que la muestra esté hecha, se puede comparar con
la población real según las líneas demográficas de las cuales tiene
información, y después sopesar a las personas hacia arriba o hacia abajo en la
dirección apropiada. Imaginemos, por ejemplo, que en la muestra se contactaran
el doble de mujeres a las que verdaderamente existen en la totalidad de la
población. En este caso, cada mujer en la muestra sería sopesada, al final,
hacia abajo por la mitad, para llevar la proporción de mujeres de la muestra a
su proporción adecuada.
La construcción de muestras es determinante para los
costos de una encuesta dada. Las muestras que requieren una alta proporción de
personas del medio rural que respondan, tenderán a ser más costosas debido a
que los entrevistadores se tienen que trasladar a esas áreas.
Para lograr configurar muestras representativas en una
encuesta de bases nacionales, usualmente se requiere de una considerable
cantidad de infraestructura y personal. De esta manera, la mayoría de las
organizaciones no gubernamentales, aun si pueden diseñar el proyecto y son
capaces de analizar los resultados, necesitarán contratar una organización
profesional para que conduzca las entrevistas.