Las encuestas son útiles cuando queremos saber sobre una gran número de personas. La meta es hablar con un número menor de personas (muestra) y generalizar a un gran grupo de personas (población). El muestreo es generalmente complejo y usualmente requiere muchas estadísticas y computadoras. Pero es importante entender las bases lógicas para que usted le pueda decir inteligentemente a una compañía que realiza el trabajo de campo lo que quiere revisar sobre sus labores desempeñadas.
Empiece por preguntarse a usted mismo, ¿Cuál es la población sobre la que usted quiere saber o generalizar algo? ¿todos son votantes? ¿tan solo son votantes potenciales? ¿hombres o mujeres? ¿gente de edad avanzada o jóvenes?
Dibujar una muestra de una población grande puede ser comparado con la elaboración de una sopa. Cuando usted mezcla una olla grande de sopa, un buen cocinero le dirá que con tan solo dos o tres cucharadas usted puede darse una idea razonable y confiable del sabor de toda la sopa. Obviamente se asume que usted mezcló bien la sopa y que la sal no se amontonó en una sola esquina, o que todas las papas están en el fondo, o que el ajo esta solamente a un lado de la olla. Cualquiera de estas posibilidades significaría que las cucharadas no estarían en la posibilidad de medir el contenido completo de la olla.
De nuevo, asumiendo una olla bien mezclada, mas o menos el mismo número de cucharadas bien mezcladas nos daría una buena idea del sabor, sin tener en cuenta si fue hecha en una olla casera o en una olla de tamaño industrial de las que se usan en los restaurantes o en una olla pequeña como las de la Unión Soviética. El mismo número de cucharadas darían lo mismo si la sopa esta bien mezclada. La cantidad de cucharadas deseadas variaría un poco, pero no se incrementaría tan rápido como el tamaño de la olla.
Empero, muy pocas poblaciones están "bien mezcladas": Generalmente hay grupos ( o una clase social) con actitudes que difieren significativamente del resto de las personas ( así como sabemos que hay diferentes vegetales y condimentos diferentes) que no están repartidos al azar entre la población, sino que tienden a agruparse en ciertas regiones o vecindarios.
Usted querrá entonces minimizar la posibilidad de que su muestra pueda fallar o no representar cualquiera de estos grupos o estratos en una muestra puramente aleatoria. En efecto, mientras intenta dibujar una muestra que sea representativa de toda la población, (o la olla de sopa), probablemente también querrá "estratificar" la muestra y dibujará las sub-muestras de los grupos deseados (estando seguros de que existen las sub-muestras de papa, arroz y tomate).
Esto quiere decir que usted prestó atención a todos los tipos de razas y grupos lingüísticos, todas la regiones, pobres o ricas, urbanas o rurales que hay que representar. Usualmente, usted desearía asegurarse que se construyeron estos estratos de acuerdo al tamaño real. De esta manera, si el componente rural de alguna población deseada es el 52%, nosotros querríamos asegurarnos que el componente rural de la muestra sea el mismo.
Si usted decide estratificar mas de dos dimensiones, la selección de la composición de la muestra puede resultar engañosa. Una muestra nacional en Sudáfrica, por ejemplo, puede dictar que necesitamos un numero determinado de personas de color, personas rurales de Western Cape y también un numero determinado de Africanos y personas blancas rurales, de la provincia. Como usted puede ver, esto se puede ser bastante incierto. Un demógrafo o un matemático entrenado pueden ayudar a solucionar este problema.
De todas formas, en algunas instancias usted va a querer dibujar una muestra aleatoria estratificada que resulte desproporcionada. Esto sucede cuando un sub-grupo deseado compromete a una proporción muy pequeña de la población deseada. Una muestra proporcionada en Sudáfrica, por ejemplo, consistiría alrededor de un 9% de personas de color y alrededor de un 2% de personas con tradición indígena. Pero si por razones de costo, nuestra muestra nacional fuera sólo de 2000 personas, esto nos dejaría con menos de doscientas personas de color y alrededor de cuarenta Indios, para que respondieran.
De todas formas, es probable que usted no pueda basar ninguna estadística confiable en una sub-muestra de cuarenta personas. Aun con doscientas personas, el margen de error de la estadística seria tan grande que las proyecciones respecto a los votantes de color no serian muy buenas para guiar un programa de educación dirigido a estas comunidades. Esto seria mucho más importante si usted quisiera examinar las diferencias entre hombres y mujeres, urbanos y rurales o quiénes apoyan los partidos, dentro de las sub-muestras de personas de color o Indios. El número de personas que responderían dentro de estos sub-grupos resultaría increíblemente pequeño.
De esta manera, usted quizás quiera "sobre medir" pequeños grupos como estos. En ese caso, sabiendo que algunos de los pequeños grupos en los que usted esta interesado solo ameritan cuarenta entrevistados en una base de proporciones estrictas, usted puede decidir entrevistar a cien personas para obtener una base confiable de información. Una vez todos los datos han sido seleccionados, usted corrige las desproporciones de la muestra "pesando" las cien entrevistas, hasta obtener la proporciones correctas de la muestra completa.
Pesar también es útil, cuando se trata de otros atributos demográficos importantes de los que ya existe información, pero no sabrá como se enfilan los que responden hasta que abran la puerta. Usted puede conocer cuántos hombres y cuántas mujeres hay en una población deseada, por ejemplo, y cuántas personas hay de diferentes estratos educativos. Pero usted quizás no pueda estratificar la muestra de acuerdo a estos rasgos a priori, porque usted no sabrá el grado de educación que tiene hasta que alguien abra la puerta o conteste el teléfono, sin importar si es hombre o mujer.
Una vez que la muestra esté hecha, simplemente puede compararla con la población actual según las líneas demográficas de las cuales tiene información, y después pesar a las personas hacia arriba o hacia abajo en la dirección apropiada. Imagine, por un momento, que usted contactó en su muestra, el doble de mujeres a las que verdaderamente existen en la totalidad de la población. En este caso, cada mujer en la muestra seria pesada hacia abajo por la mitad, para llevar la proporción de mujeres de la muestra a su proporción real.
La construcción de muestras es una clave determinante para los costos de una encuesta dada. Las muestras que requieren una alta proporción de personas rurales para que respondan, tenderán a ser más costosas debido a que los entrevistadores se tienen que transportar a las áreas rurales.
Para lograr configurar muestras representativas en una encuesta de bases nacionales, usualmente se requiere una considerable cantidad de infraestructura y personal. De esta manera, la mayoría de las organizaciones no gubernamentales, aun si pueden diseñar el proyecto y son capaces de analizar los resultados, necesitarán contratar una organización profesional para que conduzca las entrevistas.