Muestreo de encuestas - Survey sampling

En estadística , el muestreo de encuestas describe el proceso de seleccionar una muestra de elementos de una población objetivo para realizar una encuesta. El término " encuesta " puede referirse a muchos tipos o técnicas de observación diferentes. En el muestreo de encuestas, la mayoría de las veces implica un cuestionario que se utiliza para medir las características y / o actitudes de las personas. Las diferentes formas de contactar a los miembros de una muestra una vez seleccionados son el tema de la recopilación de datos de la encuesta . El propósito del muestreo es reducir el costo y / o la cantidad de trabajo que se necesitaría para encuestar a toda la población objetivo. Una encuesta que mide toda la población objetivo se llama censo . Una muestra se refiere a un grupo o sección de una población de la que se va a obtener información.

Las muestras de encuestas se pueden dividir en dos tipos: muestras probabilísticas y supermuestras. Las muestras basadas en probabilidades implementan un plan de muestreo con probabilidades específicas (quizás probabilidades adaptadas especificadas por un procedimiento adaptativo). El muestreo basado en probabilidades permite inferencias basadas en el diseño sobre la población objetivo. Las inferencias se basan en una distribución de probabilidad objetiva conocida que se especificó en el protocolo del estudio. Las inferencias de encuestas basadas en probabilidades aún pueden sufrir muchos tipos de sesgos.

Las encuestas que no se basan en un muestreo probabilístico tienen mayor dificultad para medir su sesgo o error de muestreo . Las encuestas basadas en muestras no probabilísticas a menudo no representan a las personas de la población objetivo.

En la investigación de encuestas académicas y gubernamentales, el muestreo probabilístico es un procedimiento estándar. En los Estados Unidos, la "Lista de estándares para encuestas estadísticas" de la Oficina de Administración y Presupuesto establece que las encuestas financiadas con fondos federales deben realizarse:

seleccionar muestras utilizando métodos estadísticos generalmente aceptados (por ejemplo, métodos probabilísticos que pueden proporcionar estimaciones del error de muestreo). Cualquier uso de métodos de muestreo no probabilísticos (por ejemplo, muestras de corte o basadas en modelos) debe justificarse estadísticamente y ser capaz de medir el error de estimación.

El muestreo aleatorio y la inferencia basada en el diseño se complementan con otros métodos estadísticos, como el muestreo asistido por modelos y el muestreo basado en modelos.

Por ejemplo, muchas encuestas tienen cantidades sustanciales de falta de respuesta. Aunque las unidades se eligen inicialmente con probabilidades conocidas, se desconocen los mecanismos de falta de respuesta. Para las encuestas con una falta sustancial de respuesta, los estadísticos han propuesto modelos estadísticos con los que se analizan los conjuntos de datos.

Las cuestiones relacionadas con el muestreo de encuestas se discuten en varias fuentes, incluidas Salant y Dillman (1994).

Muestreo de probabilidad

En una muestra probabilística (también llamada muestra "científica" o "aleatoria") cada miembro de la población objetivo tiene una probabilidad conocida y distinta de cero de ser incluido en la muestra. Una encuesta basada en una muestra probabilística puede, en teoría, producir mediciones estadísticas de la población objetivo que son:

Una muestra de encuesta basada en la probabilidad se crea mediante la construcción de una lista de la población objetivo, llamada marco de muestreo , un proceso aleatorio para seleccionar unidades del marco de muestra, llamado procedimiento de selección, y un método para contactar unidades seleccionadas para permitirles completar la encuesta, denominada método o modo de recopilación de datos. Para algunas poblaciones objetivo, este proceso puede resultar sencillo; por ejemplo, muestrear a los empleados de una empresa utilizando listas de nómina. Sin embargo, en poblaciones grandes y desorganizadas, la simple construcción de un marco muestral adecuado suele ser una tarea compleja y costosa.

Los métodos comunes para realizar una muestra probabilística de la población de hogares en los Estados Unidos son el muestreo de probabilidad de área, el muestreo de teléfono con marcación aleatoria de dígitos y, más recientemente, el muestreo basado en direcciones.

Dentro del muestreo probabilístico, existen técnicas especializadas como el muestreo estratificado y el muestreo por conglomerados que mejoran la precisión o eficiencia del proceso de muestreo sin alterar los principios fundamentales del muestreo probabilístico.

La estratificación es el proceso de dividir a los miembros de la población en subgrupos homogéneos antes del muestreo, basándose en información auxiliar sobre cada unidad de muestra. Los estratos deben ser mutuamente excluyentes: cada elemento de la población debe asignarse a un solo estrato. Los estratos también deben ser colectivamente exhaustivos: no se puede excluir ningún elemento de la población. Entonces se pueden aplicar métodos como el muestreo aleatorio simple o el muestreo sistemático dentro de cada estrato. La estratificación a menudo mejora la representatividad de la muestra al reducir el error de muestreo.

Sesgo en el muestreo probabilístico

El sesgo en las encuestas es indeseable, pero a menudo inevitable. Los principales tipos de sesgo que pueden ocurrir en el proceso de muestreo son:

  • Sesgo de no respuesta : Cuando los individuos u hogares seleccionados en la muestra de la encuesta no pueden o no completar la encuesta existe la posibilidad de sesgo que el resultado de esta falta de respuesta. El sesgo de falta de respuesta ocurre cuando el valor observado se desvía del parámetro de población debido a diferencias entre los encuestados y los no encuestados.
  • Sesgo de respuesta : esto no es lo opuesto al sesgo de no respuesta, sino que se relaciona con una posible tendencia de los encuestados a dar respuestas inexactas o falsas por varias razones.
  • Sesgo de selección: El sesgo de selección ocurre cuando algunas unidades tienen una probabilidad de selección diferente que el investigador no tiene en cuenta. Por ejemplo, algunos hogares tienen varios números de teléfono, lo que los hace más propensos a ser seleccionados en una encuesta telefónica que los hogares con un solo número de teléfono. Este sesgo de selección se corregiría aplicando una ponderación de la encuesta igual a [1 / (# de números de teléfono)] a cada hogar.
  • Sesgo de autoselección : un tipo de sesgo en el que los individuos se seleccionan voluntariamente a sí mismos en un grupo, lo que puede sesgar potencialmente la respuesta de ese grupo.
  • Sesgo de participación : Sesgo que surge debido a las características de quienes optan por participar en una encuesta o sondeo.
  • Sesgo de cobertura: el sesgo de cobertura puede ocurrir cuando los miembros de la población no aparecen en el marco de la muestra (subcobertura). El sesgo de cobertura ocurre cuando el valor observado se desvía del parámetro de población debido a diferencias entre las unidades cubiertas y no cubiertas. Las encuestas telefónicas adolecen de una fuente bien conocida de sesgo de cobertura porque no pueden incluir hogares sin teléfono.

Muestreo no probabilístico

Muchas encuestas no se basan en muestras probabilísticas, sino más bien en encontrar una colección adecuada de encuestados para completar la encuesta. Algunos ejemplos comunes de muestreo no probabilístico son:

  • Muestras de juicio: un investigador decide qué miembros de la población incluir en la muestra en función de su juicio. El investigador puede proporcionar alguna justificación alternativa para la representatividad de la muestra. El supuesto subyacente es que el investigador seleccionará unidades que sean características de la población. Este método puede estar sujeto a los sesgos y la percepción del investigador.
  • Muestras de bolas de nieve: se utilizan a menudo cuando la población objetivo es escasa. Los miembros de la población objetivo reclutan a otros miembros de la población para la encuesta.
  • Muestras de cuotas : la muestra está diseñada para incluir un número designado de personas con ciertas características específicas. Por ejemplo, 100 bebedores de café. Este tipo de muestreo es común en las encuestas de investigación de mercado no probabilísticas.
  • Muestras de conveniencia : la muestra se compone de las personas a las que se puede acceder más fácilmente para completar la encuesta.

En las muestras no probabilísticas, la relación entre la población objetivo y la muestra de la encuesta es inconmensurable y el sesgo potencial es incognoscible. Los usuarios sofisticados de muestras de encuestas no probabilísticas tienden a ver la encuesta como una condición experimental, más que como una herramienta para la medición de la población, y examinan los resultados para establecer relaciones internamente consistentes.

Ver también

Referencias

Otras lecturas

El libro de texto de Groves et alia proporciona una descripción general de la metodología de la encuesta, incluida la literatura reciente sobre el desarrollo de cuestionarios (informada por la psicología cognitiva ):

Los otros libros se centran en la teoría estadística del muestreo de encuestas y requieren cierto conocimiento de estadística básica, como se analiza en los siguientes libros de texto:

El libro de primaria de Scheaffer et alia usa ecuaciones cuadráticas del álgebra de la escuela secundaria:

  • Scheaffer, Richard L., William Mendenhal y R. Lyman Ott. Muestreo de encuestas elementales , Quinta Edición. Belmont: Duxbury Press, 1996.

Se requieren más estadísticas matemáticas para Lohr, para Särndal et alia y para Cochran (clásico):

Los libros de importancia histórica de Deming y Kish siguen siendo valiosos para los científicos sociales (en particular sobre el censo de EE. UU. Y el Instituto de Investigación Social de la Universidad de Michigan ):

enlaces externos