Muestra (estadísticas) - Sample (statistics)

Una representación visual de la selección de una muestra aleatoria simple

En estadística y metodología de investigación cuantitativa , una muestra es un conjunto de individuos u objetos recolectados o seleccionados de una población estadística mediante un procedimiento definido. Los elementos de una muestra se conocen como puntos de muestra , unidades de muestreo u observaciones. Cuando se concibe como un conjunto de datos, una muestra a menudo se denota con letras mayúsculas romanas como y , con sus elementos expresados ​​en minúsculas (p. Ej., ) Y el tamaño de la muestra indicado por la letra .

Por lo general, la población es muy grande, lo que hace que un censo o una enumeración completa de todos los individuos de la población sea impráctico o imposible. La muestra generalmente representa un subconjunto de tamaño manejable. Se recogen muestras y se calculan estadísticas a partir de las muestras, de modo que se puedan hacer inferencias o extrapolaciones de la muestra a la población.

La muestra puede extraerse de una población "sin reemplazo" (es decir, ningún elemento puede seleccionarse más de una vez en la misma muestra), en cuyo caso es un subconjunto de una población ; o 'con reemplazo' (es decir, un elemento puede aparecer varias veces en una muestra), en cuyo caso es un subconjunto múltiple.

Tipos de muestras

Una muestra completa es un conjunto de objetos de una población madre que incluye todos esos objetos que satisfacen un conjunto de criterios de selección bien definidos. Por ejemplo, una muestra completa de hombres australianos de más de 2 m consistiría en una lista de todos los hombres australianos de más de 2 m. Pero no incluiría a los machos alemanes, ni a las hembras australianas altas, ni a las personas de menos de 2 m. Por lo tanto, para compilar una muestra tan completa se requiere una lista completa de la población de padres, que incluya datos sobre la altura, el sexo y la nacionalidad de cada miembro de esa población de padres. En el caso de las poblaciones humanas, es poco probable que exista una lista tan completa (la población humana es de miles de millones). Pero estas muestras completas a menudo están disponibles en otras disciplinas, como el conjunto de jugadores en una liga deportiva importante, las fechas de nacimiento de los miembros de un parlamento o una lista completa de objetos astronómicos de magnitud limitada.

Una muestra insesgada (representativa) es un conjunto de objetos elegidos de una muestra completa, mediante un proceso de selección que no depende de las propiedades de los objetos. Por ejemplo, una muestra imparcial de hombres australianos de más de 2 m podría consistir en un subconjunto muestreado al azar del 1% de hombres australianos de más de 2 m. Pero uno elegido del registro electoral podría no ser imparcial ya que, por ejemplo, los hombres menores de 18 años no estarán en el registro electoral. En un contexto astronómico, una muestra no sesgada puede consistir en la fracción de una muestra completa para la que hay datos disponibles, siempre que la disponibilidad de los datos no esté sesgada por las propiedades de la fuente individual.

La mejor manera de evitar una muestra sesgada o poco representativa es seleccionar una muestra aleatoria, también conocida como muestra probabilística. Una muestra aleatoria se define como una muestra en la que cada miembro individual de la población tiene una probabilidad conocida distinta de cero de ser seleccionado como parte de la muestra. Varios tipos de muestras aleatorias son muestras aleatorias simples , muestras sistemáticas , muestras aleatorias estratificadas y muestras aleatorias agrupadas .

Una muestra que no es aleatoria se denomina muestra no aleatoria o muestreo no probabilístico . Algunos ejemplos de muestras no aleatorias son muestras de conveniencia , muestras de juicio , muestras intencionales , muestras por cuotas , muestras de bola de nieve , y los nodos de cuadratura en métodos cuasi-Monte Carlo .

Descripción matemática de muestra aleatoria

En términos matemáticos, dada una distribución de probabilidad F , una muestra aleatoria de longitud n (donde n puede ser cualquier número entero positivo) es un conjunto de realizaciones de n independientes , idénticamente distribuidas ( iid variables) al azar con distribución F .

Una muestra representa concretamente los resultados de n experimentos en los que se mide la misma cantidad. Por ejemplo, si queremos estimar la altura promedio de los miembros de una población en particular, medimos la altura de n individuos. Cada medición se extrae de la distribución de probabilidad F caracterización de la población, por lo que cada altura medida es la realización de una variable aleatoria con una distribución F . Tenga en cuenta que un conjunto de variables aleatorias (es decir, un conjunto de funciones mensurables) no debe confundirse con las realizaciones de estas variables (que son los valores que toman estas variables aleatorias). En otras palabras, es una función que representa la medición en el i -ésimo experimento, y es el valor obtenido al realizar la medición.

Ver también

Notas

enlaces externos