Aleatorización restringida - Restricted randomization

En estadística , la aleatorización restringida se produce en el diseño de experimentos y, en particular, en el contexto de experimentos aleatorizados y ensayos controlados aleatorizados . La aleatorización restringida permite evitar asignaciones intuitivamente pobres de tratamientos a unidades experimentales, al tiempo que conserva los beneficios teóricos de la aleatorización. Por ejemplo, en un ensayo clínico de un nuevo tratamiento propuesto para la obesidad en comparación con un control, un experimentador querría evitar los resultados de la aleatorización en la que el nuevo tratamiento se asignó solo a los pacientes más pesados.

El concepto fue introducido por Frank Yates (1948) y William J. Youden (1972) "como una forma de evitar malos patrones espaciales de tratamientos en experimentos diseñados".

Ejemplo de datos anidados

Considere un proceso por lotes que usa 7 obleas de monitoreo en cada ejecución. El plan además requiere medir una variable de respuesta en cada oblea en cada uno de los 9 sitios. La organización del plan de muestreo tiene una estructura jerárquica o anidada: la ejecución por lotes es el nivel más alto, el segundo nivel es una oblea individual y el tercer nivel es el sitio en la oblea.

La cantidad total de datos generados por lote será 7 · 9 = 63 observaciones. Un enfoque para analizar estos datos sería calcular la media de todos estos puntos, así como su desviación estándar, y usar esos resultados como respuestas para cada ejecución.

Analizar los datos como se sugirió anteriormente no es absolutamente incorrecto, pero al hacerlo se pierde información que de otro modo se podría obtener. Por ejemplo, el sitio 1 en la oblea 1 es físicamente diferente del sitio 1 en la oblea 2 o en cualquier otra oblea. Lo mismo es cierto para cualquiera de los sitios en cualquiera de las obleas. De manera similar, la oblea 1 en la ejecución 1 es físicamente diferente de la oblea 1 en la ejecución 2, y así sucesivamente. Para describir esta situación, se dice que los sitios están anidados dentro de las obleas mientras que las obleas están anidadas dentro de los recorridos.

Como consecuencia de este anidamiento, existen restricciones sobre la aleatorización que pueden ocurrir en el experimento. Este tipo de aleatorización restringida siempre produce fuentes de variación anidadas. Los ejemplos de variación anidada o aleatorización restringida discutido en esta página son de parcela dividida y tira Diseños de parcela .

El objetivo de un experimento con este tipo de plan de muestreo es generalmente reducir la variabilidad debido a los sitios en las obleas y obleas dentro de las corridas (o lotes) en el proceso. Los sitios en las obleas y las obleas dentro de un lote se convierten en fuentes de variación no deseada y un investigador busca hacer que el sistema sea robusto para esas fuentes; en otras palabras, se podrían tratar las obleas y los sitios como factores de ruido en tal experimento.

Debido a que las obleas y los sitios representan fuentes de variación no deseadas y porque uno de los objetivos es reducir la sensibilidad del proceso a estas fuentes de variación, tratar las obleas y los sitios como efectos aleatorios en el análisis de los datos es un enfoque razonable. En otras palabras, la variación anidada es a menudo otra forma de decir efectos aleatorios anidados o fuentes de ruido anidadas. Si los factores "obleas" y "sitios" se tratan como efectos aleatorios, entonces es posible estimar un componente de varianza debido a cada fuente de variación mediante técnicas de análisis de varianza . Una vez que se han obtenido las estimaciones de los componentes de la varianza, un investigador puede determinar la fuente más grande de variación en el proceso bajo experimentación y también determinar las magnitudes de las otras fuentes de variación en relación con la fuente más grande.

Efectos aleatorios anidados

Si un experimento o proceso tiene variación anidada, el experimento o proceso tiene múltiples fuentes de error aleatorio que afectan su resultado. Tener efectos aleatorios anidados en un modelo es lo mismo que tener una variación anidada en un modelo.

Diseños de parcela dividida

Los diseños de parcelas divididas resultan cuando se ha producido un tipo particular de aleatorización restringida durante el experimento. Un experimento factorial simple puede resultar en un tipo de diseño de parcela dividida debido a la forma en que se ejecutó realmente el experimento.

En muchos experimentos industriales, a menudo ocurren tres situaciones:

  1. algunos de los factores de interés pueden ser "difíciles de variar" mientras que los factores restantes son fáciles de variar. Como resultado, el orden en el que se ejecutan las combinaciones de tratamiento para el experimento está determinado por el orden de estos factores 'difíciles de variar'
  2. Las unidades experimentales se procesan juntas como un lote para uno o más de los factores en una combinación de tratamiento particular.
  3. las unidades experimentales se procesan individualmente, una tras otra, para la misma combinación de tratamiento sin restablecer la configuración de factores para esa combinación de tratamiento.

Ejemplos experimentales de parcela dividida

Un experimento realizado en una de las tres situaciones anteriores generalmente da como resultado un tipo de diseño de parcela dividida. Considere un experimento para examinar la galvanoplastia de aluminio (no acuoso) en tiras de cobre. Los tres factores de interés son: corriente (A); temperatura de la solución (T); y la concentración de la solución del agente de recubrimiento (S). La tasa de recubrimiento es la respuesta medida. Hay un total de 16 tiras de cobre disponibles para el experimento. Las combinaciones de tratamientos que se ejecutarán (escaladas ortogonalmente) se enumeran a continuación en orden estándar (es decir, no se han aleatorizado):

Combinaciones de tratamientos a escala ortogonal de un factorial completo de 2 3
Actual La temperatura Concentración
−1 −1 −1
−1 −1 +1
−1 +1 −1
−1 +1 +1
+1 −1 −1
+1 −1 +1
+1 +1 −1
+1 +1 +1

Ejemplo: algunos factores difíciles de variar

Considere ejecutar el experimento bajo la primera condición mencionada anteriormente, siendo difícil variar la concentración de la solución de factor del agente de recubrimiento (S). Dado que este factor es difícil de variar, al experimentador le gustaría aleatorizar las combinaciones de tratamientos para que el factor de concentración de la solución tenga un número mínimo de cambios. En otras palabras, la aleatorización de las series de tratamiento está algo restringida por el nivel del factor de concentración de la solución.

Como resultado, las combinaciones de tratamientos pueden ser aleatorias de modo que las ejecuciones de tratamiento correspondientes a un nivel de concentración (-1) se ejecuten primero. Cada tira de cobre se platea individualmente, lo que significa que solo se coloca una tira a la vez en la solución para una combinación de tratamiento determinada. Una vez que se han completado las cuatro corridas al nivel bajo de concentración de la solución, la solución se cambia al nivel alto de concentración (1), y se realizan las cuatro corridas restantes del experimento (donde nuevamente, cada tira se platea individualmente).

Una vez que se ha completado una réplica completa del experimento, se realiza una segunda réplica con un conjunto de cuatro tiras de cobre procesadas para un nivel dado de concentración de solución antes de cambiar la concentración y procesar las cuatro tiras restantes. Tenga en cuenta que los niveles de los dos factores restantes aún se pueden aleatorizar. Además, el nivel de concentración que se ejecuta primero en las ejecuciones de replicación también se puede aleatorizar.

La ejecución del experimento de esta manera da como resultado un diseño de parcela dividida . La concentración de la solución se conoce como el factor de la parcela completa y los factores de la subparcela son la corriente y la temperatura de la solución.

Un diseño de parcela dividida tiene más de un tamaño de unidad experimental . En este experimento, una unidad experimental de un tamaño es una tira de cobre individual. Los tratamientos o factores que se aplicaron a las tiras individuales son la temperatura de la solución y la corriente (estos factores se cambiaron cada vez que se colocó una nueva tira en la solución). La otra unidad experimental o de mayor tamaño es un conjunto de cuatro tiras de cobre. El tratamiento o factor que se aplicó a un conjunto de cuatro tiras es la concentración de la solución (este factor se cambió después de que se procesaron cuatro tiras). La unidad experimental de menor tamaño se denomina unidad experimental de subparcela , mientras que la unidad experimental más grande se denomina unidad de parcela completa .

Hay 16 unidades experimentales de subparcelas para este experimento. La temperatura y la corriente de la solución son los factores secundarios de este experimento. Hay cuatro unidades experimentales de parcela completa en este experimento. La concentración de la solución es el factor de la parcela completa en este experimento. Como hay dos tamaños de unidades experimentales, hay dos términos de error en el modelo, uno que corresponde al error de toda la parcela o unidad experimental de toda la parcela y otro que corresponde al error de la subparcela o unidad experimental de la subparcela.

La tabla ANOVA para este experimento se vería, en parte, como sigue:

Tabla ANOVA parcial
Fuente DF
Replicación 1
Concentración 1
Error (parcela completa) = Rep × Conc 1
La temperatura 1
Rep × Temp 1
Actual 1
Rep × actual 1
Temp × Conc 1
Rep × Temp × Conc 1
Temp × actual 1
Rep × Temp × Actual 1
Actual × Conc 1
Rep × Actual × Conc 1
Temp × actual × Conc 1
Error (subparcela) = Rep × Temp × Actual × Conc 1

Las primeras tres fuentes son del nivel de la trama completa, mientras que las 12 siguientes son de la parte de la subtrama. Se podría usar una gráfica de probabilidad normal de las estimaciones de los 12 términos de la subparcela para buscar términos estadísticamente significativos .

Ejemplo: proceso por lotes

Considere ejecutar el experimento bajo la segunda condición mencionada anteriormente (es decir, un proceso por lotes) para el cual se colocan cuatro tiras de cobre en la solución a la vez. Se puede aplicar un nivel específico de corriente a una tira individual dentro de la solución. Se ejecutan las mismas 16 combinaciones de tratamientos (un factorial 2 3 replicado ) que se ejecutaron en el primer escenario. Sin embargo, la forma en que se realiza el experimento sería diferente. Hay cuatro combinaciones de tratamiento de temperatura y concentración de la solución: (-1, -1), (-1, 1), (1, -1), (1, 1). El experimentador elige al azar uno de estos cuatro tratamientos para configurar primero. Se colocan cuatro tiras de cobre en la solución. Dos de las cuatro tiras se asignan aleatoriamente al nivel de corriente bajo. Las dos tiras restantes se asignan al nivel de corriente alto. Se realiza el plateado y se mide la respuesta. Se elige una segunda combinación de tratamiento de temperatura y concentración y se sigue el mismo procedimiento. Esto se hace para las cuatro combinaciones de temperatura / concentración.

La ejecución del experimento de esta manera también da como resultado un diseño de parcela dividida en el que los factores de la parcela completa ahora son la concentración de la solución y la temperatura de la solución, y el factor de la subparcela es el actual.

En este experimento, una unidad experimental de un tamaño es nuevamente una tira de cobre individual. El tratamiento o factor que se aplicó a las tiras individuales es el actual (este factor se cambió cada vez para una tira diferente dentro de la solución). La otra unidad experimental o de mayor tamaño es nuevamente un conjunto de cuatro tiras de cobre. Los tratamientos o factores que se aplicaron a un conjunto de cuatro tiras son la concentración de la solución y la temperatura de la solución (estos factores se cambiaron después de que se procesaron cuatro tiras).

La unidad experimental de menor tamaño se denomina nuevamente unidad experimental de subparcela. Hay 16 unidades experimentales de subparcelas para este experimento. La corriente es el factor de la subtrama en este experimento.

La unidad experimental de mayor tamaño es la unidad experimental de parcela completa. Hay cuatro unidades experimentales de parcela completa en este experimento y la concentración de la solución y la temperatura de la solución son los factores de la parcela completa en este experimento.

Hay dos tamaños de unidades experimentales y hay dos términos de error en el modelo: uno que corresponde al error de la parcela completa o unidad experimental de la parcela completa, y otro que corresponde al error de la subparcela o unidad experimental de la subparcela.

El ANOVA para este experimento se ve, en parte, como sigue:

Tabla ANOVA parcial
Fuente DF
Concentración 1
La temperatura 1
Error (parcela completa) = Conc × Temp 1
Actual 1
Conc × actual 1
Temp × actual 1
Conc × Temp × Corriente 1
Error (trama secundaria) 8

Las primeras tres fuentes provienen del nivel de la parcela completa y las siguientes 5 provienen del nivel de la subparcela. Dado que hay 8 grados de libertad para el término de error de la subparcela, este MSE se puede usar para probar cada efecto que involucre corriente.

Ejemplo: unidades experimentales procesadas individualmente

Considere ejecutar el experimento en el tercer escenario mencionado anteriormente. Solo hay una tira de cobre en la solución a la vez. Sin embargo, dos tiras, una en la corriente baja y otra en la corriente alta, se procesan una tras otra bajo el mismo ajuste de temperatura y concentración. Una vez que se han procesado dos tiras, se cambia la concentración y se restablece la temperatura a otra combinación. Se vuelven a procesar dos tiras, una tras otra, bajo este ajuste de temperatura y concentración. Este proceso continúa hasta que se hayan procesado las 16 tiras de cobre.

La ejecución del experimento de esta manera también da como resultado un diseño de parcela dividida en el que los factores de la parcela completa son nuevamente la concentración de la solución y la temperatura de la solución y el factor de la subparcela es el actual. En este experimento, una unidad experimental de un tamaño es una tira de cobre individual. El tratamiento o factor que se aplicó a las tiras individuales es el actual (este factor se cambió cada vez para una tira diferente dentro de la solución). La otra unidad experimental o de mayor tamaño es un conjunto de dos tiras de cobre. Los tratamientos o factores que se aplicaron a un par de dos tiras son la concentración de la solución y la temperatura de la solución (estos factores se cambiaron después de que se procesaron dos tiras). La unidad experimental de menor tamaño se denomina unidad experimental de subparcela.

Hay 16 unidades experimentales de subparcelas para este experimento. La corriente es el factor de la subparcela del experimento. Hay ocho unidades experimentales de parcela completa en este experimento. La concentración de la solución y la temperatura de la solución son todos los factores de la trama. Hay dos términos de error en el modelo, uno que corresponde al error de la parcela completa o la unidad experimental de la parcela completa, y otro que corresponde al error de la subparcela o la unidad experimental de la subparcela.

El ANOVA para este (tercer) enfoque es, en parte, el siguiente:

Tabla ANOVA parcial
Fuente DF
Concentración 1
La temperatura 1
Conc * Temp 1
Error (trama completa) 4
Actual 1
Conc × actual 1
Temp × actual 1
Conc × Temp × Corriente 1
Error (trama secundaria) 4

Los primeros cuatro términos provienen del análisis de parcela completa y los siguientes 5 términos provienen del análisis de subparcela. Tenga en cuenta que tenemos términos de error separados tanto para la trama completa como para los efectos de la subparcela, cada uno basado en 4 grados de libertad.

Como puede verse en estos tres escenarios, una de las principales diferencias entre los diseños de parcelas divididas y los diseños factoriales simples es el número de diferentes tamaños de unidades experimentales en el experimento. Los diseños de parcelas divididas tienen más de un tamaño de unidad experimental, es decir, más de un término de error. Dado que estos diseños involucran diferentes tamaños de unidades experimentales y diferentes varianzas, los errores estándar de las diversas comparaciones de medias involucran una o más de las varianzas. Especificar el modelo apropiado para un diseño de parcela dividida implica poder identificar cada tamaño de unidad experimental. La forma en que se define una unidad experimental en relación con la estructura de diseño (por ejemplo, un diseño completamente aleatorizado versus un diseño de bloque completo aleatorizado ) y la estructura de tratamiento (por ejemplo, un factorial completo de 2 3 , una resolución V de media fracción, un diseño de dos forma estructura de tratamiento con un grupo de control , etc.). Como resultado de tener más de un tamaño de unidad experimental, el modelo apropiado utilizado para analizar diseños de parcelas divididas es un modelo mixto .

Si los datos de un experimento se analizan con un solo término de error utilizado en el modelo, se pueden extraer conclusiones engañosas e inválidas de los resultados.

Diseños de parcelas en franjas

Similar a un diseño de parcela dividida, un diseño de parcela de franjas puede resultar cuando se ha producido algún tipo de aleatorización restringida durante el experimento. Un diseño factorial simple puede resultar en un diseño de parcela de franjas dependiendo de cómo se realizó el experimento. Los diseños de parcelas de franjas a menudo son el resultado de experimentos que se llevan a cabo en dos o más pasos del proceso en los que cada paso del proceso es un proceso por lotes, es decir, completar cada combinación de tratamiento del experimento requiere más de un paso de procesamiento con unidades experimentales procesadas juntas en cada proceso. paso. Como en el diseño de parcelas divididas, los diseños de parcelas de franjas resultan cuando la aleatorización en el experimento se ha restringido de alguna manera. Como resultado de la aleatorización restringida que ocurre en los diseños de parcelas de franjas, existen múltiples tamaños de unidades experimentales. Por lo tanto, existen diferentes términos de error o diferentes variaciones de error que se utilizan para probar los factores de interés en el diseño. Un diseño tradicional de parcelas en franjas tiene tres tamaños de unidades experimentales.

Ejemplo de diagrama de bandas: dos pasos y tres variables de factor

Considere el siguiente ejemplo de la industria de los semiconductores. Un experimento requiere un paso de implante y un paso de recocido. Tanto en la etapa de recocido como en la de implante, hay tres factores a probar. El proceso de implantación admite 12 obleas en un lote, y la implantación de una sola oblea en un conjunto específico de condiciones no es práctica ni representa un uso económico del implantador. El horno de recocido puede manejar hasta 100 obleas.

Los ajustes para un diseño factorial de dos niveles para los tres factores en el paso del implante se indican (A, B, C) y un diseño factorial de dos niveles para los tres factores en el paso de recocido se indican (D, E, F ). También están presentes los efectos de interacción entre los factores de implante y los factores de recocido. Por lo tanto, este experimento contiene tres tamaños de unidades experimentales, cada una de las cuales tiene un término de error único para estimar la importancia de los efectos.

Para dar un significado físico real a cada una de las unidades experimentales en el ejemplo anterior, considere cada combinación de implantes y pasos de recocido como una oblea individual. Un lote de ocho obleas pasa primero por el paso del implante. La combinación de tratamiento 3 en los factores A, B y C es la primera ejecución de tratamiento con implantes. Este tratamiento de implante se aplica a las ocho obleas a la vez. Una vez finalizado el primer tratamiento de implante, se implanta otro conjunto de ocho obleas con la combinación de tratamiento 5 de los factores A, B y C. Esto continúa hasta que se implanta el último lote de ocho obleas con la combinación de tratamiento 6 de los factores A, B y C. Una vez que se han ejecutado las ocho combinaciones de tratamiento de los factores de implante, comienza el paso de recocido. La primera combinación de tratamiento de recocido que se ejecutará es la combinación de tratamiento 5 de los factores D, E y F. Esta combinación de tratamiento de recocido se aplica a un conjunto de ocho obleas, y cada una de estas ocho obleas proviene de una de las ocho combinaciones de tratamientos de implantes. Después de que se haya recocido este primer lote de obleas, el segundo tratamiento de recocido se aplica a un segundo lote de ocho obleas, y estas ocho obleas provienen de una de cada una de las ocho combinaciones de tratamientos de implantes. Esto se continúa hasta que el último lote de ocho obleas se haya implantado con una combinación particular de factores D, E y F.

La ejecución del experimento de esta manera da como resultado un diseño de parcela de franjas con tres tamaños de unidades experimentales. Un conjunto de ocho obleas que se implantan juntas es la unidad experimental para los factores de implante A, B y C y para todas sus interacciones. Hay ocho unidades experimentales para los factores de implante. Se recoce un conjunto diferente de ocho obleas. Este conjunto diferente de ocho obleas es la unidad experimental de segundo tamaño y es la unidad experimental para los factores de recocido D, E y F y para todas sus interacciones. La unidad experimental de tercer tamaño es una sola oblea. Esta es la unidad experimental para todos los efectos de interacción entre los factores de implante y los factores de recocido.

En realidad, la descripción anterior del diseño de parcelas en franjas representa un bloque o una réplica de este experimento. Si el experimento no contiene replicación y el modelo para el implante contiene solo los efectos principales y las interacciones de dos factores, el término de interacción de tres factores A * B * C (1 grado de libertad) proporciona el término de error para la estimación de efectos dentro de la unidad experimental de implantes. La invocación de un modelo similar para la unidad experimental de recocido produce el término de interacción de tres factores D * E * F para el término de error (1 grado de libertad) para los efectos dentro de la unidad experimental de recocido.

Ver también

Referencias

Otras lecturas

Para una discusión más detallada de estos diseños y los procedimientos de análisis apropiados, consulte:

  • Milliken, GA; Johnson, DE (1984). Análisis de datos desordenados . 1 . Nueva York: Van Nostrand Reinhold.
  • Miller, A. (1997). "Configuración Strip-Plot de factoriales fraccionales". Tecnometría . 39 (2): 153-161. doi : 10.2307 / 1270903 . JSTOR   1270903 .

enlaces externos

 Este artículo incorpora  material de dominio público del sitio web del Instituto Nacional de Estándares y Tecnología https://www.nist.gov .