Análisis de sensibilidad basado en la varianza - Variance-based sensitivity analysis

El análisis de sensibilidad basado en la varianza (a menudo denominado método de Sobol o índices de Sobol , después de Ilya M. Sobol ) es una forma de análisis de sensibilidad global . Trabajando dentro de un marco probabilístico , descompone la varianza de la salida del modelo o sistema en fracciones que pueden atribuirse a entradas o conjuntos de entradas. Por ejemplo, dado un modelo con dos entradas y una salida, uno podría encontrar que el 70% de la varianza de la salida es causada por la varianza en la primera entrada, el 20% por la varianza en la segunda y el 10% debido a las interacciones entre las dos. Estos porcentajes se interpretan directamente como medidas de sensibilidad. Las medidas de sensibilidad basadas en la varianza son atractivas porque miden la sensibilidad en todo el espacio de entrada (es decir, es un método global), pueden manejar respuestas no lineales y pueden medir el efecto de interacciones en sistemas no aditivos .

Descomposición de varianza

Desde una perspectiva de caja negra , cualquier modelo puede verse como una función Y = f ( X ), donde X es un vector de d entradas de modelo inciertas { X 1 , X 2 , ... X d }, e Y es un modelo elegido. Salida del modelo univariante (tenga en cuenta que este enfoque examina las salidas del modelo escalar, pero se pueden analizar múltiples salidas mediante múltiples análisis de sensibilidad independientes). Además, se supondrá que las entradas se distribuyen de forma independiente y uniforme dentro de la unidad hipercubo, es decir, para . Esto no incurre en pérdida de generalidad porque cualquier espacio de entrada se puede transformar en este hipercubo unitario. f ( X ) puede descomponerse de la siguiente manera,

donde f 0 es una constante y f i es una función de X i , f ij una función de X i y X j , etc. Una condición de esta descomposición es que,

es decir, todos los términos de la descomposición funcional son ortogonales . Esto conduce a definiciones de los términos de la descomposición funcional en términos de valores esperados condicionales,

De lo cual se puede ver que f i es el efecto de variar X i solo (conocido como el efecto principal de X i ), y f ij es el efecto de variar X i y X j simultáneamente, adicional al efecto de su variaciones . Esto se conoce como interacción de segundo orden . Los términos de orden superior tienen definiciones análogas.

Ahora, asumiendo además que f ( X ) es integrable al cuadrado , la descomposición funcional puede elevarse al cuadrado e integrarse para dar,

Observe que el lado izquierdo es igual a la varianza de Y , y los términos del lado derecho son términos de varianza, ahora descompuestos con respecto a los conjuntos de X i . Esto finalmente conduce a la descomposición de la expresión de varianza,

dónde

,

y así. La notación X ~ i indica el conjunto de todas las variables excepto X i . La descomposición de la varianza anterior muestra cómo la varianza de la salida del modelo se puede descomponer en términos atribuibles a cada entrada, así como los efectos de interacción entre ellos. Juntos, todos los términos suman la varianza total de la salida del modelo.

Índices de primer orden

Una medida de sensibilidad S i basada en la varianza directa , denominada "índice de sensibilidad de primer orden", o "índice de efecto principal", se establece de la siguiente manera:

Ésta es la contribución a la varianza de salida del efecto principal de X i , por lo tanto, mide el efecto de variar X i solo , pero promediado sobre las variaciones en otros parámetros de entrada. Está estandarizado por la varianza total para proporcionar una contribución fraccionaria. Los índices de interacción de orden superior S ij , S ijk, etc. se pueden formar dividiendo otros términos en la descomposición de la varianza por Var ( Y ). Tenga en cuenta que esto tiene la implicación de que,

Índice de efecto total

Usando los índices S i , S ij y de orden superior dados anteriormente, se puede construir una imagen de la importancia de cada variable en la determinación de la varianza del producto. Sin embargo, cuando el número de variables es grande, esto requiere la evaluación de índices 2 d -1, que pueden ser demasiado exigentes desde el punto de vista informático. Por esta razón, se utiliza una medida conocida como "índice de efecto total" o "índice de orden total", S Ti . Esto mide la contribución a la varianza de salida de X i , incluida toda la varianza causada por sus interacciones, de cualquier orden, con cualquier otra variable de entrada. Se da como,

Tenga en cuenta que a diferencia del S i ,

debido al hecho de que el efecto de interacción entre, por ejemplo, X i y X j se cuenta tanto en S Ti como en S Tj. De hecho, la suma de S Ti solo será igual a 1 cuando el modelo sea puramente aditivo .

Cálculo de índices

Para funciones analíticamente tratables, los índices anteriores se pueden calcular analíticamente evaluando las integrales en la descomposición. Sin embargo, en la gran mayoría de los casos se estiman, esto generalmente se hace mediante el método de Monte Carlo .

Secuencias de muestreo

Un ejemplo de construcción de matrices A B i con d = 3 y N = 4.

El enfoque de Monte Carlo implica generar una secuencia de puntos distribuidos aleatoriamente dentro de la unidad hipercubo (estrictamente hablando, estos serán pseudoaleatorios ). En la práctica, es habitual sustituir secuencias aleatorias por secuencias de baja discrepancia para mejorar la eficiencia de los estimadores. Esto se conoce entonces como el método cuasi-Monte Carlo . Algunas secuencias de discrepancia baja comúnmente utilizadas en el análisis de sensibilidad incluyen la secuencia de Sobol y el diseño de hipercubo latino .

Procedimiento

Para calcular los índices utilizando el método (cuasi) Monte Carlo, se siguen los siguientes pasos:

  1. Genere una matriz de muestra de N × 2 d , es decir, cada fila es un punto de muestra en el hiperespacio de 2 d dimensiones. Esto debe hacerse con respecto a las distribuciones de probabilidad de las variables de entrada.
  2. Utilizar el primer d columnas de la matriz como matriz A , y los restantes d columnas como matriz B . Esto efectivamente da dos muestras independientes de N puntos en el hipercubo de la unidad d- dimensional.
  3. Construya d más N × d matrices A B i , para i = 1,2, ..., d, de modo que la i- ésima columna de A B i sea ​​igual a la i- ésima columna de B , y las columnas restantes sean de Una .
  4. Las matrices A , B y d A B i en total especifican N ( d +2) puntos en el espacio de entrada (uno para cada fila). Ejecute el modelo en cada punto de diseño en las matrices A , B y A B i , dando un total de N ( d +2) evaluaciones del modelo: las correspondientes f ( A ), f ( B ) yf ( A B i ) valores.
  5. Calcule los índices de sensibilidad utilizando los estimadores siguientes.

La precisión de los estimadores es por supuesto dependiente de N . El valor de N puede elegirse sumando puntos secuencialmente y calculando los índices hasta que los valores estimados alcancen una convergencia aceptable. Por esta razón, cuando se utilizan secuencias de baja discrepancia, puede ser ventajoso utilizar aquellas que permiten la adición secuencial de puntos (como la secuencia de Sobol), en comparación con las que no lo hacen (como las secuencias de hipercubo latino).

Estimadores

Hay varios estimadores de Monte Carlo posibles disponibles para ambos índices. Dos que son actualmente de uso generalizado son,

y

para la estimación de S i y S Ti respectivamente.

Gasto computacional

Para la estimación de S i y S Ti para todas las variables de entrada, se requieren ejecuciones del modelo N ( d +2). Dado que N suele ser del orden de cientos o miles de ejecuciones, los gastos de cálculo pueden convertirse rápidamente en un problema cuando el modelo requiere una cantidad significativa de tiempo para una sola ejecución. En tales casos, hay una serie de técnicas disponibles para reducir el costo computacional de estimar índices de sensibilidad, como emuladores , HDMR y FAST .

Ver también

Referencias