Variación estructural - Structural variation

La variación estructural genómica es la variación en la estructura del cromosoma de un organismo . Consiste en muchos tipos de variación en el genoma de una especie y, por lo general, incluye tipos microscópicos y submicroscópicos , como deleciones, duplicaciones, variantes de número de copias , inserciones, inversiones y translocaciones . Originalmente, una variación de estructura afecta a una longitud de secuencia de aproximadamente 1 kb a 3 Mb, que es más grande que los SNP y más pequeña que la anomalía cromosómica (aunque las definiciones tienen cierta superposición). Sin embargo, la gama operativa de variantes estructurales se ha ampliado para incluir eventos> 50 pb. La definición de variación estructural no implica nada sobre frecuencia o efectos fenotípicos. Muchas variantes estructurales están asociadas con enfermedades genéticas , sin embargo, muchas no lo están. Investigaciones recientes sobre SV indican que los SV son más difíciles de detectar que los SNP. Aproximadamente el 13% del genoma humano se define como variante estructural en la población normal, y hay al menos 240 genes que existen como polimorfismos de deleción homocigotos en poblaciones humanas, lo que sugiere que estos genes son prescindibles en humanos. La evidencia que se acumula rápidamente indica que las variaciones estructurales pueden comprender millones de nucleótidos de heterogeneidad dentro de cada genoma, y ​​es probable que hagan una contribución importante a la diversidad humana y la susceptibilidad a las enfermedades.

Variación estructural microscópica

Microscópico significa que puede detectarse con microscopios ópticos , como aneuploidías , cromosomas marcadores , reordenamientos macroscópicos y variación en el tamaño de los cromosomas. Se cree que la frecuencia en la población humana está subestimada debido al hecho de que algunos de estos no son realmente fáciles de identificar. Estas anomalías estructurales existen en 1 de cada 375 nacidos vivos según información putativa.

Variación estructural submicroscópica

Las variantes estructurales submicroscópicas son mucho más difíciles de detectar debido a su pequeño tamaño. El primer estudio en 2004 que utilizó microarrays de ADN pudo detectar decenas de loci genéticos que exhibían variaciones en el número de copias , deleciones y duplicaciones , superiores a 100 kilobases en el genoma humano. Sin embargo, en 2015, los estudios de secuenciación del genoma completo podrían detectar alrededor de 5,000 variantes estructurales tan pequeñas como 100 pares de bases que abarcan aproximadamente 20 megabases en cada genoma individual. Estas variantes estructurales incluyen eliminaciones, duplicaciones en tándem, inversiones , inserciones de elementos móviles . La tasa de mutación también es mucho más alta que las variantes estructurales microscópicas, estimadas por dos estudios en 16% y 20% respectivamente, ambas probablemente subestimadas debido a los desafíos de detectar con precisión las variantes estructurales. También se ha demostrado que la generación de variantes estructurales espontáneas aumenta significativamente la probabilidad de generar más variantes espontáneas de un solo nucleótido o indeles dentro de las 100 kilobases del evento de variación estructural.

Variación del número de copias

La variación del número de copias (CNV) es una gran categoría de variación estructural, que incluye inserciones , eliminaciones y duplicaciones . En estudios recientes, las variaciones en el número de copias se prueban en personas que no tienen enfermedades genéticas, utilizando métodos que se utilizan para el genotipado cuantitativo de SNP. Los resultados muestran que el 28% de las regiones sospechosas en los individuos en realidad contienen variaciones en el número de copias. Además, las CNV en el genoma humano afectan a más nucleótidos que el polimorfismo de nucleótido único (SNP). También es digno de mención que muchas de las CNV no se encuentran en regiones codificantes. Debido a que las CNV generalmente son causadas por una recombinación desigual , secuencias similares generalizadas como LINE y SINE pueden ser un mecanismo común de creación de CNV.

Inversión

Se conocen varias inversiones relacionadas con las enfermedades humanas. Por ejemplo, la inversión recurrente de 400 kb en el gen del factor VIII es una causa común de hemofilia A , y las inversiones más pequeñas que afectan a la 2-sulfatasa idunorate (IDS) causarán el síndrome de Hunter . Más ejemplos incluyen el síndrome de Angelman y el síndrome de Sotos . Sin embargo, investigaciones recientes muestran que una persona puede tener 56 inversiones putativas, por lo que las inversiones que no son enfermedades son más comunes de lo que se suponía anteriormente. También en este estudio se indica que los puntos de corte de inversión se asocian comúnmente con duplicaciones segmentarias. Una inversión de 900 kb en el cromosoma 17 está bajo selección positiva y se prevé que aumente su frecuencia en la población europea.

Otras variantes estructurales

Pueden ocurrir variantes estructurales más complejas que incluyen una combinación de las anteriores en un solo evento. El tipo más común de variación estructural compleja son las duplicaciones no en tándem, donde la secuencia se duplica y se inserta en orientación invertida o directa en otra parte del genoma. Otras clases de variantes estructurales complejas incluyen deleción-inversión-deleciones, duplicación-inversión-duplicaciones y duplicaciones en tándem con deleciones anidadas. También hay translocaciones crípticas y disomía uniparental segmentaria (UPD). Hay informes cada vez mayores de estas variaciones, pero son más difíciles de detectar que las variaciones tradicionales porque estas variantes están equilibradas y los métodos basados ​​en matrices o basados ​​en PCR no pueden localizarlas.

Variación estructural y fenotipos

Se sospecha que algunas enfermedades genéticas son causadas por variaciones estructurales, pero la relación no es muy segura. No es plausible dividir estas variantes en dos clases como "normal" o "enfermedad", porque la producción real de la misma variante también variará. Además, algunas de las variantes se seleccionan positivamente para (mencionadas anteriormente). Una serie de estudios ha demostrado que los genes que alteran las NVC espontáneas ( de novo ) alteran los genes con una frecuencia aproximadamente cuatro veces mayor en el autismo que en los controles y contribuyen a aproximadamente el 5-10% de los casos. Las variantes heredadas también contribuyen a alrededor del 5-10% de los casos de autismo.

Las variaciones estructurales también tienen su función en la genética de poblaciones. Se puede usar una frecuencia diferente de una misma variación como marca genética para inferir la relación entre poblaciones en diferentes áreas. Una comparación completa entre la variación estructural de humanos y chimpancés también sugirió que algunos de estos pueden estar fijos en una especie debido a su función adaptativa. También hay deleciones relacionadas con la resistencia contra la malaria y el SIDA . Además, se cree que algunos segmentos muy variables se deben a la selección equilibrada, pero también hay estudios en contra de esta hipótesis.

Base de datos de variación estructural

Algunos de los navegadores del genoma y las bases de datos bioinformáticas tienen una lista de variaciones estructurales en el genoma humano con énfasis en las CNV, y pueden mostrarlas en la página de navegación del genoma, por ejemplo, UCSC Genome Browser . Debajo de la página que visualiza una parte del genoma, hay "CNV de células comunes" y "Var estructural" que se pueden habilitar. En NCBI, hay una página especial para variaciones estructurales. En ese sistema, se muestran tanto las coordenadas "internas" como las "externas"; ambos no son puntos de ruptura reales, sino un rango de secuencia mínimo y máximo supuestamente afectado por la variación estructural. Los tipos se clasifican en inserción, pérdida, ganancia, inversión, LOH, evertido, transchr y UPD.

Métodos de detección

Firmas y patrones de SV para eliminación (A), inserción de secuencia novedosa (B), inversión (C) y duplicación en tándem (D) en recuento de lectura (RC), par de lectura (RP), lectura dividida (SR), y métodos de ensamblaje de novo (AS).

Se han desarrollado nuevos métodos para analizar la variación estructural genética humana a altas resoluciones. Los métodos utilizados para probar el genoma son de una manera dirigida específica o de una manera amplia del genoma. Para las pruebas de todo el genoma, los enfoques de hibridación del genoma comparativo basados ​​en matrices brindan las mejores exploraciones de todo el genoma para encontrar nuevas variantes de número de copias. Estas técnicas utilizan fragmentos de ADN que están marcados a partir de un genoma de interés y se hibridan, con otro genoma etiquetado de manera diferente, a matrices manchadas con fragmentos de ADN clonados. Esto revela diferencias en el número de copias entre dos genomas.

Para los exámenes del genoma dirigidos, los mejores ensayos para verificar áreas específicas del genoma se basan principalmente en la PCR. El mejor establecido de los métodos basados ​​en PCR es la reacción en cadena de la polimerasa cuantitativa en tiempo real (qPCR). Un enfoque diferente es verificar específicamente ciertas áreas que rodean duplicaciones segmentarias conocidas, ya que generalmente son áreas de variación en el número de copias. Se puede utilizar un método de genotipado de SNP que ofrece intensidades de fluorescencia independientes para dos alelos para apuntar a los nucleótidos entre dos copias de una duplicación segmentaria. A partir de esto, se puede observar un aumento en la intensidad de uno de los alelos en comparación con el otro.

Con el desarrollo de la tecnología de secuenciación de próxima generación (NGS), se han informado cuatro clases de estrategias para la detección de variantes estructurales con datos de NGS, cada una de las cuales se basa en patrones que son diagnósticos de diferentes clases de SV.

  • Los métodos de lectura en profundidad o lectura-recuento asumen una distribución aleatoria (por ejemplo, distribución de Poisson ) de lecturas a partir de una secuencia de lectura corta. Se investiga la divergencia de esta distribución para descubrir duplicaciones y eliminaciones. Las regiones con duplicación mostrarán una mayor profundidad de lectura, mientras que aquellas con eliminación resultarán en una menor profundidad de lectura.
  • Los métodos de lectura dividida permiten la detección de inserciones (incluidas las inserciones de elementos móviles ) y eliminaciones hasta una resolución de un solo par de bases. La presencia de un SV se identifica a partir de una alineación discontinua con el genoma de referencia. Un espacio en la lectura marca una eliminación y en la referencia marca una inserción.
  • Los métodos de lectura de pares examinan la longitud y la orientación de las lecturas de los extremos emparejados a partir de datos de secuenciación de lectura corta. Por ejemplo, los pares de lectura más separados de lo esperado indican una eliminación. Las translocaciones, inversiones y duplicaciones en tándem también se pueden descubrir utilizando pares de lectura.
  • El ensamblaje de secuencia de novo se puede aplicar con lecturas que sean lo suficientemente precisas. Si bien en la práctica el uso de este método está limitado por la longitud de las lecturas de secuencia, los ensamblajes genómicos basados ​​en lecturas largas ofrecen el descubrimiento de variaciones estructurales para clases tales como inserciones que escapan a la detección cuando se usan otros métodos.

Ver también

Referencias

enlaces externos