ARN quimérico - Chimeric RNA

El ARN quimérico , a veces denominado transcrito de fusión , está compuesto por exones de dos o más genes diferentes que tienen el potencial de codificar proteínas nuevas. Estos ARNm son diferentes de los producidos por empalme convencional, ya que son producidos por dos o más loci de genes.

Revisión de la producción de ARN

El camino del ADN a la expresión de proteínas es fundamental para el dogma central de la biología.

En 1956, Francis Crick propuso lo que ahora se conoce como el " dogma central " de la biología:

El ADN codifica la información genética necesaria para que un organismo lleve a cabo su ciclo de vida. De hecho, el ADN sirve como "disco duro" que almacena datos genéticos. El ADN se replica y sirve como su propia plantilla para la replicación. El ADN forma una estructura de doble hélice y está compuesto por un esqueleto de azúcar-fosfato y bases nitrogenadas; esto se puede considerar como una estructura de escalera donde los lados de la escalera están construidos con azúcar desoxirribosa y fosfato, mientras que los peldaños de la escalera están compuestos de bases nitrogenadas emparejadas . Hay cuatro bases en una molécula de ADN: adenina (A), citosina (C), timina (T) y guanina (G). Los nucleótidos son un componente estructural del ADN y el ARN, y están compuestos por una molécula de azúcar y una molécula de ácido fosfórico. La estructura de doble hélice del ADN se compone de dos hebras antiparalelas que están orientadas en direcciones opuestas. El ADN está compuesto por pares de bases en los que la adenina se empareja con la timina y la guanina se empareja con la citosina. Mientras que el ADN sirve como molde para la producción de ácido ribonucleico (ARN), el ARN suele ser responsable de la producción de proteínas. El proceso de producción de ARN a partir de ADN se llama transcripción. El ARN usa un conjunto similar de bases excepto que la timina se reemplaza con uracilo . Un grupo de enzimas llamadas ARN polimerasas (aisladas por los bioquímicos Jerard Hurwitz y Samuel B. Weiss) funcionan en presencia de ADN. Estas enzimas producen ARN utilizando segmentos de ADN cromosómico como plantilla. A diferencia de la replicación, donde se hace una copia completa del ADN, la transcripción copia solo el gen que se va a expresar como proteína.

Inicialmente, se pensó que el ARN servía como plantilla estructural para la síntesis de proteínas , esencialmente ordenando los aminoácidos por una serie de cavidades formadas específicamente para que solo encajaran aminoácidos específicos. Crick no quedó satisfecho con esta hipótesis dado que las cuatro bases del ARN son hidrófilas y que muchos aminoácidos prefieren interacciones con grupos hidrófobos. Además, algunos aminoácidos son muy similares estructuralmente y Crick consideró que no sería posible una discriminación precisa dadas las similitudes. Luego, Crick propuso que antes de la incorporación en proteínas, los aminoácidos se unen primero a moléculas adaptadoras que tienen características superficiales únicas que pueden unirse a bases específicas en las plantillas de ARN. Estas moléculas adaptadoras se denominan ARN de transferencia (ARNt).

A través de una serie de experimentos con E. coli y el fago T4 en 1960, se demostró que el ARN mensajero (ARNm) transporta información del ADN a los sitios ribosómicos de síntesis de proteínas. Los ribosomas colocan los precursores de tRNA-aminoácidos donde pueden leer la información proporcionada por las plantillas de mRNA para sintetizar la proteína.

Empalme de ARN

La creación de una proteína consta de dos pasos principales: la transcripción del ADN en ARN y la traducción del ARN en proteína. Después de que el ADN se transcribe en ARN, la molécula se conoce como ARN pre-mensajero (ARNm) y consta de exones e intrones que se pueden dividir y reorganizar de muchas formas diferentes. Históricamente, los exones se consideran la secuencia codificante y los intrones se consideran el ADN "basura". Aunque se ha demostrado que esto es falso, es cierto que los exones a menudo se fusionan. Dependiendo de las necesidades de la célula, los mecanismos reguladores eligen qué exones, y a veces intrones, unir. Este proceso de eliminar fragmentos de una transcripción de pre-ARNm y combinarlos con otros fragmentos se denomina empalme. El genoma humano codifica aproximadamente 25.000 genes, pero se producen significativamente más proteínas. Esto se logra mediante el empalme de ARN. Los exones de estos 25.000 genes pueden empalmarse de muchas formas diferentes para crear innumerables combinaciones de transcripciones de ARN y, en última instancia, innumerables proteínas. Normalmente, los exones del mismo transcrito de pre-ARNm se cortan y empalman. Sin embargo, ocasionalmente los productos génicos o las transcripciones de pre-ARNm se empalman entre sí de manera que los exones de diferentes transcripciones se mezclan en un producto de fusión conocido como ARN quimérico. El ARN quimérico a menudo incorpora exones de genes altamente expresados, pero el propio transcrito quimérico se expresa generalmente a niveles bajos.

Este ARN quimérico se puede traducir luego en una proteína de fusión. Las proteínas de fusión son muy específicas de tejido y con frecuencia se asocian con cánceres como el colorrectal, el de próstata y el mesotelioma. Explotan significativamente los péptidos señal y las proteínas transmembrana que pueden alterar la localización de las proteínas, posiblemente contribuyendo al fenotipo de la enfermedad.

Descubrimiento de ARN quimérico

Uno de los primeros estudios para investigar la generación de ARN quimérico examinó la fusión de los primeros tres exones de un gen conocido como JAZF1 con los últimos 15 exones de un gen conocido como JJAZ1. Esta transcripción exacta y la proteína resultante se encontraron específicamente en el tejido endometrial. Aunque a menudo se encuentran en los cánceres de endometrio, estas transcripciones también se expresan en el tejido normal. Originalmente se pensó que era el resultado de fusiones cromosómicas, un grupo investigó si esto era exacto. Utilizando Southern blot y la hibridación in situ de fluorescencia (FISH) en el genoma, los investigadores no encontraron evidencia de reordenamiento del ADN. Decidieron investigar más mediante la combinación de células endometriales humanas con fibroblastos rhesus y encontraron productos quiméricos que contienen secuencias de ambas especies. Estos datos sugirieron que el ARN quimérico se genera empalmando partes de genes en lugar de reordenamientos cromosómicos. También realizaron espectrometría de masas en la proteína traducida para verificar que el ARN quimérico se traduce en proteína.

Recientemente, los avances en la secuenciación de próxima generación han reducido significativamente el costo de la secuenciación, lo que permite que se lleven a cabo más proyectos de RNAseq . Estos proyectos de RNAseq son capaces de detectar transcripciones de ARN novedosas en lugar del microarray tradicional en el que solo se pueden detectar transcripciones conocidas. La secuenciación profunda permite la detección de transcripciones incluso a niveles muy bajos. Esto ha permitido a los investigadores detectar muchos más ARN quiméricos y proteínas de fusión y ha facilitado la comprensión de su papel en la salud y la enfermedad.

Productos de proteína quimérica

Se han identificado numerosas transcripciones quiméricas putativas entre las etiquetas de secuencia expresadas utilizando tecnología de secuenciación de ARN de alto rendimiento . En los seres humanos, las transcripciones quiméricas se pueden generar de varias formas, como el empalme trans de pre-ARNm, el escurrimiento de la transcripción del ARN, a partir de otros errores en la transcripción del ARN o también pueden ser el resultado de la fusión de genes después de translocaciones o reordenamientos intercromosómicos . Entre los pocos productos proteicos correspondientes que se han caracterizado hasta ahora, la mayoría resulta de translocaciones cromosómicas y están asociados con el cáncer. Por ejemplo, la fusión de genes en la leucemia mielógena crónica (LMC) conduce a una transcripción de ARNm que abarca el extremo 5 'del gen de la proteína de la región de clúster del punto de ruptura (BCR) y el extremo 3' del homólogo 1 del oncogén viral de la leucemia murina de Abelson (ABL) gene. La traducción de esta transcripción da como resultado una proteína BCR-ABL quimérica que posee una mayor actividad de tirosina quinasa . Las transcripciones quiméricas caracterizan fenotipos celulares específicos y se sospecha que funcionan no solo en el cáncer, sino también en las células normales. Un ejemplo de quimera en células humanas normales se genera mediante el empalme en trans de los exones 5 'del gen JAZF1 en el cromosoma 7p15 y los exones 3' de JJAZ1 ( SUZ12 ) en el cromosoma 17q1. Este ARN quimérico se traduce en las células del estroma endometrial y codifica una proteína antiapoptótica. Ejemplos notables de genes quiméricos en el cáncer son los genes fusionados BCR-ABL, FUS - ERG , MLL -AF6 y MOZ-CBP expresados ​​en la leucemia mieloide aguda (AML), y la quimera TMPRSS2-ETS asociada con la sobreexpresión del oncogén en la próstata. cáncer.

Características de las proteínas quiméricas

Frenkel-Morgenstern y col. han definido dos características principales de las proteínas quiméricas. Han informado que las quimeras explotan péptidos señal y dominios transmembrana para alterar la localización celular de las actividades asociadas. En segundo lugar, las quimeras incorporan genes parentales que se expresan a un alto nivel. Un estudio de todos los dominios funcionales en proteínas codificadas por transcripciones quiméricas demostró que las quimeras contienen dominios proteicos completos con mucha más frecuencia que en conjuntos de datos aleatorios. 0 - == 0

Bases de datos de transcripciones quiméricas

Se han construido varias bases de datos para incorporar transcripciones quiméricas de diferentes recursos utilizando una variedad de procedimientos computacionales:

  • ChiTaRS
  • ChimerDB 2.0
  • HybridDB
  • TICdb
  • dbCrid

Herramientas computacionales para detectar ARN quimérico

Los avances recientes en la secuenciación de transcriptomas de alto rendimiento han allanado el camino para nuevos métodos computacionales para el descubrimiento de la fusión. Las siguientes son herramientas computacionales disponibles para la detección de transcripciones de fusión a partir de datos de RNA-Seq:

  • Fusim es una herramienta de software para simular transcripciones de fusión para una comparación completa entre los métodos de descubrimiento de fusión.
  • CRAC integra ubicaciones genómicas y cobertura local para permitir la unión de empalmes o las predicciones de ARN de fusión directamente desde el análisis de lectura de ARN-seq.
  • TopHat-Fusion puede descubrir productos de fusión derivados de genes conocidos, genes desconocidos y variantes de empalme no anotadas de genes conocidos.
  • FusionAnalyser es una herramienta dedicada a la identificación de reordenamientos de fusión de impulsores en el cáncer humano a través del análisis de datos de secuenciación de transcriptomas de alto rendimiento y pares .
  • ChimeraScan ofrece el descubrimiento de la transcripción quimérica entre dos transcripciones independientes en datos de secuenciación de transcriptomas de alto rendimiento al proporcionar características como la capacidad de procesar lecturas de pares de extremos largos (> 75 pb), procesamiento de lecturas de mapeo ambiguas y detección de lecturas que abarcan una unión de fusión .
  • FusionHunter identifica las transcripciones de fusión a partir del análisis transcripcional de lecturas de RNA-seq de extremos emparejados.
  • SplitSeek permite la predicción de novo de uniones de empalme en datos de secuencia de ARN de lectura corta, adecuados para la detección de nuevos eventos de empalme y transcripciones quiméricas.
  • Trans-AB ySS es un conjunto de análisis y ensamblaje de transcriptomas de lectura corta de novo que ayuda en la identificación de estructuras conocidas, nuevas y alternativas en transcripciones expresadas como transcripciones quiméricas.
  • FusionSeq identifica las transcripciones de fusión a partir de la secuenciación de ARN de extremos emparejados. Incluye filtros para eliminar fusiones candidatas falsas con artefactos, como desalineación o emparejamiento aleatorio de fragmentos de transcripción.

Es necesario tener cierta precaución en la interpretación de los eventos de empalme trans detectados en experimentos de secuenciación de alto rendimiento, ya que las enzimas de transcriptasa inversa utilizadas de forma ubicua para determinar las secuencias de ARN son capaces de introducir eventos de empalme trans aparentes que no estaban presentes en el ARN original. Sin embargo, algunos ARN quiméricos se han confirmado mediante otros métodos.

ARN quimérico en eucariotas inferiores

Aunque es raro en eucariotas superiores, varios eucariotas inferiores, incluidos nematodos y tripanosomas, hacen un uso extensivo del empalme trans para generar ARN quiméricos. En estos organismos, las reacciones de empalme entre una proteína que codifica ARN y una secuencia universal dan como resultado la unión de un líder de empalme al extremo 5 'del ARN, generando un ARN mensajero funcional . Este sistema permite el uso de operones : colecciones de genes que codifican proteínas con una función compartida que se transcriben simultáneamente en un solo ARN y luego se empalman en ARN mensajeros individuales, cada uno de los cuales codifica una sola proteína.

Referencias