Elemento regulador cis - Cis-regulatory element

Los elementos reguladores cis ( CRE ) o los módulos reguladores cis ( CRM ) son regiones de ADN no codificante que regulan la transcripción de genes vecinos. Las CRE son componentes vitales de las redes reguladoras genéticas , que a su vez controlan la morfogénesis , el desarrollo de la anatomía y otros aspectos del desarrollo embrionario , estudiados en biología evolutiva del desarrollo .

Los CRE se encuentran cerca de los genes que regulan. Las CRE normalmente regulan la transcripción de genes uniéndose a factores de transcripción . Un solo factor de transcripción puede unirse a muchas CRE y, por lo tanto, controlar la expresión de muchos genes ( pleiotropía ). El prefijo latino cis significa "en este lado", es decir, en la misma molécula de ADN que el gen o genes que se van a transcribir.

Los CRM son tramos de ADN , generalmente de 100 a 1000 pares de bases de ADN de longitud, donde varios factores de transcripción pueden unirse y regular la expresión de genes cercanos y regular sus tasas de transcripción. Se etiquetan como cis porque normalmente se encuentran en la misma hebra de ADN que los genes que controlan en lugar de trans , que se refiere a los efectos sobre genes que no se encuentran en la misma hebra o más lejos, como los factores de transcripción. Un elemento regulador cis puede regular varios genes y, a la inversa, un gen puede tener varios módulos reguladores cis . Los módulos reguladores cis cumplen su función integrando los factores de transcripción activos y los cofactores asociados en un momento y lugar específicos en la celda donde se lee esta información y se da una salida.

Los CRE se encuentran a menudo, pero no siempre, aguas arriba del sitio de transcripción. Las CRE contrastan con los elementos transreguladores (TRE) . Los TRE codifican los factores de transcripción.

Visión general

Diagrama que muestra en qué etapas de la vía de ADN-ARNm-proteína se puede controlar la expresión

El genoma de un organismo contiene desde unos pocos cientos hasta miles de genes diferentes, todos codificando un producto singular o más. Por numerosas razones, incluido el mantenimiento organizativo, la conservación de energía y la generación de varianza fenotípica , es importante que los genes solo se expresen cuando se necesitan. La forma más eficaz de que un organismo regule la expresión génica es a nivel transcripcional. Las CRE funcionan para controlar la transcripción actuando cerca o dentro de un gen. Los tipos de CRE mejor caracterizados son los potenciadores y los promotores . Ambos elementos de secuencia son regiones estructurales de ADN que sirven como reguladores de la transcripción .

Los módulos reguladores cis son uno de varios tipos de elementos reguladores funcionales . Los elementos reguladores son sitios de unión para factores de transcripción, que están involucrados en la regulación de genes. Los módulos reguladores cis realizan una gran cantidad de procesamiento de información sobre el desarrollo. Los módulos reguladores cis son grupos no aleatorios en su sitio objetivo especificado que contienen sitios de unión a factores de transcripción.

La definición original presentaba módulos reguladores en cis como potenciadores del ADN que actuaba en cis, lo que aumentaba la tasa de transcripción de un promotor ligado . Sin embargo, esta definición ha cambiado para definir los módulos reguladores cis como una secuencia de ADN con sitios de unión al factor de transcripción que se agrupan en estructuras modulares, que incluyen, pero no se limitan a, regiones de control de locus, promotores, potenciadores, silenciadores, elementos de control de límites y otros. moduladores.

Los módulos de regulación cis se pueden dividir en tres clases; potenciadores , que regulan positivamente la expresión génica; aisladores , que funcionan indirectamente al interactuar con otros módulos reguladores cis cercanos; y silenciadores que desactivan la expresión de genes.

El diseño de los módulos reguladores cis es tal que los factores de transcripción y las modificaciones epigenéticas sirven como entradas, y la salida del módulo es el comando dado a la maquinaria de transcripción, que a su vez determina la tasa de transcripción del gen o si está activado o no. apagado . Hay dos tipos de entradas de factores de transcripción: las que determinan cuándo se va a expresar el gen diana y las que sirven como impulsores funcionales , que entran en juego solo durante situaciones específicas durante el desarrollo. Estas entradas pueden provenir de diferentes puntos de tiempo, pueden representar diferentes ligandos de señal o pueden provenir de diferentes dominios o linajes de células. Sin embargo, aún quedan muchas cosas por conocer.

Además, la regulación de la estructura de la cromatina y la organización nuclear también desempeña un papel en la determinación y el control de la función de los módulos reguladores cis. Por tanto, las funciones de regulación génica (GRF) proporcionan una característica única de un módulo regulador cis (CRM), que relaciona las concentraciones de factores de transcripción (entrada) con las actividades promotoras (salida). El desafío es predecir los GRF. Este desafío sigue sin resolverse. En general, las funciones de regulación genética no utilizan lógica booleana , aunque en algunos casos la aproximación de la lógica booleana sigue siendo muy útil.

El supuesto de la lógica booleana

Dentro del supuesto de la lógica booleana, los principios que guían el funcionamiento de estos módulos incluyen el diseño del módulo que determina la función reguladora. En relación con el desarrollo, estos módulos pueden generar resultados tanto positivos como negativos. La salida de cada módulo es un producto de las diversas operaciones realizadas en él. Las operaciones comunes incluyen la puerta OR - este diseño indica que en una salida se dará cuando se dé una entrada [3], y la puerta AND - en este diseño se necesitan dos factores regulatorios diferentes para asegurar que se obtenga una salida positiva. "Interruptores de palanca": este diseño se produce cuando el ligando de señal está ausente mientras el factor de transcripción está presente; este factor de transcripción acaba actuando como represor dominante. Sin embargo, una vez que el ligando señal está presente, el papel del factor de transcripción como represor se elimina y puede ocurrir la transcripción.

También pueden ocurrir otras operaciones lógicas booleanas, como represores transcripcionales específicos de secuencia, que cuando se unen al módulo regulador cis conducen a una salida de cero. Además, además de la influencia de las diferentes operaciones lógicas, la salida de un módulo regulador "cis" también estará influenciada por eventos anteriores. 4) Los módulos reguladores cis deben interactuar con otros elementos regulatorios. En su mayor parte, incluso con la presencia de superposición funcional entre los módulos reguladores cis de un gen, las entradas y salidas de los módulos tienden a no ser las mismas.

Si bien la suposición de la lógica booleana es importante para la biología de sistemas , estudios detallados muestran que, en general, la lógica de la regulación genética no es booleana. Esto significa, por ejemplo, que en el caso de un módulo regulador cis regulado por dos factores de transcripción, las funciones de regulación génica determinadas experimentalmente no pueden describirse mediante las 16 funciones booleanas posibles de dos variables. Se han propuesto extensiones no booleanas de la lógica de regulación genética para corregir este problema.

Clasificación

Los módulos reguladores cis pueden caracterizarse por el procesamiento de la información que codifican y la organización de sus sitios de unión a factores de transcripción. Además, los módulos reguladores cis también se caracterizan por la forma en que afectan la probabilidad, proporción y velocidad de transcripción. Los módulos reguladores cis altamente cooperativos y coordinados se clasifican como potenciadores . La arquitectura y la disposición de los sitios de unión del factor de transcripción son fundamentales porque la interrupción de la disposición podría cancelar la función. Los módulos reguladores cis funcionales y flexibles se denominan vallas publicitarias. Su salida transcripcional es el efecto de suma de los factores de transcripción unidos. Los potenciadores afectan la probabilidad de que un gen se active, pero tienen poco o ningún efecto sobre la tasa. El modelo de respuesta binaria actúa como un interruptor de encendido / apagado para la transcripción. Este modelo aumentará o disminuirá la cantidad de células que transcriben un gen, pero no afecta la tasa de transcripción. El modelo de respuesta reostática describe los módulos reguladores en cis como reguladores de la tasa de iniciación de la transcripción de su gen asociado.

Promotor

Los promotores son CRE que consisten en secuencias relativamente cortas de ADN que incluyen el sitio donde se inicia la transcripción y la región aproximadamente 35 pb corriente arriba o corriente abajo del sitio de inicio (pb). En eucariotas , los promotores suelen tener los siguientes cuatro componentes: la caja TATA , un sitio de reconocimiento de TFIIB , un iniciador y el elemento promotor del núcleo corriente abajo . Se ha descubierto que un solo gen puede contener múltiples sitios promotores. Para iniciar la transcripción del gen aguas abajo, una serie de proteínas de unión al ADN llamadas factores de transcripción (TF) deben unirse secuencialmente a esta región. Solo una vez que esta región se ha unido con el conjunto apropiado de TF, y en el orden correcto, puede unirse la ARN polimerasa y comenzar a transcribir el gen.

Potenciadores

Los potenciadores son CRE que influyen (mejoran) la transcripción de genes en la misma molécula de ADN y se pueden encontrar corriente arriba, corriente abajo, dentro de los intrones o incluso relativamente lejos del gen que regulan. Múltiples potenciadores pueden actuar de manera coordinada para regular la transcripción de un gen. Varios proyectos de secuenciación de todo el genoma han revelado que los potenciadores a menudo se transcriben a ARN largo no codificante (lncRNA) o ARN potenciador (eRNA), cuyos cambios en los niveles se correlacionan con frecuencia con los del ARNm del gen diana.

Silenciadores

Los silenciadores son CRE que pueden unirse a factores de regulación de la transcripción (proteínas) llamados represores , evitando así la transcripción de un gen. El término "silenciador" también puede referirse a una región en la región no traducida 3 ' del ARN mensajero, que se une a proteínas que suprimen la traducción de esa molécula de ARNm, pero este uso es distinto de su uso para describir una CRE.

Operadores

Los operadores son CRE en procariotas y algunos eucariotas que existen dentro de los operones , donde pueden unirse a proteínas llamadas represores para afectar la transcripción.

Papel evolutivo

Las CRE tienen un papel evolutivo importante. Las regiones codificantes de los genes suelen estar bien conservadas entre los organismos; sin embargo, diferentes organismos muestran una marcada diversidad fenotípica. Se ha encontrado que los polimorfismos que ocurren dentro de secuencias no codificantes tienen un efecto profundo sobre el fenotipo al alterar la expresión génica . Las mutaciones que surgen dentro de una CRE pueden generar una variación de expresión al cambiar la forma en que se unen los TF. La unión más estrecha o más débil de las proteínas reguladoras conducirá a una transcripción regulada hacia arriba o hacia abajo.

Cis -módulo regulador en la red de regulación genética

La función de una red reguladora de genes depende de la arquitectura de los nodos , cuya función depende de los múltiples módulos reguladores cis . El diseño de los módulos reguladores cis puede proporcionar suficiente información para generar patrones espaciales y temporales de expresión génica. Durante el desarrollo, cada dominio, donde cada dominio representa una región espacial diferente del embrión, de expresión génica estará bajo el control de diferentes módulos reguladores cis . El diseño de módulos regulatorios ayuda a producir retroalimentación , retroalimentación y ciclos regulatorios cruzados.

Modo de acción

Los módulos reguladores cis pueden regular sus genes diana a grandes distancias. Se han propuesto varios modelos para describir la forma en que estos módulos pueden comunicarse con su promotor del gen diana. Estos incluyen el modelo de escaneo de ADN, el modelo de bucle de secuencia de ADN y el modelo de seguimiento facilitado. En el modelo de exploración de ADN, el complejo de factor de transcripción y cofactor se forma en el módulo regulador cis y luego continúa moviéndose a lo largo de la secuencia de ADN hasta que encuentra el promotor del gen diana. En el modelo de bucle, el factor de transcripción se une al módulo regulador cis , que luego provoca el bucle de la secuencia de ADN y permite la interacción con el promotor del gen diana. El complejo del módulo regulador cis- factor de transcripción provoca el bucle de la secuencia de ADN lentamente hacia el promotor diana y forma una configuración de bucle estable. El modelo de seguimiento facilitado combina partes de los dos modelos anteriores.

Identificación y predicción computacional

Además de determinar experimentalmente los CRM, existen varios algoritmos bioinformáticos para predecirlos. La mayoría de los algoritmos intentan buscar combinaciones significativas de sitios de unión a factores de transcripción ( sitios de unión al ADN ) en secuencias promotoras de genes coexpresados. Los métodos más avanzados combinan la búsqueda de motivos significativos con la correlación en conjuntos de datos de expresión génica entre factores de transcripción y genes diana. Ambos métodos se han implementado, por ejemplo, en ModuleMaster . Otros programas creados para la identificación y predicción de módulos reguladores cis incluyen:

INSECT 2.0 es un servidor web que permite buscar módulos reguladores Cis en todo el genoma. El programa se basa en la definición de restricciones estrictas entre los sitios de enlace de factores de transcripción (TFBS) que componen el módulo para disminuir la tasa de falsos positivos. INSECT está diseñado para ser fácil de usar, ya que permite la recuperación automática de secuencias y varias visualizaciones y enlaces a herramientas de terceros para ayudar a los usuarios a encontrar aquellas instancias que tienen más probabilidades de ser verdaderos sitios regulatorios. El algoritmo INSECT 2.0 se publicó anteriormente y el algoritmo y la teoría detrás de él se explicaron en

Stubb utiliza modelos de Markov ocultos para identificar grupos estadísticamente significativos de combinaciones de factores de transcripción. También utiliza un segundo genoma relacionado para mejorar la precisión de predicción del modelo.

Las redes bayesianas utilizan un algoritmo que combina predicciones de sitios y datos de expresión específicos de tejido para factores de transcripción y genes diana de interés. Este modelo también utiliza árboles de regresión para representar la relación entre el módulo regulador cis identificado y el posible conjunto de unión de factores de transcripción.

CRÈME examina grupos de sitios objetivo en busca de factores de transcripción de interés. Este programa utiliza una base de datos de sitios de unión de factores de transcripción confirmados que se anotaron en todo el genoma humano . Se aplica un algoritmo de búsqueda al conjunto de datos para identificar posibles combinaciones de factores de transcripción, que tienen sitios de unión cercanos al promotor del conjunto de genes de interés. A continuación, se analizan estadísticamente los posibles módulos cis-reguladores y se representan gráficamente las combinaciones significativas.

Los módulos reguladores cis activos en una secuencia genómica han sido difíciles de identificar. Los problemas de identificación surgen porque a menudo los científicos se encuentran con un pequeño conjunto de factores de transcripción conocidos, por lo que es más difícil identificar grupos estadísticamente significativos de sitios de unión a factores de transcripción. Además, los altos costos limitan el uso de grandes conjuntos de ordenamiento en teselas de genoma completo .

Ejemplos de

Un ejemplo de una secuencia reguladora que actúa en cis es el operador en el operón lac . Esta secuencia de ADN está unida por el represor lac , que a su vez evita la transcripción de los genes adyacentes en la misma molécula de ADN. Por tanto, se considera que el operador lac "actúa en cis" sobre la regulación de los genes cercanos. El propio operador no codifica ninguna proteína o ARN .

Por el contrario, los elementos transreguladores son factores difusibles, generalmente proteínas, que pueden modificar la expresión de genes distantes del gen que se transcribió originalmente para crearlos. Por ejemplo, un factor de transcripción que regula un gen en el cromosoma 6 podría haberse transcrito a partir de un gen en el cromosoma 11 . El término transregulador se construye a partir de la raíz latina trans , que significa "frente a".

Hay elementos cis-reguladores y trans-reguladores. Los elementos reguladores cis son a menudo sitios de unión para uno o más factores que actúan en trans .

Para resumir, los elementos reguladores cis están presentes en la misma molécula de ADN que el gen que regulan, mientras que los elementos reguladores trans pueden regular genes distantes del gen del que fueron transcritos.

Ejemplos en ARN

Elementos de ARN
Escribe Abbr. Función Distribución Árbitro.
Elemento de desplazamiento de fotograma Regula el uso de marcos alternativos con ARN mensajero Archaea , bacterias , eucariotas , virus de ARN
Sitio de entrada de ribosoma interno IRES Inicia la traducción en medio de un ARN mensajero. Virus de ARN , eucariota
Elemento de respuesta de hierro IRA Regula la expresión de genes asociados al hierro. Eucariota
Péptido líder Regula la transcripción de genes y / u operones asociados Bacterias
Riboswitch Regulación genética Bacterias , eucariotas
Termómetro de ARN Regulación genética Bacterias
Secuencia de inserción de selenocisteína SECIS Dirige a la célula a traducir codones de parada UGA como selenocisteínas Metazoos

Ver también

Referencias

Otras lecturas

enlaces externos