Cladograma - Cladogram

Un cladograma horizontal, con la raíz a la izquierda.
Dos cladogramas verticales, la raíz en la parte inferior.

Un cladograma (del griego clados "rama" y grama "carácter") es un diagrama utilizado en cladística para mostrar relaciones entre organismos. Sin embargo, un cladograma no es un árbol evolutivo porque no muestra cómo se relacionan los antepasados ​​con los descendientes, ni muestra cuánto han cambiado, por lo que muchos árboles evolutivos diferentes pueden ser consistentes con el mismo cladograma. Un cladograma usa líneas que se ramifican en diferentes direcciones que terminan en un clado , un grupo de organismos con un último ancestro común . Hay muchas formas de cladogramas, pero todos tienen líneas que se derivan de otras líneas. Las líneas se pueden rastrear hasta donde se bifurcan. Estos puntos de ramificación representan un antepasado hipotético (no una entidad real) que se puede inferir que exhibe los rasgos compartidos entre los taxones terminales por encima de él. Este antepasado hipotético podría proporcionar pistas sobre el orden de evolución de varias características, la adaptación y otras narrativas evolutivas sobre los antepasados. Aunque tradicionalmente estos cladogramas se generaban en gran medida sobre la base de caracteres morfológicos, los datos de secuenciación de ADN y ARN y la filogenética computacional se utilizan ahora con mucha frecuencia en la generación de cladogramas, ya sea por sí solos o en combinación con morfología.

Generando un cladograma

Datos moleculares versus morfológicos

Las características utilizadas para crear un cladograma se pueden clasificar aproximadamente como morfológicas (cráneo sinápsido, sangre caliente, notocorda , unicelular, etc.) o moleculares (ADN, ARN u otra información genética). Antes del advenimiento de la secuenciación del ADN, el análisis cladístico utilizaba principalmente datos morfológicos. También se pueden utilizar datos de comportamiento (para animales).

A medida que la secuenciación del ADN se ha vuelto más barata y sencilla, la sistemática molecular se ha convertido en una forma cada vez más popular de inferir hipótesis filogenéticas. Usar un criterio de parsimonia es solo uno de varios métodos para inferir una filogenia a partir de datos moleculares. Enfoques como el de máxima verosimilitud , que incorporan modelos explícitos de evolución de secuencia, son formas no hennigianas de evaluar los datos de secuencia. Otro método poderoso para reconstruir filogenias es el uso de marcadores de retrotransposón genómico , que se cree que son menos propensos al problema de reversión que afecta a los datos de secuencia. También se asume generalmente que tienen una baja incidencia de homoplasias porque alguna vez se pensó que su integración en el genoma era completamente aleatoria; sin embargo, al menos a veces esto parece no ser el caso.

Apomorfia en cladística. Este diagrama indica "A" y "C" como estados ancestrales, y "B", "D" y "E" como estados que están presentes en taxones terminales. Tenga en cuenta que, en la práctica, las condiciones ancestrales no se conocen a priori (como se muestra en este ejemplo heurístico), pero deben inferirse del patrón de estados compartidos observado en las terminales. Dado que cada terminal en este ejemplo tiene un estado único, en realidad no seríamos capaces de inferir nada concluyente acerca de los estados ancestrales (aparte del hecho de que la existencia de estados no observados "A" y "C" serían inferencias no parsimoniosas. )

Plesiomorfias y sinapomorfias

Los investigadores deben decidir qué estados de carácter son "ancestrales" ( plesiomorfias ) y cuáles se derivan ( sinapomorfías ), porque sólo los estados de carácter sinapomórficos proporcionan evidencia de agrupamiento. Esta determinación se realiza generalmente por comparación con los estados de carácter de uno o más grupos externos . Los estados compartidos entre el grupo externo y algunos miembros del grupo interno son simmpliomorfias; los estados que están presentes solo en un subconjunto del grupo interno son sinapomorfias. Tenga en cuenta que los estados de caracteres exclusivos de un solo terminal (autapomorfias) no proporcionan evidencia de agrupación. La elección de un grupo externo es un paso crucial en el análisis cladístico porque diferentes grupos externos pueden producir árboles con topologías profundamente diferentes.

Homoplasias

Una homoplastia es un estado de carácter compartido por dos o más taxones debido a alguna causa distinta a la ascendencia común. Los dos tipos principales de homoplasia son la convergencia (evolución del "mismo" carácter en al menos dos linajes distintos) y la reversión (el retorno a un estado de carácter ancestral). Los personajes que son obviamente homoplásticos, como el pelaje blanco en diferentes linajes de mamíferos árticos, no deben incluirse como un personaje en un análisis filogenético, ya que no contribuyen en nada a nuestra comprensión de las relaciones. Sin embargo, la homoplastia a menudo no es evidente a partir de la inspección del carácter en sí (como en la secuencia de ADN, por ejemplo), y luego se detecta por su incongruencia (distribución no parsimoniosa) en un cladograma muy parsimonioso. Tenga en cuenta que los caracteres que son homoplásticos aún pueden contener una señal filogenética .

Un ejemplo bien conocido de homoplastia debido a la evolución convergente sería el carácter "presencia de alas". Aunque las alas de los pájaros, los murciélagos y los insectos cumplen la misma función, cada uno evolucionó de forma independiente, como puede verse por su anatomía . Si un pájaro, un murciélago y un insecto alado se calificaran para el carácter "presencia de alas", se introduciría una homoplastia en el conjunto de datos, y esto podría confundir potencialmente el análisis, lo que posiblemente resulte en una hipótesis falsa de relaciones. Por supuesto, la única razón por la que una homoplasia es reconocible en primer lugar es porque hay otros caracteres que implican un patrón de relaciones que revelan su distribución homoplástica.

Que no es un cladograma

Un cladograma es el resultado esquemático de un análisis, que agrupa taxones basándose únicamente en sinapomorfías. Hay muchos otros algoritmos filogenéticos que tratan los datos de manera algo diferente y dan como resultado árboles filogenéticos que parecen cladogramas pero no cladogramas. Por ejemplo, los algoritmos fenéticos, como UPGMA y Neighbor-Joining, se agrupan por similitud general y tratan tanto las sinapomorfías como las sinapomorfias como evidencia de agrupación. Los diagramas resultantes son fenogramas, no cladogramas. De manera similar, los resultados de métodos basados ​​en modelos (Máximo Probabilidad o enfoques bayesianos) que tienen en cuenta tanto el orden de ramificación como la "longitud de la ramificación", cuentan tanto las sinapomorfías como las autapomorfias como evidencia a favor o en contra de la agrupación. Los diagramas resultantes de ese tipo de análisis tampoco son cladogramas.

Selección de cladogramas

Hay varios algoritmos disponibles para identificar el "mejor" cladograma. La mayoría de los algoritmos usan una métrica para medir qué tan consistente es un cladograma candidato con los datos. La mayoría de los algoritmos de cladograma utilizan técnicas matemáticas de optimización y minimización.

En general, los algoritmos de generación de cladogramas deben implementarse como programas de computadora, aunque algunos algoritmos se pueden realizar manualmente cuando los conjuntos de datos son modestos (por ejemplo, solo unas pocas especies y un par de características).

Algunos algoritmos son útiles solo cuando los datos característicos son moleculares (ADN, ARN); otros algoritmos son útiles solo cuando los datos característicos son morfológicos. Se pueden utilizar otros algoritmos cuando los datos característicos incluyen tanto datos moleculares como morfológicos.

Los algoritmos para cladogramas u otros tipos de árboles filogenéticos incluyen mínimos cuadrados , unión de vecinos , parsimonia , máxima verosimilitud e inferencia bayesiana .

Los biólogos a veces usan el término parsimonia para un tipo específico de algoritmo de generación de cladogramas y, a veces, como un término general para todos los algoritmos filogenéticos.

Los algoritmos que realizan tareas de optimización (como la construcción de cladogramas) pueden ser sensibles al orden en el que se presentan los datos de entrada (la lista de especies y sus características). Ingresar los datos en varios órdenes puede hacer que el mismo algoritmo produzca diferentes "mejores" cladogramas. En estas situaciones, el usuario debe ingresar los datos en varios órdenes y comparar los resultados.

El uso de diferentes algoritmos en un solo conjunto de datos a veces puede producir diferentes cladogramas "mejores", porque cada algoritmo puede tener una definición única de lo que es "mejor".

Debido al número astronómico de cladogramas posibles, los algoritmos no pueden garantizar que la solución sea la mejor solución en general. Se seleccionará un cladograma no óptimo si el programa se establece en un mínimo local en lugar del mínimo global deseado. Para ayudar a resolver este problema, muchos algoritmos de cladograma utilizan un enfoque de recocido simulado para aumentar la probabilidad de que el cladograma seleccionado sea el óptimo.

La posición basal es la dirección de la base (o raíz) de un árbol filogenético o cladograma enraizado. Un clado basal es el primer clado (de un rango taxonómico dado [a]) que se ramifica dentro de un clado más grande.

Estadísticas

Prueba de diferencia de longitud de incongruencia (o prueba de homogeneidad de partición)

La prueba de diferencia de longitud de incongruencia (ILD) es una medida de cómo la combinación de diferentes conjuntos de datos (por ejemplo, genes morfológicos y moleculares, plástidos y nucleares) contribuye a un árbol más largo. Se mide calculando primero la longitud total del árbol de cada partición y sumándolos. Luego, las réplicas se hacen haciendo particiones ensambladas al azar que consisten en las particiones originales. Se suman las longitudes. Se obtiene un valor de p de 0.01 para 100 repeticiones si 99 repeticiones tienen longitudes de árbol combinadas más largas.

Medición de homoplastia

Algunas medidas intentan medir la cantidad de homoplastia en un conjunto de datos con referencia a un árbol, aunque no está necesariamente claro con precisión qué propiedad estas medidas pretenden cuantificar.

Índice de consistencia

El índice de consistencia (IC) mide la consistencia de un árbol con un conjunto de datos, una medida de la cantidad mínima de homoplasia implícita en el árbol. Se calcula contando el número mínimo de cambios en un conjunto de datos y dividiéndolo por el número real de cambios necesarios para el cladograma. También se puede calcular un índice de coherencia para un carácter individual i , denotado c i .

Además de reflejar la cantidad de homoplasia, la métrica también refleja el número de taxones en el conjunto de datos, (en menor medida) el número de caracteres en un conjunto de datos, el grado en que cada carácter lleva información filogenética y la forma en que los caracteres aditivos están codificados, lo que los hace inadecuados para su propósito.

c i ocupa un rango de 1 a 1 / [ n.taxa / 2] en caracteres binarios con una distribución de estado par; su valor mínimo es mayor cuando los estados no están distribuidos uniformemente. En general, para un carácter binario o no binario con , c i ocupa un rango de 1 a .

Índice de retención

El índice de retención (RI) se propuso como una mejora del IC "para ciertas aplicaciones". Esta métrica también pretende medir la cantidad de homoplasia, pero también mide qué tan bien las sinapomorfías explican el árbol. Se calcula tomando el (número máximo de cambios en un árbol menos el número de cambios en el árbol) y dividiendo por (número máximo de cambios en el árbol menos el número mínimo de cambios en el conjunto de datos).

El índice de consistencia reescalado (RC) se obtiene multiplicando el IC por el RI; en efecto, esto amplía el rango del IC de tal manera que su valor mínimo teóricamente alcanzable se vuelve a escalar a 0, y su máximo permanece en 1. El índice de homoplasia (HI) es simplemente 1 - IC.

Relación de exceso de homoplastia

Esto mide la cantidad de homoplasia observada en un árbol en relación con la cantidad máxima de homoplastia que teóricamente podría estar presente - 1 - (exceso de homoplasia observado) / (exceso máximo de homoplasia). Un valor de 1 indica que no hay homoplastia; 0 representa tanta homoplastia como habría en un conjunto de datos completamente aleatorio, y los valores negativos indican aún más homoplastia (y tienden a ocurrir solo en ejemplos artificiales). El HER se presenta como la mejor medida de homoplasia actualmente disponible.

Ver también

Referencias

enlaces externos

  • Medios relacionados con Cladogramas en Wikimedia Commons