domingo, febrero 13, 2011

¿Quien es un cladista?


Hace algún tiempo, alguien me preguntó en que se diferenciaba la cladística de los otros métodos filogenéticos. Para mucha gente, la respuesta es simple: un cladista es el que usa parsimonia (e.g. [1][2]).

Yo creo que la parsimonia es muy importante para los cladistas, pero no creo que uno sea cladista solo cuando usa parsimonia. Hay muchos artículos de autores que usan parsimonia, pero que no creo que sean artículos cladísticos. También hay trabajos de autores que no usan parsimonia, pero que están claramente dentro del marco cladístico (Pienso en los autores lejendarios: Hennig, Brundin, Wygodzinsky etc., todos ellos cladistas, pero ninguno uso parsimonia, al menos de una manera explícita [=numérica]).

Entonces, si no es un algoritmo ¿donde esta la diferencia? ¿cuando uno es un cladista?

Una parte escencial del pensamiento cladístico es la monofilia, pero actualmente la monofilia se entiende como un termino topologico (esto es, solo la relación representada en el árbol), pero creo que este pasaje de Hennig [3] es claro:
“La suposición de que dos o más especies están más cercanamente relacionadas entre si que con cualquier otra especie, y por ello forman un grupo monofilética, solo puede ser confirmada demostrando la presencia en común de un carácter derivado (“sinapomorfía”). Cuando ese carácter se a demostrado, entonces la suposición ha confirmado que lo han heredado del ancestro común únicamente para esas especies que muestran el carácter.”
Entonces, para un cladista, la monofilia no es solo la relación, sino los caracteres que apoyan esa relación. Cuando un cladista responde a la pregunta “¿es este grupo monofilético?” el /ella no muestra únicamente un árbol, sino además los caracteres que apoyan ese agrupamiento.

Entonces, la cladística no es sobre el algoritmo en particular usado para inferir las relaciones, sino sobre los caracteres que apoyan esos grupos. No es extraño entonces que la mayor parte de los cladistas usen morfología en sus análisis. Aún así, usando solo datos moleculares, se puede ser un cladista, cuando al referirse a calda clado, se discute también las sinapomorfías de dicho clado (sean moleculares y/o morfologicas). Después de eso, uno puede preferir cierto algoritmo sobre otro.

Aquí va un ejemplo, estos dos artículos, uno es de Wiens et al. [4] sobre la filogenia de los Escamados, y el otro es de Beutel et al. [5] sobre la filogenía de Holometabola. Ambos artículos usan parsimonia y análisis bayesiano de sus datos, y ambos parecen preferir los resultados del árbol del análisis bayesiano. Ambos artículos tienen más o menos el mismo tamaño (en cuanto a páginas), discuten las relaciones de grupos de gran diversidad y usan conjuntos de datos morfológicos y moleculares. Uno es claramente un trabajo cladístico, y el otro no.

Si uno mira el artículo de Beutel et al., uno se encuentra con un montón de discusión sobre los caracteres que apoyan cada clado. Para ellos, el apoyo no es solo el valor del apoyo de Bremer, la frequencia de Jackknife o la probabilidad Bayesiana, todo eso es importante por su puesto, pero no tiene sentido sin una referencia explicita a los caracteres que en el nodo. Entonces, así ellos prefieran el análisis bayesiano, ellos continúan siendo cladístas.

Del otro lado, esta el artículo de Wiens et al. Para estos autores, lo único importante son las relaciones, ellos discuten grupos y probabilidades bayesianas, pero nunca discuten ningún carácter de manera explicita para ningún grupo. Entonces, incluso si Wiens et al. solo hubieran usado parsimonia, ellos no son cladistas: los caracteres no son importantes para ellos.

Un cladista no es que escribe un artículo con las ultimas estrategías de búsqueda, o las medidas de apoyo, o la mayor cantidad de nuevos datos moleculares, o usa parsimonia. Todo eso es de gran importancia. Pero en un artículo cladístico, lo importante son los caracteres que apoyan la filogenía. Un buen artículo cladístico es un artículo sobre los caracteres.

Referencias
[1] Felsenstein, J. 2001. The troubled growth of statistical phylogenetics. Syst. Biol. 50: 465-467. Doi: 10.1080/10635150119297 [disponible gratis en el sitio de Syst. Biol.]
[2] Williams, D.M., Ebach, M.C. 2007. Foundations of systematics and biogeography. Springer, New York (USA).
[3] Hennig, W. 1965. Phylogenetic systematics. Ann. Rev. Entomol. 10: 97-116. Doi: 10.1146/annurev.en.10.010165.000525 [disponible gratis aquí]
[4] Wiens, J.J. et al. 2010. Combining phylogenomics and fossils in higher-level squamate reptile phylogeny: molecular data change the placement of fossil taxa. Syst. Biol. 59: 674-658. doi: 10.1093/sysbio/syq048 [disponible gratis en el sitio de Syst. Biol.]
[5] Beutel, R.G. et al. In press. Morphological and molecular evidence converge upon a robust phylogeny of the megadiverse Holometabola. Cladistics. Doi:10.1111/j.1096-0031.2010.00338.x [disponible gratis en el sitio de Cladistics]

sábado, febrero 12, 2011

Who is a cladist?


Some time ago, someone ask me about which makes cladistics different from other phylogenetic approaches. For most people the answer is straightforward: a cladist is the one that uses parsimony (e.g. [1][2]).

I think parsimony is very important for cladists, but I do not think that you are only a cladists when use parsimony. There is a lot of papers from author that use parsimony, but which I'm not think that are cladistic papers. Also there are a lot of works form author that do not use parsimony, but they are clearly under the cladistic framework (I think on the old one authors: Hennig, Brundin, Wydodzinsky, etc., all of them are cladists, but no one uses parsimony, at least in an explicit [=numerical] way).

So, if it is not an algorithm, where is the difference? When are you a cladists?

A key part of cladistic thinking is monophyly, but monophyly actually is usually understood as a topological term (i.e. just the relationships depicted on a tree), but I think this passage from Hennig [3] is clear:
“The supposition that two or more species are more closely related to one another than to any other species, and that, together they form a monophyletic group, can only be confirmed by demonstrating their common possession of derivative characters (“synapomorphy”). When such character have been demonstrated, then the supposition has been confirmed that they have been inherited from an ancestral species common only to the species showing these characters.”
Then, for a cladist, monophyly is not just about the relationship, but the characters that support such relationship. When a cladist answer the question “Is this group monophyletic?” he/she not only shows a tree, he/she also shows the characters that support such grouping.

Then cladistics is not about the particular algorithm used to infer the relationships, but about the characters that support such groups. It is not estrange then that most cladists used morphology in their analyzes. But even, using just molecular data, you can be a cladist, when referring to each clade you are also discussing the synapomorphies of that clade (either molecular and/or morphological). Then also, you might prefer some particular algorithm over another.

Here is an example, there are two papers, one by Wiens et al. [4] about the phylogeny of Squamates, and other from Beutel et al. [5] on the phylogeny of Holometabola. Both papers use parsimony and bayesian analysis on their data, and both seems to prefer the tree resulting from the bayesian analysis. Both are about the same size (in pages), and discuss highl level relationships of a largely diverse group using both molecular and morphological data sets. One of this works is clearly a cladistic work, and the other not.

If you look to Beutel et al. paper, you will find a lot of discussion about the characters that support each clade. For them, support is not just the Bremer' support value, jackknife frequency or Bayesian probability, they are important of course, but they are meaningless without an explicit reference to the characters on the node. So, even if they prefer Bayesian analysis, they continue to be cladistis.

On the other hand, you have de Wiens et al. paper. For that authors, just the relationships are important, they discuss groupings and bayesian probabilies, but no discussion on any explicit character for any group is made. Then, even in the case of Wiens et al. only use the results of parsimony, they are not cladists: characters are not important for them.

A cladist is not the one which write a paper with the more up-to-date search strategies, or support measures, or larges amounts of new molecular data, or parsimony analysis. All of that things are important. But in a cladistic paper, the important think are the characters that support the phylogeny. A good cladistic paper is a paper about the characters.

References
[1] Felsenstein, J. 2001. The troubled growth of statistical phylogenetics. Syst. Biol. 50: 465-467. Doi: 10.1080/10635150119297 [available free at Syst. Biol. site]
[2] Williams, D.M., Ebach, M.C. 2007. Foundations of systematics and biogeography. Springer, New York (USA).
[3] Hennig, W. 1965. Phylogenetic systematics. Ann. Rev. Entomol. 10: 97-116. Doi: 10.1146/annurev.en.10.010165.000525 [available free here]
[4] Wiens, J.J. et al. 2010. Combining phylogenomics and fossils in higher-level squamate reptile phylogeny: molecular data change the placement of fossil taxa. Syst. Biol. 59: 674-658. doi: 10.1093/sysbio/syq048 [available free at Syst. Biol. site]
[5] Beutel, R.G. et al. In press. Morphological and molecular evidence converge upon a robust phylogeny of the megadiverse Holometabola. Cladistics. Doi:10.1111/j.1096-0031.2010.00338.x [available free at Cladistics site]