miércoles, enero 25, 2006

Selección de funciones en cladística

Este post esta basado en mi proyecto de grado, defendido públicamente el 17de enero de 2006. Pueden descargar la presentación y el manuscrito en mi página académica http://ciencias.uis.edu.co/labsist/salvador/relfun.htm. Este proyecto fue dirigido por Daniel Miranda.

Goloboff (1993) desarrollo una alternativa a la parsimonia tradicional (minimizar los pasos homoplasicos), que tiene en cuanta cuan homoplasico es el carácter. Entre más homoplasicos el aumento la distorsión (alejamiento del optimo ideal: no homoplasia) es mucho más pequeño. Es decir que si vamos a escoger entre dos soluciones, se prefiere la que minimize la homoplasia, en los caracteres menos homoplasicos (en vez de minimizarla en todos los caracteres sin importar la homoplasia).

Sin embargo, existen muchas funciones para conseguir esto (en piwe (Goloboff, 1998), tnt (Goloboff et al., 2005) y paup (Swofford, 2001) esta implementada h / (h + k), o su inverso, donde h es la homoplasia del carácter y k una constante de concavidad, entre menor sea el valor de k, mayor sera la fuerza a favor de los caracteres poco homoplasicos. En tnt es posible implementar otras funciones, por ejemplo ln(h), raiz de h, o una con los valores definidos por el usuario). Así que ¿como escogemos las funciones?

La solución usada aquí esta basada en el trabajo de Goloboff (1997) y Ramírez (2003). Consiste en escoger la función que maximize la estabilidad de la topología ante la perturbación de los datos. Las perturbaciones fueron basadas en jackknife: de caracteres, terminales o combinando las dos. También es posible observar la estabilidad revisando solamente el número de nodos muy bien soportados usando búsquedas rápidas (Goloboff & Farris, 2001).

En concordancia con el trabajo de Goloboff (1997), la parsimonia tradicional produjo los resultados menos resueltos y con la menor cantidad de nodos estables. El resultado más interesante para mi, fue que con pocas replicas (20 replicas de eliminación) y sin importar el árbol de referencia usado (uno con búsquedas exhaustivas o usando consensos de Goloboff-Farris), la cantidad nodos estables es la misma que con muchas replicas. Dado ese resultado en el manuscrito se sugirió una búsqueda rápida inicial y luego una búsqueda un poco más exhaustiva para la selección de una sola función.

Goloboff en sus observaciones del manuscrito argumenta que seria mejor explorar la estabilidad de los nodos sin importar el tipo de función usada (similar a la aproximación de Wheeler, 1995 y Giribet, 2003 para datos moleculares).

Creo que es posible tener una solución que tome lo mejor de las dos propuestas. Hacer una búsqueda rápida a lo largo de muchas funciones, y seleccionar el vecindario de funciones optimas, y limitando los resultados de la estabilidad a lo largo de las funciones, solo para los resultados óptimos en el (o los) vecindario(s) de funciones escogido.

Agradezco mucho a P. Goloboff y M. Ramírez que leyeron el manuscrito y proporcionaron muchas ideas y discusión, tanto en su comunicación conmigo, como en sus escritos sobre el tema. D. Miranda dirigió mi proyecto y su ayuda en mi estancia en la universidad es invaluable. El proyecto fue financiado por Colciencias (1102-05-13563).

Giribet, G. 2003. Stability in phylogenetic formulations and its relationships to nodal support. Syst. Biol. 52, 554-564.
Goloboff, P.A. 1993. Estimating character weights during tree search. Cladistics 9, 83-91.
Goloboff, P.A. 1997. Self-weighted optimization: tree searches and character state reconstructions under implied transformation costs. Cladistics 13, 225-245.
Goloboff, P.A. 1998. PiWe/NONA, manual y programa distribuido por el autor. Disponible en internet en http://www.zmuc.dk/public/phylogeny/Nona-PeeWee/
Goloboff, P.A., Farris, J.S. 2001. Methods for quick consensus estimation. Cladistics 17, s26-s34.
Goloboff, P.A., Farris, J.S., Nixon, K.C. 2005. TNT, manual y programa distribuido por los autores. Disponible en internet en http://www.zmuc.dk/public/phylogeny/TNT/
Ramírez, M.J. 2003. The spider subfamily Amaurobioidinae (Aranea, Anyphaenidae): a phylogenetic revision at the generic level. Bull. AMNH 277.
Swofford, D.L. 2001. Paup*, manual y programa distribuido por Sinauer, Sunderland (USA).
Wheeler, W.C. 1995. Sequence alignment, parameter sensitivity, and the phylogenetic analysis of molecular data. Syst Biol. 44, 321-331.

No hay comentarios.: