V. Genómica comparada y la búsqueda del cenancestro
La reconstrucción de estadios ancestrales ha adquirido una perspectiva totalmente novedosa con la disponibilidad, a partir de 1995, de un número creciente de genomas celulares completamente secuenciados. Como habían afirmado desde 1965 Zuckerkandl y Pauling, la historia evolutiva de un organismo está contenida en su genoma --pero a menudo esta información es difícil de interpretar, debido a una serie de fenómenos biológicos que van desde la falta de preservación de la estructura primaria de los genes, hasta la existencia de niveles de redundancia de las secuencias cuya naturaleza no entendemos del todo, pasando por el transporte horizontal, una de las peores pesadillas que pueden enfrentar los biólogos.
Como se observa en la Figura 6, los genes del cenancestro estarían definidos por el conjunto de secuencias presentes en la intersección de los conjuntos que representan los genomas de las Archaea, las Bacteria y los Eucarya. Sin embargo, en la práctica esta reconstrucción se ha visto limitada por (a) el hecho de que los genomas secuenciados no representan la diversidad biológica real; (b) los distintos niveles de conservación de los genes, que distan mucho de ser los mismos para todas las secuencias; (c) los problemas para anotar, es decir, identificar a las secuencias presentes en las bases de datos; (d) la presencia de secuencias altamente conservadas cuya función es aún completamente desconocida por no disponer de datos experimentales; (e) la pérdida polifilética independiente de secuencias, funciones y rutas metabólicas que han sufrido diversos organismos, sobre todo parásitos y simbiontes; y (f) el movimiento lateral de los genes, que en algunos casos pueden traspasar las fronteras que separan a los grandes dominios.
Ante un inventario de dificultades como éste parecería ser imposible definir con precisión los rasgos del cenancestro; sin embargo, los resultados son alentadores. Por ejemplo, el transporte horizontal de secuencias es un fenómeno real (que subyace, por ejemplo, la bien conocida resistencia a antibióticos que se observa con una frecuencia cada vez más alarmante entre muchos patógenos de humanos y animales) que puede obscurecer la reconstrucción del pasado evolutivo. Sabemos, por ejemplo, que incluso los operones del ARNr pueden llegar a sufrir este fenómeno, pero el hecho de que se mantenga la identidad de los grupos de microorganismos (es decir, las espiroquetas siguen siendo indentificables como tales, no hay bacterias Gram positivas que se hayan transformado en Gram negativas, etc.) sugiere que existen limitaciones biológicas al intercambio de genes. En 1999, por ejemplo, tres grupos de trabajo demostraron, en forma independiente, que la representación gráfica del contenido total de secuencias (es decir, fenogramas) en los genomas secuenciados (Figura 7) mostraba como, a pesar del transporte horizontal, no sólo los tres dominios, sino incluso las distintas líneas biológicas que las constituyen, se pueden identificar sin problemas (Snel et al., 1999; Tekaia et al., 1999a; Fitz-Gibbon y House, 1999)). Es decir, a pesar de la promiscuidad con la que los seres vivos han intercambiado genes a lo largo de la evolución, la reconstrucción del pasado es posible.
Claro que los resultados no siempre son del todo compatibles. Al comparar las secuencias de los tres dominios resulta sorprendente la falta de conservación de los distintos tipos de ADN polimerasas (sobre todo si tenemos presentes que uno de los rasgos que solemos definir como esenciales en la caracterización de los seres vivos es la reproducción, que a nivel molecular depende precisamente de la actividad enzimática de estas enzimas) y su distribución biológica. Ello ha llevado al grupo de Arkadi Koonin, del National Institute of Health de los EEUU, por ejemplo, a sostener que el último ancestro común poseía un genoma de ARN, o tal vez de ARN/ADN, mientras que Patrick Forterre, de la Université de Paris-Sud, en Francia, propone un complejo esquema de transporte lateral de genes que involucra a los tres linajes y a sus virus. En cambio, un grupo de la Facultad de Ciencias de la UNAM, que ha podido identificar la presencia de dominios catalíticos de distintas ADN polimerasas en los tres linajes, cree haber identicado partes de la ADN polimerasa ancestral, que probablemente se derivó, como lo sugiere su homología con algunas ARN polimerasas, de una molécula que originalmente estaba involucrada en la replicación de genomas de ARN que poseían células más sencillas que precedieron al cenancestro mismo. Estas conclusiones, de hecho, son congruentes con los resultados preliminares obtenidos por Fredj Tekaia, Bernard Dujo, y Antonio Lazcano, que muestran que las secuencias más conservadas comunes a los genomas celulares disponibles codifican para secuencias que sintetizan, degradan o interaccionan con ARN --es decir, que se pueden reconocer, al menos en parte, evidencias de un pasado biológico anterior a la aparición del ADN mismo.
VI. Conclusiones
Al igual que ocurre con otras áreas del conocimiento, pocas tareas resultan tan complejas y difíciles en las ciencias biológicas como la reconstrucción del pasado. Si bien es cierto que en el marco de la teoría evolutiva es fácil aceptar la existencia de sistemas ancestrales más simples de los cuales descendemos los organismos actuales, su estudio no es una tarea fácil, sobre todo si, como ocurre con el caso del cenancestro, hay que remontarse a épocas precámbricas. La reconstrucción de estadios ancestrales es una tarea multi e interdisciplinario que tiene que recurrir, necesariamente, a actitudes eclécticas que apelen a metodologías que incluyen desde las discusiones sobre el medio ambiente primitivo, hasta la anotación automatizada de las secuencias de genomas completos. Los resultados pueden ser a veces confusos. Por ejemplo, la conservación de las secuencias de las ATPasas implica la existencia de membranas de lípidos y fosfolípidos, aunque desconocemos cual era la naturaleza química de éstas últimas. A pesar de éstas dificultades, resulta asombroso que, por otro lado, existan secuencias, estructuras y funciones, como las que participan en lectura y expresión de la información genética, que parecen haberse conservado a lo largo de miles de millones de años. La lectura de éstas crónicas moleculares que se han mantenido desde épocas Precámbricas nos permite asomarnos, aunque sea en forma limitada, al interior de los procesos biológicos de los microorganismos que antecedieron a todas las formas de vida que existen hoy en nuestro planeta, aunque no nos permiten predecir hacia donde va la biósfera. Después de todo, no hay que olvidar que los evolucionistas somos como el ave goofus que describió Jorge Luis Borges, y que vuela con la cabeza hacia atrás, porque no le interesa saber hacia donde va, sino de donde viene.
Fitz-Gibbon, S. T. and House, C. H. (1999) Whole genome-based phylogenetic analysis of free-living microorganisms. Nucleic Acid Res. 27: 4218-4222
Galtier, N.
Gogarten, J. P., et al (1989) Proc. Natl. Acad. Sci. USA 86: 6661-
Huet, J., Schnabel, R., Sentenac, A., and Zillig, W. (1983) Archaebacteria and eukaryotes possess DNA-dependent RNA polymerases of a common type. EMBO Jour. 2: 1291-1294
Iwabe et al. (1989) Proc. Natl. Acad. Sci. USA 86: 9355
Lazcano, A., Fox, G. E., and Oró, J. (1992) Life before DNA: the origin and evolution of early Archean cells. In R. P. Mortlock (ed) The Evolution of Metabolic Function (CRC Press, Boca Raton), 237-295
Margulis, L. (1993) Symbiosis in Cell Evolution: microbial communities in the Archaean and Proterozoic Eons (Freeman Co., New York)
Margulis, L. y Schwartz, K. V. (1985) Cinco Reinos: guía ilustrada de los phyla de la vida en la Tierra (Editorial Labor, Barcelona)
Miller, S. L. and Lazcano, A. (1995) The origin of life --did it occur at high temperatures?Journal of Molecular Evolution 41: 689-692
Snel, B., Bork, P., and Huynen, M. A. (1999) Genome phylogeny based on gene content. Nature Genetics 21:
Tekaia, F., Lazcano, A., and Dujon, B. (1999a) The genomic tree as revealed from whole proteome comparisons. Genome Research 9: 550-557
Tekaia, F., Dujon, B., and Lazcano, A. (1999b) Comparative genomics: products of the most conserved protein-encoding genes synthesize, degrade, or interact with RNA Abstracts of the 12th International Conference on the Origin of Life & 9th ISSOL Meeting (San Diego, California, USA, July 11-16, 1999) , Abstract c4.6, p. 53
Woese, C. R. and Fox, G. E. (1977) Phylogenetic structure of the prokaryotic domain: the primary kingdoms. Proc. Natl. Acad. Sci. USA 74: 5088-5090
Woese, C. R., Kandler, O., and Wheelis, M. L. (1990) Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya. Proc. Natl. Acad. USA 87: 4576-
Zuckerkandl, E., and Pauling, L. (1965). Molecules as documents of evolutionary history. Journal of Theoretical Biology 8: 357-366
La reconstrucción de estadios ancestrales ha adquirido una perspectiva totalmente novedosa con la disponibilidad, a partir de 1995, de un número creciente de genomas celulares completamente secuenciados. Como habían afirmado desde 1965 Zuckerkandl y Pauling, la historia evolutiva de un organismo está contenida en su genoma --pero a menudo esta información es difícil de interpretar, debido a una serie de fenómenos biológicos que van desde la falta de preservación de la estructura primaria de los genes, hasta la existencia de niveles de redundancia de las secuencias cuya naturaleza no entendemos del todo, pasando por el transporte horizontal, una de las peores pesadillas que pueden enfrentar los biólogos.
Como se observa en la Figura 6, los genes del cenancestro estarían definidos por el conjunto de secuencias presentes en la intersección de los conjuntos que representan los genomas de las Archaea, las Bacteria y los Eucarya. Sin embargo, en la práctica esta reconstrucción se ha visto limitada por (a) el hecho de que los genomas secuenciados no representan la diversidad biológica real; (b) los distintos niveles de conservación de los genes, que distan mucho de ser los mismos para todas las secuencias; (c) los problemas para anotar, es decir, identificar a las secuencias presentes en las bases de datos; (d) la presencia de secuencias altamente conservadas cuya función es aún completamente desconocida por no disponer de datos experimentales; (e) la pérdida polifilética independiente de secuencias, funciones y rutas metabólicas que han sufrido diversos organismos, sobre todo parásitos y simbiontes; y (f) el movimiento lateral de los genes, que en algunos casos pueden traspasar las fronteras que separan a los grandes dominios.
Ante un inventario de dificultades como éste parecería ser imposible definir con precisión los rasgos del cenancestro; sin embargo, los resultados son alentadores. Por ejemplo, el transporte horizontal de secuencias es un fenómeno real (que subyace, por ejemplo, la bien conocida resistencia a antibióticos que se observa con una frecuencia cada vez más alarmante entre muchos patógenos de humanos y animales) que puede obscurecer la reconstrucción del pasado evolutivo. Sabemos, por ejemplo, que incluso los operones del ARNr pueden llegar a sufrir este fenómeno, pero el hecho de que se mantenga la identidad de los grupos de microorganismos (es decir, las espiroquetas siguen siendo indentificables como tales, no hay bacterias Gram positivas que se hayan transformado en Gram negativas, etc.) sugiere que existen limitaciones biológicas al intercambio de genes. En 1999, por ejemplo, tres grupos de trabajo demostraron, en forma independiente, que la representación gráfica del contenido total de secuencias (es decir, fenogramas) en los genomas secuenciados (Figura 7) mostraba como, a pesar del transporte horizontal, no sólo los tres dominios, sino incluso las distintas líneas biológicas que las constituyen, se pueden identificar sin problemas (Snel et al., 1999; Tekaia et al., 1999a; Fitz-Gibbon y House, 1999)). Es decir, a pesar de la promiscuidad con la que los seres vivos han intercambiado genes a lo largo de la evolución, la reconstrucción del pasado es posible.
Claro que los resultados no siempre son del todo compatibles. Al comparar las secuencias de los tres dominios resulta sorprendente la falta de conservación de los distintos tipos de ADN polimerasas (sobre todo si tenemos presentes que uno de los rasgos que solemos definir como esenciales en la caracterización de los seres vivos es la reproducción, que a nivel molecular depende precisamente de la actividad enzimática de estas enzimas) y su distribución biológica. Ello ha llevado al grupo de Arkadi Koonin, del National Institute of Health de los EEUU, por ejemplo, a sostener que el último ancestro común poseía un genoma de ARN, o tal vez de ARN/ADN, mientras que Patrick Forterre, de la Université de Paris-Sud, en Francia, propone un complejo esquema de transporte lateral de genes que involucra a los tres linajes y a sus virus. En cambio, un grupo de la Facultad de Ciencias de la UNAM, que ha podido identificar la presencia de dominios catalíticos de distintas ADN polimerasas en los tres linajes, cree haber identicado partes de la ADN polimerasa ancestral, que probablemente se derivó, como lo sugiere su homología con algunas ARN polimerasas, de una molécula que originalmente estaba involucrada en la replicación de genomas de ARN que poseían células más sencillas que precedieron al cenancestro mismo. Estas conclusiones, de hecho, son congruentes con los resultados preliminares obtenidos por Fredj Tekaia, Bernard Dujo, y Antonio Lazcano, que muestran que las secuencias más conservadas comunes a los genomas celulares disponibles codifican para secuencias que sintetizan, degradan o interaccionan con ARN --es decir, que se pueden reconocer, al menos en parte, evidencias de un pasado biológico anterior a la aparición del ADN mismo.
VI. Conclusiones
Al igual que ocurre con otras áreas del conocimiento, pocas tareas resultan tan complejas y difíciles en las ciencias biológicas como la reconstrucción del pasado. Si bien es cierto que en el marco de la teoría evolutiva es fácil aceptar la existencia de sistemas ancestrales más simples de los cuales descendemos los organismos actuales, su estudio no es una tarea fácil, sobre todo si, como ocurre con el caso del cenancestro, hay que remontarse a épocas precámbricas. La reconstrucción de estadios ancestrales es una tarea multi e interdisciplinario que tiene que recurrir, necesariamente, a actitudes eclécticas que apelen a metodologías que incluyen desde las discusiones sobre el medio ambiente primitivo, hasta la anotación automatizada de las secuencias de genomas completos. Los resultados pueden ser a veces confusos. Por ejemplo, la conservación de las secuencias de las ATPasas implica la existencia de membranas de lípidos y fosfolípidos, aunque desconocemos cual era la naturaleza química de éstas últimas. A pesar de éstas dificultades, resulta asombroso que, por otro lado, existan secuencias, estructuras y funciones, como las que participan en lectura y expresión de la información genética, que parecen haberse conservado a lo largo de miles de millones de años. La lectura de éstas crónicas moleculares que se han mantenido desde épocas Precámbricas nos permite asomarnos, aunque sea en forma limitada, al interior de los procesos biológicos de los microorganismos que antecedieron a todas las formas de vida que existen hoy en nuestro planeta, aunque no nos permiten predecir hacia donde va la biósfera. Después de todo, no hay que olvidar que los evolucionistas somos como el ave goofus que describió Jorge Luis Borges, y que vuela con la cabeza hacia atrás, porque no le interesa saber hacia donde va, sino de donde viene.
Fitz-Gibbon, S. T. and House, C. H. (1999) Whole genome-based phylogenetic analysis of free-living microorganisms. Nucleic Acid Res. 27: 4218-4222
Galtier, N.
Gogarten, J. P., et al (1989) Proc. Natl. Acad. Sci. USA 86: 6661-
Huet, J., Schnabel, R., Sentenac, A., and Zillig, W. (1983) Archaebacteria and eukaryotes possess DNA-dependent RNA polymerases of a common type. EMBO Jour. 2: 1291-1294
Iwabe et al. (1989) Proc. Natl. Acad. Sci. USA 86: 9355
Lazcano, A., Fox, G. E., and Oró, J. (1992) Life before DNA: the origin and evolution of early Archean cells. In R. P. Mortlock (ed) The Evolution of Metabolic Function (CRC Press, Boca Raton), 237-295
Margulis, L. (1993) Symbiosis in Cell Evolution: microbial communities in the Archaean and Proterozoic Eons (Freeman Co., New York)
Margulis, L. y Schwartz, K. V. (1985) Cinco Reinos: guía ilustrada de los phyla de la vida en la Tierra (Editorial Labor, Barcelona)
Miller, S. L. and Lazcano, A. (1995) The origin of life --did it occur at high temperatures?Journal of Molecular Evolution 41: 689-692
Snel, B., Bork, P., and Huynen, M. A. (1999) Genome phylogeny based on gene content. Nature Genetics 21:
Tekaia, F., Lazcano, A., and Dujon, B. (1999a) The genomic tree as revealed from whole proteome comparisons. Genome Research 9: 550-557
Tekaia, F., Dujon, B., and Lazcano, A. (1999b) Comparative genomics: products of the most conserved protein-encoding genes synthesize, degrade, or interact with RNA Abstracts of the 12th International Conference on the Origin of Life & 9th ISSOL Meeting (San Diego, California, USA, July 11-16, 1999) , Abstract c4.6, p. 53
Woese, C. R. and Fox, G. E. (1977) Phylogenetic structure of the prokaryotic domain: the primary kingdoms. Proc. Natl. Acad. Sci. USA 74: 5088-5090
Woese, C. R., Kandler, O., and Wheelis, M. L. (1990) Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya. Proc. Natl. Acad. USA 87: 4576-
Zuckerkandl, E., and Pauling, L. (1965). Molecules as documents of evolutionary history. Journal of Theoretical Biology 8: 357-366