Así como hay bacterias patógenas al humano y a diversos organismos, también se han identificado organismos inocuos e inclusive benéficos. Uno de estos organismos, es la bacteria Escherichia coli K-12.
Este microorganismo que forma parte de la flora microbiana de todos los mamíferos, representa uno de los organismos modelo más importantes en la biología, ya que muchos de los principios básicos se han evidenciado experimentalmente en él. En esta bacteria se conoce la secuencia completa de su cromosoma y de sus elementos accesorios o plásmidos, a nivel del ADN (Ácido Desoxirribonucleico), en el que están contenidos cerca de 4300 genes (secuencias que posteriormente darán lugar a las proteínas o a elementos de la maquinaria de síntesis de las mismas o ARN estructurales).
Un elemento importante asociado con la expresión de los genes en esta bacteria es el que corresponde a las proteínas reguladoras o factores transcripcionales (FTs que reconocen sitios específicos en el ADN). Estas proteínas proporcionan a E. coli y en general todos los organismos, la capacidad de contender contra cambios ambientales, ya sea bloqueando o permitiendo que se lleve a cabo la expresión de los genes, dependiendo de las condiciones del entorno y del estado metabólico.
En este contexto, motivado por el cúmulo de evidencias experimentales en las últimas cinco décadas en esta bacteria, en nuestro equipo estamos interesados en contestar tres preguntas principales: ¿cuál es el conjunto total de proteínas dedicado a regular
la expresión génica en E. coli K-12 ?; ¿cuántos genes podrían estar regulados por estas proteínas?; y ¿cuántos genes podrían estar regulados con mecanismos alternativos? Cabe mencionar que nuestro grupo, conformado por biológos, químicos y computológos, también está interesado en otras preguntas de las cuales hablaré en otra oportunidad.
En este sentido, con base en métodos de las Ciencias Computacionales (minería de datos, diseño e implementación de algoritmos de búsqueda, identificación de patrones, entre otros), intentamos contestar preguntas biológicas; es decir: la Bioinformática. Hemos explorado el contenido de proteínas en la bacteria previamente descrita. De esta forma, se identificaron 304 proteínas como el conjunto mínimo que E. coli utiliza en diferentes condiciones para regular su expresión génica, lo que constituye casi un 7% del total de genes en esta bacteria. De estas 304 proteínas, cerca del 60% han sido caracterizadas experimentalmente, mientras que el resto son predicciones computacionales. En este sentido, con las evidencias experimentales asociadas al 60% de proteínas es suficiente para controlar la expresión de alrededor del 36% del total de genes en esta bacteria, lo que sugiere la existencia de genes regulados no descritos hasta ahora, ya sea por los FTs caracterizados experimentalmente o bien por los FTs predichos. Adicionalmente, la existencia de mecanismos alternativos de regulación, sugiere que hay genes que podrían ser regulados de forma independiente a los FTs, abriendo un panorama todavía más interesante a explorar.
Así mismo, en nuestro grupo de investigación hemos identificado posibles relaciones funcionales entre las proteínas reguladoras y los posibles genes regulados. Para ello, identificamos y evaluamos diversos eventos evolutivos, tales como la fusión de diversos genes para originar uno sólo; los perfiles filogenéticos, es decir, la historia evolutiva de una proteína en el contexto de su presencia o ausencia en todos los organismos; y la asociación cromosómica de genes bacterianos en operones (genes que se expresan en conjunto debido a que se organizan como bloques). Con base en esta información, se identificaron grupos funcionales que incluyen proteínas reguladoras con una misma historia evolutiva y grupos de genes involucrados en funciones fisiológicas similares, sugiriendo su conservación en términos funcionales y evolutivos.
Es importante mencionar que el análisis de los elementos regulatorios, nos permite entender cómo se organiza la red de regulación en todos los organismos para responder de manera eficiente a cambios ambientales o metabólicos. En este contexto y a pesar de que las proteínas reguladoras son el elemento más ampliamente utilizado en redes de regulación, la presencia de otros mecanismos de regulación permite un incremento en la versatilidad y la modulación para la respuesta genética a partir de la red. Por último, los análisis que involucran miles de datos utilizando herramientas computacionales, nos proporcionan nuevas pistas sobre la red de regulación genética en la bacteria E. coli K-12, que se puede ampliar a otros organismos, incluido el humano.