Por: Edgar Dantán González, Joivier Vichi Lozada, Armando Hernández Mendoza

Todo los seres vivos tienen moléculas de ácido desoxirribonucléico (DNA) de doble cadena, el cual forma a los cromosomas, una larga secuencia de cuatro nucleótidos (Adenina, Timina, Citosina y Guanina) que se unen por millones y que parecen estar arregladas al azar. Sin embargo, esa aleatoriedad es engañosa. Existe un código particular que hace que sólo se puedan expresar ciertas regiones, conocidas como genes, a cadenas sencillas de ácido ribonucleíco  (RNA). El RNA, puede ser convertido a proteínas o ser usado como parte de la maquinaria para producir proteínas, como los RNA de transferencia (tRNA) y los RNA ribosomales (rRNA) mientras que otros, como los RNA no codificante (ncRNA) tienen un papel regulatorio.

La  interacción  de los ncRNAs con otros elementos de regulación permite que las células respondan a las condiciones a la que se ven sometidas en el medio. El conjunto de genes contenidos en los cromosomas se conoce como Genoma y aquello que se copia a RNA se conoce como Transcriptoma, y representa el paisaje de expresión génica.

Durante muchos años se han usado los microarreglos para analizar el transcriptoma  de un organismo bajo ciertas condiciones. El RNA extraído de un organismo en dos o más condiciones experimentales se copiaba con la enzima Transcriptasa Reversa a un DNA complementario (cDNA) que se marcaba con una molécula fluorescente y se dejaban hibridar en el microarreglo para unirse por complementaridad.

Posteriormente, usando luz con la longitud de onda que excita al fluoróforo, se toma una fotografía del microarreglo y la unión del cDNA con el DNA da una señal luminosa que ya digitalizada se puede cuantificar. Una gran limitación de los microarreglos es que solo llevan impresos los genes o secuencias que de acuerdo a nuestro conocimiento actual, se sabe que se expresan o que tiene la potencialidad de expresarse.

Tecnología de la secuenciación masiva de DNA

Desde hace algunos años surgió la tecnología de la secuenciación masiva de DNA. Esta técnica consiste en fragmentar el DNA de un genoma en pedazos pequeños y agregarle adaptadores en los extremos y con diferentes técnicas, secuenciar por síntesis de la cadena complementaria fragmentos que van desde 35 a 300 pares de bases pero haciéndolo al mismo tiempo sobre cientos de millones de fragmentos.

Gracias a esto, en nuestros laboratorios hemos sido capaces de secuenciar varios genomas de interés industrial, agronómico, biotecnológico y ecológico. Hemos identificado genes involucrados en la degradación de pesticidas altamente tóxicos, usados en el campo. Propusimos posibles proteínas presentes en bacterias que viven dentro de gusanos que cuando son consumidos, matan al insecto plaga que afectan cultivos ornamentales o de consumo humano. Identificamos genes presentes en hongos inocuos para el humano capaces de matar protozoarios que afectan el desarrollo de pollos de granja cuyo impacto económico es de miles de millones de pesos.

Sin embargo, esta tecnología sirve también para secuenciar el RNA. Lo único que necesitamos es  copiar el RNA a cDNA y este es secuenciado como se mencionó anteriormente. Una vez obtenidas las secuencias, usamos métodos computacionales para el procesamiento de minería de datos biológicos para ubicar la posición de estas lecturas en el genoma del organismo analizado. La cantidad de lecturas nos da una referencia cuantitativa para determinar cuánto se expresan los genes en las condiciones de análisis. Además, podemos distinguir si hay expresión de otras regiones que no codifican para los genes que no están anotados en el genoma o que se desconoce su función como los ncRNAs.

En nuestros laboratorios intentamos comprender cómo y cuándo se expresan este tipo de RNAs dentro de un contexto evolutivo. Por ejemplo, crecemos bacterias (procariotes) o levaduras (eucariotes) por separado con el mismo medio de cultivo y cambiando la fuente de carbono para modificar el metabolismo primario, hacemos una comparación de la expresión génica entre dos reinos de la vida. Parte de nuestros resultados están dirigidos a detectar y cuantificar nuevos elementos sobre el genoma que no era posible realizar con los microarreglos, como los ncRNAs, seudogenes, señales de inicio y terminación de la transcripción, transcripción de promotores, etc., (Fig. 1).

Figura 1.- Regiones del genoma de Schizosaccharomyces pombe (arriba) y Escherichia coli (abajo) mostrando las zonas donde se expresan diferencialmente los genes en dos condiciones de cultivo.

Analizar en forma global la expresión del genoma nos da una visión general de cómo actúa una célula a partir de la inferencia de las redes de interacción biológicas.  Por ejemplo la asimilación de una fuente de carbono no fermentable induce en Escherichia coli, una bacteria presente en el tracto gastroinstetinal de los humanos, induce la expresión de genes asociados a la quimiotaxis y motilidad celular, un efecto conocido como “búsqueda de alimento”, lo cual es considerado como un estado de diferenciación celular en estos organismos (Fig. 2).

Figura 2.- Módulo de proteínas del flagelo de Escherichia coli cuyos genes se inducen cuando se crece en medio semidefinido con glicerol y lactato como fuente de carbono.

La secuenciación masiva de ácidos nucleicos requiere servidores con capacidades de almacenamiento y procesamiento que idealmente sean del orden de los Giga o Terabytes pero en la actualidad la empleamos para construir una visión holística de los procesos biológicos, estableciendo nuevas hipótesis y paradigmas de la biología celular y molecular y continuamente esta técnica nos está generando una gran cantidad de datos, que logra generar nuevas líneas de investigación y por lo tanto requiere la participación de estudiantes e investigadores de áreas como la biología, informática, física y matemáticas, haciendo que este campo de trabajo sea multidisciplinario.