Theobroma cacao, es una especie de árbol frutal diploide (2n = 2x = 20) endémica de las selvas tropicales de América del Sur.  El cacao fue domesticado hace aproximadamente 3.000 años en América Central.  La variedad de cacao Criollo, que tiene un genotipo casi único y homocigoto, fue una de las primeras en ser cultivada. El cacao criollo es ahora una de las dos variedades de cacao que proporcionan chocolate de sabor fino.

Sin embargo, debido a su pobre rendimiento agronómico y susceptibilidad a enfermedades, se han introducido híbridos más vigorosos creados con genotipos extraños (Forastero). Estos híbridos, llamados Trinitario, ahora se cultivan ampliamente.

Los consumidores han mostrado un mayor interés por el chocolate de alta calidad y por el chocolate negro, que contiene un mayor porcentaje de cacao.  Sin embargo, se estima que la producción de cacao fino es menos del 5% de la producción mundial de cacao debido a la baja productividad y susceptibilidad a las enfermedades de las variedades tradicionales de cacao de sabor fino.  Por lo tanto, el mejoramiento de variedades criollas mejoradas es importante para la producción sostenible de cacao de sabor fino.

Actualmente, se producen 3,7 millones de toneladas de cacao al año.  Sin embargo, las enfermedades fúngicas, oomicetas y virales, así como las plagas de insectos, son responsables de aproximadamente el 30% de las pérdidas de cosecha.  Al igual que muchos otros cultivos tropicales, el conocimiento de la genética y la genómica de T. cacao es limitado.  Para acelerar el progreso en el mejoramiento del cacao y la comprensión de su bioquímica, se secuenció y analizó el genoma de un genotipo criollo beliceño (B97-61/B2).

Este genotipo es adecuado para un ensamblaje de secuencia genómica de alta calidad porque es altamente homocigoto como resultado de las muchas generaciones de autofecundación que ocurrieron durante el proceso de domesticación.

Realización de la secuenciación

Un equipo de investigadores utilizaron la estrategia de escopeta en todo el genoma de T. cacao la cual incorpora las tecnologías de secuenciación Roche / 454, Illumina y Sanger.  El consorcio internacional de secuenciación del genoma del cacao (ICGS) produjo un total de 17.6 millones de 454 lecturas individuales, 8.8 millones de 454 lecturas finales emparejadas, 398.0 millones de lecturas finales emparejadas Illumina y alrededor de 88,000 lecturas finales Sanger BAC, correspondientes a 26 Gb de datos sin procesar. Estos datos fueron los que se utilizaron en Roche / 454 y Sanger para producir el ensamblaje.  Esto representó una cobertura × 16.7 del genoma de 430 Mb de B97-61 / B2, cuyo tamaño se estimó por citometría de flujo.

Este ensamblaje, realizado con el software Newbler (Roche, Inc.), consta de 25,912 contigs y 4,792 andamios. El ochenta por ciento del ensamble está en 542 andamios, y el andamio más grande mide 3.4 Mb.  El equipo de investigación determinó que el N50 (el tamaño del andamio por encima del cual se puede encontrar el 50% de la longitud total del conjunto de secuencia) era de 473.8 kb, mientras que  la longitud total del ensamblaje fue de 326.9 Mb, lo que representa el 76% del tamaño estimado del genoma del genotipo T. cacao B97-61 / B2 (430 Mb).

Utilizando los parámetros de alineamiento y las pruebas estadísticas reportadas previamente,  se identificaron 7.866 relaciones ortólogas que cubren el 80% del genoma de T. cacao con respecto al álamo, uva, soja y papaya.

Genoma del cacao

Discusión y conclusiones

Una vez secuenciando el genoma de T. cacao, este resultó en un ensamblaje del 76% de su genoma, así como la identificación de 28,798 genes codificadores de proteínas, entre los cuales 23,529 (82%) estaban anclados en los diez cromosomas de cacao. Destacaron los probabilidad de que una gran proporción de la eucromatina del genoma de T. cacao estuviese cubierta por este ensamblaje, lo que les permitió la recuperación del 97.8% del recurso unigene de T. cacao

Se enontró que 682 familias de genes son específicas de T. cacao, y que sólo el 24% de su genoma consta de elementos transponibles, un porcentaje menor que en otros genomas de tamaño similar.

Este estudio resaltó la estrecha relación evolutiva del genoma de T. cacao con el ancestro putativo eudicot, que muestra un número limitado de recombinaciones entre cromosomas ancestrales, como también se ha observado en la uva. T. cacao, que tiene solo diez pares de cromosomas, se propaga fácilmente y representa un modelo nuevo y simple para estudiar los procesos evolutivos, la función genética, asi como también la genética y  bioquímica de los árboles de cultivos frutales.  

Referencias asociadas

Argout, et al. The genome of Theobroma cacao. Nat Genet . 2011 Feb;43(2):101-8. Henderson, et al. Chemical and archaeological evidence for the earliest cacao beverages. Proc. Natl. Acad. Sci. USA 104, 18937–18940 (2007).