Open-access Identificación de secuencias génicas relacionadas con la ruta metabólica de síntesis de glicósidos en Stevia rebaudiana

Stevia rebaudiana genetic-sequences identification related with the glycosides synthesis pathway

Resumen

Las plantas medicinales forman parte de la cultura de los pueblos desde tiempos inmemorables, pero los estudios sobre los procesos de síntesis de sus metabolitos secundarios son insuficientes. Por tanto, las tecnologías de transcriptómica y metabolómica han ganado credibilidad como opciones biológicamente más certeras para la caracterización del material vegetal, incluyendo estudios muy específicos en términos de expresión génica.

Esta investigación tuvo por objetivo la búsqueda de genes de ruta de síntesis de glicósidos en Stevia rebaudiana, así como el análisis de regiones promotoras, para establecer relaciones entre sitios de interacción en el ADN y proteínas de anclaje reguladoras de la transcripción de Arabidopsis thaliana. Se secuenció una muestra de ARN mensajero a partir de tejidos de hoja de S. rebaudiana y se alineó contra las secuencias génicas reportadas. Algunos de los genes seleccionados se encontraron menos representados en el transcriptoma, lo que podría ser un indicador de la producción controlada de glicósidos regulada por ciertos genes; esto concuerda con los estudios correlativos, que han puesto de manifiesto la importancia de los genes SrCPPS, SrKS y SrKO en la regulación del contenido de glicósidos. El aprovechamiento de estos resultados involucra el estudio de los estímulos a los factores de transcripción que regulan la expresión génica dentro de la ruta metabólica de interés, como la respuesta al estrés hídrico y altos niveles de salinidad.

Palabras clave: Factor de transcripción; glicósidos; región promotora; sitio de unión al ADN; transcriptómica

Abstract

Medicinal plants are part of world culture since immemorial times, but studies about the processes of secondary-metabolites synthesis, are insufficient. Therefore, transcriptomics and metabolomics technologies have gained credibility as more accurate biologically options for characterization of plant material, including very specific studies in terms of gene expression. This research aimed to search in databases, glycosides synthesis pathway related genes in Stevia rebaudiana, and the analysis of promoter regions, to establish relationships between DNA interaction sites and transcription regulation proteins in Arabidopsis thaliana. A sample of mRNA was sequenced from S. rebaudiana leaf and was aligned against gene sequences reported. Some of the selected genes were found underrepresented in the transcriptome, which would signal the controlled production of glycosides regulated by certain genes; this is consistent with the correlative studies that have shown the importance of SrCPPS, SRKs, SrKO genes in regulating the content of glycosides. The use of these results involves the study of the stimuli to transcription factors that regulate gene expression in the metabolic pathway of interest, as the response to water stress and high levels of salinity.

Keywords: DNA binding site; glycosides; promoter region; transcription factor; transcriptomic

Introducción

Los numerosos estudios sobre especies medicinales aún son pocos en comparación con todo lo que falta por conocer acerca de los procesos de síntesis de metabolitos secundarios, tanto en términos de las rutas metabólicas y enzimas involucradas como de los factores internos y externos que afectan su acumulación (Crispin & Wurtele, 2013). En consecuencia, recientemente se ha adicionado la secuenciación y análisis de transcriptomas, ya sea por mapeo contra un genoma o bien mediante el ensamblaje de novo, como una estrategia innovadora para generar información sobre la expresión de genes de ruta como de regulación (Sitakanta et al., 2006).

En Stevia rebaudiana se han identificado más de 100 compuestos, siendo los más conocidos los esteviol glucósidos, que comprenden el esteviósido, los rebaudiosidos A, B, C, D, E y F y dulcósido A, compuestos de sabor dulce, cuyas concentraciones varían ampliamente dependiendo del genotipo y el medio ambiente de producción de la planta (Karaköse et al., 2011; Puri et al., 2011; Wölwer, 2012).

En la ruta metabólica de síntesis de glicósidos en esta especie participan numerosos genes y enzimas, algunos de los cuales han podido ser identificados y caracterizados. Entre estos destacan los denominados SrDXS, SrDXR, SrCPPS, SrKS, SrKO y las tres glucosiltransferasas (UGTs) SrUGT85C2, SrUGT74G1 y SrUGT76G1; además, recientemente se dio la clonación de otros siete genes, SrMCT, SrCMK, SrMDS, SrHDS, SrHDR, SrIDI y SrGGDPS. Para los 15 genes anteriores se ha realizado el respectivo análisis de su expresión dentro de la ruta de esteviol glicósidos (Kumar et al., 2012). Una mejor comprensión de la regulación genética de las vías de biosíntesis podría ser muy útil para manipular el rendimiento de compuestos edulcorantes en Stevia (Guleria & Kumar, 2011; Urban et al., 2013).

Muchos de los compuestos bioactivos de las plantas medicinales se han descrito con detalle gracias a las herramientas de la biología molecular y la bioinformática, que facilitan la identificación de los genes implicados en el metabolismo de compuestos, ya sea de los que participan en la conversión de un compuesto a otro (genes de biosíntesis) o de aquellos que participan en la regulación de la ruta metabólica (genes de regulación) (Muir et al., 2001).

La naturaleza modular de los factores de transcripción ha llevado a la idea de que se puede ejercer un control en la expresión de estos a través de la ingeniería de proteínas, para regular a su vez la expresión del gen o genes de ruta deseados. De manera que coordinar el control de la transcripción de genes de biosíntesis ha surgido como un enfoque eficaz para la producción de metabolitos secundarios en plantas (Sitakanta et al., 2006).

El objetivo de esta investigación fue la búsqueda de posibles mecanismos de regulación de los factores de transcripción, con el fin de ejercer un control que a la vez pueda incidir en el incremento de la expresión de los genes de síntesis de glicósidos.

Materiales y Métodos

El presente trabajo se realizó en el Centro de Investigación en Biotecnología (CIB) del Tecnológico de Costa Rica (TEC) en Cartago, Costa Rica.

Identificación de secuencias génicas reportadas para S. rebaudiana:

La identificación de las secuencias génicas reportadas para la especie S. rebaudiana se hizo empleando la base de datos del National Center for Biotechnology Information (NCBI). La búsqueda se centró en identificar enzimas participantes en la ruta metabólica de síntesis de glicósidos con o sin regiones promotoras descritas.

Análisis de regiones promotoras, identificación de sitios de unión al ADN y relación con factores de transcripción:

Las secuencias génicas reportadas como regiones promotoras en S. rebaudiana fueron analizadas mediante la herramienta Database of Plant Cis-acting Regulatory DNA Elements (PLACE, 2014, Higo et al., 1999) para predecir sitios de unión de factores de transcripción al ADN, que se ubican en los genes de estevia seleccionados. Posteriormente, se empleó la herramienta Plant Interactome Database (Center for Cancer Systems Biology, Dana-Farber Cancer Institute, Harvard Medical School) creada para la especie Arabidopsis thaliana, para relacionar dichos sitios de unión al ADN, con secuencias codificantes de factores de transcripción de A. thaliana.

Secuenciación y análisis de transcriptoma

Material biológico

El material biológico utilizado en la extracción de ARN total correspondió a clones de plantas jóvenes de S. rebaudiana cuyo origen se encuentra en la comunidad El Millón, en Pococí, Limón, Costa Rica. Para la extracción se utilizaron hojas procedentes del segundo y tercer nudo de plantas seleccionadas al azar, mezcladas en una sola muestra.

Extracción de ARN total.

La extracción de ARN total se hizo a partir de 150 mg de muestra de hoja, siguiendo el protocolo Total RNA Isolation from Plant, del NucleoSpin RNA Plant kit marca Macherey-Nagel®. La muestra de ARN se cuantificó con el equipo NanoDrop Lite® y se verificó la presencia de ARN mediante una electroforesis en gel de agarosa al 1,3% durante 45 min a 80 V. Para la precipitación de la muestra se agregó 0.1 V de acetato de sodio 3M a pH 7-8 y 2 V de etanol absoluto.

Secuenciación del ARN

La secuenciación fue realizada por la empresa Axeq Technologies, con el equipo Illumina HiSeq 2000 Sequencer. El software utilizado fue el Illumina Pipeline (CASAVA) v1.8.2.

Análisis de calidad de la secuenciación

La calidad de los fragmentos de secuenciación se verificó con las herramientas Fastqc (Babraham Institute) y RobiNA (Lohse et al., 2010). Se realizaron cortes tipo clipping de la base 1 a la base 15 empleando la herramienta FastX-Toolkit (Hannon Lab) y cortes tipo trimming eliminando colas con calidad inferior a 30% con RobiNA; el filtrado de fragmentos inferiores a las 70 bases también se hizo con esa herramienta.

Alineamiento de genes contra el transcriptoma

El alineamiento de fragmentos se realizó contra los genes participantes en la ruta metabólica de síntesis de glicósidos usando la herramienta RobiNA.

Resultados

Identificación de secuencias génicas reportadas para S. rebaudiana:

La búsqueda bioinformática de genes de S. rebaudiana determinó que existen al menos 20 genes de la ruta de síntesis de glicósidos descritos para esta especie (cuadro 1). La función asociada a dichos genes se muestra en el cuadro 2.

Cuadro 1
Genes de Stevia rebaudiana reportados en el National Center for Biotechnology Information.

Análisis de regiones promotoras, elementos en cis y factores de transcripción

De los sitios identificados como posibles sitios de anclaje de factores de regulación de la transcripción, se seleccionaron aquellos descritos en la especie modelo A. thaliana (cuadro 3).

Cuadro 2
Función de 20 genes descritos en el National Center for Biotechnology Information para la especie Stevia rebaudiana y su relación con la síntesis de glicósidos.
Cuadro 3
Función de 11 sitios de regulación de la transcripción descritos en Arabidosis thaliana y sus proteínas de anclaje.

Secuenciación y análisis de transcriptoma

Las condiciones de la muestra de ARN total a partir de muestras de hoja, previamente a su secuenciación, se resumen en una concentración de 84,6 ng/ µl, OD260/280 1.9 y RIN de 9.3.

Los datos de secuenciación se dividieron en dos librerías tipo paired-end, cada una con 28 360 329 fragmentos, con una proporción de guanina-citosina de 52,7%. El porcentaje de fragmentos con calidad Sanger superior a 30% fue de 88,81%. Del total de 56 720 658 fragmentos generados con la secuenciación, 53 998 440 fragmentos pasaron el sistema implementado con la eliminación de bases de baja calidad (27 627 790 en la librería 1 y 26 236 583 en la librería 2).

La calidad de los fragmentos de la librería 1 fue superior al 30% en su totalidad, incluyendo el rango de la desviación estándar. En la librería 2 la calidad promedio también fue superior al 30% y los valores de la desviación estándar superiores al 25% (figura 1).

Alineamiento de genes contra el transcriptoma:

El alineamiento entre los fragmentos de secuenciación correspondientes a los ocho genes de ruta metabólica de síntesis de glicósidos en S. rebaudiana se presenta en el cuadro 4.

Figura 1:
Distribución de la calidad a lo largo de los fragmentos amplificados de ADN copia de Stevia rebaudiana con secuencias depuradas: a. Librería 1, b. Librería 2. Fuente: RobiNA (2014).

Cuadro 4
Alineamiento de ocho genes descritos para Stevia rebaudiana contra el transcriptoma de esta misma especie.

Discusión

En total se identificaron 20 genes de S. rebaudiana, los cuales pudieron ser relacionados con la ruta metabólica de síntesis de glicósidos, de acuerdo con la función descrita en la base de datos del NCBI así como aquella descrita en la investigación que Kumar et al. (2012) han desarrollo, documentando comportamientos fisiológicos y describiendo genes para esta especie.

De los 20 genes de estevia descritos en las bases de datos, únicamente de cinco de ellos se conocía la región promotora, que fue analizada para determinar los posibles sitios de anclaje a ADN por parte de proteínas de regulación. En 2013 se realizó un estudio similar (Kumar & Guleria, 2012), para determinar los sitios en cis correspondientes a las cajas TATA y GATA, con la finalidad de evaluar la producción de glicósidos ante estímulos lumínicos en estevia.

En relación con las regiones promotoras descritas en S. rebaudiana, la herramienta de análisis seleccionada generó predicciones acerca de la posible ubicación de las cajas TATA, GATA y CAAT; además, también se pudo señalar la ubicación de posibles sitios de anclaje a otros factores de regulación como los factores de transcripción.

La selección de los sitios de interés se efectuó mediante una discriminación de acuerdo con su descripción para la especie modelo A. thaliana, específicamente para tejidos de hoja. Esto se debe justamente a que la complejidad de las interacciones que ocurren entre el ADN y las proteínas reguladoras de la transcripción depende de los diferentes tejidos del organismo, sus tipos celulares, estadíos de desarrollo, estados fisiológicos y condiciones ambientales y/o hormonales (Carlberg & Molár, 2014; Ceunen & Geuns, 2013; Latchman, 2003; Zhang, 2003).

Por la razón anterior es que también se escogieron sitios promotores que se relacionaran con respuestas típicas en hojas, como ante condiciones de estrés hídrico y deshidratación, principalmente porque las hojas se encargan del proceso de fotosíntesis y respiración, durante los cuales puede darse la pérdida de agua a través de los estomas (Audersik et al., 2008). De igual manera, se escogieron sitios que se vincularan con respuesta a niveles de salinidad y ataque de insectos, porque la literatura reporta investigaciones al respecto en estevia, cuyo objetivo ha sido comprender y relacionar la síntesis de compuestos bioactivos como los glicósidos, según diversos estímulos ambientales.

En este estudio, una vez establecida la función concreta de los factores de regulación seleccionados de A. thaliana, se determinó que solo tres de ellos correspondieron a factores de transcripción propiamente dichos, estos fueron proteínas con dominios MYC y MYB. Las proteínas MYB se relacionan con la respuesta de estrés de las plantas, como exposición a luz ultravioleta, heridas, estrés anaeróbico y entrada de patógenos (Singh et al., 2002). Las proteínas MYC se relacionan con la diferenciación de las células epidérmicas y patrones de tricomas, actuando como cofactores con otras proteínas (Schwechheimer et al., 1998).

Tras el final de la etapa de búsqueda de genes, se continuó con el proceso de secuenciación del transcriptoma. Si bien la estrategia para medir la expresión génica es la comparación del transcriptoma contra un genoma de referencia, muchas veces, dependiendo del organismo en estudio, esta aproximación se dificulta cuando no se cuenta con un genoma de referencia conocido o este está parcialmente descrito (Grabherr et al., 2011). Una de las estrategias propuestas para solventar este problema es la comparación de los fragmentos o los transcriptomas ensamblados de novo, contra organismos modelo filogenéticamente cercanos (Hornett & Wheat, 2012). Los niveles de expresión génica para cada unidad de ARN pueden aproximarse de acuerdo con el número de fragmentos secuenciados que se alinean con un genoma de referencia, relacionándolos directamente con niveles de abundancia (Trapnell et al., 2010).

Con el análisis de calidad de la secuenciación de estevia se eliminaron 2 722 218 fragmentos, lo que representa casi un 5% del total secuenciado. Un 5% representa un porcentaje bajo, por lo que se reafirma la idea de que la secuenciación realizada fue de alta calidad. Además se verificó que todos los fragmentos restantes presentaban una calidad promedio superior al 30% y una longitud de entre 70 y 80 bases.

En el análisis de alineación entre los ocho genes de estevia y el transcriptoma, todos los genes de ruta metabólica de síntesis de glicósidos estaban presentes en la muestra de ARN secuenciada, ya que, aunque se considera que un mapeo es válido si se genera más de un 80% de alineamiento contra un transcriptoma y que con menos de un 50% cuestiona si los fragmentos representan un transcriptoma incompleto o son contaminación de la muestra (Lin, 2013)., esto únicamente es válido cuando el mapeo se realiza contra la totalidad de un genoma, pero en este caso no, porque se trabajó con genes de entre 2000 y 3000 pb; por tanto, los bajos porcentajes de alineación son esperables y justificados.

Es decir, el resultado obtenido en esta sección fue positivo para la comprobación molecular de síntesis de compuestos bioactivos (glicósidos) en la muestra de hoja trabajada. Ahora, con base en el principio de que la expresión de un gen puede relacionarse con estos datos de alineación obtenidos, es importante notar que algunos de los genes seleccionados se encontraron menos representados en el transcriptoma, lo cual puede ser un indicador de lo que algunos autores describen como la producción controlada de glicósidos dada por ciertos genes.

Con respecto a lo expuesto con anterioridad, los genes 14, 15, 16, al alinear con un menor número de fragmentos, podría considerarse que su expresión en la muestra era menor en comparación con los demás genes. Esto concuerda con los estudios correlativos entre las enzimas de ruta, que han puesto de manifiesto la importancia de los genes denominados como SrCPPS (13), SrKS (14 y 15), SrKO en la regulación del contenido de glicósidos (Kumar et al., 2012). En esta investigación, el paso de copalil difosfato a kaureno, de kaureno a ácido kaureonico y de este último a esteviol fueron los pasos más regulados.

Referencias

  • Audesirk, T., Audesirk, G. & Byers, B. (2008). Biología: la vida en la Tierra Trad. de A. Flores. 8 ed. México D.F.: Prentice-Hall, Interamericana.
  • Carlberg, C. & Molnár, F. (2014). Mechanisms of Gene Regulation Londres: Springer Science.
  • Ceunen, S. & Geuns, J. (2013). Spatio-temporal variation of the diterpene steviol in Stevia rebaudiana grown under different photoperiods. Phytochemistry, 89, 32-38.
  • Crispin, M. & Wurtele, E. (2013). Use of Metabolomic and Transcriptomics to Gain Insights into the Regulation and Biosynthesis of Medicinal Compounds: Hypericum as a Model. En Chandra, S ., et al., Biotechnology for Medicinal Plants: Micropropagation and Improvement Berlín: Springer.
  • Grabherr, M.G., et al. (2011). Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nature Biotechnology, 29(7), 644-653.
  • Guleria, P. & Kumar, S. (2011). Identification of miR414 and Expression Analysis of Conserved miRNAs from Stevia rebaudiana Genomics Proteomics Bioinformatics, 9(6), 211-217.
  • Higo, K., Ugawa, Y., Iwamoto, M. & Korenaga, T. (1999). Plant cis-acting regulatory DNA elements (PLACE) database. Nucleic Acids Res, 27(1), 297-300.
  • Hornett, E. & Wheat, C. (2012). Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC Genomics, 13, 361-377.
  • Karaköse, H., Rakesh, J. & Kuhnert, N. (2011). Characterization and Quantification of Hydroxycinnamate Derivatives in Stevia rebaudiana Leaves by LC-MSn†. Journal of Agricultural and Food Chemistry, 59, 10143-10150.
  • Kumar, H., Kaul, K., Bajpai-Gupta, S., Kumar, V. & Kumar, J. (2012). A comprehensive analysis of fifteen genes of steviol glycosides biosynthesis pathway in Stevia rebaudiana (Bertoni). Gene, 492, 276-284.
  • Kumar, S. & Guleria, P. (2012). Steviol Glycosides from Stevia: Biosynthesis Pathway Review and their Application in Foods and Medicine. Critical Reviews in Food Science and Nutrition, 52, 988-998.
  • Latchman, D. (2003). Eucaryotic Transcripcion Factors 4 ed. San Diego: Academic Press.
  • Lin, J. (2012). NGS Impacts and Key Concepts. Consultado en: http://training.bioinformatics.ucdavis.edu/ docs/2012/05/RNA/_downloads/RNAIntro.pdf
    » http://training.bioinformatics.ucdavis.edu/ docs/2012/05/RNA/_downloads/RNAIntro.pdf
  • Lohse, M., Nunes-Nesi, A., Krueger, P., Nagel, A., Hannemann, J., Giorgi, F., Childs, L., Osorio, S., Walther, D., Selbig, J., Sreenivasulu, N., Stitt, M., Fernie, A. & Usadel, B. (2010). Robin: An intuitive wizard application for R-based expression microarray quality assessment and analysis. Plant Physiology, 153, 642-51.
  • Muir, S., Collins, G, Robinson, S., Hughes, S., Bovy, A., Ric De Vos, C., Tunen, A. & Verhoeyen, M. (2001). Overexpression of petunia chalcone isomerase in tomato results in fruit containing increased levels of flavonols. Natural Biotecnology, 19, 470-474.
  • Database of Plant Cis-acting Regulatory DNA Elements (PLACE). (2014). Consultado en: http://www.dna.affrc.go.jp/ PLACE/
    » http://www.dna.affrc.go.jp/ PLACE/
  • Puri, M., Sharma, D. & Tiwari, A. (2011). Downstream processing of stevioside and its potential applications. Biotechnology Advances, 29, 781-791.
  • Schwechheimer, C., Zourelidou, M. & Bevan, M. (1998). Plant Transcription Factor Studies. Annu. Rev. Plant Physiol. Plant Mol. Biol, 49, 127-150.
  • Sitakanta, P., Claire, X., Kong, Q., Shen, K. & Yuan, L. (2006). Directed evolution of plant basic helix-loop-helix transcription factors for the improvement of transactivational properties. Biochimica et Biophysica, Acta 1759, 308-318.
  • Trapnell, C., Williams, B., Pertea, G., Mortazavi, A., Kwan G., van Baren, M., Salzberg S., Wold, B. & Pachter, L. (2010). Transcript assembly and quantication by RNA-Seq reveals unannotated transcripts and isoforms switching during cell differentiation. Nat Biotechnol, 28(5):511-515.
  • Urban, J., Carakostas, M. & Brusick, D. (2013). Steviol glycoside safety: Is the genotoxicity data base sufficient? Food and Chemical Toxicology, 51, 386-390.
  • Wölwer, U. (2012). The Leaves of Stevia rebaudiana (Bertoni). Their Constituents and the Analyses Thereof: A Review. J. Agric. Food Chem, 60, 886-895.
  • Zhang, J. (2003). Overexpression analysis of plant transcription factors. Current Opinion in Plant Biology, 6, 430-440.

Disponibilidad de datos

Citaciones de datos

Database of Plant Cis-acting Regulatory DNA Elements (PLACE). (2014). Consultado en: http://www.dna.affrc.go.jp/ PLACE/

Fechas de Publicación

  • Fecha del número
    Oct-Dec 2016

Histórico

  • Recibido
    27 Nov 2015
  • Acepto
    15 Mar 2016
location_on
None Cartago, Costa Rica, Cartago, Cartago, Costa Rica, CR, 159-7050 , 25502336, 25525354 - E-mail: alramirez@itcr.ac.cr
rss_feed Acompanhe os números deste periódico no seu leitor de RSS
Acessibilidade / Reportar erro