Download identificación y caracterización molecular de
Document related concepts
Transcript
Centro de Investigación Científica de Yucatán, A.C. Posgrado en Ciencias Biológicas IDENTIFICACIÓN Y CARACTERIZACIÓN MOLECULAR DE FACTORES DE TRANSCRIPCIÓN DE LA FAMILIA NAC INVOLUCRADOS EN RESPUESTA A ESTRÉS ABIÓTICO EN Carica papaya, L. cultivar Maradol Tesis que presenta ALEJANDRO PEREIRA SANTANA En opción al título de DOCTOR EN CIENCIAS (Ciencias Biológicas: Opción Biotecnología) Mérida, Yucatán, México Diciembre de 2015 Mérida, Yucatán, México; a 2 de Diciembre de 2015 DECLARACIÓN DE PROPIEDAD Declaro que la información contenida en la sección de Materiales y Métodos Experimentales, los Resultados y Discusión de este documento proviene de las actividades de experimentación realizadas durante el período que se me asignó para desarrollar mi trabajo de tesis, en las Unidades y Laboratorios del Centro de Investigación Científica de Yucatán, A.C., y que a razón de lo anterior y en contraprestación de los servicios educativos o de apoyo que me fueron brindados, dicha información, en términos de la Ley Federal del Derecho de Autor y la Ley de la Propiedad Industrial, le pertenece patrimonialmente a dicho Centro de Investigación. Por otra parte, en virtud de lo ya manifestado, reconozco que de igual manera los productos intelectuales o desarrollos tecnológicos que deriven o pudieran derivar de lo correspondiente a dicha información, le pertenecen patrimonialmente al Centro de Investigación Científica, A.C., y en el mismo tenor, reconozco que si derivaren de este trabajo productos intelectuales o desarrollos tecnológicos, en lo especial, estos se regirán en todo caso por lo dispuesto por la Ley Federal del Derecho de Autor y la Ley de la Propiedad Industrial, en el tenor de lo expuesto en la presente Declaración. ________________________________ Alejandro Pereira Santana AGRADECIMIENTOS Agradezco al Consejo Nacional de Ciencia y Tecnología (CONACyT) por la beca otorgada (#240187) en apoyo a mis estudios de Doctorado, así como el apoyo otorgado a través del proyecto de Ciencia básica 2010-I (CB-2010-01) titulado “Factores de Transcripción de papaya (Carica papaya) como una plataforma molecular para mejorar su tolerancia a estreses bióticos y abióticos” con número 155356. Agradezco al Dr. Luis Carlos Rodríguez Zapata toda la confianza que deposito en mi persona, por toda su ayuda, sus comentarios, sus consejos y sobre todo agradezco su amistad a lo largo de mi formación académica. Agradezco de manera muy personal al Dr. Felipe Sánchez Teyer, por toda su confianza y el apoyo brindado hacia mi persona, durante mi formación académica en el transcurso de mi estadía en el CICY. Agradezco de igual forma a mi comité tutoral integrado por el Dr. Luis C. Rodríguez Zapata, Dr. Enrique Castaño de la Serna, Dr. Lenin Sánchez Calderón y Dr. Luis David Alcaráz Peraza, cuyas aportaciones y sugerencias llevaron a buen término este trabajo. De igual forma agradezco a mi comité revisor integrado por el Dr. Luis C. Rodríguez Zapata, Dr. Enrique Castaño de la Serna, Dr. Felipe Sánchez Teyer, Dr. Lenin Sánchez Calderón, Dr. Manuel Martínez Estévez, Dra. Ana Ly Arroyo Herrera y la Dra. Daisy de la Caridad Pérez Brito, gracias por sus valiosas observaciones y comentarios. Agradezco de manera institucional al Centro de Investigación Científica de Yucatán, A.C. (CICY), al Dr. Felipe Sánchez Teyer en su carácter de Director General del CICY, a la Unidad de Biotecnología, al Departamento de Posgrado actual y al anteriormente dirigido por la Lic. Gilma Michell y la Lic. Nancy Sulub Herrera, al Coordinador de Posgrado actual de la Unidad de Biotecnología Dra. Marcela Gamboa Angulo, y al anterior, Dr. Luis Saénz Carbonell, así como a la subdirectora de docencia la CP. Liligelia García Cano. De igual forma quiero agradecer al Departamento de Cómputo por su pronta ayuda durante mi estadía en el CICY. Agradezco al Instituto de Ecología, de la Universidad Nacional Autónoma de México, por permitirme realizar una estancia de Investigación en sus instalaciones. Agradezco también al M. en C. Francisco Espadas Gil por su ayuda y asesoría con las mediciónes de parámetros fisiológicos. Agradezco al M. en C. Pablo Acereto Escoffie por su disposición y su ayuda con los análisis de nutrientes realizados en su laboratorio. De igual forma Agradezco a la M. en C. Ángela Kú González por su ayuda en el uso del microscopio confocal. Al Dr. Cesar de los Santos Briones por sus comentarios y sugerencias. A la IIA. Wilma Aracely González Kantún por su ayuda en la preparación de muestras para microscopía. Quiero agradecer a todas las personas que formaron parte de las labores diaras durante mi estadía en el CICY e hicieron ameno el trabajo en el laboratorio. Dra. Ana Ly Arroyo Herrera, Dr. Luis Joel Figueroa Yáñes, QFB. Miguel Keb llanes, M. en C. Jorge Espadas Alcocer, M en C. Samuel David Gamboa Tuz, Biol. Gabriela Flores Vargaz, M. en C. Christian Alcocer Jauriga, IBT. Edyciel Jordán Alvarado Robledo, IBT. Sandi Julissa Reyes Hernández, M. en C. Jesús Alejandro Zamora Briseño, QFB. Ricardo Ortíz Luevano, Ing. Biomédico María Magdalena Rodríguez Ruíz, IBQ. Karina Maricela Sosa Martínez, Biol. Aarón Xavier G Cantón Bastarrachea, IBT. María Ileana Leon Campos, IBQ. Evelyn Arlette Carrillo Bermejo. Agradezco a todas aquellas personas las cuales no aparece su nombre pero que sin duda han sido parte de este gran proceso formativo y de mi vida. Dedico esta tesis a mi Familia. Mi esposa Diana Sofía Gutiérrez Martín, Mis Padres Manuel Pereira Novelo y Landy Elizabeth Santana Rivas, y Mis hermanos Manuel y Fernando. Sin duda este trabajo es el resultado del esfuerzo conjunto de mi familia, del gran ejemplo de dedicación y perseverancia que me inculcaron, y de la paciencia para esperar el fruto del trabajo. “Consideré luego todas las cosas que mis manos habían hecho y el trabajo en que me había empeñado y he aquí, me di cuenta de que nada de esto tenía sentido y era como correr tras el viento…” Índice RESUMEN ..............................................................................................................................................1 ABSTRACT ............................................................................................................................................3 INTRODUCCIÓN ....................................................................................................................................5 CAPÍTULO I ............................................................................................................................................7 1.1 ANTECEDENTES .................................................................................................................. 7 1.1.1 ESTRÉS ABIÓTICO ................................................................................................................. 7 1.1.2 SISTEMAS DE REGULACIÓN DE LA EXPRESIÓN GÉNICA ANTE ESTRÉS ABIÓTICO .......................................................................................................................................... 11 1.1.3 FACTORES DE TRANSCRIPCIÓN INVOLUCRADOS EN RESPUESTA A ESTRÉS ABIÓTICO ......................................................................................................................... 11 1.1.4 EL REGULÓN NAC ................................................................................................................ 13 1.1.5 PLANTAS USADAS COMO MODELOS EXPERIMENTALES EN BIOLOGÍA MOLECULAR..................................................................................................................................... 17 1.1.6 Carica papaya .......................................................................................................................... 18 1.2 JUSTIFICACIÓN .................................................................................................................. 20 1.3 HIPÓTESIS .......................................................................................................................... 21 1.4 OBJETIVOS ......................................................................................................................... 21 1.4.1 OBJETIVO GENERAL ............................................................................................................ 21 1.4.2 OBJETIVOS ESPECÍFICOS ................................................................................................. 21 1.5 DISEÑO EXPERIMENTAL DE LA INVESTIGACIÓN.......................................................... 22 1.6 REFERENCIAS.................................................................................................................... 23 CAPÍTULO II COMPARATIVE GENOMICS OF NAC TRANSCRIPTIONAL FACTORS IN ANGIOSPERMS: IMPLICATIONS FOR THE ADAPTATION AND DIVERSIFICATION OF FLOWERING PLANTS .................................................................................................................. 35 2.1 ABSTRACT.......................................................................................................................... 36 2.1 INTRODUCTION .................................................................................................................. 37 2.2 MATERIALS AND METHODS ............................................................................................. 40 2.2.1 NAC GENE FAMILY SEARCHES AND RETRIEVAL ........................................................ 40 2.2.2 SEQUENCE ANALYSIS, MULTIPLE SEQUENCE ALIGNMENTS AND EVOLUTIONARY MODEL TESTING............................................................................................. 40 2.2.3 DEFINING ORTHOLOGOUS GROUPS (OGs) .................................................................. 41 2.2.4 EVOLUTIONARY ANALYSIS AND ANGIOSPERM TREE OF LIFE .............................. 41 2.3 RESULTS AND DISCUSSION ............................................................................................. 42 2.3.1 GENOME-WIDE IDENTIFICATION OF NAC GENES ...................................................... 42 2.3.2 ORTHOLOGOUS GROUPS AND DUPLICATIONS IN THE NAC FAMILY ................... 46 i Índice 2.3.3 NAC PHYLOGENETIC ANALYSES ..................................................................................... 50 2.4 CONCLUSIONS ................................................................................................................... 57 2.5 ACKNOWLEDGMENTS ...................................................................................................... 57 2.6 AUTHOR CONTRIBUTIONS ............................................................................................... 58 2.7 REFERENCES ..................................................................................................................... 59 2.8 SUPPORTING INFORMATION ........................................................................................... 74 CAPÍTULO III CARACTERIZACIÓN IN SILICO DE FACTORES DE TRANCRIPCIÓN NAC INVOLUCRADOS EN RESPUESTA A ESTRÉS ABIÓTICO ................................................. 77 3.1 INTRODUCCIÓN ................................................................................................................. 77 3.2 MATERIALES Y MÉTODOS ................................................................................................ 79 3.2.1 DETERMINACIÓN DE SECUENCIAS NAC CARACTERIZADAS EN DISTINTAS ESPECIES VEGETALES, E IDENTIFICACIÓN DE LAS SECUENCIAS ORTÓLOGAS EN C. papaya L. cv. MARADOL ........................................................................... 79 3.2.2 MODELOS ESTRUCTURALES DE LAS PROTEÍNAS NAC DE C. papaya SELECCIONADAS ........................................................................................................................... 80 3.2.3 ANÁLISIS DE PROMOTORES ............................................................................................. 80 3.3 RESULTADOS..................................................................................................................... 81 3.3.1 DETERMINACIÓN DE SECUENCIAS NAC CARACTERIZADAS E IDENTIFICACIÓN DE SECUENCIAS ORTÓLOGAS EN C. papaya L. cv. MARADOL .......................................................................................................................................... 81 3.3.2 MODELOS ESTRUCTURALES DE LAS PROTEÍNAS NAC SELECCIONADAS ........................................................................................................................... 86 3.3.3 ANÁLISIS DE PROMOTORES DE GENES NAC .............................................................. 87 3.4 DISCUSIÓN ......................................................................................................................... 89 3.5 REFERENCIAS.................................................................................................................... 92 CAPÍTULO IV EXPRESIÓN TRANSCRIPCIONAL DE GENES NAC DE C. PAPAYA ANTE DIFERENTES CONDICIONES DE ESTRÉS ABIÓTICO ...................................................... 99 4.1 INTRODUCCIÓN ................................................................................................................. 99 4.2 MATERIALES Y MÉTODOS .............................................................................................. 102 4.2.1 TRATAMIENTOS DE ESTRÉS ABIÓTICO PARA C. papaya ....................................... 102 4.2.2 EXTRACCIÓN DE ARN Y SÍNTESIS DE ADNc .............................................................. 103 4.2.3 CLONACIÓN DE LOS GENES CpNAC SELECCIONADOS ......................................... 103 4.2.4 DETERMINACIÓN DE LA EXPRESIÓN TRANSCRIPCIONAL .................................... 103 4.3 RESULTADOS................................................................................................................... 105 4.3.1 EXTRACCIÓN DE ARN Y SÍNTESIS DE ADNc .............................................................. 105 4.3.2 DETERMINACIÓN DE LA EXPRESIÓN TRANSCRIPCIONAL .................................... 108 ii Índice 4.4 DISCUSIÓN ....................................................................................................................... 114 4.5 REFERENCIAS.................................................................................................................. 118 CAPÍTULO V DETERMINACIÓN DE LA FUNCIONALIDAD DE LOS GENES NAC SELECCIONADOS ............................................................................................................................ 123 5.1 INTRODUCCIÓN ............................................................................................................... 123 5.2 MATERIALES Y MÉTODOS .............................................................................................. 125 5.2.1 SOBREEXPRESIÓN EN N. tabaccum. ............................................................................. 125 5.2.1.1 ESTANDARIZACIÓN DE LA TRANSFORMACIÓN GENÉTICA DE TABACO ....... 125 5.2.2 LOCALIZACIÓN NUCLEAR DE LAS PROTEÍNAS CpNAC-GFP ................................. 126 5.2.3 ENSAYOS DE ESTRÉS EN LÍNEAS TRANSGÉNICAS DE TABACO ........................ 126 5.3 RESULTADOS................................................................................................................... 128 5.3.1 TRANSFORMACIÓN GENÉTICA DE PLANTAS DE TABACO .................................... 128 5.3.2 LOCALIZACIÓN NUCLAR GFP-CpNAC’s ........................................................................ 131 5.3.3 ENSAYOS DE ESTRÉS ABIÓTICO EN LAS LÍNEAS TRANSGÉNICAS DE TABACO ........................................................................................................................................... 132 5.4 DISCUSIÓN ....................................................................................................................... 137 5.5 REFERENCIAS.................................................................................................................. 140 CAPÍTULO VI ..................................................................................................................................... 143 6.1 DISCUSIÓN GENERAL ..................................................................................................... 143 6.2 CONCLUSIONES GENERALES ....................................................................................... 146 6.3 PERSPECTIVAS................................................................................................................ 147 iii Índice ÍNDICE DE FIGURAS CAPÍTULO I Figura 1.1 Cascada de señalización en respuesta a estrés abiótico. Los factores de transcripción son mostrados dentro cajas de color (Shinozaki y Yamaguchi-Shinozaki., 2007) . ......................................................................................................................................... 12 Figura 1. 2 Esquema de la estructura de un factor de transcripción NAC. La región del dominio de unión al ADN está contenida en los subdominios D y E. La región TAR (Región de activación transcripcional) se encuentra en el C-terminal de las proteínas de la familia NAC. ............................................................................................................................................ 14 Figura 1.3 Representación esquemática de las principales estructuras de las proteína NAC (Ooka et al., 2003). Las barras grises indican el dominio N-terminal NAC. Proteínas VOZ con un dedo de zinc indicado como (Zinc F). ............................................................................. 14 Figura 1.4 Estrategia experimental de este trabajo.................................................................... 22 CAPÍTULO II Fig. 1 Phylogenetic relationships among 24 land plant species and the distribution of NAC proteins identified in this study, based on the HMM-generated profile. The total number of NAC proteins identified in each genome; the plant genome size, ploidy and chromosome number of each species; and the number of NAC sequences with Transmembrane motifs (TMM) for each genome are indicated on the right in colored squares. Ancient WGDs are represented by colored stars (details were taken from CoGepedia, https://genomevolution.org). Species names are color-coded as follows: blue – Moss, purple – pseudofern, red - monocots, and green - eudicots. *Genome size in Gb. ............................... 43 Fig. 2 Schematic representation of NAC OGs shared among Angiosperms. A) Venn diagram showing the orthologous gene number shared between the P. patens outgroup and rice and grapevine genomes as the selected representatives for monocot and eudicot plants, respectively. The total overlap consisted of five proteins that define the basal core of the NAC genes. B) The number of orthologous proteins detected by means of BBH in 24 green plants. Green lines indicate the OGs shared between the moss P. paten, S. moellendorffii, and the basal taxa of the monocot and eudicot lineages. The number below the red line indicates the number of OGs shared between the rice and grapevine species. Black lines indicate the number of OGs shared among the monocots and eudicots with their respective selected pivotal species. ............................................................................................................. 48 Fig. 3 Phylogenetic relationships of the NAC gene family. A) Maximum likelihood phylogenetic tree derived from a MUSCLE alignment of the NAC domains from 24 plant species. The unrooted phylogenetic tree of the 2106 NAC proteins was clustered into six major families. Specific motifs found in the C-terminal region of the NAC proteins are shown iv Índice next to each group. Blue lines and blue asterisks indicate sequences of P. patens in the tree, green circles show Arabidopsis proteins, and purple and red circles show grapevine and rice sequences, respectively. B) Schematic depiction of the proposed NAC family classification. Names of each subgroup are shown next to each clade. Triangles represent the NAC subgroups (detailed phylogenetic analysis is available in S4 Fig; branch lengths are arbitrary). C) Schematic representation of the five NAC's BOGs detected in the plant lineage and their affiliation into the major groups. Paralogous proteins for rice and grapevine are shown below each colored box. The affiliation of each BOG into the phylogenetic tree is available in S5 Fig. C) HMM LOGO of the NAC domain of 2106 proteins used in the phylogenetic tree. ........................................................................................................................ 51 CAPÍTULO III Figura 3. 1 Análisis comparativo entre las tres secuencias caracterizadas de A. thaliana ANAC019, ANAC055 y ANAC072 con la secuencia ortóloga CpNAC4 de C. papaya (color naranja). ...................................................................................................................................... 84 Figura 3. 2 Comparación de las estructuras secundarias de las proteínas de A. thaliana con respecto a sus secuencias ortólogas en C. papaya. A y E corresponden a la proteína CpNAC5 y ANAC002 respectivamente; B y F, proteínas CpNAC1 y ANAC029; C y G, proteínas CpNAC39 y ANAC040; D y H, proteínas CpNAC12 y ANAC092 respectivamente. .. 86 Figura 3. 3 Comparación de modelos tridimensionales de las proteínas NAC seleccionadas A) Ensamble biológico del dominio NAC de la proteína ANAC019 (Crystal form IV, PDB), B) ANAC019, C) ANAC055, D) ANAC072 y E) proteína CpNAC4 de papaya ortóloga a ANAC072..................................................................................................................................... 86 Figura 3. 4 Resumen de los diversos elementos en cis presentes en la región promotora de los genes NAC seleccionados. Los nombres de los diferentes elementos en cis se señalan dentro de cajas en color verde, y el sitio dentro del promotor se señala con figuras para cada uno de los elementos encontrados. (Análisis realizado 1.5 Kb río arriba a partir del ATG de la secuencia codificante) ............................................................................................................. 88 CAPÍTULO IV Figura 4. 1 ARN total de plantas de papaya sometidas a 40°C en diferentes tiempos de exposición (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% ...................................................... 105 Figura 4. 2 ARN total de plantas de papaya sometidas a 4°C en tiempos de exposición (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% .............................................................................. 105 Figura 4. 3 Muestras de ARN total de plantas de papaya sometidas a diferentes tiempos de estrés por sequía (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% ........................................... 106 Figura 4. 4 Muestras de ARN total de plantas de papaya sometidas a diferentes tiempos de estrés por salinidad (300mM NaCl). Gel de agarosa al 1.5% ................................................... 106 v Índice Figura 4. 5 Muestras de ADNc de plantas sometidas a tratamiento de 40ºC en diferentes tiempos (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% ........................................................... 107 Figura 4. 6 Muestras de ADNc de plantas sometidas a tratamiento de 4ºC en diferentes tiempos (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% ........................................................... 107 Figura 4. 7 Muestras de ADNc de plantas sometidas a tratamiento de sequía en diferentes tiempos. Gel de agarosa 1.5%. ................................................................................................. 108 Figura 4. 8 Muestras de ADNc de plantas sometidas a tratamiento de salinidad (300mM) en diferentes tiempos. Gel de agarosa 1.5%. ................................................................................ 108 Figura 4. 9 Patrón de expresión transcripcional en dos diferentes tejidos, hoja y raíz, de los cinco genes NAC seleccionados de C. papaya sometidos a estrés por baja temperatura (4°C). Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga. ......................................................................................................................................... 109 Figura 4. 10 Patrón de expresión transcripcional en dos diferentes tejidos, hoja y raíz, de los cinco genes NAC seleccionados de papaya sometidos a estrés por alta temperatura (40°C). Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga .. 109 Figura 4. 11 Perfil de expresión transcripcional en dos diferentes tejidos, hoja y raíz, para los cinco genes NAC seleccionados de papaya sometidos a estrés por sequía así como para el grupo control. Se utilizaron los genes HSP70 y DREB2C como control positivo ante el estrés por sequía. Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga ............................................................................................................... 110 Figura 4. 12 Perfil de expresión transcripcional de los genes NAC seleccionados de papaya para el estrés por salinidad así como para el grupo control. Se utilizaron los genes HSP70 y DREB2C como control positivo ante el estrés. Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga ..................................................................... 111 CAPÍTULO V Figura 5. 1 Explantes de tabaco transformados en medio semisólido de inducción de brotes, con los respectivos antibióticos para cada tratamiento. ........................................................... 128 Figura 5. 2 Plantas de N. tabacum transformadas con el gen gusA, mediante el protocolo de Clemente, 2006. ........................................................................................................................ 129 Figura 5. 3 Desarrollo de plantas de tabaco transformadas con genes CpNAC4 y CpNAC5 de C. papaya. A) Regeneración mediante organogénesis directa de plantas transformadas, B) plantas de tabaco transformadas de 8 semanas en medio de enraizamiento. .................... 130 Figura 5. 4 Plantas transgénicas de N. tabacum (progenie F0) después de su aclimatación . 130 vi Índice Figura 5. 5 Localización de la proteína CpNAC4 y CpNAC5 en hojas de tabaco. Proteínas de papaya fusionadas a la proteína GFP bajo el control del promotor 35S. ............................ 131 Figura 5. 6 Localización nuclear de la proteína CpNAC4 y CpNAC5 en raíz de tabaco. Proteínas de papaya fusionadas a la proteína GFP bajo el control del promotor 35S. ............ 132 Figura 5. 7 Trantamiento de estrés por temperatura (42°C) para plantas de tabaco sobreexpresantes del gen CpNAC5 de papaya. Tres líneas pertenecientes al gen CpNAC5 (a, b y c) fueron sometidas junto con un grupo control a un ensayo por calor durante 8 horas. ......................................................................................................................................... 133 Figura 5. 8 Tratamiento de salinidad para plantas de tabaco sobreexpresantes del gen CpNAC5 de papaya. En cajas rojas se señalas las diferencias más notorias en la afectación del crecimiento de la raíz en las líneas transgénicas de tabaco. En recuadro verde (100 mM) se muestra la diferencia del crecimiento de la parte aérea de la planta control con respecto a las sobreexpresantes. ............................................................................................................... 134 Figura 5. 9 Tratamiento de germinación de plantas de tabaco transformadas con el gen CpNAC4 de papaya. A) Disposición de las líneas transgénicas y el control (wild-type) en la placa; B) placa con medio MS sin ABA a los 18 días; C y D) placa con 0.1 µM de ABA a los 18 días; E y F) placa con 0.1 µM de ABA a los 21 días de germinación; G y H) placa con 0.1 µM de ABA a los 24 días de germinación. ................................................................................ 135 Figura 5. 10 Fenotipos resultantes de plantas de tabaco no transformadas y plantas sobreexpresantes del gen CpNAC4_1 después de siete días de estrés por temperatura a 44°C durante 7 días. A) Plantas no transformadas de tabaco después de siete días de estrés; B) Plantas de tabaco que sobreexpresan el gen CpNAC4_1 despues de 7 días a 44°C. Las plantas fueron regadas diariamente con 200 mL de agua. ...................................... 136 vii Índice ÍNDICE DE CUADROS CAPÍTULO I Tabla 1. 1 Plantas genéticamente modificadas con Factores de Transcripción NAC para conferir tolerancia a estrés abiótico............................................................................................. 17 CAPÍTULO III Tabla 3. 1 Genes funcionales NAC reportados en la literatura, involucrados en diversas respuestas ambientales. ............................................................................................................. 81 Tabla 3. 2 Secuencias seleccionadas de C. papaya ortólogas a genes de A. thaliana responsivos a estrés abiótico ...................................................................................................... 83 CAPÍTULO IV Tabla 4. 1 Iniciadores usados para clonación y análisis de expresión transcripcional de los genes NAC seleccionados de papaya ...................................................................................... 104 viii Resumen RESUMEN Los factores de transcripción (FT) son conocidos por regular una amplia gama de procesos fisiológicos y estar incluidos en las estrategias moleculares que las plantas utilizan para hacer frente ante los diversos tipos de estrés ambiental. Se ha comprobado que la alteración de la expresión de ciertos FT en las plantas puede influir considerable en la tolerancia al estrés. La familia NAC es una de los grupos más grandes de FT encontrados específicamente en plantas, los cuales se encuentran involucrados en un gran número de procesos del desarrollo y en respuesta al estrés ambiental. Dichas proteínas se pueden identificar por la presencia de un dominio Nterminal conservado, con la capacidad de unirse al ADN, y un dominio C- terminal altamente variable el cual tiene la capacidad de ser un activador de la transcripción. En este estudio se determinó mediante diversos análisis bioinformáticos, la evolución de esta familia de FT en Angiospermas, así como las expansiones génicas que ha sufrido entre los diversos linajes de plantas. Por otro lado, se determinó la expresión transcripcional de cinco genes NAC de C. papaya cv. Maradol ante cuatro diferentes tipos de estrés abiótico, comprobando de esta manera la actividad transrcripciona de dichos genes en respuesta a un determinado tipo de estrés abiótico. La sobreexpresión de los genes CpNAC4 y CpNAC5 en plantas de tabaco, demostraron su participación en los mecanismos moleculares que dichos organismos adoptan para hacer frente al estrés abiótico. 1 Abstract ABSTRACT Transcription factors (TFs) are known to regulate a wide range of physiological processes and are included in the strategies that plants use to cope with environmental stresses. It has been found that the overexpression of certain transcription factors in plants can considerably influence on stress tolerance. NAC TF family, which is only found in plants, regulates many processes of plant development and in response to stress. NAC proteins can be identified by the presence of an N-terminal conserved domain (called NAC domain) with the ability to bind to DNA and a highly variable Cterminal region which is an activator of transcription. In this study we determine the evolutionary history of NAC TF family in Angiosperms. On the other hand, the transcriptional expression of five stress-related NAC's genes from papaya tree was determined. Furthermore, the functionality of two stress-related NAC genes (CpNAC4 and CpNAC5) was determined by overexpression in tobacco plants and their participation in tolerance to abiotic-stress processes was corroborated. 3 Introducción INTRODUCCIÓN Las plantas crecen en un ambiente dinámico que a menudo presenta grandes retos y limitaciones para su crecimiento y desarrollo. Entre los factores adversos que impone el medio ambiente encontramos las altas y bajas temperaturas, la salinidad de los suelos, los déficits hídricos, la disponibilidad de nutrientes en los suelos y el estrés osmótico. Estas problemáticas han sido el centro de la atención de un gran número de estudios a nivel fisiológico y bioquímico, los cuales se han enfocado a desentrañar las diversas respuestas y los mecanismos celulares/moleculares que las plantas han desarrollado ante los diversos tipos de estrés (Zhu, 2002). El primer evento de adaptación vegetal ante cualquier tipo de estrés involucra la percepción del mismo y la subsecuente transducción de la señal que permitirá a la planta adoptar las estrategias metabólicas y fisiológicas necesarias para hacer frente a dichos retos, entre estas respuestas se incluye la expresión transcripcional de genes responsivos al estrés (Shinozaki et al., 2003). Diversos estudios han señalado que las respuestas de una planta ante un estrés está gobernado por múltiples loci, esto hace mención del carácter multigénico inherente de las plantas en respuesta a las condiciones de la naturaleza (Tran et al., 2004). La regulación transcripcional actúa como el primer controlador de los diversos procesos celulares en las plantas, tales como la morfogénesis celular, las señales de transducción y las respuesta a estrés ambiental (Riechmann et al., 2000). Aunque la función de muchos genes permanece sin conocer, existen algunos como los factores de transcripción (FT) que han sido descritos en una amplia variedad estudios a nivel molecular en diversas especies de plantas (Tra et al., 2004). Los Factores de Transcripción (FTs) son proteínas consideradas como reguladores maestros de la transcripción, debido a que un solo FT puede controlar la expresión de diversos genes a través de la unión específica de estos en los elementos en cis encontrados en los respectivos promotores de los genes blanco (Nakashima et al., 2009; Wray et al., 2003; Riechmann et al., 2000). Dichas proteínas se encuentran agrupadas en familias con base en la similitud de sus secuencias, más frecuentemente en el dominio de unión al ADN (DBD) por sus siglas en inglés DNA-binding domain (Jensen et al., 2010). Los FT's desempeñan un rol importante en la regulación de la expresión de genes en respuesta al estrés abiótico, por tal motivo son considerados 5 Introducción como un poderoso blanco para la ingeniería genética en la tolerancia al estrés debido a que la sobreexpresión de estos puede desencadenar la regulación de un gran número de genes en respuesta al estrés. Algunos de los FT's más importantes en respuesta al estrés abiótico incluyen a los DREB1/CBF, DREB2, AREB/ABF, NAC y MYC/MYB, los cuales han sido usados para mejorar la tolerancia al estrés abiótico en una gran variedad de plantas (Nakashima et al., 2009) Hasta la fecha, han sido identificadas más de 60 diferentes familias de FT's en plantas basados en análisis bioinformáticos (Zhang et al., 2011). Un ejemplo de la enorme diversidad de estas secuencias es el genoma de Arabidopsis que codifica por lo menos 1550 FT's, representando un 6.2% del número total de genes estimados (AtTFDB, 2011). En cuanto a Populus, se ha encontrado que un 6.4% de su genoma codifica para más de 2900 FT's (Riano-Pachon et al., 2007; Tuskan et al., 2006). Por lo tanto, la identificación y caracterización funcional de los FT's es esencial para la reconstrucción de las redes de regulación transcripcional y el entendimiento de los mecanismos adaptativos de las plantas frente a un entorno cada vez más cambiante (Riano-Pachon et al., 2007). 6 Capítulo I CAPÍTULO I 1.1 ANTECEDENTES 1.1.1 ESTRÉS ABIÓTICO 1.1.1.1 SEQUÍA La disponibilidad de agua es obviamente el agente selectivo más significativo dentro de las poblaciones vegetales en la naturaleza. El entendimiento de las bases genéticas y fisiológicas de la adaptación a la sequía, es por lo tanto de vital importancia para comprender la evolución de las especies silvestres, así como para mejorar los cultivos vegetales. Arabidopsis, como otras plantas, posee tres mecanismos para hacer frente al estrés por sequía: 1) El escape de la sequía, el cual permite a la planta reproducirse y dejar su descendencia antes de que el ambiente se vuelva seco, probablemente una estrategia de vida (Chávez et al., 2003). 2) Evitar la deshidratación, se refiere al ajuste del crecimiento con el fin de evitar perturbaciones fisiológicas internas. Durante la sequía, las plantas cierran sus estomas para evitar la pérdida de agua, y alargan sus raíces para poder captar más agua. La mayoría de las plantas evitan la deshidratación mediante este mecanismo primario, que involucra la regulación de la conductancia estomática con el fin de mantener un estado interno de agua favorable (Ludlow et al., 1989). Sin embargo, los estomas son usados en la respiración, y las plantas bajo estrés por sequía, necesitan encontrar un balance con el fin de mantener una asimilación residual de carbono y subsecuentemente poder crecer. 3) La tolerancia a la deshidratación varía con respecto al genotipo y la habilidad de sus tejidos para soportar la deshidratación, algunas veces mediante la acumulación de metabolitos como la prolina y la glicina betaína, con el fin de mantener la integridad y la homeostasis celular. Esta clase de mecanismo es bastante teórico, ya que las plantas experimentan una variedad de tensiones como resultado de la combinación de factores estresantes, lo que da a lugar múltiples y complejos ajustes internos (Lefebvre et al., 2009). Durante el proceso de respuesta de las plantas al estrés por sequía, una gran cantidad de genes son inducidos. Estos genes se clasifican en dos grandes grupos de acuerdo a su modo de funcionamiento. El primer grupo comprende genes que codifican para proteínas estructurales, los cuales son los efectores dentro de la señalización en respuesta al estrés, como es el caso de los genes de osmorregulación, proteínas antioxidantes, acuaporinas y proteínas LEA (Late Embryogenes Abundant; Wang et 7 Capítulo I al., 2006). El segundo grupo consiste en genes que codifican para proteínas reguladoras, que son activadores transcripcionales de respuesta temprana, en las cuales se incluyen los factores de transcripción y las proteínas cinasas. Entre los principales factores de transcripción relacionados con el estrés se incluyen las proteínas bZIP, WRKY, MYB y AP2/EREBP, las cuales han demostrado desempeñar un rol importante en la regulación en la tolerancia a sequía (Song et al., 2005). Las proteínas cinasas incluye a las CDPK's (calmodulin dependent protein kinases), MAPK's (mitoge-activated protein kinases), RPK's (receptor protein kinases) y las proteínas cinasas ribosomales, éstas se encuentran involucradas en la amplificación de las señales en cascada, en respuesta a diferentes factores estresantes (Ludwig et al., 2004). La expresión de genes inducibles por sequía puede estar controlada por los sistemas de regulación dependientes o independientes de ABA (Yamaguchi-Shinozaki y Shinozaki, 2005). Existen varios mecanismos de señalización cruzados (cross-talks) entre diversos tipos de estrés, tales como sequía, estrés salino y estrés biótico (Huang et al., 2008). Los cambios en la expresión transcripcional de genes bajo estrés por sequía, provocan una serie de alteraciones fisiológicas y bioquímicas. La fotosíntesis, una de las rutas biosintéticas primarias, es significativamente afectada por el estrés por sequía, el cual restringe el funcionamiento normal de otras rutas metabólicas, tales como la fijación del nitrógeno (Chaves et al., 2009). La ruta de la respiración, la cual cataboliza moléculas complejas en compuestos más simples, para proveer de la energía requerida para el desarrollo de las plantas, es acelerada bajo condiciones de estrés (Haupt-Herting et al., 2001). Los sistemas de protección tales como las rutas antioxidantes, las cuales pueden proteger a las células vegetales mediante la eliminación de especies reactivas de oxígeno (ROS por sus siglas en inglés Reactive Oxygen Species), son afectadas por la sequía (Apel y Hirt, 2004). 1.1.1.2 TEMPERATURAS Debido a que las plantas son organismos sésiles, se encuentran expuestas a un gran número de estreses, por lo cual necesitan estrategias para adaptarse a cada uno de ellos. Uno de los estreses más comunes que enfrentan son las altas y bajas temperaturas. La respuesta al choque térmico (heat-shock response) es una reacción 8 Capítulo I causada por la exposición repentina de un organismo, tejido o célula a temperaturas extremas, la cual es caracterizada por la expresión transitoria de proteínas de choque térmico (HSPs, heat-shock proteins). Estas proteínas se encuentran involucradas en la protección del organismo contra el estrés por calor y el mantenimiento de la homeostasis (Koh, 2002). La inducción de estas proteínas depende de la temperatura a la cual cada especie crece normalmente. En plantas superiores, las HSP son generalmente inducidas por una corta exposición a temperaturas entre 38-40ºC. Existen varios HSP de diferente tamaño molecular, pero todos ellos son caracterizados por unirse a la estructura de proteínas inestables. Poseen funciones importantes, como moléculas chaperonas, prevén la agregación de proteínas desnaturalizadas y promueven la renaturalización de agregados de proteínas. Otro factor de importancia es el incremento de las ROS durante el aumento y el descenso de las temperaturas. En este proceso, existen seis enzimas encargadas de detoxificar a las ROS, la superóxido dismutasa (SOD), la ascorbato peroxidasa (APX), la catalasa (CAT), monodehidroascorbato reductasa (MDAR), dehidroascorbato reductasa (DHAR) y glutatión reductasa (GR). Cuando la planta modelo Arabidopsis es sometida a bajas temperaturas acumula grandes concentraciones de H2O2 en sus células, y las actividades enzimática de APX y GR aumentan. El efecto de la temperatura varía grandemente, desde el congelamiento hasta las altas temperaturas. No se conoce mucho sobre las bases del mecanismo molecular de la variación natural de la tolerancia a las bajas temperaturas, sin embargo tanto las temperaturas bajas como el congelamiento, son dos factores relevantes que limitan la distribución de las especies vegetales. El estrés por frío resulta en cambios en la expresión de genes, cambios en la composición de los lípidos de la membrana, en la acumulación de osmolitos compatibles, elevación transitoria de la concentración de ABA y disminución del crecimiento. Las bajas temperaturas de igual forma imponen un estrés por deshidratación, debido a la baja absorción y transporte de agua por parte de las raíces (Smallwood et al., 2002) 1.1.1.3 SALINIDAD La salinidad de los suelos es un suceso natural anterior a la civilización humana, hoy en día sigue siendo uno de los principales tipos de estrés abiótico que afecta severamente el crecimiento y desarrollo de las plantas, causando pérdidas en los cultivos en todo el mundo (Jah et al., 2009). 9 Capítulo I Los suelos salinos se caracterizan por su nivel de toxicidad debido principalmente a los cloruros y a los sulfatos de sodio, aunque existen otro tipos de sales en menor proporción; este problema se agudiza cada vez más debido al factor antropogénico y a sucesos naturales como por ejemplo: 1) el uso de agua para riego de mala calidad, 2) drenaje inadecuado de los canales de riego de los agroecosistemas, 3) entrada de agua de mar durante los ciclones en las zonas costeras y 4) la acumulación de sal en la zona de las raíces en las regiones áridas y semi-áridas debido a la alta demanda de evaporación y lixiviación insuficiente de los iones, debido a las escasas lluvias (Chinnusamy y Jian-Kang, 2003). La producción alimentaria en aumento es el principal factor de presión ejercido sobre los recursos de la tierra, lo que acentúa la degradación de los suelos. De acuerdo al laboratorio de salinidad USDA (United State Department of Agriculture), un suelo salino se define como aquel que presenta 40 mM de NaCl o más. Muchos cultivos de granos y vegetales como las glicofitas son altamente susceptibles a los suelos salinos. Existen diferentes umbrales de tolerancia y diferentes tasas de reducción de los cultivos indicando una variación en los mecanismos de tolerancia a sal entre especies cultivables (Witcombe et al., 2007). La salinidad es perjudicial para el desarrollo de las plantas, ya que restringe la captación de nutrientes a través de la raíz y la absorción de fósforo, potasio, nitrato de calcio (Flowers y Colmer, 2008), causa una severa citotoxicidad debido a la presencia de iones sodio, cloro y sulfatos, aunado al estrés osmótico al que se encuentra sometida la planta. El sodio desplaza al potasio en el interior celular y altera la homeostasis enzimática en el citoplasma, donde más de 50 enzimas utilizan el potasio para su activación. Además, está molécula puede penetrar la capa de hidratación de las proteínas e interferir con las interacciones no covalentes entre aminoácidos, llevando a cambios conformacionales y pérdida de la función de las proteínas, ocasionando la reducción de la asimilación del CO2, reducción de la conductancia estomatal, daño a los fotosistemas, cambios en los contenidos de clorofila, lo que conlleva a un desequilibrio metabólico dando lugar a un estrés oxidativo. Se estima que la salinidad afecta el nivel transcripcional en un promedio del 8% de todos los genes (Smethurst et al., 2009). 10 Capítulo I El estrés salino frecuentemente es acompañado por la deshidratación y el estrés osmótico. El bajo nivel osmótico reduce la captación de agua por la planta, resultando en sequía fisiológica (Lefebvre et al., 2009). 1.1.2 SISTEMAS DE REGULACIÓN DE LA EXPRESIÓN GÉNICA ANTE ESTRÉS ABIÓTICO Existen al menos cuatro sistemas de regulación a nivel transcripcional para la expresión génica, en respuesta al estrés abiótico en Arabidopsis, entre éstos se encuentran dos vías independientes del ácido abscísico (ABA) y otras dos dependientes de ABA (Shinozaki and Yamaguchi-Shinozaki, 2000). En la vía independiente de ABA, se encuentra el elemento en cis conocido como "Dehydrationresponsive element/C-repeat" (DRE/CRT), el cual actúa en respuesta al frío y la alta salinidad, controlando los niveles transcripcionales de genes involucrados ante dichos procesos. Otros regulador transcripcional son las proteínas MYC y MYB las cuales son activadoras en uno de los sistemas de regulación dependientes de ABA (Abe et al., 2003) al igual que las proteínas "ABA-responsive element-binding protein/ABA-binding factor" (AREB/ABF's) (Uno et al., 2000). El sistema de regulación menos entendido es el independiente de ABA, el cual interviene en la activación de genes que no responden ante la acumulación endógena o aplicación exógena de ABA, tales como el gen erd1, que codifica un proteína homóloga a la subunidad de unión al ATP de la clp ATP-dependent protease de Escherichia coli (Nakashima et al., 1997). Estudios realizados por Tran et al., (2004) en la secuencia promotora de erd1, señalaron la presencia de un tipo de FT's que regula la expresión del gen, dicho factor posee un dominio característico encontrado en la familia multigénica de FT's NAC los cuales son específicos en plantas (Riechmann et al., 2000). 1.1.3 FACTORES DE TRANSCRIPCIÓN INVOLUCRADOS EN RESPUESTA A ESTRÉS ABIÓTICO Las respuestas ante el estrés abiótico requieren de la producción de proteínas metabólicas, como las que participan en la síntesis de osmoprotectores y proteínas reguladoras que operan en las vías de transducción de señales, tales como cinasas y factores de transcripción. Dado a que la mayoría de las respuestas implica un control 11 Capítulo I de la expresión génica, los FT's desempeñan un rol importante en la respuesta al estrés abiótico (Chaves y Oliveira, 2004). Los FT's son proteínas específicas, que poseen un dominio capaz de interaccionar con los elementos en cis presentes en las cajas promotoras de los genes, estos inducen (activan) o reprimen la actividad de la ARN polimerasa, por lo tanto regulan la expresión de sus genes "blanco". Los factores de transcripción pueden ser agrupados en familias de acuerdo a su dominio de unión al ADN (Riechmann et al., 2000). Un grupo de genes controlado por cierto tipo de FT's es conocido como regulón. En respuesta a estrés abiótico en plantas se han identificado por lo menos cuatro tipos diferentes de regulones (Figura 1.1): (1) el regulón CBF/DREB, (2) el regulón NAC (NAM, ATAF y CUC) y ZF-HD (zinc-finger homeodomain), (3) regulón AREB/ABF (ABA-responsive element-binding protein/ABAbinding factor) y el regulón (4) MYC (myelocytomatosis oncogene)/MYB (myeloblastosis oncogene). (Saibo et al., 2009). Figura 1.1 Cascada de señalización en respuesta a estrés abiótico. Los factores de transcripción son mostrados dentro cajas de color (Shinozaki y YamaguchiShinozak i., 2007). 12 Capítulo I 1.1.4 EL REGULÓN NAC La vía dependiente de ABA se dio a conocer cuando se observó que el transcripto del gen ERD1 (Early responive to dehydration stress 1) se acumulaba antes de cualquier incremento de ABA, en respuesta a deshidratación o salinidad, sugiriendo la presencia de una vía independiente de ABA (Nakashima et al., 1997). El análisis del promotor ERD1 reveló la presencia de FT's pertenecientes a la familia NAC y ZF-HD los cuales son esenciales para la activación del gen ERD1 (Tran et al., 2007). En un estudio propuesto por Hu et al., en 2006, se aisló el gen responsivo a sequía SNAC1 (Stressresponsive NAC1) de una variedad de arroz de tierras altas y fue sobreexpresado en otra variedad de tierras bajas. Cuando se comparó la planta transformada con la planta de arroz silvestre de tierras bajas, la que sobreexpresaba SNAC1 mostró tolerancia a sequía en la antesis, y tolerancia a la sequía y a la salinidad en el estado vegetativo. Dichas plantas no mostraron el fenotipo enano esperado, como las que sobreexpresan CBF/DREB1 (Ito et al., 2006) revelando un mecanismo diferente ante el estrés. Las proteínas con el dominio característico NAC (NAM, ATAF1/2 y CUC2) comprenden una de las familias más grandes de FT's específicos para plantas, representados por 105 genes en Arabidopsis (Ooka et al., 2003), 140 genes en arroz (Fang et al., 2008) y 101 genes en el genoma de soya (Pinheiro et al., 2009). Dichos factores de transcripción poseen un dominio N-terminal conservado, el cual es nombrado como dominio NAC, que comprende cerca de 160 aminoácidos (aa) el cual se encuentra dividido en 5 subdominios (A-E) (Figura 1.2); los subdominios A, C y D se encuentran altamente conservados entre las proteínas NAC de diversos organismos, mientras que los subdominios B y E presentan mayor variabilidad (Ooka, 2003; Kikuchi et al., 2000). Dentro del dominio NAC se encuentra una región de 60 a.a. conteniendo un único doblez en todo el factor de transcripción, que forma una doble trenza unida por algunos elementos helicoidales (Duval et al., 2002). Dicho dominio ha sido implicado en la señalización de localización nuclear, en la unión al ADN y en la formación de homodímeros o heterodímeros con otras proteínas con dominio NAC (Jensen et al., 2010; Ernst et al., 2004). Diversos estudios realizados en Arabidopsis señalan la existencia de por lo menos cinco diferentes secuencias blanco de unión al ADN de dichos FT's, la primera de ellas es la "Secuencia de Reconocimiento en Respuesta a sequía NAC (NACRS)" la cual contiene el motivo central CACG; el segundo sitio de unión es el "Motivo en Respuesta a Deficiencias fe 13 Capítulo I Hierro IDE2" con la secuencia central CA(A/C)G(T/C)(T/C/A)(T/C/A); el sitio de unión CBNACBS "Unión a Calmodulina" con la secuencia central GCTT; el "Elemento de unión NAC de pared secundaria SNBE" el cual posee el motivo de 19 pb (T/A)NN(C/T) (T/C/G)TNNNNNNNA(A/C)GN(A/C/T) (A/T); y por último la secuencia de 21 pb del promotor 35S (283-263) conteniendo dos secuencias centrales, CGTA y CGTC. En contraste, la región C-terminal de los FT's NAC poseen secuencias altamente variables difíciles de agrupar (Olsen et al., 2005; Kikuchi et al., 2000), éstas les confieren la capacidad de regular una amplia gama de funciones celulares mediante la activación o represión de la actividad transcripcional (Figura 1.3) (Yamaguchi et al., 2008; Hegedus et al., 2003; Xie et al., 2000). Figura 1. 2 Esquema de la estructura de un factor de transcripción NAC. La región del dominio de unión al ADN está contenida en los subdominios D y E. La región TAR (Región de activación transcripcional) se encuentra en el C-terminal de las proteínas de la familia NAC. N-terminal extendida VOZ TAR Dominio NAC Zinc F Tandem TAR Dominio NAC Dominio NAC Dominio NAC Figura 1.3 Representación esquemática de las principales estructuras de las proteína NAC (Ooka et al., 2003). Las barras grises indican el dominio N-terminal NAC. Proteínas VOZ con un dedo de zinc indicado como (Zinc F). 14 Capítulo I 1.1.4.1 PROCESOS EN LOS QUE SE ENCUENTRAN INVOLUCRADAS LAS PROTEÍNAS NAC Las proteínas NAC se encuentran implicadas en una amplia gama de procesos de desarrollo vegetal, tales como, la formación del meristemo apical (Nikovics et al., 2006), la morfogénesis floral (Sablowski y Meyerowitz, 1998), el desarrollo de raíces laterales (He et al., 2005), la senescencia de las hojas (NAP) (Balazadeh et al, 2010), la inducción de la floración por estrés (Kim et al., 2007), el desarrollo del embrión (Duval et al., 2002), el control del ciclo celular (Kato et al., 2009), la señalización hormonal (Jensen et al., 2008), la movilización de nutrientes en semilla (Waters et al., 2009) y en la determinación del patrón de ramificación (Mao et al., 2007). Particularmente, un gran número de FT's NAC se encuentran implicados en respuesta a distintos tipos de estrés abiótico, tales como sequía, salinidad, altas temperaturas y estrés por frío (ANAC019, ANAC055 y ANAC072); por otro lado, se ha comprobado la participación de algunos de éstos FT's NAC en diversos tipos de estrés biótico, tales como daño mecánico e infecciones virales (Wang et al., 2009; Lu et al., 2007). El gen ANAC019, de acuerdo a varios estudios de expresión transcripcional, se encuentra implicado en la respuesta a diversos tipos de estrés (Greve et al., 2003) la sobreexpresión de este gen causa un incremento en la tolerancia a la sequía (Tran et al., 2004). Además de esta respuesta ante el estrés abiótico, se ha demostrado que ANAC019 responde ante el ataque de hongos mediante vías de señalización relacionadas con la hormona vegetal ácido jasmónico (Bu, et al., 2008). Recientemente Bu et al., (2009), demostraron que ANAC019 interacciona con RHA2a los cuales responden como un nuevo regulador positivo en la señalización de la hormona ABA. Otro gen perteneciente a la familia NAC es ATAF1 o ANAC002, uno de los primero genes en ser descritos para esta familia. ATAF1 posee un rol distinto debido a que actúa como un regulador negativo en respuesta a sequía, ya que experimentos llevados a cabo con mutantes de Arabidopsis (ataf1) revelaron altos niveles transcripcionales de genes responsivos al estrés inducido por sequía, incluidos los genes COR47 (también conocido como RD17), ERD10, KIN1, RD22 y RD29 (COR78 o LT178, Lu et al., 2007). Recientemente, se ha visto que algunos FT's NAC desempeñan un papel fundamental en la xilogénesis (formación del xilema), en la formación de fibras y en la formación de la madera en plantas vasculares (Mitsuda y Ohme-Takagi, 2008; Ko et al., 2007). En 15 Capítulo I Arabidopsis, se han identificado algunos subgrupos de proteínas NAC, tales como NST1/ANAC043 (NAC NST2/ANAC066, y secondary NST3/SND1 Wall Thickening (Secondary Promoting Wall-associated NAC Factor-1), Domain Protein)/ANAC012, los cuales actuan como controles maestros de la transcripción (master switches) en la biosíntesis de la pared secundaria (Zhong et al., 2007). Otro subgrupo de proteínas NAC son las VND6 y VND7 (Vascular-related NAC-Domain) que han sido propuestas como reguladoras en la formación de vasos vasculares en Arabidopsis (Yamaguchi et al., 2008); dichas proteínas regulan la diferenciación del metaxilema y el protoxilema en raíces primarias (Kubo et al., 2005). Un tercer subgrupo de proteínas NAC, son las XND1/ANAC104 (Xylem NAC Domain 1) que se encuentran involucradas en la diferenciación de elementos traqueales y en el desarrollo del xilema en Arabidopsis, mediante regulación negativa de la biosíntesis de la pared secundaria y de la muerte celular programada en vasos del xilema. Aunque un buen número de FT's NAC han sido caracterizados funcionalmente en Arabidopsis y en arroz, como se señala en la tabla 1.1, la función de la mayoría de los miembros de la familia NAC es aún desconocida (Hu et al., 2010). 16 Capítulo I Tabla 1. 1 Plantas genéticamente modificadas con Factores de Transcripción NAC para conferir tolerancia a estrés abiótico Planta transgénica Gen/Procedencia Arabidopsis Referencia Hu et al., (2006) SNAC1/Arroz Tolerancia a Salinidad ORS1/Arroz Control de senescencia OsNAC10/Arroz Tolerancia a sequía Jeong et al., (2010) SNAC2/Arroz IRA109 Tolerancia a salinidad y Frío Hu et al., (2008) OsNAC5/Arroz Tolerancia a Salinidad y Sequía Song et al., (2011) NTL8 (NAC)/Arabidopsis Señalización en salinidad mediada por GA Kim et al., (2008) ONAC063/Arroz Tolerancia a Salinidad y a estrés osmótico Yokotani et al., (2009) GmNAC20/Glycine max Tolerancia a Salinidad Hao et al., (2011) GmNAC11/Glycine max Tolerancia a Salinidad Hao et al., (2011) Respuesta a salinidad Yang, et al., (2011) SlNAC3/ Tomate Tolerancia a Salinidad y Sequía Han et al., (2011) CsNAC1/Citrus Tolerancia abiótico De Oliveira et al.,(2011) DgNAC1/Chrysanthemu m Tolerancia a Salinidad Arroz Arabidopsis y Arroz Fenotipo de la planta transgénica la Balazadeh, et al. (2011) SlNAC1/Tomate Solanum tuberosum SlNAM1/ Tomate Solanum lycopersicum Citrus Tabaco a estrés Liu et al., (2011) 1.1.5 PLANTAS USADAS COMO MODELOS EXPERIMENTALES EN BIOLOGÍA MOLECULAR Una de las plantas dicotiledóneas más importantes dentro de los estudios molecuares es Arabidopsis thaliana, esto debido a que su genoma ha sido completamente secuenciado y existen un gran número de líneas mutantes. Cerca de 28,000 genes han sido predichos a partir de la secuenciación, pero solamente se conoce la función biológica de la mitad de ellos (Ooka, et al, 2003). La secuenciación del genoma de Arabidopsis fue la primera en completarse para plantas en el año 2000, trayendo 17 Capítulo I consigo nuevas perspectivas en la genética de las plantas superiores. Posee un genoma pequeño (220Mb en cinco cromosomas), es de vida corta (2-3 meses en invernadero), genera una gran descendencia en cada generación (más de 10,000 semillas por planta), y presenta autopolinización. Todo esto ha hecho de esta pequeña planta, perteneciente a las Brassicaceae, uno de los modelos favoritos en la genética molecular y en la biología celular del desarrollo. En los últimos 15 años, se ha creado una gran colección de líneas mutantes por inserción, lo cual ha facilitado la asociación de un cierto fenotipo con la función de un solo gen interrumpido. Más recientemente, Arabidopsis se ha convertido en una especie modelo para la biología evolutiva (Lefebvre et al., 2009). Por otro lado, Nicotiana tabaccum y N. benthamiana han servido como modelo experimental desde hace más de 20 años. Esta última posee características únicas al ser susceptible a una gran número de virus (>500), incluso aquellos que solamente afectan a plantas monocotiledóneas (Dasgupta et al., 2001). Dichas plantas se han ubicado en la categoría de "plantas modelo" por la facilidad y rapidez de evaluar y modular la expresión de transgenes en plantas superiores mediante ingeniería genética (Voinnet et al., 2003). N. tabaccum y N. benthamiana son susceptibles a una gran variedad de cepas desarmadas de A. tumefaciens y el sistema de transformación dispone de una amplia gama de agentes de selección diferentes a kanamicina (Fraley et al., 1983). Tabaco posee una regeneración prolífica a partir de discos foliares, mediante la organogénesis indirecta. Por otra parte, el tamaño de las semillas y la cantidad producida por evento permite monitorear la segregación en placas petri, puede ser acumulada suficiente biomasa a partir de una sola planta y puede de igual forma ser propagada clonalmente, autopolinizada y es de fácil entrecruzamiento manual. Por estas razones, el tabaco es considerada como una valiosa herramienta en la genómica funcional (Bendahmane et al., 2000). 1.1.6 Carica papaya Por otra parte, la planta de papaya es un sistema excepcional para el estudio y exploración de genomas de árboles tropicales y frutales, posee un genoma diploide relativamente pequeño de 372 Mb, agrupado en 9 cromosomas, con un porcentaje de GC del 35.3%. El 52% de su genoma está compuesto por regiones repetitivas largas conocidas como retrotransposones. De acuerdo a estudios citogenéticos 65-70% se compone de eucromatina y el 35-30% restante de heterocromatina. La Papaya posee 24,746 genes predichos con un promedio de 1,057 pb, 9,760 se catalogan como 18 Capítulo I genes únicos, de los cuales 6,845 genes poseen un promedio de 309 pb, de los cuales no ha sido reportada asociación alguna dentro las bases de datos de proteínas no redundantes. De igual modo, se han predicho para papaya un total de 27,873 proteínas codificantes. Por otro lado, la papaya posee un número mucho menor de genes en comparación con otras plantas, posee un 11-20% menos que Arabidopsis thaliana, un 34% menor que arroz (Oryza sativa japonica) y un 19% menor que la vid (Vitis vinifera), siendo hasta el momento la planta secuenciada con el menor número de genes. En una comparación entre cinco especies secuenciadas (Arabidopsis thaliana, Carica papaya, Populus trichicarpa, Oryza sativa y Vitis vinifera), todas las proteínas inferidas se colapsaron en 39,709 grupos similares, y en una comparación entre Arabidopsis y papaya se encontró que 3,595 grupos de los 6,726 compartidos, poseían el mismo número de genes. Para el resto de los grupos, Arabidopsis superó en número a papaya en una relación de dos a uno, siendo ésta una tendencia con las demás plantas comparadas, teniendo en común solamente 13,311 genes compartidos de entre los 39,709 grupos colapsados. (ASGPB, 2011; Ming et al., 2008), Por otro lado, papaya posee un sistema de transformación genética bien establecido, un ciclo de vida corto (9-15 meses), una floración continua durante todo el año y un sistema primitivo de cromosomas sexuales. Esta planta requiere de una pluviometría media de 1.800 mm anuales y una temperatura media anual de 20 a 22 ºC, puede resistir fríos ligeros, pero si no tiene las condiciones ambientales óptimas no se desarrolla y los frutos no maduran. La papaya ocupa el primer lugar en las puntuaciones de nutrición de entre 38 frutos comunes (FAO 2009) y posee una gran versatilidad en cuanto a sus usos, tanto así que para el año 2014 en México se sembró una superficie total de 16,055.52 ha con una producción de 836,370.48 Ton (SAGARPA, 2014). 19 Capítulo I 1.2 JUSTIFICACIÓN Las plantas, en el transcurso del tiempo, han desarrollado estrategias que les han permitido adaptarse y permanecer ante situaciones adversas que el medio ambiente les ha impuesto, como es el caso de los diferentes tipos de estreses bióticos y abióticos. Muchas de las las estrategias que las plantas han implementado, no han sido suficientes para lograr la tolerancia ante las condiciones ambientales cada día más severas. Dentro de estas especies vegetales se encuentran aquellas de gran importancia para el hombre, como es el caso de los cultivos. Durante las últimas décadas, alrededor de todo el mundo, la productividad de los cultivos se ha visto mermada hasta en un 70% debido a los diferentes tipos de estrés abiótico, aunado al cambio climático ocasionado por acción del hombre. En las plantas un gran número de genes son regulados en respuesta a estrés abiótico. Estudios moleculares dan evidencia del papel fundamental que desempeñan los FT's en la regulación de la expresión génica en respuesta al estrés, motivo por el cual son un blanco de la ingeniería genética. Al día de hoy, no existen estudios de la función que desempeñan los FT's de la familia NAC en papaya; dicho conocimiento es fundamental para el mejoramiento genético de plantas cultivadas en un medio ambiente cambiante cada vez más extremoso, aunado a la creciente demanda de producción de alimentos a nivel mundial. Por tales motivos, en este estudio se llevó a cabo la identificación y caracterización molecular de FTs de la familia NAC en Carica papaya involucrados en respuesta estrés abiótico. 20 Capítulo I 1.3 HIPÓTESIS Existen evidencias moleculares y bioquímicas sobre la participación de los Factores de Transcripción NAC en respuesta a distintos tipos de estrés abiótico; por lo tanto, se espera que miembros de esta familia de proteínas de Carica papaya cv. Maradol, estén involucrados en dicha respuesta y la sobreexpresión de estas secuencias en la planta modelo Nicotiana tabaccum, le confieran tolerancia ante diversos tipos de estrés abiótico. 1.4 OBJETIVOS 1.4.1 OBJETIVO GENERAL Determinar la funcionalidad de factores de transcripción NAC de C. papaya cultivar Maradol, involucrados en respuesta a estrés abiótico. 1.4.2 OBJETIVOS ESPECÍFICOS Realizar una reconstrucción filogenética de la familia de FT NAC en Angiospermas. Determinar mediante análisis in silico, secuencias NAC dentro el proteoma de Carica papaya cultivar Maradol, con una posible participación en procesos moleculares en respuesta a estrés abiótico. Determinar la expresión transcripcional de genes NAC en respuesta a diferentes tipos de estrés abiótico en C. papaya mediante PCR semicuantitativa. Evaluar plantas Intragénicas de N. tabaccum que sobreexpresan genes NAC de C. papaya involucrados en respuesta a estrés abiótico. 21 Capítulo I 1.5 DISEÑO EXPERIMENTAL DE LA INVESTIGACIÓN La estrategia experimental de este trabajo se resume en la Figura 1. 4 Identificación y caracterización molecular de factores de transcripción de la familia NAC involucrados en respuesta a estrés abiótico en Carica papaya, L. cultivar. Maradol. Muestra Genes NAC de Carica papaya L. Diseño del estudio Análisis bioinformático de la familia de genes NAC en diferentes especies vegetales Extracción de ARN y síntesis de ADNc de plantas sometidas a diferentes tratamientos de estrés Abiótico Diseño de oligonucleótidos específicos Análisis de expresión de genes candidatos mediante PCR semicuantitativo Clonación y secuenciación de genes de interés Transformación genética de plantas de N. tabacum con genes NAC Fenotipicación de plantas intragénicas ante diversos tratamientos de estrés abiótico 22 Capítulo I 1.6 REFERENCIAS Abe, H., T. Urao, T. Ito, M. Seki, K. Shinozaki, y K. Yamaguchi-Shinozaki (2003), Arabidopsis AtMYC2 (bHLH) and AtMYB2 (MYB) function as transcriptional activators in abscisic acid signaling, Plant Cell 15: 63–78. Advanced Studies in Genomics, Proteomics and Bioinformatics (ASGPB), University of Hawaii [http://asgpb.mhpcc.hawaii.edu/] Accesado 21-06-11. Apel K., y H. Hirt (2004), Reactive oxygen species: metabolism, oxidative stress, and signal transduction, Annual Review of Plant Biology 55: 373-399. Asif, MA., Y. Zafar, J. Iqbal, MM. Iqbal, U. Rashid, GM. Ali, A. Arif, y F. Nazir (2011), Enhanced Expression of AtNHX1, in Transgenic Groundnut (Arachis hypogaea L.) improves salt and drought tolerance, Molecular Biotechnology 49(3): 250256. Bu, Q., H. Jiang, C.B. Li, Q. Zhai, J. Zhang, X. Wu, J. Sun, Q. Xie y C. Li (2008), Role of the Arabidopsis thaliana NAC transcription factors ANAC019 and ANAC055 in regulating jasmonic acid-signaled defense responses, Cell Research 18: 756–767 Bu, Q., H. Li, Q. Zhao, H. Jiang, Q. Zhai, J. Zhang, X. Wu, J. Sun, Q. Xie, D. Wang y C. Li (2009), The Arabidopsis RING finger E3 ligase RHA2a is a novel positive regulator of abscisic acid signaling during seed germination and early seedling development, Plant Physiology 150: 463–481 Balazadeh, S., A. Wu, y B. Mueller-Roeber (2010), Salt-triggered expression of the ANAC092-dependent senescence regulon in Arabidopsis thaliana, Plant Signal & Behavior 5(6). Balazadeh S, N. Kwasniewski, C. Caldana, M. Mehrnia, M.I. Zanor, G.P. Xue (2011). ORS1, an H2O2-Responsive NAC Transcription Factor, Controls Senescence in Arabidopsis thaliana, Molecular Plant 4(2):346-360. 23 Capítulo I Bendahmane, A., M. Querci, K. Kanyuka y D.C. Baulcombe (2000), Agrobacterium transient expression system as a tool for the isolation of disease resistance genes: application to the Rx2 locus in potato, Plant Journal 21: 73-81. Chaves, M.M., J.P. Maroco y J.S. Pereira (2003), Understanding plant responses to drought From genes to the whole plant, Functional Plant Biology 30: 239-264. Chaves, M.M., y M.M. Oliveira (2004), Mechanisms underlying plant resilience to water deficits: prospects for water-saving agriculture, Journal of Experimental Botany 55: 2365-2384. Chaves M.M., J. Flexas y C. Pinheiro (2009), Photosynthesis under drought and salt stress: regulation mechanisms from whole plant to cell, Annals of Botany 103: 551-560. Chinnusamy, V. y Z. Jian-Kang (2003), Plant salt tolerance. En: Plant stress responses, Topics in current Genetics 4: 241-270. Dasgupta, R., B.H. Garcia y R.M. Goodman (2001), Systemic spread of an RNA insect virus in plants expressing plant viral movement protein genes, Proceedings of the National Academy of Sciences 98: 4910-4915. De Oliveira T.M., L.C. Cidade, A.S. Gesteira, M.A. Coelho-Filho, W.S. Soares-Filho y M.G.C. Costa (2011), Analysis of the NAC transcription factor gene family in citrus reveals a novel member involved in multiple abiotic stresss responses, Tree Genetics & Genomes 7(6):1123-1134 Duval, M., T.F. Hsieh, S.Y. Kim, y T.L. Thomas (2002), Molecular characterization of AtNAM: a member of the Arabidopsis NAC domain superfamily, Plant Molecular Biology 50(2): 237-248. Ernst, H.A., A.N. Olsen, S. Larsen, y L.L. Leggio (2004), Structure of the conserved domain of ANAC, a member of the NAC family of transcription factors, EMBO Reports 5(3): 297-303. 24 Capítulo I Fang Y, J. You, K. Xie, W. Xie, y L. Xiong (2008), Systematic sequence analysis and identification of tissue-specific or stress-responsive genes of NAC transcription factor family in rice, Molecular Genetics & Genomics 280(6): 547-563. Flowers T.J. y TD. Colmer (2008), Salinity tolerance in halophytes, New Phytologist 179: 945–963. Food and Agriculture Organization of the United Nations (FAO), En [http://www.fao.org] Accesado el 24-06-11 Fraley, R.T., S.G. Rogers, R.B. Horsch, et al. (1983), Expression of bacterial genes in plant cells, Proceedings of the National Academy of Sciences 80: 4803-4807. Greve, K., T. La Cour, M.K. Jensen, F.M. Poulsen y K. Skriver (2003), Interactions between plant RING-H2 and plant-specific NAC (NAM/ATAF1/2/CUC2) proteins: RING-H2 molecular specificity and cellular localization, Biochemical. Journal 371: 97-108 Han, Q., J. Zhang, H. Li, Z. Luo, K. Ziaf, B. Ouyang, T. Wang y Z. Ye (2011) Identification and expression pattern of one stress-responsive NAC gene from Solanum lycopersicum, Molecular Biology Reports 39(2):1713-1720 Hao, Y.J., W. Wei, Q.X. Song, H.W. Chen, Y.Q. Zhang, F. Wang (2011). Soybean NAC transcription factors promote abiotic stress tolerance and lateral root formation in transgenic plants, Plant Journal 68: 302-313. Haupt-Herting S., K. Klug, H.P. Fock (2001), A new approach to measure gross CO2 fluxes in leaves: gross CO2 assimilation, photorespiration, and mitochondrial respiration in the light in tomato under drought stress, Plant Physiology 126: 388-396. He, X.J., R.L. Mu, W.H. Cao, Z.G. Zhang, J.S. Zhang, y S.Y. Chen (2005), AtNAC2, a transcription factor downstream of ethylene and auxin signaling pathways, is 25 Capítulo I involved in salt stress response and lateral root development, Plant Journal 44(6): 903-916. Hegedus, D., M. Yu, D. Baldwin, M. Gruber, A. Sharpe, I. Parkin, S. Whitwill, y D. Lydiate (2003), Molecular characterization of Brassica napus NAC domain transcriptional activators induced in response to biotic and abiotic stress, Plant Molecular Biology 53(3): 383-397. Hu, H., M. Dai, y J. Yao (2006), Overexpressing a NAM, ATAF, and CUC (NAC) transcription factor enhances drought resistance and salt tolerance in rice, Proceedings of the National Academy of Sciences 103: 12987-12992. Hu, H., J. You, Y. Fang, X. Zhu, Z. Qi, y L. Xiong (2008). Characterization of a transcription factor gene SNAC2 conferring cold and salt tolerance in rice, Plant Molecular Biology 67: 169-181. Hu, R., G. Qi, Y. Kong, D. Kong, Q. Gao, y G. Zhou (2010), Comprehensive analysis of NAC domain transcription factor gene family in Populus trichocarpa, BMC Plant Biology 10(145): 1-23. Huang D.Q., W.R. Wu, S.R. Abrams, A.J. Cutler (2008), The relationship of droughtrelated gene expression in Arabidopsis thaliana to hormonal and environmental factors, Journal of Experimental Botany 59: 2991-3007. Ito, Y., K. Katsura, y K. Maruyama (2006), Functional analysis of rice DREB1/CBF-type transcription factors involved in cold-responsive gene expression in transgenic rice, Plant and Cell Physiology 47: 141-153. Jah, B., P.K. Agarwal, y P.S. Reddy (2009). Identification of salt-induced genes from Salicornia brachiata, an extreme halophyte through expressed sequence tags analysis, Genes & Genetic Systems 84: 111-120 Jensen, M.K., P.H. Hagedorn, M. de Torres-Zabala, M.R. Grant, J.H. Rung, D.B. Collinge, y M.F. Lyngkjaer (2008), Transcriptional regulation by an NAC (NAMATAF1,2-CUC2) transcription factor attenuates ABA signalling for efficient basal 26 Capítulo I defence towards Blumeria graminis f. sp. hordei in Arabidopsis, Plant Journal 56(6): 867-880. Jensen, M.K., T. Kjaersgaard, M.M. Nielsen, P. Galberg, K. Petersen, C. O’Shea, y K. Skriver (2010), The Arabidopsis thaliana NAC transcription factor family: structure-function relationships and determinants of ANAC019 stress signaling, Biochemic Journal 426(2): 183-96. Jeong J.S., Y.S. Kim, K.H. Baek, H. Jung, S.H. Ha, Y. Do Choi, M. Kim, C. Reuzeau y J.K. Kim (2010), Root-specific expression of OsNAC10 improves drought tolerance and grain yield in rice under field drought conditions, Plant Physiology 153: 185-197 Kato, H., T. Motomura, Y. Komeda, T. Saito, y A. Kato (2009), Overexpression of the NAC transcription factor family gene ANAC036 results in a dwarf phenotype in Arabidopsis thaliana, Plant Physiology 167(7): 571-577. Kikuchi, K., M. Ueguchi-Tanaka, K.T. Yoshida, Y. Nagato, M. Matsusoka, y H.Y. Hirano (2000), Molecular analysis of the NAC gene family in rice, Molecular & General Genetics 262(6):1047-1051. Kim, S.G., S.Y. Kim, y C.M. Park (2007), A membrane-associated NAC transcription factor regulates salt-responsive flowering via FLOWERING LOCUS T in Arabidopsis, Planta 226(3): 647-654. Kim, S.G., A.K Lee, H.K. Yoon, y C.M. Park (2008). A membrane-bound NAC transcription factor NTL8 regulates gibberellic acid-mediated salt signaling in Arabidopsis seed germination, Plant Journal 55: 77–88. Koh, I. (2002), Acclimative response to temperature stress in higher plants: Approaches of Gene Engineering for Temperature Tolerance, Annual Review of Plant Biology 53: 225-45. 27 Capítulo I Ko, J.H., S.H. Yang, A.H. Park, O. Lerouxel, y K.H. Han (2007), ANAC012, a member of the plant-specific NAC transcription factor family, negatively regulates xylary fiber development in Arabidopsis thaliana, Plant Journal 50(6): 1035-1048. Kubo, M., M. Udagawa, N. Nishikubo, G. Horiguchi, M. Yamaguchi, J. Ito, T. Mimura, H. Fukuda, y T. Demura (2005), Transcription switches for protoxylem and metaxylem vessel formation, Genes & Development 19(16): 1855-1860. Langridge, P., N. Paltridge y G. Fincher (2006), Funcional genomics of abiotic stress tolerance in cereals, Briefings in functional genomics and proteomics 4(4): 343354. Lefebvre, V., S.P. Kiani y M. Durand-Tardif (2009), A Focus on Natural Variation for Abiotic Constraints Response in the Model Species Arabidopsis thaliana, International Journal of Molecular Science 10: 3547-3582. Liu, X., L. Hong, X.Y. Li, Y. Yao, B. Hu, y L. Li (2011). Improved drought and salt tolerance in transgenic Arabidopsis overexpressing a NAC transcriptional factor from Arachis hypogaea, Bioscience, Biotechnology, and Biochemistry 3: 443450. Lu, P.L., N.Z. Chen, R. An, Z. Su, B.S. Qi, F. Ren, J. Chen, y X.C. Wang (2007), A novel drought-inducible gene, ATAF1, encodes a NAC family protein that negatively regulates the expression of stress-responsive genes in Arabidopsis, Plant Molecular Biology 63 (2): 289-305. Ludlow, M. (1989), Strategies of response to water stress. In Structural and Functional Responses to Environmental Stresses. SPB Academic.: The Hague, The Netherlands pp. 269-281. Ludwig A.A., T. Romeis, J.D.G. Jones (2004), CDPK-mediated signalling pathways: specificity and cross-talk, Journal of Experimental Botany 55: 181-188. 28 Capítulo I Mao, C., W. Ding, Y. Wu, J. Yu, X. He, H. Shou, y P. Wu (2007), Overexpression of a NAC-domain protein promotes shoot branching in rice, New Phytologist 176(2): 288-298. Ming, R., S. Hou, Y. Feng, Q. Yu, A. Dionne-Laporte, J.H. Saw, P. Senin, W. Wang, B.V. Ly, K.L. Lewis, S.L Salzberg, L. Feng, M.R. Jones, R.L. Skelton, J.E. Murray, C. Chen, W. Qian, J. Shen, P. Du, M. Eustice, E. Tong, H. Tang, E. Lyons, R.E. Paull, T.P. Michael, K. Wall, D.W. Rice, H. Albert, M.L. Wang, Y.J. Zhu, M. Schatz, N. Nagarajan, R.A. Acob, P. Guan, A. Blas, C.M. Wai, C.M. Ackerman, Y. Ren, C. Liu, J. Wang, J. Wang, J.K. Na, E.V. Shakirov, B. Haas, J. Thimmapuram, D. Nelson, X. Wang, J.E. Bowers, A.R. Gschwend, A.L Delcher, R. Singh, J.Y. Suzuki, S. Tripathi, K. Neupane, H. Wei, B. Irikura, M. Paidi, N. Jiang, W. Zhang, G. Presting, A. Windsor, R. Navajas-Pérez, M.J. Torres, F.A. Feltus, B. Porter, Y. Li, A.M. Burroughs, M.C. Luo, L. Liu, D.A. Christopher, S.M. Mount, P.H. Moore, T. Sugimura, J. Jiang, M.A. Schuler, V. Friedman, T. Mitchell-Olds, D.E. Shippen, C.W. de Pamphilis, J.D. Palmer, M. Freeling, A.H. Paterson, D. Gonsalves, L. Wang, y M. Alam (2008), The draft genome of the transgenic tropical fruit tree papaya (Carica papaya Linnaeus), Nature 452(7190): 991-996. Mitsuda, N., y M. Ohme-Takagi (2008), NAC transcription factors NST1 and NST3 regulate pod shattering in a partially redundant manner by promoting secondary wall formation after the establishment of tissue identity, Plant Journal 56(5): 768-778. Nakashima, K., T. Kiyosue, K. Yamaguchi-Shinozaki, y K. Shinozaki (1997), A nuclear gene, erd1, encoding a chloroplast-targeted Clp protease regulatory subunit homolog is not only induced by water stress but also developmentally upregulated during senescence in Arabidopsis thaliana, Plant Journal 12: 851-861 Nakashima, K., Y. Ito y K. Yamaguchi-Shinozaki (2009), Transcriptional regulatory networks in response to abiotic stresses in Arabidopsis and grasses, Plant Physiology 149: 88-95 29 Capítulo I Nikovics, K., T. Blein, A. Peaucelle, T. Ishida, H. Morin, M. Aida, y P. Laufs (2006), The balance between the MIR164A and CUC2 genes controls leaf margin serration in Arabidopsis, Plant Cell 18(11): 2929-2945. Olsen, A.N., H.A. Ernst, L.L. Leggio, y K. Skriver (2005), NAC transcription factors: structurally distinct, functionally diverse, Trends in Plant Science 10(2): 79-87. Ooka, H., K. Satoh, K. Doi, T. Nagata, Y. Otomo, K. Murakami, K. Matsubara, N. Osato, J. Kawai, P. Carninci, Y. Hayashizaki, K. Suzuki, K. Kojima, Y. Takahara, K. Yamamoto, y S. Kikuchi (2003), Comprehensive analysis of NAC family genes in Oryza sativa and Arabidopsis thaliana, DNA Research 10(6): 239-247. Pinheiro G.L., C.S. Marques, M.D. Costa, P.A. Reis, M.S. Alves, C.M. Carvalho, L.G. Fietto, y E.P. Fontes (2009), Complete inventory of soybean NAC transcription factors: sequence conservation and expression analysis uncover their distinct roles in stress response, Gene 444(1-2): 10-23. Riano-Pachon D.M, S. Ruzicic, I. Dreyer, y B. Mueller-Roeber (2007), PlnTFDB: an integrative plant transcription factor database, BMC Bioinformatics 8:(42). Riechmann J.L, J. Heard, G. Martin, L. Reuber, C. Jiang, J. Keddie, L. Adam, O. Pineda, O.J. Ratcliffe, R.R. Samaha, R. Creelman, M. Pilgrim, P. Broun, J.Z. Zhang, D. Ghandehari, B.K. Sherman, y G. Yu (2000), Arabidopsis transcription factors: genome wide comparative analysis among eukaryotes, Science 290(5499): 2105-2110. Sablowski, R.W. y E.M. Meyerowitz (1998). A homolog of NO APICAL MERISTEM is an immediate target of the floral homeotic genes APETALA3/PISTILLATA, Cell 92(1): 93-103. Secretaría de Agricultura, Ganadería, Desarrollo rural, Pesca y Alimentación. (SAGARPA), en [siap.gob.mx] Accesado el 26-11-15 30 Capítulo I Saibo, N.J.M., T. Lourenço, y Oliveira, M.M (2009), Transcription factors and regulation of photosynthetic and related metabolism under environmental stresses, Annals of Botany 103: 609-623. Shinozaki, K., y K. Yamaguchi-Shinozaki (2000), Molecular responses to dehydration and low temperature: Differences and crosstalk between two stress signaling pathways, Current Opinion in Plant Biology 3: 217-223. Shinozaki, K., K. Yamaguchi-Shinozaki, y M. Seki (2003), Regulatory network of gene expression in the drought and cold stress responses, Current Opinion in Plant Biology 6: 410-417. Shinozaki K. y K. Yamaguchi-Shinozaki (2007), Gene networks involved in drought stress response and tolerance, Journal of Experimental Botany 58:221-227 Smallwood, M. y D.J. Bowles (2002), Plants in a cold climate, Philosophical Transactions of the Royal Society B: Biogical 357: 831-847. Smethurst, C.F., W.M. Gill, S. Shabala (2009), Using excised leaves to screen l ucerne for salt tolerance. Physiological and cytological evidence, Plant Signaling & Behavior 4(1): 39-41. Song C.P., M. Agarwal, M. Ohta, Y. Guo, U. Halfter, P.C. Wang y J.K. Zhu (2005), Role of an Arabidopsis AP2/EREBP-type transcriptional repressor in abscisic acid and drought stress responses, Plant Cell 17: 2384-2396. Song, S.Y., Y. Chen, J. Chen, X.Y. Dai y W.H. Zhang (2011). Physiological mechanisms underlying OsNAC5-dependent tolerance of rice plants to abiotic stress, Planta 234: 331-345. Tran, L.S., K. Nakashima, Y. Sakuma, S.D. Simpson, Y. Fujita, K. Maruyama, M. Fujita, M. Seki, K. Shinozaki, y K. Yamaguchi-Shinozaki (2004), Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promoter, Plant Cell 16: 2481-2498. 31 Capítulo I Tran, L.S., K. Nakashima, y Y. Sakuma (2007), Co-expression of the stress-inducible zinc finger homeodomain ZFHD1 and NAC transcription factors enhances expression of the ERD1 gene in Arabidopsis, Plant Journal 49: 46-63 Tuskan G.A., S. Difazio, S. Jansson, J. Bohlmann, I. Grigoriev, U. Hellsten, N. Putnam, S. Ralph, S. Rombauts, A. Salamov, J. Schein, L. Sterck, A. Aerts, R.R. Bhalerao, R.P. Bhalerao, D. Blaudez, W. Boerjan, A. Brun, A. Brunner, V. Busov, M. Campbell, J. Carlson, M. Chalot, J. Chapman, G.L. Chen, D. Cooper, P.M. Coutinho, J. Couturier, S. Covert, y Q. Cronk (2006), The genome of black cottonwood, Populus trichocarpa (Torr. & Gray), Science 313(5793): 15961604. Uno, Y., T. Furihata, H. Abe, R. Yoshida, K. Shinozaki, y K. Yamaguchi-Shinozaki (2000), Arabidopsis basic leucine zipper transcription factors involved in an abscisic acid-dependent signal transduction pathway under drought and highsalinity conditions, Proceedings of the National Academy of Sciences 97: 11632-11637. Voinnet, O., S. Rivas, P. Mestre y D. Baulcombe (2003), An enhanced transient expression system in plants based on suppression of gene silencing by the p19 protein of tomato bushy stunt virus, Plant Journal 33: 949-956. Wang, X., B.N. Basnayake, H. Zhang, G. Li, W. Li, N. Virk, T. Mengiste, y F. Song (2009), The Arabidopsis ATAF1, a NAC transcription factor, is a negative regulator of defense responses against necrotrophic fungal and bacterial pathogens, Molecular Plant Microbe Interaction 22(10): 1227-1238. Waters, B.M., C. Uauy, J. Dubcovsky, y M.A. Grusak (2009), Wheat (Triticum aestivum) NAM proteins regulate the translocation of iron, zinc, and nitrogen compounds from vegetative tissues to grain, Journal of Experimental Botany 60(15): 4263-4274. 32 Capítulo I Witcombe, J.R., P.A. Hollington, C.J. Howarth, S. Reades, K.A. Steele (2007), Breeding for abiotic stresses for sustainable agriculture, Philosophical Transactions of the Royal Society B: 363: 703-716. Wang Y.C., J. Jiang, X. Zhao, G.F. Liu, C.P. Yang y L.P. Zhan (2006), A novel LEA gene from Tamarix androssowii confers drought tolerance in transgenic tobacco, Plant Science 171: 655-662. Wray G.A., M.W. Hahn, E. Abouheif, J.P. Balhoff, M. Pizer, M.V. Rockman, y L.A. Romano (2003), The evolution of transcriptional regulation in eukaryotes, Molecular Biology Evolution 20(9): 1377-1419. Xie, Q., G. Frugis, D. Colgan, y N.H. Chua (2000), Arabidopsis NAC1 transduces auxin signal downstream of TIR1 to promote lateral root development, Genes & Development 4(23): 3024-3036. Yamaguchi-Shinozaki K., y K. Shinozaki (2005), Organization of cisacting regulatory elements in osmotic- and cold-stress-responsive promoters, Trends in Plant Science 10: 88-94. Yamaguchi, M., M. Kubo, H. Fukuda y T. Demura (2008), Vascular-related NACDOMAIN7 is involved in the differentiation of all types of xylem vessels in Arabidopsis roots and shoots, Plant Journal 55(4): 652-664. Yang R., C. Deng, B. Ouyang y Z. Ye (2011), Molecular analysis of two salt-responsive NAC-family genes and their expression analysis in tomato, Molecular Biology Reports 38: 857-863 Yokotani, N., T. Ichikawa, Y. Kondou, M. Matsui, H. Hirochika, M. Iwabuchi (2009). Tolerance to various environmental stresses conferred by the salt-responsive rice gene ONAC063 in transgenic Arabidopsis, Planta 229: 1065-1075. 33 Capítulo I Zhang H, J.P. Jin, L. Tang, Y. Zhao, X.C. Gu, G. Gao, y J.C.Luo (2011), PlantTFDB 2.0: update and improvement of the comprehensive plant transcription factor database, Nucleic Acids Research 39: D1114-D1117 Zhong, R., E.A. Richardson, y Z.H. Ye (2007), Two NAC domain transcription factors, SND1 and NST1, function redundantly in regulation of secondary wall synthesis in fibers of Arabidopsis, Planta 225(6): 1603-1611. Zhu, J.K (2002), Salt and drought stress signal transduction in plants. Annual Review in Plant Physiology 53: 247-273. 34 Capítulo II CAPÍTULO II COMPARATIVE GENOMICS OF NAC TRANSCRIPTIONAL FACTORS IN ANGIOSPERMS: IMPLICATIONS FOR THE ADAPTATION AND DIVERSIFICATION OF FLOWERING PLANTS Alejandro Pereira-Santana1, Luis David Alcaraz3, Enrique Castaño2, Lenin SanchezCalderon4, Felipe Sanchez-Teyer1, and Luis Rodriguez-Zapata1* 1 Unidad de Biotecnología, Centro de Investigación Científica de Yucatán, Mérida, Yucatán, México. 2 Unidad de Bioquímica y Biología Molecular de Plantas, Centro de Investigación Científica de Yucatán, Mérida, Yucatán, México. 3 Departamento de Ecología de la Biodiversidad, Instituto de Ecología, Universidad Nacional Autónoma de México, México, D.F., México. 4 Laboratorio de Biología Molecular de Plantas, Unidad Académica de Ciencias Biológicas, Universidad Autónoma de Zacatecas, Zacatecas, Zacatecas, México. * Corresponding author E-mail: lcrz@cicy.mx (LRZ) PLoS ONE (10)11: e0141866 DOI 10.1371/journal.pone.0141866 35 Capítulo II 2.1 ABSTRACT NAC proteins constitute one of the largest groups of plant-specific transcription factors and are known to play essential roles in various developmental processes. They are also important in plant responses to stresses such as drought, soil salinity, cold, and heat, which adversely affect growth. The current knowledge regarding the distribution of NAC proteins in plant lineages comes from relatively small samplings from the available data. In the present study, we broadened the number of plant species containing the NAC family origin and evolution to shed new light on the evolutionary history of this family in angiosperms. A comparative genome analysis was performed on 24 land plant species, and NAC ortholog groups were identified by means of bidirectional BLAST hits. Large NAC gene families are found in those species that have experienced more whole-genome duplication events, pointing to an expansion of the NAC family with divergent functions in flowering plants. A total of 3,187 NAC transcription factors that clustered into six major groups were used in the phylogenetic analysis. Many orthologous groups were found in the monocot and eudicot lineages, but only five orthologous groups were found between P. patens and each representative taxa of flowering plants. These groups were called basal orthologous groups and likely expanded into more recent taxa to cope with their environmental needs. This analysis on the angiosperm NAC family represents an effort to grasp the evolutionary and functional diversity within this gene family while providing a basis for further functional research on vascular plant gene families. Keywords: NAC transcription factors, Angiosperms, basal orthologous groups (BOG), Whole-Genome Duplication (WGD) 36 Capítulo II 2.1 INTRODUCTION Environmental abiotic stresses, such as water deficit, soil salinity, and extreme temperatures, have adverse effects on the growth, development, and grain yields of crops worldwide [1, 2]. To cope with these stresses, land plants have developed molecular mechanisms to protect cellular activities and maintain plant integrity [3]. Transcriptional control under environmental stresses plays a major role in plant adaptation. During abiotic stress, many transcription factors (TF) are involved in the induction of stress-responsive genes that play important roles under stress conditions such as drought, cold, heat, soil salinity, and flooding. Among the proteins involved in abiotic stress responses are the AP2/ERF [4, 5, 6], ABF [7, 8], HSF [9], bZIP [7, 10], MYB [11], NAC [12, 13, 14], and the WRKY families [10, 15]. NAC proteins constitute one of the largest groups of plant TFs. They are ubiquitously expressed across plant organisms and are known to participate in various developmental processes and stress responses. The NAC acronym is derived from three genes that were initially discovered to contain a particular domain (the NAC domain): NAM (no apical meristem), ATAF1/2 (Arabidopsis transcription activator factor 1/2) and CUC2 (cup-shaped cotyledon, [16, 17]). Typically, the NAC family contains a highly conserved NAC DNA-binding domain located in the N-terminal region and consists of approximately 150-160 amino acids divided into five sub-domains (A-E) encoding a twisted β-sheet surrounded by a few helical elements [18]. The C-terminal domain contains the transcriptional activation region (TAR), which is non-conserved among plants and can act as either a transcriptional activator or repressor [19, 20]. In many cases, NAC TFs are inactively stored in the cytoplasm and translocated into the nucleus after stimulation. The NAC's TAR contains transmembrane motifs (TMM) that help anchor the protein to the plasma membrane and provide an efficient method for gene regulation, which is an adaptive strategy that allows for prompt responses to environmental changes [21, 22, 23]. NAC TFs play several essential roles in plant development [24], senescence [25], auxin signaling [26], floral time control [27], floral morphogenesis [28, 29], lateral root development [26], nutrient mobilization [30], leaf margin development [31], fruit ripening [32], longevity control [33], embryo development [34], postembryonic shoot meristem formation [35], organ boundary formation [35], leaf movement [36], vascular element formation [37], and tolerance to multiple biotic [38, 39] and abiotic stresses [25, 26, 27, 40, 41], and so on. Although NAC TFs have been characterized and described in several plants species, such as Arabidopsis [19], 37 Capítulo II populus [42], citrus [43], rice [19], and barley [44] (ranging from 16-289 NAC sequences [45]), a systematic classification is still lacking, and genome-wide analysis of this gene family keeps being applied within the plant lineage. Polyploidy or whole-genome duplication (WGD) is now recognized as a major evolutionary force in angiosperm genome development [46]. In fact, researchers have long recognized that polyploidy is an inseparable part of angiosperm biology. Over time, polyploids may become diploidized, such that they behave like diploids at the cytogenetic and genetic levels [47]. Given this genome duplication trend, the genome conservation in terms of gene number and chromosomal organization is astonishing. After the duplication of all genes by the WDG process, redundant copies get lost (fractionation), retained, or fixed with modified functional properties in contrast to the original genes. Therefore, the gene family size can vary greatly between species due to the number of WGD events that their genomes have experienced through evolution [48, 49]. Despite the relatively recent origin of angiosperms during the Early Cretaceous period ~130 to >385 million years (MYr) ago, [50, 51, 52] land plant evolution has become extremely diverse both in morphological and ecological terms. Over the past 130 and 150 MYr, angiosperms have diversified to occupy all habitable terrestrial and many aquatic environments [53]. The current knowledge regarding the NAC distribution in the plant lineage comes from a relatively small sampling [1, 49, 54, 55]. To shed new light into the evolutionary history of the NAC family in angiosperms, we broadened the number of plant species to assess the origin and evolution of this family in the present study. We conducted a comprehensive phylogenetic analysis through this lineage, and defined the orthologous groups (OGs) between 24 green plant genomes in order to examine the groups that were identified from the early-diverging plant Physcomitrella patens as an out-group genome to inspect the species-specific expansion along the angiosperms lineage. Our results revealed that an increased number of predicted NAC family members with probable divergent functions are present in those species with more WGD events, suggesting that a significant expansion of the NAC family occurred shortly before the rapid radiation of flowering plants. The lack of knowledge regarding the origin of the NAC family has impeded our understanding of the evolution of this family across the history of plant development. 38 Capítulo II Therefore, given our conception of the evolutionary history of the NAC family as part of a much more diverse set of evolutionarily plants, we can update our knowledge of this family and determine the expansion of this lineage over time. The main focus of this work was to conduct a comparative genomics analysis of the NAC family across the angiosperms. 39 Capítulo II 2.2 MATERIALS AND METHODS 2.2.1 NAC GENE FAMILY SEARCHES AND RETRIEVAL A Hidden Markov Model (HMM) profile was constructed for the identification of new members of the NAC TF family in flowering plants. The HMM profile was built using the Plant Transcription Factor Database v3.0 [45], in which 436 NAC proteins were predicted from five plants (O. sativa, V. vinifera, A. thaliana, S. moellendorffii, and P. patens). Sequences were retrieved, and a multiple alignment was completed with Clustal Omega [56]. Subsequently, the alignment was manually curated, and the positions that contained gaps or missing data were not considered to build and calibrate the HMM model by HMMER package (version 3.1; [57]). The model was calibrated with the required cut-off values and was used to detect NAC sequences in 24 plant species. Gene models of the plant species analyzed in this study are shown in S1 Table. The EMBOSS 3.0 suite [58] was used to manipulate the sequences. The genome size and the ploidy level of each plant were obtained from published genome data and the Plant DNA C-values database [59]. 2.2.2 SEQUENCE ANALYSIS, MULTIPLE SEQUENCE ALIGNMENTS AND EVOLUTIONARY MODEL TESTING Amino acid sequences were subjected to a motif scan in the Pfam database v27.0 [60] to confirm the presence of the NAC domain. All retrieved sequences were clustered using the CD-HIT clustering program [61] with an identity cut-off of 0.7 in order to exclude isoforms and reduce sequence redundancy. Multiple sequence alignments were completed using MUSCLE [62] and were manually curated. They were then tested with the ProtTest 2.4 statistical package [63] to find the best evolutionary model for the maximum likelihood (ML) analysis. The MEME software [64] was used to identify conserved motifs in the amino acid sequences of interest, with an occurrence parameter for a single motif of “one per sequence” and the maximum number of motifs. The TMHMM Server v. 2.0 (http://www.cbs.dtu.dk/services/TMHMM/) was used to predict the TMM for all retrieved NAC sequences. HMM logos of the NAC domain were plotted with the Skylign tool [65] for each of the 24 plant species as well as for the global set of all the NAC sequences. The amino acid alignments of the selected sequences were visualized using BOXSHADE v3.31C (http://boxshade.sourceforge.net/). 40 Capítulo II 2.2.3 DEFINING ORTHOLOGOUS GROUPS (OGs) We used a reciprocal best BLAST hits (BBH) approach [66, 67] to identify possible orthologous groups among the 24 plant genomes. Significant hits were filtered according to the following criteria: we retained all potential OGs where the BLASTP bitscore of the compared proteins was more than 200 and had sequence coverage of at least 50% of their lengths [66]. Protein pairs were labeled as orthologs when both sequences were each other's bi-directional best hit. Moss P. patens, a basal lineage of land plants, was used as a reference outgroup to perform all the comparison analysis and to establish the BBH approach. Additionally, O. sativa and V. vinifera NAC proteins were used as reference sequences for analysis into monocot and eudicot species, respectively [48]. Each NAC protein of P. patens was compared with the NAC protein set of the basal Magnoliopsida (Vitis vinifera) and Liliopsida (Oryza sativa) species. On the other hand, a BLASTP search was performed against Coccomyxa subellipsoidea, Chlamydomonas reinhardtii, Ostreococcus lucimarinus, Cyanidioschyzon merolae (http://www.phytozome.net, [68]), Cyanobacteria (NCBI taxid:1117), and Alphaproteobacteria (NCBI taxid:28211) to determine the origin of the NAC proteins. A Venn diagram was created on R (v3.0.1; [69]) using the Vennerable package (https://rforge.r-project.org/projects/vennerable/). 2.2.4 EVOLUTIONARY ANALYSIS AND ANGIOSPERM TREE OF LIFE The phylogenetic reconstructions were completed using RAxML v.8.0.26 suite [70] with a JTT substitution model and 100 parametric bootstrap (BS) replicates. The gammadistributed rates were estimated from the dataset. The topology of the best-scoring tree was visualized in FigTree v1.4 (http://www.molecularevolution.org) and PhyloWidget (http://www.phylowidget.org, [71]). An evolutionary tree of the 24 plants used in the analysis of the NAC proteins was constructed with the PhyloT tree generator (http://phylot.biobyte.de/index.html) and manually corrected according to the APG III [72] tree topology. . 41 Capítulo II 2.3 RESULTS AND DISCUSSION 2.3.1 GENOME-WIDE IDENTIFICATION OF NAC GENES We analyzed whole-genome sequences of algae and bacteria, and no sequences containing the NAC domain were found. In early diverging plants, we identified 35 NAC proteins in the moss P. patens used as an out-group, and seven of those sequences contained a TMM, providing evidence of this basal mechanism in green plants. However, no TMMs were found in the 20 predicted NACs of S. moellendorffii, the earliest evolutionary branch of vascular plants for which genome information is available. In contrast, studied flowering plants possess an average of 140 NAC genes, with a minimum of 71 and a maximum of 288 genes, suggesting a lineage-specific expansion into the NAC family shortly before the rapid radiation in Angiosperms history [53, 73], likely due to the numerous WGDs that have occurred through the angiosperm lineage [46, 74]. According to our results, the extent and nature of this expansion varies between the different plant lineages. A total of 3,187 sequences were identified and retrieved from 24 plant species (Fig. 1). These species included; 16 eudicots plants (Class Magnoliopsida), 6 monocots (Class Liliopsida), one fern (Lycopodiopsida), and a moss (Bryopsida). All identified NAC homologs host the expected NAM domain (Pfam PF02365), while some contained additional domains. The complete list of NAC proteins analyzed in this study, the additional annotation of each sequence, and the sequences used in the phylogenetic analysis are available in S2 Table. A HMM LOGO of the NAC domain was completed for each species to analyze the prevalence of specific residues per lineage (S1 Fig). 42 Capítulo II Fig. 1 Phylogenetic relationships among 24 land plant species and the distribution of NAC proteins identified in this study, based on the HMM-generated profile. The total number of NAC proteins identified in each genome; the plant genome size, ploidy and chromosome number of each species; and the number of NAC sequences with Transmembrane motifs (TMM) for each genome are indicated on the right in colored squares. Ancient WGDs are represented by colored stars (details were taken from CoGepedia, https://genomevolution.org). Species names are color-coded as follows: blue – Moss, purple – pseudofern, red - monocots, and green - eudicots. *Genome size in Gb. 43 Capítulo II The monocot lineage revealed a similar number of NAC sequences in the six analyzed species, regardless of their genome size. Maize was found to contain the greatest number of NAC sequences from the analyzed monocot species, with 186 NAC genes. However, it also was found to contain an additional WGD event compared to the other grass species. Regarding the TMM sequences, no correlation was found between the number of these sequences and the genome size, as seen in the case of A. tauschii, which only possesses three TMM sequences in a 4.3 Gb genome, and B. distachtion, which has seven TMM sequences in a 0.27 Gb genome. The regulated activation of preexisting dormant TFs by TMM is a versatile system for accurate stress signal perception and transduction. It provides an efficient method for gene regulation and is considered to be an adaptive mechanism in response to environmental changes [23, 75]. On the other hand, 43 of the 3,187 NAC sequences contained additional domains, mainly in the C-terminal region (see S2 Table). The Ataus42 NAC sequence of A. tauschii contained a zinc-binding motif in its reverse transcriptase domain (zf-RVT, Pfam PF13966) and a Reverse transcriptase-like domain (RVT-3, Pfam PF13456) on its C-terminus. The Zmays146 NAC sequence has four TMM helixes and an additional motif called MatE, which is annotated as a Multi antimicrobial extrusion protein (Pfam PF01554) and is involved in the detoxification of secondary metabolites including alkaloids. This last mechanism is poorly studied in plant systems and can help us understand how plants have evolved to cope with toxins in their environment [76, 77]. It is well known that eudicot plants have a smaller genome size than monocot plants; nevertheless, we found that the number of NAC sequences was greater in the eudicot lineage. In the case of the TMM sequences, we found a 1:2 ratio in the monocot plants compared to the eudicot plants. In some cases, the TMM sequences further increased for those species that experienced more WGD events, such as some rosid species (e.g., apple tree, populus, and B. rapa). A detailed study of genome size reveals a dynamic pattern of genome evolution. An increase in the genome size occurred over the course of vascular plant development, with an independent genome reduction in Selaginella and angiosperms and subsequent increases within some groups of monocots [78]. Hence, there appears to be a greater relative expansion of the NAC gene family (140:35:20) in the spermatophyta (seed plants) compared to moss and fern species [79], demonstrating that duplicated genes contributed to the expansion of large families in grapevine 44 Capítulo II species. These duplications were produced by WGD and tandem, proximal, retrotransposed, and DNA-based transposed duplications. In Arabidopsis, it has been shown that several gene families have expanded by tandem duplication [80], retaining many of their genes after WGD and transposition [81]. Each of these gene family expansion modes creates paralogs that potentially duplicates the function of the original gene. If retained, this functional duplication sets the stage for biased gene expansion and subsequent subfunctionalization [82]. Some gene families in eudicot plants are much larger, suggesting differential expansion (e.g., the NAC family in Poplar is represented by 288 members, soybean by 246 sequences, and apple tree by 245 NAC sequences). On the other hand, some rosid species, such as grapevine, papaya tree, and soybean, contain the lowest NAC sequence numbers of their families, with 71, 77, and 75 sequences, respectively. The Eurosid group contains many economically important flowering plants, such as legumes and brassicales; all of these species share a palaeo-hexaploid common ancestor that emerged after divergence from the monocots and before the radiation of the eurosids [83]. Grapevine and papaya tree serve as evolutionary important model plants for fruit tree genomics [83, 84]. With only 24,746 predicted genes for the papaya tree genome (the lowest predicted gene number for the eudicot plants [85]) and 26,346 predicted genes for the grapevine [83], these two plants appear to have experienced only one WGD shared by all monocot and eudicot lineages. This observation allows us to better understand the ancestral traits of this lineage. However, the grapevine genome is also the closest to the palaeohexaploid ancestral arrangement by far [83], suggesting that the duplication patterns of ancestral genes and the addition of new activities in their functions were common occurrences in the evolution of this genome [79]. For these reasons, the papaya tree was proposed as an excellent outgroup for Arabidopsis, while grapevine was proposed as a useful outgroup for Brassicales [86]. A resent report [85] demonstrated a reduction in most gene families and biosynthetic pathways in the papaya plant and highlighted the value of this plant as model to study complex pathways and networks. Papaya contains no recent WGDs, explaining its lower opportunities for subfunctionalization and implying that papaya genes may be more representative of basal angiosperms than Arabidopsis genes and those of many other sequenced plants. Here, we found that the papaya tree's genome contains 77 NAC proteins. This study is the first to report and characterize the NAC family in the papaya tree genome. All the identified NAC genes were named using the prefix CpNAC, and the complete set of the papaya's NAC proteins is available in S3 Table. 45 Capítulo II The major difference between the NAC protein family numbers within the angiosperms and within the outgroup P. patens could be due to common selective pressures such as environmental stresses, which may have guided the regulation of plant growth and development [87]. Another explanation for the NAC gene family differences could be the release of selective pressures due to gene redundancy. The ease of subfunctionality among the duplicated TFs could also be a contributing factor. After duplication, TFs are capable of acquiring different functions from their ancestors and could be naturally selected for their new functions, thus resulting in the indispensability of both copies [82]. Gene family number differences suggest the genes in question may be involved in plant-specific regulatory functions. The differences also highlight the importance of TF duplication, due its contribution to the regulatory novelties that could be involved in development, and responses to external stimuli [88, 89]. Other authors [79] have found that large gene families in grapevine and others plant species are essential and are involved in the basic processes of plant growth. These authors have also suggested that these families have undergone large expansions during their evolutionary history, as supported by our report for the NAC family. 2.3.2 ORTHOLOGOUS GROUPS AND DUPLICATIONS IN THE NAC FAMILY Orthologous Groups (OGs) were calculated by means of a BBH using all 24 analyzed proteomes. Then, a matrix containing presence information from all predicted OGs was built and used to define the shared core of OGs for the NAC proteins. According to previous work [90], evolutionary genomics compares a set of genomes with an outgroup genome. To test the minimum content of orthologous proteins in monocots, we used rice (O. sativa) as a reference because its phylogenetic position is closest to the tested plants in terms of the hypothetical basal monocots genome. O. sativa is thought to have an original monocot chromosome number (12) and has not evolved through independent nested chromosome fusion (NCF) events [48]. On the other hand, grapevine (V. vinifera) was used as a pivotal genome for eudicots because the grapevine genome contains the ancient genome-wide duplications shared by all eudicots and has the lowest number of NCF events [48, 83, 91, 92]. P. patens was used as an outgroup for comparing these two pivotal genomes for monocots and eudicots and to identify OGs in the S. moellendorffii plant. The comparison across multiple outgroups is a useful tool that permits us to unambiguously discrimination 46 Capítulo II between gene additions and losses in any group [86]. We ruled out the 39 homologous genes that did not have significant hits according to the criteria previously established (see Materials and Methods). Four OGs were identified between P. patens and S. moellendorffii, which branched off earlier in plant evolution. Two of the sequences in S. moellendorffii were orthologous to the PpVNS1 and PpVNS5 proteins of P. patens. These genes were found to be involved in hydroid cell differentiation by inducing cell death, water conducting and tissue support in vascular plants [54]. PpVNS1 gene expression has been found in the rhizoid tissues of P. patens, although this gene is not shared with vascular plants. In flowering plants, we identified seven OGs shared between P. patens and each representative taxa of monocots (rice) and eudicots (grapevines) (Fig. 2). Among the seven OGs shared by P. patens and rice, two of them belonging to the PpVNS related proteins (PpVNS6 and PpVNS8) were found to act as cell-specialized regulators for water-conduction and plant support. All six analyzed monocots share 24 OGs, among which are the rice characterized sequences OsNAC7 (SND-related protein), OsNAC4, OsNAC6, and OsNAC10 (stress-related proteins). However, only six OGs were shared pairwise (Osat-other species). A total of 43 NAC sequences were rice specific (not shared with other species). The complete list of OGs and their paralogous genes in monocots is available in S4 Table. 47 Capítulo II Fig. 2 Schematic representation of NAC OGs shared among Angiosperms. A) Venn diagram showing the orthologous gene number shared between the P. patens outgroup and rice and grapevine genomes as the selected representatives for monocot and eudicot plants, respectively. The total overlap consisted of five proteins that define the basal core of the NAC genes. B) The number of orthologous proteins detected by means of BBH in 24 green plants. Green lines indicate the OGs shared between the moss P. paten, S. moellendorffii, and the basal taxa of the monocot and eudicot lineages. The number below the red line indicates the number of OGs shared between the rice and grapevine species. Black lines indicate the number of OGs shared among the monocots and eudicots with their respective selected pivotal species. In the case of eudicot plants, we found seven OGs among the P. patens and grapevine sequences, two of which belonged to the PpVNS related proteins (PpVNS6 and PpVNS7, [54]), which play a key role in water conducting. These proteins are preferentially expressed in the midrib of the central region of newly emerged leaves and in the developing leaf midrip of P. patens. We found that the PpVNS6 protein was shared for both monocot and eudicot plants, unlike PpVNS7 and PpVNS8 proteins that were specific for eudicots and monocots, respectively. We identified 13 OGs among the 16 analyzed eudicot species (S5 Table), including the Arabidopsis-characterized sequences ANAC029 (cell death related protein), ANAC033 (SOMBRERO), ANAC037 48 Capítulo II (VND1), and ANAC040 (NTL8). Only two OGs were shared pairwise (Vvin-other species), and 10 sequences were specific to grapevine. On the other hand, we found 31 OGs shared between rice and grapevine, the two selected representative taxa for monocots and eudicots, respectively (S6 Table). All studied taxa in flowering plants host paralogous genes, showing evidence of large expansions in this family. Finally, only five OGs were shared among the P. patens-rice-grapevine (see Fig. 2). We decided to call these the Basal Orthologous Groups (BOGs). The BOGs were taken as the core NAC sequences, from which evolution progressed through different events of genome-duplication. Functional divergence events among the duplicated genes were likely the source of evolutionary innovations and specific adaptation processes for each lineage [46]. Comparative analysis of each BOG was done by sequence alignment. P. patens sequences were used as basal group to underline character changes along plant evolution. We included the orthologous sequences from the analyzed angiosperm plants with the orthologous proteins shared in rice and grapevine to broaden the scope of the analysis. Plesiomorphic amino acids were detected along the NAC domain and in the C-terminal region through diverse lineages of plants, and lineage-specific synapomorphies for monocot/eudicot species were detected in the NAC domain (S2 Fig). However, the evolutionary distance of the plant lineages and amino acids in the NAC domain were very similar, confirming the importance of this domain along its evolutionary history. Overall, the NAC domain in all five BOGs has structural conservation, giving evidence of the importance of this DNA-binding domain through the plant lineage. Furthermore, a visual inspection of the C-terminal region of each BOG was performed using the MEME software [64], identifying several conserved motifs that could be considered as the signature of these basal groups (S3 Fig). In the case of BOG1, all its members have the signature LP-box (LP[QX]L[ED]SP) and the WQ-box (W[RA]ALD[KR][FL][VL]ASQL) that were previously defined as the responsible motifs for the transcriptional activity of gene ANAC012 (SND1; [93]). Some conserved motifs were present both in early diverging plants and in more recent flowering plant lineages, suggesting they originated before the split of the monocot and eudicot lineages. Members of each OG are supposed to be derived from the same ancestor gene, 49 Capítulo II sharing well-conserved motifs, structures and likely functions [49]. Our findings reveal the presence of five ancestral proteins preserved both in monocot and eudicot lineages. These proteins probably played key roles in the adaptation and survival of flowering plant lineage and expanded through different duplication mechanisms to cope with the environment challenges. 2.3.3 NAC PHYLOGENETIC ANALYSES We conducted a phylogenetic tree reconstruction from 24 green plants in order to understand the NAC family evolution and distribution through the angiosperms lineage and identify species-specific NAC gene expansions or reductions. The global set of NAC sequences was clustered by CD-HIT software ([61]; see Materials and Methods) to reduce sequence redundancy, resulting in 2016 non-redundant sequences used for the phylogenetic analyses. The phylogenetic tree was arranged into six major clusters, as shown in the Fig. 3. 50 Capítulo II Fig. 3 Phylogenetic relationships of the NAC gene family. A) Maximum likelihood phylogenetic tree derived from a MUSCLE alignment of the NAC domains from 24 plant species. The unrooted phylogenetic tree of the 2106 NAC proteins was clustered into six major families. Specific motifs found in the C-terminal region of the NAC proteins are shown next to each group. Blue lines and blue asterisks indicate sequences of P. patens in the tree, green circles show Arabidopsis proteins, and purple and red circles show grapevine and rice sequences, respectively. B) Schematic depiction of the proposed NAC family classification. Names of each subgroup are shown next to each clade. Triangles represent the NAC 51 Capítulo II subgroups (detailed phylogenetic analysis is available in S4 Fig; branch lengths are arbitrary). C) Schematic representation of the five NAC's BOGs detected in the plant lineage and their affiliation into the major groups. Paralogous proteins for rice and grapevine are shown below each colored box. The affiliation of each BOG into the phylogenetic tree is available in S5 Fig. C) HMM LOGO of the NAC domain of 2106 proteins used in the phylogenetic tree. There were some conserved residues in the NAC domain, suggesting a vital role in their structure due to their prevalence through distinct lineages, as in the case of the GxxFxP residues into A-motif, the W residue into the C-motif, and the WxMHEY signature in the D-motif. The importance of these residues should be regarded in future studies to unravel the origin and evolution of the NAC domain in plant lineage. In the phylogenetic analysis, sequences from monocots and eudicots tend to cluster in the same clades, suggesting a lineage-specific expansion after divergence from their common ancestor (see S4 Fig). Arabidopsis sequences were used as references for the phylogenomic analysis of the NAC family because of the experimental support of this model species. The NAC group I (see Fig. 3) contains proteins involved in controlling cell wall composition, biosynthesis, and xylem development [94]. According to our results, Group I is proposed as the basal NAC group, given the essential angiosperm-specific innovations in water conduction controlled by a Vascular NAC Domain (VND) subgroup of NAC family. Previous authors [54] determined that NAC transcription factors may have contributed to the evolution of both water conducting and cell supporting during the adaptation of plants to land. In Group I, P. patens' 12 sequences were clustered, with only one sequence with a TMM, and this group contains 8 grapevine and 12 rice sequences. We determined that OG Vvin21-Athal22 (ANAC070, BEARSKIN2, BRN2; S7 Table) is involved in root cap maturation and cell wall modifications. Athal22 contains only one paralogous sequence: Athal35 (ANAC070, BEARSKIN1). All eudicot species share the orthologous sequence BRN2, except for the papaya tree [95]. The OG Vvin27-Athal40 (ANAC043, NST1) has two paralogous sequences, Athal44 (ANAC012, NST3) and Athal46 (ANAC066, NST2), which are involved in secondary wall synthesis, and have redundancy with the VND proteins in Arabidopsis [96]. We could only detect one NST in papaya tree, cucumber, and cacao; two sequences for rice, soybean and tomato; three sequences in barley, Arabidopsis, cassava and Poplar tree; four sequences for maize; and five sequences for banana tree. 52 Capítulo II We determined the OG Vvin25-Athal34 (ANAC037, VND1) has two paralogous sequences, Athal30 (ANAC076, VND2) and Athal45 (ANAC105, VND3). The other VND sequences of Arabidopsis are in the OGs Vvin16-Athal28 (VND4, ANAC007), which has only one paralogous sequence Athal33 (VND5/ANAC026), and Vvin28Athal42 (VND7, ANAC030). Other researchers [54] found eight NAC sequences in P. patens with similarity to the VND/NST/SND proteins, and they named the sequences PpVNS [VND-, NST/SND-, SMB (SOMBRERO)-related protein]. These sequences have a conserved transcriptional regulation and cellular function between moss and Arabidopsis water-conducting cells. Ppat23 (PpVNS7) can regulate many putative orthologous to the VND/NST/SND direct targets, such as MYB46/83/103; transcriptional activators for secondary wall formation; CesA, a cellulose synthase subunit; IRX7/FRA8, a glucuronoxylan biosynthesis protein; 4CL, a lignin biosynthesis, and XCP, a papain-like cysteine peptidase. According to our analysis, the Ppat23 (PpVNS7) sequence of P. patens, which was specific to eudicot plants, is orthologous to the Vvin25 protein, which in turn is orthologous to the VND1 sequence in Arabidopsis. The OG PpVNS7-Vvin25 appears to be the basal group of the VNDrelated proteins, suggesting the expansion of this group through concerted evolution. We hypothesize that Vvin25, Vvin16 and Vvin28 (group I-A) were the principal NAC VND sequences that expanded through angiosperm lineage. We found three VND genes for papaya tree, tomato, and cucumber, seven genes for Arabidopsis, and 15 VND genes for Poplar. In previous work, it was determined that only two VND genes are present in P. abies (Gymnosperm) compared with seven genes in Arabidopsis [78]. The NAC group II (see Fig. 3) hosts 8 P. patens sequences, 9 grapevine sequences and 24 rice sequences. The OG Vvin6-Athal2 (ANAC100, an ethylene responsive gene; see S7 Table), contains the paralogous sequence Athal6 (ANAC080). ANAC080 has a characterized orthologous RhNAC100 in Rosa hybrid, and it is involved in cell expansion in flower petals via ethylene network [97]. The Vvin38 protein is orthologous to Athal62 (ANAC22), which is involved in auxin signaling promoting lateral root development [98]. This group II hosts the CUC1-3 (Cup-shape cotyledon) proteins that are involved in shoot apical meristem (SAM) formation and cotyledon separation during embryogenesis in Arabidopsis [35, 99]. The OG Vvin10-Athal16 (CUC2, ANAC098) has the paralogous sequence Athal27 (CUC1, ANAC054) in Arabidopsis. This protein has orthologous sequences in all analyzed eudicot plants, except in the Medicago plant. The OG Vvin30-Athal39 (CUC3, ANAC031) contains other characterized CUC3 53 Capítulo II proteins in the model species A. thaliana. Within group II functions, there are processes of specific development among the different organs, such as leaf, root, and floral development, and other processes are probably involved in ethylene-auxin pathways. For the NAC group III (see Fig. 3), 5 P. patens sequences were identified, while 17 and 12 sequences were found for grapevine and rice respectivelye, respectively. Furthermore, 142 of the 164 sequences containing TMMs were clustered into this group. Therefore, we named it the TMM Group. The TMM group possesses all the NTL reported sequences from Arabidopsis (NTL1-NTL14). These TMM motif sequences are regulated by proteolytic cleavage of the anchor by intra-membrane proteases and are often mediated by environmental factors and stress signaling, such as high salinity (NTL4, NTL5, NTL6 and NTL8), heat (NTL1 and NTL11), cold (NTL2, NTL3, NTL6, NTL7 and NTL9), drought (NTL2, NTL6 and NTL9), H2O2 (NTL4, NTL5, NTL7 and NTL9), ABA (NTL6-regulating PR genes), cell division (NTL12), mitochondrial retrograde signaling mediating primary stress responses (NTL7), and gibberellic acid (NTL8) [23, 100, 101, 102, 103, 104]. This strategy ensures rapid transcriptional responses to environmental fluctuations, and it would be an efficient way to maximize plant survival under adverse conditions [22]. We determined five sequences in grapevine (Vvin35, Vvin36, Vvin41, Vvin46, and Vvin48) that host the basal NTL sequences in Arabidopsis (see S7 Table), which most probably expanded differently through each plant lineage by different duplication mechanisms to adapt to the needs of each open niche in the environment. The Populus and apple tree are the two species with the highest number of gene expansions into the group of eudicot plants analyzed, with 34 and 26 NTL sequences, unlike grapevine, papaya tree, common bean, and M. truncatula that contain a lower number of NTL sequences in their genomes. The NAC group IV (see Fig. 3) hosts a P. patens sequence (Ppat27), 15 grapevine sequences and 13 rice sequences. The Ppat27 sequence belongs to BOG3, which is shared with the Vvin34 sequence of grapevine and Osat44 from rice. The Vvin34 sequence is orthologous to Athal59 (ANAC035, LOV1; see S7 Table). LOV1 controls the flowering time by negatively regulating CONSTANS (CO), a floral promoter in the circadian light pathway and cold response [105]. Another OG hosted in this clade is Vvin31-Athal48 (ANAC009, FEZ), which controls the reorientation and timing of cell division in a subset of stem cells [106]. The Athal63 gene from Arabidopsis (ANAC042, JUNGBRUNNEN1/JUB1) is orthologous to the Vvin42 sequence in grapevines. JUB1 54 Capítulo II is a hydrogen peroxide (H2O2)-induced NAC transcription factor that plays a central role in the longevity regulation of Arabidopsis, and its over-expression delays senescence and enhances tolerance to various abiotic stresses [33]. The NAC group V (see Fig. 3) hosts 8 P. patens sequences, 14 grapevine sequences, and 16 rice sequences. The OG Vvin3-Athal4 (ANAC056, NARS1, ORS1; see S7 Table) contains a Jasmonic Acid (JA) regulatory protein [107]. The OG Vvin59-Athal93 (ANAC104, XND1) contains a characterized Arabidopsis protein that acts as a negative regulator of ligno-cellulose synthesis and programmed cell death in the xylem. A previous [108] report found four putative orthologs to XND1 in Poplar's genome, suggesting the presence of a more complicated xylem in Poplar versus Arabidopsis. We found the same four XND-related sequences in Poplar contained in the OG Vvin59Ptric191. This sequence also contained three paralogous genes: Ptric195, Ptric198 and Ptric199. Grapevine, papaya tree, E. salsugineum, Ricinus, cassava, and cucumber plant all have only one XND-related sequence. The OG Vvin2-Athal1 (ANAC029, AtNAP) is responsible for controlling leaf senescence and is involved in programmed cell death (PCD) in Arabidopsis [109]. This gene has orthologous members in all the analyzed angiosperms, with several paralogous genes each. The heterologous overexpression of PvNAP (common bean) and OsNAP (rice) was able to restore the Arabidopsis atnap null mutant to wild-type, suggesting that NAP may be a universal regulator in plant leaf senescence. Additionally, AtNAP controls stomatal movement and water loss during leaf senescence via the ABA pathway [110]. We defined the OG Vvin12-Athal7 (ANAC072, RD26) as an important abiotic stress-responsive gene from Arabidopsis, which has two paralogous sequences, Athal19 (ANAC019) and Athal18 (ANAC055). All the analyzed eudicot plants, with the exception of M. truncatula, contain this orthologous sequence, suggesting the importance of this mechanism to cope with abiotic stress. These proteins improve tolerance against several abiotic stresses in plant systems [20, 111]. Athal10 (ANAC002, ATAF1), another Arabidopsis stress responsive gene, negatively regulates several stress related genes as COR47, ERD10, KIN1, RD22 and RD29. The ataf1 mutants displayed a recovery rate about seven times higher than wild-type plants in a drought response test [40]. This gene is in the OG Vvin7-Athal10 and has orthologous sequences in all the studied plants except the apple tree. Furthermore, the group V contains many others sequences that have been characterized in other species and have improved tolerance against abiotic stresses in tomato proteins Slyc6 (SlNAC1) and Slyc3 (SlNAM1), soybean proteins 55 Capítulo II Gmax24 (GmNAC20) and Gmax109 (GmNAC11), and rice proteins Osat16 (OsNAC5), Osat5 (OsNAC6, SNAC2), and Osat1 (OsNAC10) [112, 113, 114, 115]. According to our results, Group V is proposed as Stress Group of NAC family. Finally, the NAC group VI contains one P. patens sequence (belonging to BOG5), 5 grapevine sequences, and 18 rice sequences. This group hosts many species-specific sequences for rice and contains a great abundance of species-specific sequences for the rest of angiosperms, especially Populus, apple tree, Nicotiana, and tomato. These species have experienced various WGDs through their evolutionary history, resulting in the expansion of their gene families. Our results show that each lineage continued expanding after divergence from the common ancestor, resulting in species-specific innovations according to their needs. The fate of paralogous genes is poorly understood. The prevailing theory predicts that duplicated genes will eventually be lost or mutated. However, several duplications are retained in the genome, probably via new functionalities or sub-functionalities [116]. In Arabidopsis, it has been demonstrated that many genes involved in signal transduction and transcription were preferentially retained after the most recent WGD event [117, 118], suggesting the important roles of TF duplications in plant evolution. Genomic comparisons allow us to transfer genomic knowledge and generate functional hypotheses, moving from acquired experimental information on model species to lessstudied taxa. The analysis of orthologous groups in all the other plant species, both monocots and eudicots, thus helped us study the evolutionary dynamics of NACs and to understand shared patterns across the analyzed genomes. This analysis also allowed us to predict each member’s functions using the overall generated knowledge of the model species. 56 Capítulo II 2.4 CONCLUSIONS Comparative genomic analysis and gene functional analysis have shed new light on many aspects of how gene and genome duplicates have contributed to the rapid diversification of the NAC family into the angiosperm lineage by functional innovations such as key pathways, linked to the origin of flowering plants. In this study, we have broadened the number of analyzed species to unravel the origin, evolutionary history, and fate of the expanded NAC family. We observed that the expansion of the NAC family occurred shortly before the origin and rapid radiation of flowering plants. We also observed a gradual increase in the gene number, from the early diverging P. patens, to more complex trees, such as the Poplar, which wastree consistent with the occurrence of a WGD event in angiosperm history. We have identified 3,187 NAC TFs in 24 green plants and identified the principal sequences from the early diverging P. patens plant, termed basal sequences, which most likely expanded through the flowering plant lineage by different duplication mechanisms, thus allowing the diversification and adaptation of angiosperms to almost all environments. We found evidence, which had remained unknown before this work, of these five basal sequences in both monocot and eudicot plants. Comparative genomic analysis of the NAC family has opened new possibilities for the systematic functional analysis of new members while providing the basis for further functional research on this vascular plant gene family. Learning how regulatory proteins acquire new molecular functions is essential for developing an understanding of how organisms adapt to new biological niches. The NAC family represents a useful framework in which to address this question. This work is a starting point for characterizing the function of many neglected NAC genes and has provided us with a better understanding of the origin and evolution of the NAC family. 2.5 ACKNOWLEDGMENTS We thank the anonymous referees for their constructive comments and suggestions. The authors would also like to thank the Centro de Investigacion Cientifica de Yucatan, Mexico, for supporting this research. 57 Capítulo II 2.6 AUTHOR CONTRIBUTIONS Conceived and designed the study: APS and LRZ. Performed the bioinformatics analyses: APS. Supervised the bioinformatic analyses: LDA. Analyzed the data: APS, LSC and FST. Wrote the manuscript: APS and LDA. Supervised the project: LRZ and EC. All authors have read and approved the final manuscript. 58 Capítulo II 2.7 REFERENCES 1. Nakashima K, Takasaki H, Mizoi J, Shinozaki K, Yamaguchi-Shinozaki K. NAC transcription factors in plant abiotic stress responses. Biochim Biophys Acta. 2012; 1819(2):97-103. doi: 10.1016/j.bbagrm.2011.10.005 PMID: 22037288 2. Olesen JE, Trnka M, Kersebaum KC, Skjelvåg AO, Seguin B, Peltonen-Sainio P, et al. Impacts and adaptation of European crop production systems to climate change. European Journal of Agronomy. 2011; 34(2):96-112. doi: 10.1016/j.eja.2010.11.003 3. Vinocur B, Altman A. Recent advances in engineering plant tolerance to abiotic stress: achievements and limitations. Curr Opin Biotechnol. 2005; 16(2):123-32. PMID: 15831376 4. Kasuga M, Liu Q, Miura S, Yamaguchi-Shinozaki K, Shinozaki K. Improving plant drought, salt, and freezing tolerance by gene transfer of a single stressinducible transcription factor. Nat Biotechnol. 1999; 17(3):287-291. PMID: 10096298 5. Kizis D, Lumbreras V, Pagès M. Role of AP2/EREBP transcription factors in gene regulation during abiotic stress. FEBS Lett. 2001; 498(2-3):187-189. PMID: 11412854 6. Mizoi J, Shinozaki K, Yamaguchi-Shinozaki K. AP2/ERF family transcription factors in plant abiotic stress responses. Biochimica et Biophysica Acta. 2012; 1819(2):86-96. doi: 10.1016/j.bbagrm.2011.08.004 PMID: 21867785 7. Huang XS, Liu JH, Chen XJ. Overexpression of PtrABF gene, a bZIP transcription factor isolated from Poncirus trifoliata, enhances dehydration and drought tolerance in tobacco via scavenging ROS and modulating expression of stressresponsive genes. BMC Plant Biology. 2010a; 10:230. doi: 10.1186/1471-222910-230 8. Yoshida T, Fujita Y, Sayama H, Kidokoro S, Maruyama K, Mizoi J, et al. AREB1, AREB2, and ABF3 are master transcription factors that cooperatively regulate 59 Capítulo II ABRE-dependent ABA signaling involved in drought stress tolerance and require ABA for full activation. Plant J. 2010; 61(4):672-685. doi: 10.1111/j.1365-313X.2009.04092.x PMID: 19947981 9. Huang Y, Li MY, Wang F, Xu ZS, Huang W, Wang GL, et al. Heat shock factors in carrot: genome-wide identification, classification, and expression profiles response to abiotic stress. Mol Biol Rep. 2015; 42:893-905 doi: 10.1007/s11033-014-3826-x PMID: 25403331 10. Singh K, Foley RC, Onate-Sanchez L. Transcription factors in plant defense and stress responses. Curr Opin Plant Biol. 2002; 5(5):430-436. PMID: 12183182 11. Yang A, Dai X, Zhang WH. A R2R3-type MYB gene, OsMYB2, is involved in salt, cold, and dehydration tolerance in rice. Journal of Experimental Botany. 2012; 63(7):2541-56. doi:10.1093/jxb/err431 PMID: 22301384 12. Nuruzzaman M, Sharoni AM, Kikuchi S. Roles of NAC transcription factors in the regulation of biotic and abiotic stress responses in plants. Front Microbiol. 2013; 4:248. doi: 10.3389/fmicb.2013.00248 PMID: 24058359 13. Tran LSP, Nakashima K, Sakuma Y, Osakabe Y, Qin F, Simpson SD, et al. Coexpression of the stress-inducible zinc finger homeodomain ZFHD1 and NAC transcription factors enhances expression of the ERD1 gene in Arabidopsis. Plant J. 2006; 49(1):46-63. PMID: 17233795 14. Tran LSP, Nishiyama R, Yamaguchi-Shinozaki K, Shinozaki K. Potential utilization of NAC transcription factors to enhance abiotic stress tolerance in plants by biotechnological approach. GM Crops. 2010; 1(1):32-39. doi: 10.4161/gmcr.1.1.10569 PMID: 21912210 15. Jiang Y, Duan Y, Yin J, Ye S, Zhu J, Zhang F, et al. Genome-wide identification and characterization of the Populus WRKY transcription factor family and analysis of their expression in response to biotic and abiotic stresses. J Exp Bot. 2014; 65(22):6629-6644. doi: 10.1093/jxb/eru381 60 Capítulo II 16. Aida M, Ishida T, Fukaki H, Fujisawa H, Tasaka M. Genes involved in organ separation in Arabidopsis: an analysis of the cup-shaped cotyledon mutant. Plant Cell. 1997; 9(6):841-857. doi: http://dx.doi.org/10.1105/tpc.9.6.841 17. Souer E, van Houwelingen A, Kloos D, Mol J, Koes R. The No Apical Meristem gene is required for pattern formation in embryos and flowers and is expressed at meristem and primordial boundaries. Cell. 1996; 85(2):159-170. PMID: 8612269 18. Olsen AN, Ernst HA, Leggio LL, Skriver K. NAC transcription factors: structurally distinct, functionally diverse. Trends Plant Sci. 2005; 10(2):79-87. PMID: 15708345 19. Ooka H, Satoh K, Doi K, Nagata T, Otomo Y, Murakami K, et al. Comprehensive analysis of NAC family genes in Oryza sativa and Arabidopsis thaliana. DNA Res. 2003; 10(6): 239-247. PMID: 15029955 20. Tran LSP, Nakashima K, Sakuma Y, Simpson SD, Fujita Y, Maruyama K, et al. Isolation and Functional Analysis of Arabidopsis Stress-Inducible NAC Transcription Factors That Bind to a Drought-Responsive cis-Element in the early responsive to dehydration stress 1 Promoter. Plant Cell. 2004; 16(9):24812498. PMID: 15319476 21. Brown MS, Ye J, Rawson RB, Goldstein JL. Regulated intramembrane proteolysis: a control mechanism conserved from bacteria to humans. Cell. 2000: 100(4):391-398. PMID: 10693756 22. Hoppe T, Rape M, Jentsch S. Membrane-bound transcription factors: regulated release by RIP or RUP. Curr Opin Cell Biol. 2001; 13(3):344-8. PMID: 11343906 23. Kim SY, Kim SG, Kim YS, Seo PJ, Bae M, Yoon HK, et al. Exploring membraneassociated NAC transcription factors in Arabidopsis: implications for membrane biology in genome regulation. Nucleic Acids Research. 2006a; 35(1):203-213. PMID: 17158162 61 Capítulo II 24. Kato H, Motomura T, Komeda Y, Saito T, Kato A. Overexpression of the NAC transcription factor family gene ANAC036 results in a dwarf phenotype in Arabidopsis thaliana. J Plant Physiol. 2010; 167(7):571-577. doi: 10.1016/j.jplph.2009.11.004 PMID: 19962211 25. Balazadeh S, Wu A, Mueller-Roeber B. Salt-triggered expression of the ANAC092dependent senescence regulon in Arabidopsis thaliana. Plant Signal Behav. 2010; 5(6):733-5. PMID: 20404534 26. He XJ, Mu RL, Cao WH, Zhang ZG, Zhang JS, Chen SY. AtNAC2, a transcription factor downstream of ethylene and auxin signaling pathways, is involved in salt stress response and lateral root development. Plant J. 2005; 44(6):903-916. PMID: 16359384 27. Kim SG, Kim SY, Park CM. A membrane-associated NAC transcription factor regulates salt-responsive flowering via FLOWERING LOCUS T in Arabidopsis. Planta. 2007; 226(3):647-654. PMID: 17410378 28. Sablowski RW, Meyerowitz EM. A homolog of NO APICAL MERISTEM is an immediate target of the floral homeotic genes APETALA3/PISTILLATA. Cell. 1998; 92(1):93-103. PMID: 9489703 29. Shih CF, Hsu WH, Peng YJ, Yang CH. The NAC-like gene ANTHER INDEHISCENCE FACTOR acts as a repressor that controls anther dehiscence by regulating genes in the jasmonate biosynthesis pathway in Arabidopsis. J Exp Bot. 2014; 65(2):621-639. doi: 10.1093/jxb/ert412 PMID: 24323506 30. Waters BM, Uauy C, Dubcovsky J, Grusak MA. Wheat (Triticum aestivum) NAM proteins regulate the translocation of iron, zinc, and nitrogen compounds from vegetative tissues to grain. J Exp Bot. 2009; 60(15):4263-4274. doi: 10.1093/jxb/erp257 PMID: 19858116 62 Capítulo II 31. Nikovics K, Blein T, Peaucelle A, Ishida T, Morin H, Aida M. The balance between the MIR164A and CUC2 genes controls leaf margin serration in Arabidopsis. Plant Cell. 2006; 18(11):2929-2945. PMID: 17098808 32. Shan W, Juang JF, Chen L, Peng HH, Xiao YY, Li XP, et al. Molecular characterization of banana NAC transcription factor and their interactions with ethylene signalling component EIL during fruit ripenin. Journal of Experimental Botany. 2012; 63(14):5171-5187. doi: 10.1093/jxb/ers178 PMID: 22888129 33. Wu A, Allu DA, Garapati P, Siddiqui H, Dortay H, Zanor MI, et al. JUNGBRUNNEN1, a Reactive Oxygen Species–Responsive NAC Transcription Factor, Regulates Longevity in Arabidopsis. Plant Cell. 2012; 24(2):482-506. doi: 10.1105/tpc.111.090894 PMID: 22345491 34. Duval M, Hsieh TF, Kim SY, Thomas TL. Molecular characterization of AtNAM: a member of the Arabidopsis NAC domain superfamily. Plant Mol Biol. 2002; 50(2):237-248. doi: 10.1023/A:1016028530943 35. Hibara K, Karim R, Takada S, Taoka K, Furutani M, Aida M, et al. Arabidopsis CUP-SHAPED COTYLEDON3 Regulates Postembryonic Shoot Meristem and Organ Boundary Formation. Plant Cell. 2006; 18(11):2946-57. PMID: 17122068 36. Rauf M, Arif M, Fisahn J, Xue GP, Balazadeh S, Mueller-Roebera B. NAC Transcription Factor SPEEDY HYPONASTIC GROWTH regulates floodinginduced leaf movementl in Arabidopsis. Plant Cell. 2013; 25(12):4941-4955. doi: 10.1105/tpc.113.117861 PMID: 24363315 37. Yamaguchi M, Kubo M, Fukuda H, Demura T. Vascular-related NACDOMAIN7 is involved in the differentiation of all types of xylem vessels in Arabidopsis roots and shoots. Plant J. 2008; 55(4):652-664. doi: 10.1111/j.1365- 313X.2008.03533.x PMID: 18445131 38. Jensen MK, Hagedorn PH, Torres-Zabala M, Grant MR, Rung JH, Collinge DB, et al. Transcriptional regulation by an NAC (NAM-ATAF1,2-CUC2) transcription factor attenuates ABA signalling for efficient basal defence towards Blumeria 63 Capítulo II graminis f. sp. hordei in Arabidopsis. Plant J. 2008; 56(6):867-880. doi: 10.1111/j.1365-313X.2008.03646.x PMID: 18694460 39. Wang X, Basnayake BN, Zhang H, Li G, Li W, Virk N, et al. The Arabidopsis ATAF1, a NAC transcription factor, is a negative regulator of defense responses against necrotrophic fungal and bacterial pathogens. Mol Plant Microbe Interact. 2009; 22(10):1227-1238. doi: 10.1094/MPMI-22-10-1227 PMID: 19737096 40. Lu PL, Chen NZ, An R, Su Z, Qi BS, Ren F, et al. A novel drought-inducible gene, ATAF1, encodes a NAC family protein that negatively regulates the expression of stress-responsive genes in Arabidopsis. Plant Mol Biol. 2007; 63(2):289-305. PMID: 17031511 41 Yamaguchi-Shinozaki K, Shinozaki K. A novel cis-acting element in an Arabidopsis gene is involved in responsiveness to drought, low-temperature, or high-salt stress. Plant Cell. 1994; 6(2):251-264. PMID: 8148648 42. Hu R, Qi G, Kong Y, Kong D, Gao Q, Zhou G. Comprehensive analysis of NAC domain transcription factor gene family in Populus trichocarpa. BMC Plant Biol. 2010; 10:145. doi: 10.1186/1471-2229-10-145 PMID: 20630103 43. De Oliveira TM, Cidade LC, Gesteira AS, Coelho-Filho MA, Soares-Filho WS, Costa MGC, et al. Analysis of the NAC transcription factor gene family in citrus reveals a novel member involved in multiple abiotic stresss responses. Tree Genetics & Genomes. 2011; 7(6):1123-1134. doi: 10.1007/s11295-011-0400-8 44. Christiansen MW, Holm PB, Gregersen PL. Characterization of barley (Hordeum vulgare L.) NAC transcription factors suggests conserved functions compared to both monocots and dicots. BMC Research Notes. 2011; 4(302): doi: 10.1186/1756-0500-4-302 45. Jin JP, Zhang H, Kong L, Gao G, Luo JC. PlantTFDB 3.0: a portal for the functional and evolutionary study of plant transcription factors. Nucleic Acids Res. 2014; 42(Database issue):D1182-7. doi: 10.1093/nar/gkt1016 64 Capítulo II 46. Van de Peer Y, Fawcett JA. Proost S, Sterck L, Vandepoele K. The flowering world: a tale of duplications. Trends Plant Sci. 2009; 14(12):680-688. doi: 10.1016/j.tplants.2009.09.001 PMID: 19818673 47. Chen ZJ, Ha M, Soltis D. Polyploidy: genome obesity and its consequences. New Phytol. 2007; 174(4):717-720. doi: 10.1111/j.1469-8137.2007.02084.x PMCID: PMC1950720 48. Abrouk M, Murat F, Pont C, Messing J, Jackson S, Faraut T, et al. Palaeogenomics of plants: synteny-based modelling of extinct ancestors. Trends in Plant Science. 2010; 15(9):479-487. doi: 10.1016/j.tplants.2010.06.001 PMID: 20638891 49. Cenci A, Guignon V, Roux N, Rouard M. Genomic analysis of NAC transcription factors in banana (Musa acuminata) and definition of NAC orthologous groups for monocots and dicots. Plant Mol Biol. 2014; 85(1-2):63-80. doi: 10.1007/s11103-013-0169-2 PMID: 24570169 50. Bond WJ, Scott AC. Fire and the spread of flowering plants in the Cretaceous. New Phytologist. 2010; 188(4):1137-1150. doi: 10.1111/j.1469-8137.2010.03418.x 51. Soltis PS, Soltis DE. The origin ad diversification of Angiosperms. Am J Bot. 2004; 91(10):1614-1626. doi: 10.3732/ajb.91.10.1614 52. Zimmer A, Lang D, Richardt S, Frank W, Reski R, Rensing SA. Dating the early evolution of plants: detection and molecular clock analyses of orthologs. Mol Genet Genomics. 2007; 278(4):393-402. PMID: 17593393 53. Zuccolo A, Bowers JE, Estill JC, Xiong Z, Luo M, Sebastian A, et al. A physical map for the Amborella trichopoda genome sheds light on the evolution of angiosperm genome structure. Genome Biol. 2011; 12(5):R48 doi: 10.1186/gb2011-12-5-r48 PMID: 21619600 65 Capítulo II 54. Xu B, Ohtani M, Yamaguchi M, Toyooka K, Wakazaki M, Sato M, et al. Contribution of NAC Transcription Factors to Plant Adaptation to Land. Science. 2014; 343(6178):1505-1508. doi: 10.1126/science.1248417 PMID: 24652936 55. Zhu T, Nevo E, Sun D, Peng J. Phylogenetic analyses unravel the evolutionary history of NAC proteins in plants. Evolution. 2012; 66(6):1833-1848. doi: 10.5061/dryad.f2452v97 56. Sievers FA, Wilm A, Dineen D, Gibson TJ, Karplus K, Li W, et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 2011; 7:539. doi: 10.1038/msb.2011.75 PMID: 21988835 57. Eddy SR. Accelerated Profile HMM Searches. PLOS Comput Biol. 2011; 7(10):e1002195. doi: 10.1371/journal.pcbi.1002195 PMID: 22039361 58. Rice P, Longden I, Bleasby A. EMBOSS: The European Molecular Biology Open Software Suite. Trends in Genetics. 2000; 16(6):276-277. PMID: 10827456 59. Bennett MD, Leitch IJ. Plant DNA C-values database. (release 6.0, Dec. 2012) http://www.kew.org/cvalues/ 60. Finn RD, Bateman A, Clements J, Coggill P, Eberhardt RY, Eddy SR, et al. The Pfam protein families database. Nucleic Acids Research. 2014; Database Issue 42(D1):D222-D230. doi: 10.1093/nar/gkt1223 61. Huang Y, Niu B, Gao Y, Fu L, Li W. CD-HIT Suite: a web server for clustering and comparing biological sequences. Bioinformatics. 2010b; 26(5):680-682. doi: 10.1093/bioinformatics/btq003 62. Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 2004; 32(5):1792-7. PMID: 15034147 63. Abascal F, Zardoya R, Posada D. ProtTest: selection of best-fit models of protein evolution. Bioinformatics. 2005; 21(9):2104-5. PMID: 15647292 66 Capítulo II 64. Bailey TL, Elkan C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers. Proc Int Conf Intell Syst Mol Biol. 1994; 2:28-36. PMID: 7584402 65. Wheeler TJ, Clements J, Finn RD. Skylign: a tool for creating informative, interactive logos representing sequence alignments and profile hidden Markov models. BMC Bioinformatics. 2014; 15(7): doi: 10.1186/1471-2105-15-7 66. Castillo-Ramirez S, Gonzalez V. Factors affecting the concordance between orthologous gene trees and species tree in bacteria. BMC Evolutionary Biology. 2008: 8(1):300. doi: 10.1186/1471-2148-8-300 67. Moreno-Hagelsieb G, Latimer K. Choosing BLAST options for better detection of orthologs as reciprocal best hits. Bioinformatics. 2008; 24(3):319-324. PMID: 18042555 68. Goodstein DM, Shu S, Howson R, Neupane R, Hayes RD, Fazo J, et al. Phytozome: a comparative platform for green plant genomics. Nucleic Acids Res. 2012; 40(Database issue):D1178-86. doi: 10.1093/nar/gkr944 PMID: 22110026 69. R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing: Vienna, Austria; 20011 ISBN: 3-900051-07-0. Retrieved from http://cran.r-project.org/. 70. Stamatakis A. RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models. Bioinformatics. 2006; 22(21):26882690. doi: 10.1093/bioinformatics/btl446 PMID: 16928733 71. Jordan GE, Piel WH. PhyloWidget: web-based visualizations for the tree of life. Bioinformatics. 2008; 24 (14):1641-1642. doi: 10.1093/bioinformatics/btn235 72. The Angiosperm Phylogeny Group. An update of the Angiosperm Phylogeny Group classification for the orders and families of flowering plants: APG III. Botanical 67 Capítulo II Journal of the Linnean Society. 2009; 161(2):105-121. doi: 10.1111/j.10958339.2009.00996.x 73. Bowers JE, Chapman BA, Rong J, Paterson AH. Unravelling angiosperm genome evolution by phylogenetic analysis of chromosomal duplication events. Nature. 2003; 422(6930):433-438. PMID: 12660784 74. Cui L, Wall PK, Leebens-Mack JH, Lindsay BG, Soltis DE, Doyle JJ, et al. Widespread genome duplications throughout the history of flowering plants. Genomes Res. 2006; 16(6):738-749. PMID: 16702410 75. Vik A, Rine J. Membrane biology: membrane-regulated transcription. Curr Biol. 2000; 10(23):R869-R871. PMID: 11114535 76. Conte S, Lloyd AM. Exploring multiple drug and herbicide resistance in plantsSpotlight on transporter proteins. Plant Science. 2011; 180(2):196-203. doi:10.1016/j.plantsci.2010.10.015 PMID: 21421361 77. Omote H, Hiasa M, Matsumoto T, Otsuka M, Moriyama Y. The MATE proteins as fundamental transporters of metabolic and xenobiotic organic cations. Trends Pharmacol Sci. 2006; 27(11):587-93. PMID: 16996621 78. Soltis PS, Soltis DE. A conifer genome spruces up plant phylogenomics. Genome Biol. 2013; 14(6):122. doi: 10.1186/gb-2013-14-6-122 PMID: 23805854 79. Wang N, Xiang Y, Fang L, Wang Y, Xin H, Li S. Patterns of gene duplication and their contribution to expansion of gene families in grapevine. Plant Mol Biol Rep. 2013; 31(4):852-861.852-86.1 doi: 10.1007/s11105-013-0556-5 80. Rizzon C, Ponger L, Gaut BS. Striking similarities in the genomic distribution of tandemly arrayed genes in Arabidopsis and rice. PloS Comput Biol. 2006; 2(9):e115. PMID: 16948529 68 Capítulo II 81. Freeling M, Lyons E, Pedersen B, Alam M, Ming R, Lisch D. Many or most genes in Arabidopsis transposed after the origin of the order Brassicales. Genome Res. 2008; 18(12):1924-1937. doi: 10.1101/gr.081026.108 PMID: 18836034 82. Force A, Lynch M, Pickett FB, Amores A, Yan YL, Postlethwait J. Preservation of duplicate genes by complementary, degenerative mutations. Genetics. 1999; 151(4):1531-1545. PMID: 10101175 83. Jaillon O, Aury JM., Noel B, Policriti A, Clepet C, Casagrande C, et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 2007; 449(7161):463-7. PMID: 17721507 84. Liu Z, Moore PH, Ma H, Ackerman CM, Ragiba M, Yu Q, et al. A primitive Y chromosome in papaya marks incipient sex chromosome evolution. Nature. 2004; 427(6972):348-352. PMID: 14737167 85. Ming R, Hou S, Feng Y, Yu Q, Dionne-Laporte A, Saw JH, et al. The draft genome of the transgenic tropical fruit tree papaya (Carica papaya Linnaeus). Nature. 2008; 452(7190):991-996. doi: 10.1038/nature06856 PMID: 18432245 86. Lyons E, Pedersen B, Kane J, Alam M, Ming R, Tang H. Finding and comparing syntenic regions among arabidopsis and the outgroups papaya, poplar, and grape: CoGe with Rosids. Plant Physiology. 2008; 148(..):1772-1781 87. Hughes AL, Friedman R. Parallel evolution by gene duplication in the genomes of two unicellular fungi. Genome Res. 2003; 13(5):794-799. doi: 10.1101/gr.714603 88. Riechmann JL, Heard J, Martin G, Reuber L, Jiang C, Keddie J, et al. Arabidopsis transcription factors: genome-wide comparative analysis among eukaryotes. Science. 2000; 290(5499):2105-2110. PMID: 11118137 89. Shiu SH, Shih MC, Li WH. Transcription Factor Families Have Much Higher Expansion Rates in Plants than in Animals. Plant Physiol. 2005; 139(1):18-26. PMID: 16166257 69 Capítulo II 90. Kooning EV. Orthologs, paralogs, and evolutionary genomics. Annu Rev Genet. 2005; 39:309-38. PMID: 16285863 91. Velasco R, Zharkikh A, Troggio M, Cartwright DA, Cestaro A, Pruss D, et al. A high quality draft consensus sequence of the genome of a heterozygous grapevine variety. PloS one. 2007; 2(12):e1326. PMID: 18094749 92. Yue JX, Li J, Wang D, Araki H, Tian D, Yang S. Genome-wide investigation reveals high evolutionary rates in annual model plants. BMC Plant Biology. 2010; 10:242. doi: 10.1186/1471-2229-10-242 PMID: 21062446 93. Ko JH, Yang SH, Park AH, Lerouxel O, Han KH. ANAC012, a member of the plantspecific NAC transcription factor family, negatively regulates xylary fiber development in Arabidopsis thaliana. Plant J. 2007; 50(6):1035-1048. PMID: 17565617 94. Yao D, Wei Q, Xu W, Syrenne RD, Yuan JS, Su Z. Comparative genomic analysis of NAC transcriptional factors to dissect the regulatory mechanisms for cell wall biosynthesis. BMC Bioinformatics. 2012;13 Suppl 15:S10. doi: 10.1186/14712105-13-S15-S10 PMID: 23046216 95. Bennett T, van den Toorn A, Sanchez-Perez GF, Campilho A, Willemsen V, Snel B, et al. SOMBRERO, BEARSKIN1, and BEARSKIN2 Regulate Root Cap Maturation in Arabidopsis. Plant Cell. 2010; 22(3):640-54. doi: 10.1105/tpc.109.072272 PMID: 20197506 96. Zhong R, Ye ZH, Richardson EA. Two NAC domain transcription factors, SND1 and NST1, function redundantly in regulation of secondary wall synthesis in fibers of Arabidopsis. Planta. 2007; 225(6):1603-1611. PMID: 17333250 97. Pei H, Ma N, Tian J, Luo J, Chen J, Li J, et al. An NAC Transcription Factor Controls Ethylene-Regulated Cell Expansion in Flower Petals. Plant Physiol. 2013; 163(2):775-791. doi: 10.1104/pp.113.223388 PMID: 23933991 70 Capítulo II 98. Xie Q, Frugis G, Colgan D, Chua NH. Arabidopsis NAC1 transduces auxin signal downstream of TIR1 to promote lateral root development. Genes Dev. 2000; 14(23):3024-3036. PMID: 11114891 99. Hibara K, Takada S, Tasaka M. CUC1 gene activates the expression of SAMrelated genes to induce adventitious shoot formation. Plant J. 2003; 36(5):687696. doi: 10.1046/j.1365-313X.2003.01911.x 100. Lee S, Seo PJ, Lee YJ, Park CM. A NAC transcription factor NTL4 promotes reactive oxygen species production during drought-induced leaf senescence in Arabidopsis. The Plant Journal. 2012; 70:831-844. doi: 10.1111/j.1365313X.2012.04932.x PMID: 22313226 101. Kim SG, Lee AK, Yoon HK, Park CM. A membrane-bound NAC transcription factor NTL8 regulates gibberellic acid-mediated salt signaling in Arabidopsis seed germination. The Plant Journal. 2008; 55:77-88. doi: 10.1111/j.1365313X.2008.03493.x PMID: 18363782 102. Kim SY, Kim SG, Park JE, Park HY, Lim MY, Chua NH, et al. A Membrane-Bound NAC Transcription Factor Regulates Cell Division in Arabidopsis. Plant Cell. 2006b; 18(11):3132-3144. PMID: 17098812 103. Ng S, Ivanova A, Duncan O, Law SR, Aken O, De Clercq I, et al. A membranebound NAC transcription factor, ANAC017, mediates mitochondrial retrograde signaling in arabidopsis. Plant Cell. 2013; 25(9):3450-3471. doi: 10.1105/tpc.113.113985 PMID: 24045017 104. Seo PJ, Park CM. A membrane-bound NAC transcription factor as an integrator of biotic and abiotic stress signals. Plant Signaling Behav. 2010; 5(5):481-483. doi: 10.4161/psb.11083 PMID: 20139739 105. Yoo SY, Kim Y, Kim SY, Lee JS, Ahn JH. Control of Flowering Time and Cold Response by a NAC-Domain Protein in Arabidopsis. PLoS One. 2007; 2(7):e642. PMID: 17653269 71 Capítulo II 106. Willemsen V, Bauch M, Bennett T, Campilho A, Wolkenfelt H, Xu J. The NAC Domain Transcription Factors FEZ and SOMBRERO Control the Orientation of Cell Division Plane in Arabidopsis Root Stem Cells. Developmental Cell. 2008; 15(6):913-922. doi: 10.1016/j.devcel.2008.09.019 PMID: 19081078 107. Balazadeh S, Kwasniewski M, Caldana C, Mehrnia M, Zanor MI, Xue GP, et al. ORS1, an H2O2-Responsive NAC Transcription Factor, Controls Senescence in Arabidopsis thaliana. Molecular Plant. 2011; 4(2):346-360. doi: 10.1093/mp/ssq080 PMCID: PMC3063519 108. Zhao C, Avci U, Grant EH, Haigler CH, Beers EP. XND1, a member of the NAC domain family in Arabidopsis thaliana, negatively regulates lignocellulose synthesis and programmed cell death in xylem. Plant J. 2008; 53(3):425-436. PMID: 18069942 109. Guo Y, Gan S. AtNAP, a NAC family transcription factor, has an important role in leaf senescence. Plant J. 2006; 46(4):601-612 PMID: 16640597 110. Zhang K, Gan SS. An Abscisic Acid-AtNAP Transcription Factor-SAG113 Protein Phosphatase 2C Regulatory Chain for Controlling Dehydration in Senescing Arabidopsis leaves. Plant Physiol. 2012; 158(2):961-969. doi: 10.1104/pp.111.190876 PMID: 2218465 111. Fujita M, Fujita Y, Maruyama K, Seki M, Hiratsu K, Ohme-Takagi M, et al. A dehydration-induced NAC protein, RD26, is involved in a novel ABA-dependent stress-signaling pathway. Plant J. 2004; 39(6):863-76. PMID: 15341629 112. Jeong JS, Kim YS, Baek KH, Jung H, Ha SH, Choi YD, et al. Root-Specific expression of OsNAC10 improves drought tolerance and grain yield in rice under field drought conditions. Plant Physiology, 2010,; 153(1):185-197. doi: 10.1104/pp.110.154773 PMID: 20335401 113. Sperotto RA, Ricachenevsky FK, Duarte GL, Boff T, Lopes KL, Sperb ER, et al. Identifcation of up-regulated genes in flag leaves during rice grain filling and characterization of OsNAC5, a new ABA-dependent transcription factor. Planta. 72 Capítulo II 2009; 230(5):985-1002. doi: 10.1007/s00425-009-1000-9 PMID: 19697058 114. Thu NBA, Hoang XLT, Doan H, Nguyen TH, Bui D, Thao NP, et al. Differential expression analysis of a subset of GmNAC genes in shoots of two contrasting drought-responsive soybean cultivars DT51 and MTD720 under normal and drought conditions. Mol Biol Rep. 2014; 41(9):5563-5569. doi: 10.1007/s11033014-3507-9 PMID: 24985975 115. Tran LSP, Quach TN, Guttikonda SK, Aldrich DL, Kumar R, Neelakandan A, et al. Molecularin soybean characterizationof stress-inducible GmNAC genes. Mol Genet Genomics. 2009; 281(6):647-664. doi: 10.1007/s00438-009-0436-8 PMID: 19277718 116. Lynch M, Force A. The probability of duplicated gene preservation by subfunctionaliation. Genetics. 2000; 154(1):459-473. PMID: 10629003 117. Blanc G, Wolfe KH. Functional divergence of duplicated genes formed by polyploidy during Arabidopsis evolution. Plant Cell. 2004; 16(7):1679-1691. doi: http://dx.doi.org/10.1105/tpc.021410 118. Seoighe C, Gehring C. Genome duplication led to highly selective expansion of the Arabidopsis thaliana proteome. Trends Genet. 2004; 20:461-464. PMID: 15363896 73 Capítulo II 2.8 SUPPORTING INFORMATION S1 Table. Plant species used for the retrieval and analysis of the NAC sequences. AEnsemblPlants, the BPhytozome database V.9.1, and the CSol Genomics Network were used to collect sequences. (PDF) S2 Table. List from 24 plants used in this study. This file contains the IDs assigned for the retrieved NAC sequences, the names of the protein annotation files for each species, the amino acid sequences for each NAC protein, and short descriptions and annotations generated in this study. (XLS) S3 Table. List of NAC sequences detected in C. Papaya. The sequences were named using the prefix CpNAC and a denoting their order of discovery. Above each column, the CpNAC ID, the Phytozome V9.0. database ID number, the best BLASTP hit in a nr-database (GenBank), and the E-value of the best hit are shown. (PDF) S4 Table. Complete list of the NAC OG proteins in monocots. NAC OG proteins in the Liliopida Class. Oryza sativa NAC sequences were used as references. Red colored blocks represent orthologous genes. Species-specific duplications of each gene are shown below the colored blocks. Sequences belonging to the basal orthologous groups are numbered and marked with yellow stars. (PDF) S5 Table. Complete list of NAC OG proteins in eudicots. List of OG proteins from the Class Magnoliopsida using the Vitis vinifera sequences as references. Purple colored blocks represent orthologous sequences. Species-specific duplications of each gene are shown below the colored blocks. Sequences belonging to the basal orthologous groups are numbered and marked with yellow stars. (PDF) S6 Table. Complete list of NAC OGs shared by monocots and eudicots. List of 31 NAC OG proteins in basal angiosperm species. Sequences of rice and grapevine are marked in red and purple boxes, respectively. Sequences with the reciprocal BBH are shown in colored boxes. Paralogous sequences are shown below the colored boxes. The five BOGs are marked with yellow stars. (PDF) 74 Capítulo II S7 Table. Complete set of NAC OGs identified in this study. This file contains the OGs identified in the monocot lineage, the eudicot lineage, and between the monocot and eudicot lineages, as well as the OGs detected between P. patens as an outgroup and each representative taxa for the monocot and eudicot lineages. The Arabidopsis sequences were annotated to compare with the eudicot OGs. The basal sequences of P. patens are shown next to their respective orthologous sequences in both the monocot and eudicot lineages. (XLS) S1 Fig. HMM LOGO analysis of the NAC domains of 24 plant species. This file contains the HMM NAC domain LOGOS of each of the 24 plant species analyzed. (PDF) S2 Fig. Comparative analysis of the BOGs and their relative sequences. BOXSHADE analysis of the BOGs and their relative sequences in monocot and eudicot plant species. Plesiomorphic characters are shown in black shadow boxes, principal synapomorphies are shown in red and green letters, and autapomorphies are shown in yellow letters. Similar sequences are colored in gray shadow boxes. The TMM region is shown in blue letters. (PDF) S3 Fig. Motifs found outside the NAC domain in the five BOGs. Motifs scan of the BOGs and their relative sequences in monocot and eudicot plants. A) BOG1, B) BOG2, C) BOG3, D) BOG4, and E) BOG5. Motifs are shown in gray boxes. (PDF) S4 Fig. Phylogenetic tree of the NAC proteins in the 24 land plant species. The tree was arranged in six major clades (I-VI) and subclassified in minor groups. Major clades are highlighted in different colors. The ID sequences for moss P. patens are shown in blue, for S. moellendorffii in pink, for monocots in red and for eudicots in green. (PDF) S5 Fig. Phylogenetic tree of the NAC TF proteins in the basal plant lineages. Maximum Likelihood phylogenetic tree of NAC transcription factor proteins. Phylogenetic analysis was carried out with sequences of three basal plant groups: grapevine (Magnoliopsida), rice (Liliopsida), and P. patens (Bryophyta). The tree was arranged into six major clades and was then subclassified in minor groups. The ID sequences for P. patens, rice and grapevine are shown in blue, red and green, 75 Capítulo II respectively. Black asterisks indicated the BOGs shared in the three species and are indicated by red and purple dashed lines. Green colored asterisks and dashed lines indicate the OG for the P. patens-grapevine; the cyan colored asterisks and dashed lines indicate the OG for the P. patens-rice. (PDF) 76 Capítulo III CAPÍTULO III CARACTERIZACIÓN IN SILICO DE FACTORES DE TRANCRIPCIÓN NAC INVOLUCRADOS EN RESPUESTA A ESTRÉS ABIÓTICO 3.1 INTRODUCCIÓN Los factores de transcripción NAC se encuentran exclusivamente en las plantas, no se han hallado evidencias de su presencia en bacterias y algas. Estos factores se encuentran distribuidos en gran número de especies y en diversos estudios se ha demostrado la participación de estas proteínas en un gran número de procesos de desarrollo, así como en respuesta a distintos tipos de estrés biótico y abiótico (Nakashima et al, 2012). El dominio NAC carece de un motivo clásico helix-turn-helix (hélice-giro-hélice), por el contrario, éstas poseen un nuevo tipo de plegamiento descrito para FT's, el cual se conforma por un trenzado de láminas beta, rodeadas por unos pocos elementos helicoidales los cuales tienen la capacidad de unirse específicamente al ADN (Han et al, 2011). Actualmente se ha determinado la estructura cristalográfica del dominio NAC de una sola proteína de esta familia (ANAC019) perteneciente a A. thaliana (Morishita, et al, 2009). Dentro algunas de las funciones que han sido reportadas para esta familia de FT's, se encuentran las respuestas frente a diferentes tipos de estrés biótico y abótico. Los genes de Arabidopsis ATAF1 y ATAF2 se encuentran involucrados en la respuesta ante el ataque de diversos tipos de patógenos (Lu et al., 2007). Varios genes NAC de Brassica napus y de Saccharum sp., resultan altamente inducidos por las bajas temperaturas, la deshidratación y el ataque de patógenos, mientras que los genes ANAC019, ANAC055 y ANAC072 de Arabidopsis son altamente regulados por ABA, sequía y estrés salino (De Oliveira et al., 2011). Desde que el primer miembro de esta familia fue descrito por Souer et al., en 1996, diversos grupos se han enfocado en describir las características particulares de sus miembros, elucidar el rol que desempeñan en el metabolismo vegetal y comprender la evolución de esta familia génica. Para este objetivo, es esencial comprender los mecanismos que subyacen el origen de nuevos genes, como son el nacimiento de genes de novo y la hipótesis de duplicación-divergencia. Los modos de duplicación génica pueden ser sumarizados en seis mecanismos: duplicación global del genoma (whole genome duplication, WGD), duplicación en tándem, duplicación proximal, 77 Capítulo III duplicación basada en ADN transpuesto, duplicación por retrotransposones y duplicación dispersa (Wang et al., 2011). La consecuencia de estos eventos de duplicación da lugar a la expansión de las familias génicas, afectando en muchos casos las características de los genes duplicados, pudiendo conllevar a la divergencia funcional, subfuncionalización, neofuncionalización, pseudogenización y evolución concertada de los genes (Abrouk et al., 2010). Dichos cambios resultan de gran importancia para el entendimiento de la divergencia funcional de los genes y los cambios que conlleva dicha divergencia son asociados a las características particulares para cada especie. Al día de hoy se ha caracterizado esta familia de FT's en diferentes especies vegetales mediante diversas estrategias de búsqueda, las cuales no siempre suelen ser las más fiables, por lo que en este trabajo se realizó una amplia caracterización de esta familia de FT en Angiospermas, resultando en una matriz de datos robusta con las secuencias ortólogas entre los diferentes miembros del grupo. Dicha matriz nos permitió estudiar con mayor exactitud las secuencias involucradas en diferentes procesos de estrés abiótico entre especies, dentro de las cuales se encuentra nuestra especie de interés: papaya. En este tercer capítulo tomamos ventaja de los análisis comparativos realizados entre genomas vegetales en el Capítulo II, con los cuales identificamos secuencias de Arabidopsis thaliana involucradas en procesos de estrés abiótico y tomamos las secuencias ortólogas en C. papaya para su caracterización. En el presente capítulo, se reporta la identificación de 77 genes NAC de Carica papaya, como parte de un esfuerzo para identificar nuevos genes involucrados en respuesta aL estrés abiótico, especialmente en sequía, salinidad y temperaturas extremas. Debido al potencial de los FT's NAC como blanco para la ingeniería genética en la búsqueda de la tolerancia al estrés ambiental, cinco diferentes genes NAC de C. papaya cv. Maradol fueron ampliamente caracterizados mediante análisis in silico con el fin de comprender el rol que desempeñan en la señalización en respuesta al estrés. Para ello fue necesario visualizar los elementos en cis presentes en las respectivas cajas promotoras de los cinco genes, así como identificar los motivos característicos en la región C-terminal con respecto a la subfamilia de su pertenencia. 78 Capítulo III 3.2 MATERIALES Y MÉTODOS 3.2.1 DETERMINACIÓN DE SECUENCIAS NAC CARACTERIZADAS EN DISTINTAS ESPECIES VEGETALES, E IDENTIFICACIÓN DE LAS SECUENCIAS ORTÓLOGAS EN C. papaya L. cv. MARADOL Para comprender las relaciones funcionales de las proteínas NAC, se realizó una búsqueda en la literatura científica sobre secuencias NAC caracterizadas funcionalmente en distintos modelos vegetales, los cuales hayan presentado fenotipos tolerantes en distintos tipos de estrés abiótico. La búsqueda se realizó dentro de las siguientes bases de datos: NCBI (National Center for Biotechnology Information, http://www.ncbi.nlm.nih.gov/), EBI http://www.ebi.ac.uk/), v3.0 PTFDB http://planttfdb.cbi.edu.cn/index.php), Database, (European (Plant AtTFDB Bioinformatics Transcription (Arabidopsis http://arabidopsis.med.ohio-state.edu/AtTFDB/) Factor Insitute, Database, transcription y STIFDB Factor (Stress Responsive Transcription Factor Database, http://caps.ncbs.res.in/stifdb/search.html). Con base en las anotaciones realizadas, se desarrolló un conjunto de datos de dichas secuencias conteniendo la siguiente información: secuencia nucleotídica, región codificante (CDS), secuencia proteica, función, número de acceso, nombres y sinonimias de la secuencia, y por último los artículos científicos en los cuales se encuentra citada dicha información. Para la selección de los genes candidatos en este estudio, se utilizaron como referencia aquellas secuencias obtenidas de la literatura cuyos niveles de expresión transcripcionales en respuesta a estrés abiótico (sequía, deshidratación, frio, altas temperaturas, salinidad, adición de ABA) haya sido significativos, y con base en las diferentes evidencias experimentales para dichos genes. Posteriormente se determinaron las secuencias ortólogas para papaya mediante el uso de la matriz obtenida para Angiospermas en este trabajo (ver Capítulo II), con el fin de tener una aproximación in silico de la funcionalidad de las secuencias en papaya. Una vez obtenidas las predicciones para papaya se procedió a caracterizar dichas secuencias. Se realizaron comparaciones contra los genes ortólogos en diferentes especies de angiospermas, mediate alineamientos múltiples en Clustal Omega, y visualizados mediante BOXSHADE v3.21 (http://www.ch.embnet.org). De igual modo, se señalaron el número y la posición de los intrones, las posibles regiones no 79 Capítulo III traducidas 5' y 3', se caracterizó la región promotora de cada gen y finalmente se procedió a diseñar iniciadores específicos para cada uno de los genes seleccionados en C. papaya. 3.2.2 MODELOS ESTRUCTURALES DE LAS PROTEÍNAS NAC DE C. papaya SELECCIONADAS Nuestras estructuras tridimensionales propuestas fueron modeladas en el predictor Phyre2 (Lawrence y Sternberg, 2009) y presentadas mediante Chimera 1.5.3 (Pettersen et al., 2004). De igual manera, cada una de las secuencias de aminoácidos predichas fue comparada contra la base de datos PBD, Proteina Data Bank (http://www.wwpdb.org/) para la asociación con alguna secuencia reportada y caracterizada cristalográficamente. 3.2.3 ANÁLISIS DE PROMOTORES La secuencia de los promotores de los genes NAC seleccionados fue utilizada para determinar la ocurrencia de los motivos conocidos en cis mediante la base de datos PLACE (Higo et al., 1999) y AGRIS (Palaniswamy et al., 2006) 80 Capítulo III 3.3 RESULTADOS 3.3.1 DETERMINACIÓN DE SECUENCIAS NAC CARACTERIZADAS E IDENTIFICACIÓN DE SECUENCIAS ORTÓLOGAS EN C. papaya L. cv. MARADOL De acuerdo con la literatura, se identificaron 35 secuencias NAC caracterizadas, cuyas funciones han sido demostradas mediante distintas evidencias experimentales, así como análisis de expresión transcripcional, sobreexpresión en plantas y silenciamiento de dichos genes (Tabla 3.1). Muchas de estas secuencias caracterizadas, responden a procesos de desarrollo de la planta, otras en respuesta a algún tipo de estrés abiótico y otras más actúan en procesos de resistencia a patógenos, induciendo en uno de los casos, la activación de los genes PR (pathogenesis-related). De entre estas secuencias, los genes de Arabidopsis ANAC019, ANAC055 y ANAC072 presentan una alta expresión transcripcional en respuesta a estrés por altas temperaturas, sequía y salinidad (Jensen et al., 2010). Por otra parte el gen ANAC002 o ATAF1 muestra una clara actividad en la respuesta al estrés por sequía, durante el daño mecánico y la infección por patógenos; presenta una estructura proteica totalmente diferente a las otras NAC involucradas en estrés abiótico, siendo ésta única en su clase (Lu et al., 2007). Tabla 3. 1 Genes funcionales NAC reportados en la literatura, involucrados en diversas respuestas ambientales. No. Acceso GenBank Nombre Función Referencia NM_100054 ANAC002, ATAF1 Sequía, Daño mecánico, patógenos Lu et al., 2007 NM_103011 ANAC012, NST3, SND1 Regulador negativo del engrosamiento de pared secundaria y formación de xilema Ko et al., 2007 NM_104167 ANAC019 Sequía, salinidad, ABA, JA, defensa-patógenos Jensen et al., 2010 NM_104479 ANAC022, NAC1 Señalización auxinas para desarrollo de raíces laterales Xie et al., 2000 NM_105616 ANAC029, ATNAP Regulador de senescencia foliar Guo y Gan, 2006 NM_105851 ANAC030, VND7 Interruptor transcripcional de la transdiferenciación de células de metaxilema y protoxilema Kubo et al., 2005 Yamaguchi et al., 2010 NM_128289 ANAC040, NTL8 NM_129861 ANAC042, JUNGBRUNNEN 1 Regulador negativo de la germinación en estrés salino (GA signaling) Responsivo a especies reactivas de oxígeno, regulador de longevidad en A. thaliana NM_130243 ANAC043, NST1 Regulador en la formación de pared secundaria Kim et al., 2008 Wu et al., 2012 Mitsuda et al., 2005 81 Capítulo III Tabla 3.1 Continua NM_112418 ANAC055, ATNAC3 Sequía, salinidad, ABA Liu et al., 2011 Tran et al., 2004 NM_114813 ANAC062, NTL6, NTM1 Inducción de genes PR asociados a frio Seo et al., 2010 NM_116056 ANAC066, NST2 Regulador en la formación de pared secundaria Mitsuda et al., 2005 NM_116384 ANAC068, NTM1 Regula la división celular mediante señalización por citocininas Kim et al., 2006 NM_116385 ANAC069 Estrés salino Jiang y Deyholos, 2006 NM_118875 ANAC072, RD26 Sequía, salinidad, ABA NM_120523 ANAC078, NAC2, NTL11 NM_122134 ANAC089, NTL NM_123323 ANAC092, ATNAC6, ATNAC2, ORE1 Regulación de la vía de Flavonoides en alta luminosidad Regulador negativo en la vía de la fructosa, regulador negativo de la floración en A. thaliana Regulador de senescencia foliar, controlado por etileno NM_124774 ANAC098, AtCUC2 Diferenciación y separación de órganos NM_125632 ANAC101, VND6 NM_125849 ANAC104, XND1 NM_001125650 AtNTL9 Respuesta a estrés osmótico y senescencia foliar Yoon et al., 2008 AY974350 GmNAC002 Altamente regulado por salinidad y deshidratación Tran et al., 2009 AY974351 GmNAC003 Altamente regulado por salinidad y deshidratación Tran et al., 2009 AY974352 GmNAC004 Altamente regulado por salinidad y deshidratación Tran et al., 2009 AK376297 HvNAC013 Regulador de la senescencia foliar Kjaersgaard et al., 2011 AB362161 HvIDEF2 AK069257 OsNAC10 AB362160 OsIDEF2 CT829509 ONAC045 XM_002302636 PtrWND2B XM_002325955 PtrWND6B EU670749 SlNAM1 Altamente inducido por estrés salino Yang et al., 2011 EU670750 SlNAC1 Altamente inducido por estrés salino Yang et al., 2011 AY625683 TaNAC2 Confiere aumento en la tolerancia a múltiples tipos de estrés abiótico Mao et al., 2012 Interruptor transcripcional de la trans-diferenciación de células de metaxilema y protoxilema Regulador negativo en la diferenciación de elementos traqueales Regula la expresión de genes involucrados en la homeostasis de hierro ante su deficiencia. Aumenta el rendimiento de granos en arroz bajo condiciones en campo de estrés por sequía Regula la expresión de genes involucrados en la homeostasis de hierro ante su deficiencia. Aumenta la tolerancia en arroz a sequía y estrés salino Regula la expresión de otros FT’s involucrados en la síntesis de la pared secundaria Regula la expresión de otros FT’s involucrados en la síntesis de la pared secundaria Liu et al., 2011 Tran et al., 2004 Morishita et al., 2009 Li et al., 2011 Balazadeh et al., 2011 Aida et al., 1997 Kubo et al., 2005 Zhao et al., 2005 Ogo et al., 2010 Jeong et al., 2010 Ogo et al., 2010 Zheng et al., 2009 Zhong et al., 2010 Zhong et al., 2010 Con base en los antecedentes citados, se decidió hacer la caracterización in silico en papaya, de los genes ortólogos ANAC002, ANAC019, ANAC029, ANAC040, ANAC055, ANAC072 y ANAC092 de Arabidopsis thaliana. 82 Capítulo III De acuerdo con los resultados obtenidos, las secuencias ANAC019, ANAC055 y ANAC072 (RD26), de A. thaliana, con función definida ante el estrés abiótico, se encuentran representadas por un solo candidato en C. papaya cv. Maradol, siendo dicha predicción nombrada como CpNAC4. De acuerdo a los análisis comparativos realizados en el capítolo II, CpNAC4 resultó ser la secuencia ortóloga a ANAC072, y los genes ANAC019 y ANAC055 resultaron ser las secuencias parálogas de ANAC072. El resultado de las predicciones se muestra en la Tabla 3.2. Tabla 3. 2 Secuencias seleccionadas de C. papaya ortólogas a genes de A. thaliana responsivos a estrés abiótico Gen C. papaya ID (Phytozome) Gen ortólogo de Arabidopsis Subdominios pb Intrónes Intrón pb CpNAC1 evm.model.supercontig_1.48 ANAC029 A BCDE 756 3 117 165 29 97 86 CpNAC4 evm.model.supercontig_80.93 ANAC019 ANAC055 ANAC072 A BCDE 1020 2 CpNAC5 evm.model.supercontig_64.115 ANAC002 ABCDE 906 2 119 593 CpNAC12 evm.model.supercontig_14.101 ANAC092 A BCDE 1041 2 86 102 CpNAC39* evm.model.supercontig_195.35 ANAC040 ABCD 1308 3 1106 419 80 *(MA = Membrane-Associated) De las secuencias seleccionadas de Arabidopsis, ANAC072 es una de las principales responsables, junto con ANAC019 y ANAC055, de conferir tolerancia a diferentes tipos de estrés abiótico. En papaya, la secuencia ortóloga CpNAC4 presenta claramente diferencias en su secuencia de aminoácidos, en comparación con las de Arabidopsis como se puede observar en la Figura 3.1. 83 Capítulo III NAC072 CpNAC4 NAC019 NAC055 1 1 1 1 MGVREKDPLAQLSLPPGFRFYPTDEELLVQYLCRKVAGYHFSLQVIGDIDLYKFDPWDLP MGVQQMDPLAQLSLPPGFRFYPTDEELLVQYLCRKVAGQQFSLQIIAEIDLYKFDPWVLP MGIQETDPLTQLSLPPGFRFYPTDEELMVQYLCRKAAGYDFSLQLIAEIDLYKFDPWVLP MGLQELDPLAQLSLPPGFRFYPTDEELMVEYLCRKAAGHDFSLQLIAEIDLYKFDPWVLP NAC072 CpNAC4 NAC019 NAC055 61 61 61 61 SKALFGEKEWYFFSPRDRKYPNGSRPNRVAGSGYWKATGTDKIITADGRRVGIKKALVFY SKAIFGEKEWYFFSPRDRKYPNGSRPNRVAGSGYWKATGTDKIITTEGRRVGIKKALVFY NKALFGEKEWYFFSPRDRKYPNGSRPNRVAGSGYWKATGTDKIISTEGQRVGIKKALVFY SKALFGEKEWYFFSPRDRKYPNGSRPNRVAGSGYWKATGTDKVISTEGRRVGIKKALVFY NAC072 CpNAC4 NAC019 NAC055 121 121 121 121 AGKAPKGTKTNWIMHEYRLIEHSRSHGSSKLDDWVLCRIYKKTSGSQRQAVTPVQACREE VGKAPKGTKTNWIMHEYRLIESSRKNGSSKLDDWVLCRIYKKNASSQKPMLSNISS--KE IGKAPKGTKTNWIMHEYRLIEPSRRNGSTKLDDWVLCRIYKKQSSAQKQVYDNGIANARE IGKAPKGTKTNWIMHEYRLIEPSRRNGSTKLDDWVLCRIYKKQTSAQKQAYNNLMTSGRE NAC072 CpNAC4 NAC019 NAC055 181 179 181 181 HSTNG--SSSSSSSQLDDVLDSFP-EIKDQSFNLPR------MNSLRTILN--------YSNNG--SSSSSSSHLDDVLESLP-AIDDRFFSIPR------INSLRTLQQDDIKTGVIP FSNNGTSSTTSSSSHFEDVLDSFHQEIDNRNFQFSN--PNRIS-SLRPDLT-EQKTGFHG YSNNG-SSTSSSSHQYDDVLESLH-EIDNRSLGFAAGSSNALPHSHRPVLT-NHKTGFQG NAC072 CpNAC4 NAC019 NAC055 223 230 237 238 ----GNFDWASLAG----LNPIPELAPTNG-----LPSYGGYDAFR-------------NLGTGNFDWASLAG----LNSVSSVVPSDHTQSQCIPSYTDTDVFVPSLPPISHVNKLCN LADTSNFDWASFAGNVEHNNSVPELGMSHV-----VPNLEYNCGYL-------------LAREPSFDWANLIG----QNSVPELGLSHN-----VPSIRYGDG---------------- NAC072 CpNAC4 NAC019 NAC055 256 286 278 273 AAEGEAESGHVNR--------QQNSSGLTQSFGYSSS---GFGVSGQT----FEFRQ AVDEEVQSGFRSQRIDNSGFLQPNSNALSQNFTNSVD---PFGFRYPTQPAMFEFRQ KTEEEVESSHGFN----------N-SGELAQKGYGVD---SFGYSG-QVGG-FGFMGTQQQTEGIPRFN----------NNSDVSANQGFSVDPVNGFGYSGQQSSG-FGFI- Figura 3. 1 Análisis comparativo entre las tres secuencias caracterizadas de A. thaliana ANAC019, ANAC055 y ANAC072 con la secuencia ortóloga CpNAC4 de C. papaya (color naranja). La secuencia de papaya CpNAC4, pertenece al grupo V de la familia NAC, de acuerdo con nuestra propuesta de clasificación (ver Capítulo II), dentro del cual se encuentra agrupada dentro de la subfamilia B, llamada "Stress-related family". Dentro de este subgrupo se encuentra una gran variedad de secuencias reportadas específicamente en respuesta a procesos de estrés abiótico, compartiendo el clado con GhNAC4 de algodón, GmNAC3 y GmNAC4 de soya, y ANAC019, ANAC055 y ANAC072 de A. thaliana. Dichas secuencias han demostrado experimentalmente ser inducidas por aplicación exógena de ABA, responder ante la sequía, las bajas temperaturas y el estrés salino, permitiendo la tolerancia a dichos factores mediante su sobreexpresión en plantas modelo. CpNAC4 posee un marco de lectura abierto de 1020 pb codificando 339 aminoácidos y comparte un 73.6% de identidad y un 83.4% de similitud con GhNAC4 de algodón (Gossypium hirsutum). Aunado a esto, la secuencia CpNAC4 comparte las características conocidas del dominio NAC, incluyendo los cinco motivos (A-E) en la región N-terminal y los tres motivos característicos de la subfamilia "Stress NAC" en la región C- terminal o de activación transcripcional de acuerdo con la clasifcación de Ooka et al. (2003). 84 Capítulo III La secuencia CpNAC5 de papaya, es ortóloga a la secuencia ANAC002/ATAF1 de A.thaliana, la cual posee una secuencia paráloga (ANAC032). ANAC002 se encuentra dentro de la familia B "Stress-related family" del grupo V al igual que CpNAC4. Dentro de este subclado se encuentra un gran número de genes reportados para diferentes especies vegetales en respuesta a estrés abiótico, tales como las secuencias de tomate SlNAC1 y SlNAM1; GmNAC20 y GmNAC11 de soya, y OsNAC5, OsNAC6, SNAC2 y OsNAC10 de arroz. Por otro lado, dos de las secuencias NAC seleccionadas de papaya, pertenecientes a diferentes grupos filogenéticos, participan en procesos de muerte celular programada (MCP). La secuencia CpNAC1 de papaya es ortóloga a ANAC029 (AtNAP), secuencia reportada en respuesta a procesos de senescencia, la cual posee dos secuencias parálogas: ANAC063 y ANAC093. Estas secuencias pertenecen a la familia C “NARS” del grupo V de acuerdo con nuestra clasificación. Por otro parte, la secuencia CpNAC12 perteneciente a la familia C “ORE” del grupo II, está altamente relacionada con la secuencia ANAC092 de A. thaliana la cual se encuentra implicada en procesos de MCP durante el estrés abiótico inducido .por salinidad. Por último, la secuencia CpNAC39 de papaya se ubica dentro del grupo III de acuerdo a nuestra propuesta de clasificación, y se agrupa dentro de la subfamilia A “NTL family” nombrada de esta manera debido a que todas las 14 secuencias NTL de A. thaliana (NTL1-NTL14) se encuentran dentro de este subclado. Esta proteína carece del subdominio E dentro del dominio NAC.y presenta un dominio transmembrana (TMM) en su región C-terminal. CpNAC39 es la secuencia ortóloga a ANAC040 (NTL8), la cual presenta tres proteínas parálogas: ANAC049, ANAC060 (NTL5) y ANAC089 (NTL14). Por otra parte, el número de intrones, la posición y el tamaño de los mismos para cada uno de los cinco genes seleccionados de C. papaya se muestra en el anexo 1. 85 Capítulo III 3.3.2 MODELOS ESTRUCTURALES DE LAS PROTEÍNAS NAC SELECCIONADAS Se realizó una comparación de modelos estructurales mediante el programa Phyre2 de los cinco genes seleccionados para C. papaya y los cinco genes ortólogos de A. thaliana (Figura 3.2 y 3.3). A) B) C) D) Proteínas NAC de C. papaya E) G) F) H) Proteínas NAC de A. thaliana Figura 3. 2 Comparación de las estructuras secundarias de las proteínas de A. thaliana con respecto a sus secuencias ortólogas en C. papaya. A y E corresponden a la proteína CpNAC5 y ANAC002 respectivamente; B y F, proteínas CpNAC1 y ANAC029; C y G, proteínas CpNAC39 y ANAC040; D y H, proteínas CpNAC12 y ANAC092 respectivamente. A) B) C) D) E) Figura 3. 3 Comparación de modelos tridimensionales de las proteínas NAC seleccionadas A) Ensamble biológico del dominio NAC de la proteína ANAC019 (Crystal form IV, PDB), B) ANAC019, C) ANAC055, D) ANAC072 y E) proteína CpNAC4 de papaya ortóloga a ANAC072. 86 Capítulo III 3.3.3 ANÁLISIS DE PROMOTORES DE GENES NAC En las cinco distintas secuencias promotoras de los genes analizadas, encontramos una gran cantidad de elementos en cis en respuesta a estrés biótico y abiótico. Entre los principales y más conocidos elementos se encuentran los ABRE, MYC, MYB, DRE/CRT-CBF, ERD1, W-BOX, ERE, EIRE, PRE, ASF-1, entre otros más (Figura 3.4). Los promotores de CpNAC4 y CpNAC5 incluyen en gran número de sitios ABRE (ABA responsive element) y ERD1 (early responsive to dehydration), involucrados en distintos tipos de estrés osmótico. Aunado a esto, presentan un gran número de sitios de unión de los FT's WRKY nombrados W-BOX, los cuales se encuentran relacionados en la activación de genes en respuesta a estrés biótico. Por otro lado, los elementos en cis DRE actúan en la respuesta inicial a la deshidratación, estrés salino o estrés por bajas temperaturas mediante un mecanismo independiente de la señalización por ABA (Yamaguchi-Shinozaki y Shinozaki, 1994). Con la excepción de CpNAC5, encontramos el elemento TAAAG, el cuál fue reportado para el gen KST1 de Solanum tuberosum que codifica para canales de K+ en células guarda. CpNAC39 y CpNAC5 poseen un sitio PRE (Pro- or hypoosmolarity-responsive element) encontrado en el promotor del gen que codifica para Prolina Deshidrogenasa (ProDH) de Arabidopsis, reportando que un miembro de la familia bZIP funciona como activador transcripcional para este gen (Satoh et al., 2004). CpNAC39 es el único miembro que reporta sitios LTRE (low temperature responsive element), secuencia encontrada en la región promotora del gen COR15a de Arabidopsis. CpNAC39 y CpNAC1 presentan el elemento CGCG-BOX, el cual se reporta como secuencia reguladora en la señalización por calcio. 87 Capítulo III Figura 3. 4 Resumen de los diversos elementos en cis presentes en la región promotora de los genes NAC seleccionados. Los nombres de los diferentes elementos en cis se señalan dentro de cajas en color verde, y el sitio dentro del promotor se señala con figuras para cada uno de los elementos encontrados. (Análisis realizado 1.5 Kb río arriba a partir del ATG de la secuencia codificante) 88 Capítulo III 3.4 DISCUSIÓN Aunque varios miembros de la familia NAC han sido caracterizados en Arabidopsis y en arroz, la caracterización de genes NAC en especies tropicales sigue siendo aún escasa. Con el objetivo de identificar nuevos genes involucrados en respuesta a estrés abiótico en papaya, se construyó un modelo HMM, con el cual llevamos a cabo un análisis exhaustivo en 24 genomas. Dicho análisis dio como resultado la identificación de 77 miembros de la familia NAC en papaya. Este estudio resulta de gran importancia debido a que las distintas bases de datos de FT no reportan secuencias “curadas” (curación de secuencias = proceso mediante el cual se verifican la veracidad de los datos mediante corroboración manual y mediante criterios establecidos para la inclusión de cada secuencia), tal es el caso de la base de datos Plant Transcription Factor Database (PTFDB versión 2.0, http://planttfdb.cbi.edu.cn/index.php?sp=Cpa), la cual reporta 82 miembros para la familia NAC en papaya, de los cuales solamente el 56.4% presenta los cinco subdominios, aunado a que un gran número de secuencias se encuentran truncadas, o no presentan la región activación transcripcional TAR. Dentro estas secuencias, se encontró que algunas de ellas no presentan la conservación esperada en el dominio NAC, de modo que algunas bases de datos de dominios proteicos, como es el caso de la base Prosite (http://prosite.expasy.org/), no reconocen motivo alguno dentro de las secuencias. Debido a esto la base de datos PTFDB en su versión 3.0 reporta un número menor de miembros probables para esta familia en papaya (70 secuencias), aunque otras bases de datos como TreeTFDB (versión 1.0 http://treetfdb.bmep.riken.jp/index.pl) reporta 80 secuencias NAC para esta especie. Una gran variedad de secuencias NAC han sido implicadas en diversos roles en respuesta a estrés abiótico, defensa contra diversos patógenos, y en la regulación de los programas de desarrollo (Yang et al., 2011; De Oliveira et al., 2011). He et al. (2005) reportaron un miembro de la familia NAM involucrado en el desarrollo de raíces laterales y en respuesta a estrés salino. Balazadeh et al., (2010) demostró que el gen ANAC092 está involucrado en la senescencia inducida por estrés salino, sugiriendo que junto con otras proteínas NAC poseen un rol en la regulación de la expresión de genes asociados a la senescencia. 89 Capítulo III Kim et al., (2008) demostraron la participación del gen ANAC040 (NTL8) en el control del tiempo de floración y de germinación durante estrés salino, mientra que el gen NTL9 de Arabidopsis desempeña un papel fundamental en la respuesta a estrés osmótico y durante la senescencia (Yoon et al., 2008). La mayoría de los genes en respuesta a sequía o estrés osmótico responden a través de la señalización en respuesta a ABA. Los FT's WRKY, MYC y MYB se encuentran estrechamente relacionados en dicha señalización mediada por ABA. La sequía y la salinidad alteran el nivel y la acumulación de este metabolito, el cuál desempeña un papel importante en la adaptación de las plantas al estrés abiótico. Muchos de los genes responsivos a ABA contienen el elemento en cis ABRE dentro de su secuencia promotora. Se encontró un gran número de elementos en cis en respuesta a estrés abiótico y biótico (1,500 pb río arriba) en los cinco genes seleccionados (CpNAC1, CpNAC4, CpANC5, CpNAC12 y CpNAC39). Numerosos sitios ABRE fueron encontrados en las secuencias promotoras de los genes analizados de papaya. CpNAC4 presentó13 elementos ABRE, nueve sitios ERD1, ocho elementos MYB, seis elementos W-box, un elemento DRE y un elemento ERE. Fujita et al., (2004) reportaron para el gen ANAC072, el cual es ortólogo de CpNAC4, cuatro sitios ABRE, un sitio MYC, dos sitios MYB, y un sitio DRE. De igual manera Yang et al., (2011) reportó numerosos sitios ABRE en la región promotora de SlNAC3, así como seis sitios de reconocimiento para los FT's MYB. CpNAC5 presentó ocho sitios ABRE, cinco sitios ERD1, cuatro sitios MYC, cinco sitios W-Box, dos sitios DRE y un sitio PRE. Muchos genes inducidos por la sequía y la salinidad, como RD29A, contienen sitios ABRE y DRE/CRT en sus regiones promotoras lo que significa que son activados por estrés abiótico (Kant et al., 2007). La aportación de estos análisis es valiosa, ya que permiten la inferencia de la posible participación de estos genes en respuesta a distintos tipos de estrés, siendo candidatos idóneos para la subsecuente caracterización de su expresión transcripcional ante diversos tipos de estrés. De todos estos análisis, podemos deducir que los cinco genes CpNAC seleccionados son candidatos indóneos para su posterior análisis en la corroboración de su participación frente a distintos tipos de estrés abiótico, y podemos inferir que las respuestas de cada gen, ante múltiples estreses se encuentran estrictamente reguladas mediante las secuencias en cis encontradas en 90 Capítulo III cada uno de sus promoteres. Por otro lado, la evidencia obtenida sugiere un Crosstalk en las respuestas de estrés biótico y abiótico en Arabidopsis. Se ha reportado la existencia al menos de 131 genes NAC en Arabidopsis, mientras que en arroz (var. japónica) han sido identificadas 106 secuencias. Con la disponibilidad del genoma de papaya, se ha podido realizar un sin número de aproximaciones funcionales de diversos genes, mediante comparación in silico con secuencias previamente reportadas. Estas herramientas de última generación, como lo es el análisis masivo de datos, han permitido dar grandes pasos en la comprensión de la regulación de los genes, así como de la organización de los genomas. En este trabajo se reporta la caracterización de una familia de factores de transcripción en una planta frutal tropical como lo es papaya. Hasta la fecha, no se cuenta con reportes sobre la caracterización de genes NAC para papaya, ya que son funcionalmente desconocidos en plantas tropicales. 91 Capítulo III 3.5 REFERENCIAS Abrouk M., F. Murat, C. Pont, J. Messing, S. Jackson (2010), Palaeogenomics of plants: synteny-based modelling of extinct ancestors, Trends in Plant Science 15: 479-487. Aida M., T. Ishida, H. Fukaki, H. Fujisawa y M. Tasaka (1997), Genes involved in organ separation in Arabidopsis: an analysis of the cup-shaped cotyledon mutant, Plant Cell 9(6): 841-57. Arabidopsis transcription factor database (AtTFDB), [http://arabidopsis. med.ohiostate.edu/AtTFDB/]. Accesado 21-06-11. Balazadeh, S., H. Siddiqui, A.D. Allu, L.P. Matallana-Ramirez, C. Caldana, M. Mehrnia, M.I. Zanor, B. Kohler y B. Mueller-Roeber (2010), A gene regulatory network controlled by the NAC transcription factor ANAC092/AtNAC2/ORE1 during saltpromoted senescence, Plant Journal 62:250-264. Balazadeh S, N. Kwasniewski, C. Caldana, M. Mehrnia, M.I. Zanor, G.P. Xue (2011). ORS1, an H2O2-Responsive NAC Transcription Factor, Controls Senescence in Arabidopsis thaliana, Molecular Plant. 4(2):346-360. De Oliveira T.M., L.C. Cidade, A.S. Gesteira, M.A. Coelho-Filho, W.S. Soares-Filho y M.G.C. Costa (2011), Analysis of the NAC transcription factor gene family in citrus reveals a novel member involved in multiple abiotic stresss responses, Tree Genetics & Genomes 7(6):1123-1134 Fujita M., Y. Fujita, K. Maruyama, M. Seki1, K. Hiratsu, M. Ohme-Takagi, L.S. Phan Tran, K. Yamaguchi-Shinozaki y K. Shinozaki (2004), A dehydration-induced NAC protein, RD26, is involved in a novel ABA-dependent stress-signaling pathway, Plant Journal 39: 863-876. Guo Y. y S. Gan (2006), AtNAP, a NAC family transcription factor, has an important role in leaf senescence, Plant Journal 46: 601-612 92 Capítulo III Han, Q., J. Zhang, H. Li, Z. Luo, K. Ziaf, B. Ouyang, T. Wang y Z. Ye (2011) Identification and expression pattern of one stress-responsive NAC gene from Solanum lycopersicum, Molecular Biology Reports 39(2):1713-1720 He, X.J., R.L. Mu, W.H. Cao, Z.G. Zhang, J.S. Zhang y S.Y. Chen (2005), AtNAC2, a transcription factor downstream of ethylene and auxin signaling pathways, is involved in salt stress response and lateral root development, Plant Journal 44: 903-916. Higo, K., Y. Ugawa, M. Iwamoto y T. Korenaga (1999), Plant cis-acting regulatory DNA elements (PLACE) database, Nucleic Acids Research 27: 297-300. Jensen, M.K., T. Kjaersgaard, M.M. Nielsen, P. Galberg, K. Petersen, C. O’Shea, y K. Skriver (2010), The Arabidopsis thaliana NAC transcription factor family: structure-function relationships and determinants of ANAC019 stress signaling, Biochemic Journal 426(2): 183-196 Jeong S.J., Y.S. Kim, K.H. Baek, H. Jung, S.H. Ha, Y.D. Choi, M. Kim, C. Reuzeau y J.K. Kim (2010), Root-Specific Expression of OsNAC10 Improves Drought Tolerance and Grain Yield in Rice under Field Drought Conditions, Plant Physiology 153: 185-197. Jiang Y. y M.K. Deyholos (2006), Comprehensive transcriptional profiling of NaClstressed Arabidopsis roots reveals novel classes of responsive genes, BMC Plant Biology 6:25 Kant P., S. Kant, M. Gordon, R. Shaked y S. Barak (2007), Stress responsive suppressor1 and stress responsive suppressor2, two DEAD-box RNA helicases that attenuate Arabidopsis responses to multiple abiotic stresses, Plant Physiology 145: 814-830. Kim, Y.S., S.G. Kim, J.E. Park, H.Y. Park, M.H. Lim, N.H. Chua y C.M. Park (2006), A membrane-bound NAC transcription factor regulates cell division in Arabidopsis, Plant Cell 18: 3132-3144 93 Capítulo III Kim, S.G., A.K. Lee, H.K. Yoon y C.M. Park (2008), A membrane-bound NAC transcription factor NTL8 regulates gibberellic acid-mediated salt signaling in Arabidopsis seed germination, Plant Journal 55: 77-88. Kjaersgaard, T., M.K. Jensen, M.W. Christiansen, P. Gregersen, B.B. Kragelund y K. Skriver (2011), Senescence associated Barley NAC transcription factor interacts with Radical-Induced Cell Death1 through disordered regulatory domain, Journal of Biological Chemistry 286(41): 35418-35429. Ko, J.H., S.H. Yang, A.H. Park, O. Lerouxel, y K.H. Han (2007), ANAC012, a member of the plant-specific NAC transcription factor family, negatively regulates xylary fiber development in Arabidopsis thaliana, Plant Journal 50(6): 1035-1048. Kubo, M., M. Udagawa, N. Nishikubo, G. Horiguchi, M. Yamaguchi, J. Ito, T. Mimura, H. Fukuda, y T. Demura (2005), Transcription switches for protoxylem and metaxylem vessel formation, Genes & Development 19(16): 1855-1860. Lawrence A.K y M.J.E Sternberg (2009), Structural Bioinformatics Group, Division of Molecular Biosciences, Department of Life Sciences, Imperial College London, South Kensington Campus, London SW72AZ, UK. Correspondence should be addressed to L.A.K (l.a.kelley@imperial.ac.uk). Li, P., J.J. Wind, X. Shi, H. Zhang, J. Hanson, S.C. Smeekens y S. Teng (2011), Fructose sensitivity is suppressed in Arabidopsis by the transcription factor ANAC089 lacking the membrane-bound domain, Proceedings of the National Academy of Sciences108(8): 3436-3441 Liu, Q.L., K.D. Xu, L.J. Zhao, Y.Z. Pan, B.B. Jiang, H.Q. Zhang y G.L. Liu (2011), Overexpression of a novel chrysanthemum NAC transcription factor gene enhances salt tolerance in tobacco, Biotechnology Letters 33: 2073-2082. Lu P.L, N.Z. Chen, R. An, Z. Su, B.S. Qi, F. Ren, J. Chen y X.C. Wang (2007), A novel drought-inducible gene, ATAF1, encodes a NAC family protein that negatively regulates the expression of stress-responsive genes in Arabidopsis, Plant Molecular Biology 63: 289-305. 94 Capítulo III Mao X., H. Zhang, X. Qian, A. Li, G. Zhao y R. Jing (2012), TaNAC2, a NAC-type wheat transcription factor conferring enhanced multiple abiotic stress tolerances in Arabidopsis, Journal of Experimental Botany doi:10.1093/jxb/err462 Mitsuda, N., M. Seki, K. Shinozaki y M. Ohme-Takagi (2005), The NAC transcription factors NST1 and NST2 of Arabidopsis regulate secondary wall thickenings and are required for anther dehiscence, Plant Cell 17: 2993-3006 Morishita, T., Y. Kojima , T. Maruta, A. Nishizawa-Yokoi, Y. Yabuta, y S. Shigeoka (2009), Arabidopsis NAC Transcription Factor, ANAC078, Regulates flavonoid Biosynthesis under High-light, Plant Cell Physiology 50(12): 2210–2222. Nakashima K., H. Takasaki, J. Mizoi, K. Shinozaki, K. Yamaguchi-Shinozaki (2012), NAC transcription factors in plant abiotic stress responses, Biochimica et Biophysica Acta 1819: 97-103. Ogo Y., T. Kobayashi, R. N. Itai, H. Nakanishi, Y. Kakei, M. Takahashi, S. Toki, S. Mori y N.K. Nishizawa (2010), A Novel NAC Transcription Factor, IDEF2, That Recognizes the Iron Deficiency-responsive Element 2 Regulates the Genes Involved in Iron Homeostasis in Plants, The Journal of Biological Chemistry 283(19): 13407-13417. Ooka, H., K. Satoh, K. Doi, T. Nagata, Y. Otomo, K. Murakami, K. Matsubara, N. Osato, J. Kawai, P. Carninci, Y. Hayashizaki, K. Suzuki, K. Kojima, Y. Takahara, K. Yamamoto, y S. Kikuchi (2003), Comprehensive analysis of NAC family genes in Oryza sativa and Arabidopsis thaliana, DNA Research 10(6): 239-247. Palaniswamy, S.K., S. James, H. Sun, R.S. Lamb, R.V. Davuluri y E. Grotewold (2006), AGRIS and AtRegNet. a platform to link cis-regulatory elements and transcription factors into regulatory networks, Plant Physiology 140: 818-829. 95 Capítulo III Pettersen E.F., T.D. Goddard, C.C. Huang, G.S. Couch, D.M. Greenblatt, E.C. Meng y T.E. Ferrin (2004), UCSF Chimera: a visualization system for exploratory research and analysis, Journal of Computational Chemistry 25: 1605-1612 Satoh R., Y. Fujita, K. Nakashima, K. Shinozaki y K.Yamaguchi-Shinozaki (2002), A novel subgroup of bZIP proteins function as transcriptional activators in Hypoosmolarity-Responive Expression of the proDH gene in Arabidopsis, Plant Cell Physiology 45(3): 309-317. Seo, P.J., M.J. Kim, J.S. Song, Y.S. Kim, H.J. Kim y C.M. Park (2010), Proteolytic processing of an Arabidopsis membrane-bound NAC transcription factor is triggered by cold-induced changes in membrane fluidity, Biochemical Journal 427: 359-367 Souer, E., A. van Houwelingen, D. Kloos, J. Mol y R. Koes (1996), The No Apical Meristem gene is required for pattern formation in embryos and flowers and is expressed at meristem and primordial boundaries, Cell 85: 159-170. Tran, L.S., K. Nakashima, Y. Sakuma, S.D. Simpson, Y. Fujita, K. Maruyama, M. Fujita, M. Seki, K. Shinozaki, y K. Yamaguchi-Shinozaki (2004), Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promoter, Plant Cell 16: 2481-2498. Tran L.S., T.N. Quach, S.K. Guttikonda, D.L. Aldrich, R. Kumar, A. Neelakandan, B. Valliyodan y H.T. Nguyen (2009), Molecular characterization of stress-inducible GmNAC genes in soybean, Molecular Genetics & Genomics 281: 647-664. Xie, Q., G. Frugis, D. Colgan, y N.H. Chua (2000), Arabidopsis NAC1 transduces auxin signal downstream of TIR1 to promote lateral root development, Genes & Development 4(23): 3024-3036 Yamaguchi-Shinozaki, K., y K. Shinozaki (1994), A Nove1 cis-Acting Element in an Arabidopsis Gene is involved in responsiveness to drought, low temperature, or high-salt stress, Plant Cell 6: 251-264. 96 Capítulo III Yamaguchi, M., M. Ohtani, N. Mitsuda, M. Kubo, M. Ohme-Takagi, H. Fukuda y T. Demura (2010), VND-INTERACTING2, a NAC Domain Transcription Factor, Negatively Regulates Xylem Vessel Formation in Arabidopsis, Plant Cell 22: 1249-1263 Yang R., C. Deng, B. Ouyang y Z. Ye (2011), Molecular analysis of two salt-responsive NAC-family genes and their expression analysis in tomato, Molecular Biology Reports 38: 857-863. Yoon, H.K., S.G. Kim, S.Y. Kim y C.M. Park (2008), Regulation of leaf senescence by NTL9 -mediated osmotic stress signaling in Arabidopsis, Molecular Cell 25: 438-445. Wang Y., X. Wang, H. Tang, X. Tan, S.P. Ficklin (2011), Modes of gene duplication contribute differently to genetic novelty and redundancy, but show parallels across divergent angiosperms, PLoS ONE 6(12): 1-17. Wu A, D.A. Allu, P. Garapati, H. Siddiqui, H. Dortay, M.I. Zanor (2012). JUNGBRUNNEN1, a Reactive Oxygen Species–Responsive NAC Transcription Factor, Regulates Longevity in Arabidopsis, Plant Cell 24(2):482-506. Zhao, C., J.C. Craig, H.E. Petzold, A.W. Dickerman, y E.P. Beers (2005), The xylem and phloem transcriptomes from secondary tissues of the Arabidopsis roothypocotyl, Plant Physiology 138: 803-818 Zhong R., C. Lee, y Z.H. Ye (2010), Functional Characterization of Poplar WoodAssociated NAC Domain Transcription Factors, Plant Physiology 152:10441055. Zheng X., B. Chen, G. Lu y B. Han (2009), Overexpression of a NAC transcription factor enhances rice drought and salt tolerance, Biochemical and Biophysical Research Communications 379: 985-989. 97 Capítulo IV CAPÍTULO IV EXPRESIÓN TRANSCRIPCIONAL DE GENES NAC DE C. papaya ANTE DIFERENTES CONDICIONES DE ESTRÉS ABIÓTICO 4.1 INTRODUCCIÓN Las plantas son organismos sésiles que se encuentran constantemente expuestas a cambios ambientales y en ocasiones se ven amenazadas por los distintos factores ambientales que se presentan en el entorno, estos estímulos guían a una regulación fisiológica y por lo general a un cambio en el programa de desarrollo. Debido a esto, las plantas necesitan percibir y procesar los estímulos ambientales tales como la luz, la temperatura, el estado del agua y la disponibilidad de nutrientes con el fin de crecer y desarrollarse debidamente, pero en condiciones ambientales adversas varias señales restringen el crecimiento y el desarrollo de las plantas (Das y Pandey, 2010; Lefebvre et al., 2009). Existen dos clases principales de estrés en plantas, el biótico y el abiótico, los cuales pueden dificultar y amenazar la supervivencia de dichos organismos. El estrés abiótico es el resultado del impacto negativo de un factor ambiental, factor inerte, sobre un organismo viviente. Las respuestas que las plantas producen ante las condiciones específicas de estrés, se encuentran reguladas mediante la activacíon de genes específicos, que desencadenan mecanismos moleculares de señalización, que tienen como objetivo proteger al organismo y resarcir el daño ocasionado. Por ejemplo, en el caso de la sequía, los daños en las plantas pueden ser reducidos considerablemente mediante la acumulación de osmolitos compatibles, tales como la prolina, el cual disminuye el potencial osmótico en el citosol facilitando la captación de agua, protegiendo a las proteínas de la desnaturalización y a la célula de los efectos tóxicos de las especies reactivas de oxígeno (ROS; Das y Pandey, 2010). Como resultado de las diversas condiciones ambientales estresantes, el desarrollo y el crecimiento de las plantas se ve seriamente afectado ocasionando bajos rendimientos y por lo tanto ocasionando grandes pérdidas en la industria agrícola, esto aunado a los efectos secundarios adversos en la sociedad, como resultado de una baja o nula producción agroalimentaria (CGIAR et al., 2012). Las respuestas ante el estrés varían dependiendo del tipo y de la intensidad de éste, aunque en algunas ocasiones diferentes estreses poseen mecanismos moleculares 99 Capítulo IV encontrados (cross-talks), es decir, comparten elementos dentro una ruta de señalización determinada. Como ejemplo, podemos mencionar algunos mensajeros secundarios como el (Ca2+), las hormonas y las ROS (Lefebvre et al., 2009). Aunado a esto, las plantas no solo tienen que hacer frente a un tipo de estrés determinado, sino que deben lidiar con frecuencia con la combinación de ellos incluido el estrés biótico. Como ejemplo de las condiciones ambientales adversas, tenemos el efecto de la temperatura, la cual varía ampliamente desde el congelamiento hasta temperaturas por encima de los 45°C. No se conoce mucho acerca del mecanismo molecular que conlleva a la tolerancia natural ante este tipo de estrés. Las bajas temperaturas y el congelamiento son un factor limitante para la distribución de las especies vegetales, dicho estrés promueve un cambio en la expresión de genes, en la composición de la membrana lipídica, en la acumulación de osmolitos compatibles, en el aumento transitorio de la concentración endógena de ABA y la disminución del crecimiento. Las bajas temperaturas también conllevan a un estrés por deshidratación, mediante la reducción de la capacidad de absorción de agua por la raíz y el subsecuente transporte a través del xilema (Smallwood y Bowles, 2002). Por otra parte, la sequía y la salinidad de los suelos, se encuentran entre los principales factores ambientales que limitan la productividad y el potencial de crecimiento de las plantas. Las plantas se han adaptado a los diferentes retos que impone el medio ambiente mediante respuestas dinámicas que involucran ajustes a nivel fisiológico, bioquímico y molecular, permitiendo de este modo sobrevivir bajo estas variables ambientales (Nakashima et al., 2012). Las restricciones ambientales inducen la producción de la hormona ácido abscísico (ABA). Esta molécula desempeña un papel fundamental en la respuesta primaria al estrés en plantas, mediando la regulación del cierre estomático y guiando la activación de una gran número de genes, a través de los elementos regulatorios en cis encontrados en sus cajas promotoras, permitiendo de este modo la tolerancia ante distintos tipos de estrés (Nakashima et al., 2009). Muchos genes responsivos al estrés han sido identificados en modelos vegetales como arroz y Arabidopsis, mediante técnicas tales como análisis de microarreglos. Estos genes inducidos por el estrés pueden desencadenar la síntesis de proteínas funcionales y/o metabólicas. Entre las proteínas funcionales se encuentran las proteínas hidrofílicas, incluidas las LEA (late embryogenesis abundant) y las dehidrinas, y las enzimas que son requeridas para la síntesis de osmoprotectores tales como la prolina y azúcares (Yamaguchi y Shinozaki, 100 Capítulo IV 2006). Entre las proteínas regulatorias que son activadas en respuesta a estrés se incluyen los factores de transcripción (FT's) tales como DREBs (dehydrationresponsive element-binding proteins), AREB (ABA-responsive element-binding proteins), NAC (NAM-ATAF1/2-CUC2), WRKY, entre otras. Estas proteínas regulan la respuesta ante el estrés abiótico y se cree que desempeñan un papel primordial en la tolerancia a estos factores ambientales adversos en plantas (Morishita, et al., 2009). Las proteínas NAC has demostrado estar involucradas en una amplia gama de procesos de desarrollo vegetal así como participar en la regulación a distintos tipos de estrés abiótico. Hu et al., (2006) reportaron que la sobreexpresión del gen responsivo al estrés SNAC1 aumentó la tolerancia a la sequía y a la salinidad en plantas de arroz sin afectar los rendimientos. Nogueira et al., (2005) reportan que el gen SsNAC23, el cual es homólogo a OsNAC5 de arroz, está asociado con las bajas temperaturas, la herbivoría y el estrés hídrico en caña de azúcar. Por otro lado Jeong et al., (2010) reportaron que la sobreexpresión de OsNAC10 mejora la tolerancia en arroz a estrés abiótico en condiciones de campo, y mediante un análisis de microarreglos, demostraron que este gen es inducido por ABA, sequía y alta salinidad. En el 2004 Tran et al., identificaron tres genes pertenecientes a la familia NAC de Arabidopsis, ANAC019, ANAC055 y ANAC072, los cuales eran inducidos por ABA, sequía y alta salinidad. Hasta la fecha, la expresión y la función de los genes NAC en C. papaya no ha sido reportada. En este capítulo se evaluó la expresión transcripcional de cinco genes NAC de C. papaya cv. Maradol ante cuatro tratamientos de estrés abiótico; temperatura alta (40ºC), bajas temperaturas (4ºC), salinidad y sequía. Estos cinco genes demostraron ser homólogos a genes de Arabidopsis involucrados en distintos procesos de estrés abiótico. Este trabajo es una primera aproximación al estudio de los FT's NAC de papaya involucrados en diversos tipos de estrés abiótico, y es una exploración de los mecanismos moleculares que se desencadenan en respuesta al estrés abiótico en plantas tropicales 101 Capítulo IV 4.2 MATERIALES Y MÉTODOS 4.2.1 TRATAMIENTOS DE ESTRÉS ABIÓTICO PARA C. papaya Para los experimentos de estrés en papaya (temperaturas extremas de 4°C y 40°C, sequía y salinidad), semillas de esta planta cv. Maradol (Semillas del Caribe, Especialistas en papayas, S.A. de C.V.) fueron germinadas siguiendo las indicaciones del proveedor, las cuales fueron crecidas en un cuarto de cultivo a 27±2°C en un régimen de 16:8 h luz/oscuridad y una densidad de flujo de fotones de 120 μmol m−2 s−1. Para los experimentos de estrés por temperaturas (4ºC y 40ºC) plantas de cuatro semanas fueron sometidas a diferentes tiempos de exposición de estrés (0, 2, 4, 8 y 24 horas) en una cámara de incubación de temperatura controlada. Para el tratamiento de sequía, plantas de cuatro semanas fueron colocadas en cultivo hidropónico con medio Hoagland-E (fuerza iónica completa) durante tres semanas para su aclimatación, en las condiciones de temperatura y luz previamente mencionadas. Para la imposición del estrés por sequía, las plantas de papaya fueron retiradas del cultivo hidropónico, las raíces fueron secadas sutilmente con papel absorbente para evitar daños en estas, y posteriormente las plantas se dejaron deshidratar sobre un papel filtro Whatman 3MM a temperatura ambiente con una humedad relativa de 60% a diferentes tiempos (0, 2, 4, 8 y 24 horas). Este tratamiento se llevó a cabo de acuerdo con Yamaguchi-Shinozaki y Shinozaki (1994). Para los tratamientos de estrés salino, plántulas de cuatro semanas fueron colocadas en un cultivo hidropónico con solución nutritiva Hoagland-E, durante tres semanas, en las mismas condiciones de temperatura y luz. Subsecuentemente las plántulas fueron colocadas en tratamiento de estrés salino en una solución de Hoagland con 300mM de NaCl, en diferentes períodos (0, 0.5, 1, 2, 4, 8 y 24 hrs). Las muestras fueron inmediatamente congeladas en nitrógeno líquido hasta su posterior análisis. El grupo control permaneció en solución nutritiva Hoagland-E en los mismos períodos. Para dichos análisis se hicieron cuatro replicas experimentales, teniendo un total de cinco plantas para cada uno de los tratamientos. Una vez finalizado el tratamiento correspondiente, se procedió a realizar la extracción del ARN de la hoja y de la raíz de cada lote de plantas. 102 Capítulo IV 4.2.2 EXTRACCIÓN DE ARN Y SÍNTESIS DE ADNc El ARN de cada lote de plantas fue extraído de acuerdo a la metodología de TRIzol® (Cat. 15596-026, Invitrogen) siguiendo las instrucciones del proveedor, usando 200 mg de tejido de hoja y raíz por separado de cada uno de los diferentes tratamientos y posteriormente digerido con DNasa (Promega). El ARN de cada muestra fue cuantificado con mediante un equipo NanoDrop 1000 v.3.7 (Thermo-Scientific) y la integridad del material fue corroborada en un gel de agarosa al 1.5% (w/v). Para la síntesis de ADNc se utilizó la tecnología SMART™ (Cat. 635000, Clontech) siguiendo las instrucciones del proveedor y utilizando 1µg de ARN para la síntesis de la primera cadena. 4.2.3 CLONACIÓN DE LOS GENES CpNAC SELECCIONADOS Cinco genes NAC con alta probabilidad de estar relacionados con algún tipo de estrés abiótico fueron clonados en los vectores TOPO-TA® (Invitrogen, Cat.#K4500-01) y pGem®-T easy (Promega, Cat #A1360). La clonación positiva fue evaluada mediante ensayos de plaqueo "Blue/White Colony". Las secuencias resultantes fueron sometidas al NCBI/GenBank. 4.2.4 DETERMINACIÓN DE LA EXPRESIÓN TRANSCRIPCIONAL Para la determinación de la actividad transcripcional de los cinco genes NAC seleccionados, se realizó un análisis de expresión tejido específico, mediante PCR semicuantitativo, en los diferentes tratamientos de estrés abiótico propuestos. Por otra parte, se muestrearon en paralelo a las condiciones de estrés, plantas de papaya no sometidas a ningún tipo de estrés, las cuales se mantuvieron en condiciones óptimas de crecimiento reportadas en el apartado 4.2.1, y se utilizaron como grupo control para cada punto de los tratamientos. El gen constitutivo de la subunidad ribosomal 18S, se usó como control interno de carga. Las concentraciones de los reactivos de la PCR fueron las siguientes: 5µM de cada uno de los iniciadores, 50 ng de ADNc y 1u de GoTaq® Flexi DNA polimerase (Promega, Cat. #M829). Los iniciadores para los genes específicos (Tabla 4.1) fueron analizados en los programas en linea OligoAnalyzer IDT (v3.1, http://www.idtdna.com/analyzer/) y Oligo Calc (http://www.basic.northwestern.edu/biotools/oligocalc.html) con el fin de descartar la posible formación de horquillas, dimerización y/o heterodimerización. Posteriormente 103 Capítulo IV se realizó la amplificación de los genes seleccionados por PCR para los tejidos de hoja y raíz de C. papaya cv. Maradol. Tabla 4. 1 Iniciadores usados para clonación y análisis de expresión transcripcional de los genes NAC seleccionados de papaya Nombre Phytozome Iniciador Forward (5'-3') Iniciador Reverse (5'-3') C. papaya ID CpNAC5 evm.model.supercontig_64.115 5'-ATG ACG TCA CCT ACA GCC GAT 5'-AAA TGG CTT CTG CAG GTA CAT G CpNAC4 evm.model.supercontig_80.93 5'-ATG GGT GTG CAG CAG ATG G 5' GAC GGA CTT GAG CTT GTA GC CpNAC1 evm.model.supercontig_1.48 5'-ATG GCG CGA AAA TCC AAC TC 5'-TTG AAA AAT ATC ATC GTA CAA TAT CpNAC39 evm.model.supercontig_195.35 5'-ATG TCG CGA GAG ACG CAG AT 5'-CAG AAA GCG AAC ATG GTC GC CpNAC12 evm.model.supercontig_14.101 5'-ATG GAT AAT GTT TCA AAG GAT AAT 5' ATA GTT CCA GAG GCA ATA TAA AT 104 Capítulo IV 4.3 RESULTADOS 4.3.1 EXTRACCIÓN DE ARN Y SÍNTESIS DE ADNc Se extrajo ARN total de las plantas de papaya puestas en tratamientos de 40ºC y 4ºC en diferentes tiempos (Figura 4.1 y 4.2). Se realizaron extracciones tanto para hoja y raíz para cada uno de los tratamientos de temperatura. Figura 4. 1 ARN total de plantas de papaya sometidas a 40°C en diferentes tiempos de exposición (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% Figura 4. 2 ARN total de plantas de papaya sometidas a 4°C en tiempos de exposición (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% 105 Capítulo IV En la figura 4.3 se aprecia un gel de agarosa con las muestras de ARN de los tratamientos de sequía a las 0, 2, 4, 8 y 24 horas. Figura 4. 3 Muestras de ARN total de plantas de papaya sometidas a diferentes tiempos de estrés por sequía (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% Se obtuvo ARN de los tratamientos de salinidad (300mM NaCl) en los diferentes tiempos de exposición ante este estrés (0, 0.5, 1, 2, 4, 8 y 24 horas). En la figura 4.4 se aprecia un gel de agarosa con las muestras de ARN total tanto de hoja como de raíz. Figura 4. 4 Muestras de ARN total de plantas de papaya sometidas a diferentes tiempos de estrés por salinidad (300mM NaCl). Gel de agarosa al 1.5% Se sintetizó el ADN complementario (ADNc) a partir de 1µg de ARN total para cada uno de los tratamientos. Una vez obtenida la segunda cadena se procedió a cargar 2µl de cada reacción de síntesis en un gel de agarosa al 1.5% (w/v). En la figura 4.5 y 4.6 se aprecian el ADNc obtenido para cada uno de los tratamientos de temperatura. 106 Capítulo IV Figura 4. 5 Muestras de ADNc de plantas sometidas a tratamiento de 40ºC en diferentes tiempos (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% Figura 4. 6 Muestras de ADNc de plantas sometidas a tratamiento de 4ºC en diferentes tiempos (0, 2, 4, 8 y 24 horas). Gel de agarosa al 1.5% En la figura 4.7 se observa el ADNc de los tratamientos de sequía, sintetizado a partir de 1µg de ARN total de cada muestra. 107 Capítulo IV Figura 4. 7 Muestras de ADNc de plantas sometidas a tratamiento de sequía en diferentes tiempos. Gel de agarosa 1.5%. En la figura 4.8 se observa el ADNc sintetizado a partir de 1µg de ARN total para cada uno de los tratamientos de salinidad en papaya. Figura 4. 8 Muestras de ADNc de plantas sometidas a tratamiento de salinidad (300mM) en diferentes tiempos. Gel de agarosa 1.5%. 4.3.2 DETERMINACIÓN DE LA EXPRESIÓN TRANSCRIPCIONAL Se realizaron análisis de expresión transcripcional de los cinco genes NAC seleccionados de papaya (CpNAC1, CpNAC4, CpNAC5, CpNAC12 y CpNAC39) en los diferentes tratamientos de temperaturas extremas (4°C y 40°C), sequía, salinidad (300mM NaCl) y sus respectivos controles sin estrés, para los tejidos de hoja (H) y Raíz (R). Por otro lado, se visualizó el patrón trnascriptional los genes HSP70 y DREB2C. Estos dos últimos genes fueron utilizados como controles para los diferentes estreses, ya que se ha reportado que dichos genes son transcripcionalmente responsivos ante distintos tipos de estrés como lo es la sequía, temperaturas extremas y salinidad. En la figura 4.9 se pueden apreciar los distintos patrones de expresión transcripcional de los cinco genes seleccionados ante los tratamientos de estrés por baja temperatura (4ºC) en los distintos períodos muestreados (0, 2, 4, 8 y 24 h). 108 Capítulo IV Figura 4. 9 Patrón de expresión transcripcional en dos diferentes tejidos, hoja y raíz, de los cinco genes NAC seleccionados de C. papaya sometidos a estrés por baja temperatura (4°C). Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga. Del mismo modo, en la figura 4.10, se puede apreciar el patrón de la expresión transcripcional de los cinco genes NAC de papaya, CpNAC1, CpNAC4, CpNAC5, CpNAC12, CpNAC39, ante el tratamiento de estrés por alta temperatura (40°C) en los distintos períodos muestreados (0, 2, 4, 8 y 24 h.), utilizando como control de carga el gen de la subunidad ribosomal 18S. Figura 4. 10 Patrón de expresión transcripcional en dos diferentes tejidos, hoja y raíz, de los cinco genes NAC seleccionados de papaya sometidos a estrés por alta temperatura (40°C). 109 Capítulo IV Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga Para el tratamiento de estrés por sequía se observa en la figura 4.11, para los períodos propuestos (0, 2, 4, 8 y 24 horas) los distintos perfiles de la expresión transcripcional de los genes NAC seleccionados de papaya (CpNAC1, CpNAC4, CpNAC5, CpNAC12 y CpNAC39), Figura 4. 11 Perfil de expresión transcripcional en dos diferentes tejidos, hoja y raíz, para los cinco genes NAC seleccionados de papaya sometidos a estrés por sequía así como para el grupo control. Se utilizaron los genes HSP70 y DREB2C como control positivo ante el estrés por sequía. Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga De igual modo, para el estrés por salinidad (300mM NaCl) se obtuvieron los perfiles de expresión transcripcional para los tejidos de hoja y raíz de los cinco genes NAC de papaya seleccionados y de los dos genes utilizados como control positivo (HSP70 y DREB2C), los cuales se pueden observar en la figura 4.12 mostrada a continuación. 110 Capítulo IV Figura 4. 12 Perfil de expresión transcripcional de los genes NAC seleccionados de papaya para el estrés por salinidad así como para el grupo control. Se utilizaron los genes HSP70 y DREB2C como control positivo ante el estrés. Los nombres de los genes homólogos de Arabidopsis se encuentran a un lado del nombre del gen de papaya. Se utilizó el gen de la subunidad ribosomal 18S como control de carga Como se aprecia en las figuras 4.10 y 4.11, existe una expresión basal en la raíz en el tiempo cero para el gen CpNAC5. La expresión transcripcional de este gen, para el tratamiento en bajas temperaturas, no se aprecia un cambio notorio en la hoja, siendo constante la expresión en la raíz durante los períodos de tratamiento. La expresión relativa del gen CpNAC5 aumentó en el tratamiento por alta temperatura (40ºC) desde las dos h. en la hoja, manteniéndose constante en los tratamientos, y teniendo una mayor expresión que en raíz. Para el tratamiento por sequía (figura 4.11), se aprecia un aumento gradual con respecto al tiempo de exposición del estrés, empezando desde el tiempo cero para hoja y desde las dos horas en la raíz, a diferencia del control, el cual presenta una expresión relativa basal muy tenue. De la misma forma que en la sequía, para el tratamiento de salinidad (Figura 4.12) se aprecia un aumento gradual en la expresión de este gen, conforme al tiempo de exposición del estrés, alcanzando una mayor expresión a las 24 horas en la hoja y a las cuatro horas para la raíz, a diferencia del lote control. Para el gen CpNAC4, en el tratamiento por bajas temperaturas (Figura 4.9), hubo un aumento en la expresión transcripcional en la hoja y en la raíz desde las dos horas. Para el tratamiento por alta temperatura (Figura 4.10) se obtuvo un incremento en la 111 Capítulo IV expresión a partir de las dos horas, el cual aumenta con respecto a los tiempos de tratamientos, y para el caso de la expresión en raíz, esta aumenta a partir de dos horas y se mantiene uniforme en los tiempos de tratamiento posteriores. Para el tratamiento de sequía (Figura 4.11) se observó un incremento gradual en la expresión del gen de un modo más tardío en comparación con el gen CpNAC5, apreciándose el nivel más alto de expresión en hoja a las ocho y 24 horas de tratamiento, esto es similar en raíz pero con una expresíon relativa menor que en hoja. Para el tratamiento por salinidad (Figura 4.12) se obtuvo un perfil de expresión que va en aumento con respecto al tiempo de tratamiento, teniendo una expresión baja en el tiempo cero para hoja y una expresión transcripcional más elevada a las 24 horas, este patrón de expresión es similar en raíz, pero con intensidades relativas de expresión más bajas. Para el gen CpNAC1, para los tratamientos por temperaturas (Figura 4.9 y Figura 4.10), no se aprecia expresión transcripcional en ninguno de los puntos muestreados. Para el caso de sequía (Figura 4.11) se observa que los patrones de expresión transcripcional van en aumento con respecto a los tiempos de exposición al estrés tanto para hoja como para raíz, teniendo el mayor nivel de expresión relativa a las 24 horas para ambos casos. De igual forma para salinidad (Figura 4.12) se observó la inducción transcripcional de este gen a partir de las dos horas en hoja y a las cuatro horas en la raíz. El gen CpNAC12, para el tratamiento por baja temperatura (Figura 4.9) al igual que CpNAC1, no se observa expresión en el tiempo cero, en hoja. Por el contrario, tenemos que la expresión transcripcional de este gen en raíz es alta y activa para todos los tiempos del tratamiento en el grupo control, manteniéndose constante a lo largo de los períodos analizados. Por otra parte, la expresión transcripcional en raíz encondiciones de estrés posee una tendencia disminuir a medida que avanzan el tiempo en exposición ante dicho estrés, y posteriormente tiende a aumentar hasta retomar los valores iniciales de expresión a las 24 horas. Para el tratamiento por alta temperatura (Figura 4.10), al igual que el gen CpNAC4, se observó un incremento en la expresión transcripcional a las cuatro horas de exposición al estrés. De igual forma que en el tratamiento por baja temperatura en raíz, se obtuvo un perfil continuo en la expresión de este gen en el grupo control, y una disminución de la expresión a las dos, cuatro y ocho horas, incrementándose a las 24 horas. Para el caso de sequía (Figura 4.11) se hubo un incremento en la expresión transcripcional de este gen en la hoja, 112 Capítulo IV teniendo su valor relativo máximo a las ocho horas, en comparación con el tratamiento control el cual presenta una expresión basal ligera para hoja. En cuanto a la raíz, este gen presentó un nivel de expresión transcripcional alto, similar al del grupo control, disminuyó a las cuatro horas pero incrementó a las ocho horas, teniendo su valor máximo de expresión a las 24 horas de exposición al estrés. En el estrés por salinidad (Figura 4.12) se observa un incremento en la expresión de este gen en la hoja a partir de las cuatro horas teniendo su valor máximo de expresión transcripcional a las 24 horas, en comparación con el grupo control que se mantiene a un nivel basal bajo y constante. Para la raíz, el perfil de expresión sigue un patrón similar al de sequía, disminuye a la hora del tratamiento y aumentando a las cuatro horas del tratamiento, seguido de un leve descenso a las ocho y 24 horas. El gen de papaya CpNAC39 (asociado a membrana), la respuesta transcripcional no fué activada en los tratamiento de temperaturas (Figura 4.9 y 4.10). Para el caso del estrés por sequía (Figura 4.11), la expresión relativa de este gen incrementó a las ocho horas en hoja y a las 4 horas en raíz, en comparación con el grupo control, el cual presenta una expresión basal baja en la raíz. Para estrés salino (Figura 4.12) se observó un incremento en la expresión a partir de los 30 min para hoja, teniendo su nivel máximo de expresión a las cuatro horas. Para el caso de la raíz hubo una expresión baja a los dos horas la cual disminuye en los posteriores tiempos de estrés. 113 Capítulo IV 4.4 DISCUSIÓN Los Factores de Transcripción y las moléculas de señalización, son consideradas como la categoría más importante de genes involucrados en la regulación de la expresión en cascada de genes responsivos a los diversos tipos de estrés (Gong et al., 2010). Con solo 24,746 genes predecidos, papaya contiene el menor número de genes para la mayoría de la plantas eudicotiledoneas secuenciadas. Ming et al., (2008) reportan una reducción en la mayoría de sus familias génicas y rutas biosintéticas, quienes proponen esta planta como un modelo para estudiar rutas y redes de señalización complejas. Papaya no contiene duplicaciones genómicas globales (WGD) recientes, dando explicación de las bajas oportunidades de subfuncionalización, lo que implica que los genes de papaya sean más representativos en Angiospermas que los propios genes de Arabidopsis. El genoma de papaya contiene 77 secuencias con el dominio conservado NAC, los cuales fueron identificadas en este trabajo como CpNAC’s. En este estudio caracterizamos cinco genes de la familia NAC de C. papaya cv. Maradol con base en la homología a genes NAC de Arabidopsis involucrados en respuesta a estrés abiótico (ANAC002/ATAF1, ANAC019, ANAC029/ATNAP, ANAC040/NTL8, ANAC055/ATNAC3, ANAC072/RD26 y ANAC092/ATNAC2/ORE1). Subsecuentemente determinamos los perfiles de expresión transcripcional de los cinco genes de papaya en dos diferentes tejidos de acuerdo a los tratamientos de estrés planteados. El patrón de expresión de los cinco genes, en los cuatro diferentes tratamientos de estrés, reflejó una diversificación de la respuesta transcripcional de cada uno de los genes de la familia NAC de papaya. El gen CpNAC4 codifica para una proteína de 339 aa, la cual se predijo con base en la homología a los genes de Arabidopsis ANAC019, ANAC055 y ANAC072 responsivos durante diversos tipos de estrés abiótico. CpNAC4 mostró un perfil de expresión bajo, pero diferencial con respecto al tiempo cero, para ambos tratamientos de frío como de calor, con una expresión transcripcional mayor a las dos horas a 4ºC. Esto no es de sorprenderse debido a que existen reportes como el de Nakashima et al., (1997) quienes señalan que el gen ERD1, el cual es activado por un factor de transcripción NAC, es fuertemente inducido por deshidratación pero no por frío, calor, metales 114 Capítulo IV pesados, ni es inducido por reguladores de crecimiento tales como auxinas, citocininas, ácido giberélico y ABA, sugiriendo que dicho gen pertenece a la ruta independiente del ABA. Dicho gen fue altamente regulado por los tratamientos de sequía y salinidad similar a lo reportados por Fujita et al., (2004), los cuales señalan una fuerte activación de este gen a los 30 min de estrés por deshidratación, incrementando hasta las 24 horas y empleando el mismo protocolo que el utilizado en este estudio. Para el caso de salinidad, este gen de papaya incrementó su actividad transcripcional a partir de los 30 min. y mantuvo un nivel alto de expresión para los posteriores tiempos de exposición al estrés. Tran et al., (2004) reportaron que la expresión del gen ANAC055 es ligeramente inducida a las dos horas de tratamiento por sequía, ABA y ácido jasmónico (JA), pero es fuertemente inducido por el tratamiento de salinidad. ANAC019 es fuertemente inducido por deshidratación, ABA y salinidad dentro de las 2 h de tratamiento y es ligeramente inducido por JA a las 5 h. El gen ANAC072 fue el que mostró una activación transcripcional más temprana (1 h) en los tratamientos de deshidratación, salinidad y ABA. ANAC072 fue inducido ligeramente por frío a las 10 horas, mientras que ANAC055 y ANAC072 no mostraron acumulación alguna de transcrito, señalando que la expresión de estos tres genes es inducida principalmente por deshidratación y estrés por salinidad. Los datos anteriores hacen suponer que nuestro gen CpNAC4, el cual es homólogo a ANAC072, desempeña un papel similar en el estrés abiótico, y muy probablemente sea la causa por el cual no se encuentre relacionado fuertemente con el estrés por temperaturas bajas, pero si por estrés hídrico y estrés salino. CpNAC4 presenta numerosos sitios ABRE, MYC, ERD1 y W-box, al igual que la secuencia homóloga ANAC072 la cual ha sido reportada y caracterizada por Fujita et al., en 2004. La expresión de genes duplicados está más correlacionada a las respuestas de los programas de desarrollo que a los estreses ambientales, como es el caso de las diferentes respuestas transcripcionales en los genes parálogos de Arabidopsis ANAC019, ANAC055 y ANAC072, sugiriendo una rápida evolución de los genes duplicados en respuesta a factores externos (Blanc and Wolfe, 2004). ANAC072 posee una fuerte expresión transcripcional en varios tipos de estrés abiótico, incluyendo estrés por bajas temperaturas, pero sus parálogos ANAC019 y ANAC055 muestran baja expresión transcripcional ante sequía, NaCl y ABA, y no poseen actividad 115 Capítulo IV transcripcional ante estrés por bajas temperaturas (4°C), en comparación con ANAC072 (Tran et al., 2004). Ha et al., (2009) propusieron un modelo en el cual la expresión de los genes duplicados diverge rápidamente en respuesta a los cambios ocasionados por estreses bióticos y abióticos, mientras que las respuestas transcripcionales asociadas a cambios en el desarrollo, asociadas a redes complejas de regulación, cambian muy lento. Por otro lado, el gran número de genes duplicados expanden las redes de regulación transcripcional y facilitan al organismo adaptarse a los cambios del medio ambiente (Ha et al., 2009). Por otro lado, hay que considerar que un gen ortólogo seleccionado, puede no tener una función conservada, y este aspecto es dependiente de la distancia filogenética y por lo tanto de la divergencia en el tiempo de la rápida evolución de las redes regulatorias génicas (Price et al., 2009). Por otro lado, el gen CpNAC5 fué fuertemente inducido por las temperaturas altas, tanto para hoja como para raíz, desde los 15 primeros min., y mantuvo un perfil de expresión constante hasta las 2 h del tratamiento. Por el contrario, no hubo inducción por las temperaturas bajas, teniendo un nivel de expresión similar al tiempo cero. Lu et al., (2007) reportaron que para el gen ANAC002/ATAF1, gen ortólogo a nuestro gen de CpNAC5, es fuertemente inducido por sequía y ABA pero inhibido al ser restaurado el riego con agua. Las mutantes ataf1 sobreexpresan fuertemente los genes responsivos a estrés COR47, ERD10, KIN1, RD22 y RD29, sugiriendo que dicho gen participa como regulador negativo en la señalización del estrés por sequía. Hasta la fecha, no se había determinado el patrón de expresión de este gen ante el estrés provocado por la salinidad, dándonos muestra de la participación de este gen ante una gran diversidad de estreses y con una respuesta transcripcional temparana. Para el caso de CpNAC12, para hoja, fue inducido fuertemente hasta las 24 horas del tratamiento por calor. Para el caso de raíz, CpNAC12 presentó una expresión transcripcional alta y constante en todos los puntos de los tratamientos, sugiriendo una expresión basal fuete para este órgano vegetal. En el caso de CpNAC1, obtuvimos una expresión transcripcional alta a las 2 h. de tratamiento por sequía y salinidad, teniendo una expresión constante para los demás puntos. Guo y Gan (2006) reportaron que el gen ANAC029/AtNAP, ortólogo a nuestro gen CpNAC1, está involucrado en los procesos de senescencia en Arabidopsis, encontrando su expresión solamente en hojas en proceso de senescencia en tiempos largos (2-3 semanas de emergidas), demostrando que AtNAP es fuertemente inducido por la cascada de 116 Capítulo IV señalización de Muerte Celular Programada (PCD, Programmed Cell Death). Los autores reportaron que genes de la misma familia poseen funciones similares. Balazadeha et al., (2011) reportaron que la sobreexpresión de ANAC092/AtNAC2/ORE1, gen ortólogo a CpANC12, causó la modificación en los niveles de expresión de 78 de 170 genes (46%) conocidos en la senescencia (SAG's, Senescence-Associated Genes). Este gen fué inducido por salinidad y por acumulación de ROS. Por último el gen CpNAC39 no presentó alteración alguna en los perfiles de expresión llevados a cabo para los tratamientos de frío y calor. Esto pudiera ser debido a que su homólogo en Arabidopsis, el gen ANAC040/NTL8, el cual es el octavo NAC con motivo transmembrana según Kim et al., (2007a), se encuentra involucrado en estrés salino. Kim et al., (2007b) reportaron que este gen controla la floración durante el estrés salino, evitando la formación de brotes florales durante dicho estrés. La distribución de este gen se limita a los tejidos vasculares de los tallos de la inflorescencia, raíces en los pecíolos y en las nervaduras de las hojas. Kim y Park (2008) reportan que ANAC40 se expresa en la semilla en concentraciones elevadas de sal e inhibe la germinación. Por otro lado, los autores reportan que este gen funciona como un regulador negativo del ácido giberélico (GA, Gibberellic Acid). La gran mayoría de los miembros de la familia NAC son conocidos por estar involucrados de alguna u otra manera como reguladores transcripcionales en el estrés biótico y abiótico. Un análisis detallado de la expresión de estos genes, en diferentes condiciones ambientales, tales como estrés por sequía, estrés por salinidad, estrés por deficiencia de nutrientes y estés biótico, nos ayudará a especular la función biológica de cada uno de estos genes. Aunado a esto, es esencial la evaluación funcional de cada uno de estos genes en las diferentes condiciones estresantes antes mencionadas, esto con el fin de tener plena certeza de la participación de dichos factores en la cascada de señalización en respuesta a los diversos tipos de estrés, y el papel que desempeñan en la tolerancia o regulación de los factores ambientales estresantes. Sin la corroboración física antes mencionada, todos los perfiles de expresión de cada gen en cada uno de los tratamientos se quedan como predicciones de una posible participación del gen en cierta condición o como una mera deducción de la funcionalidad de un gen ante un estrés determinado. 117 Capítulo IV 4.5 REFERENCIAS Balazadeha, S. M. Kwasniewskia, C. Caldana, M. Mehrnia, M.I. Zanor G.P. Xue y B. Mueller-Roeber (2011), ORS1, an H2O2-Responsive NAC Transcription Factor, Controls Senescence in Arabidopsis thaliana, Molecular Plant 4(2):346-360 Blanc G, K.H. Wolfe (2004), Functional divergence of duplicated genes formed by polyploidy during Arabidopsis evolution, Plant Cell 16(7):1679-1691. CGIAR Consortium, FAO, IFAD, IFPRI, IICA, OECD, UNCTAD, Coordination team of UN High Level Task Force on the Food Security Crisis, WFP, World Bank, y WTO (2012), Sustainable agricultural productivity growth and bridging the gap for small-family farms, Interagency Report to the Mexican G20 Presidency, 12 June 2012 Das, R., y G.K. Pandey (2010), Expressional Analysis and Role of Calcium Regulated Kinases in Abiotic Stress Signaling, Current Genomics 11: 2-13. Fujita M., Y. Fujita, K. Maruyama, M. Seki1, K. Hiratsu, M. Ohme-Takagi, L.S. Phan Tran, K. Yamaguchi-Shinozaki y K. Shinozaki (2004), A dehydration-induced NAC protein, RD26, is involved in a novel ABA-dependent stress-signaling pathway, Plant Journal 39: 863-876. Gong P., J. Zhang, H. Li, C. Yang, C. Zhang, X. Zhang, Z. Khurram, Y. Zhang, T. Wang, Z. Fei y Z. Ye (2010), Transcriptional profiles of drought-responsive genes in modulating transcription signal transduction, and biochemical pathways in tomato, Journal of Experimental Botany 61(13): 3563-3575. Guo Y. y S. Gan (2006), AtNAP, a NAC family transcription factor, has an important role in leaf senescence, Plant Journal 46: 601-612 Ha M, E.D. Kim, Z.J. Chen (2009), Duplicate genes increase expression diversity in closely related species and allopolyploids, Proceedings of the National Academy of Sciences 106(7):2295-2300. 118 Capítulo IV Hu, H., M. Dai, J. Yao, B. Xiao, X. Li, Q. Zhang y L. Xiong (2006), Overexpressing a NAM,ATAF, and CUC (NAC) transcription factor enhances drought resistance and salt tolerance in rice, Proceedings of the National Academy of Sciences 103: 12987-12992. Jeong J.S., Y.S. Kim, K.H. Baek, H. Jung, S.H. Ha, Y. Do Choi, M. Kim, C. Reuzeau y J.K. Kim (2010), Root-specific expression of OsNAC10 improves drought tolerance and grain yield in rice under field drought conditions, Plant Physiology 153: 185-197. Kim S.Y., S.G. Kim, Y.S. Kim, P.J. Seo, M. Bae, H.K. Yoon y C.M. Park (2007a), Exploring membrane-associated NAC transcription factors in Arabidopsis: implications for membrane biology in genome regulation, Nucleic Acids Research 35(1): 203-213. Kim S.G., S.Y. Kim, y C.M. Park (2007b), A membrane-associated NAC transcription factor regulates salt-responsive Xowering via FLOWERING LOCUS T in Arabidopsis, Planta 226: 647-654. Kim S.G., y C.M. Park (2008), Gibberellic acid-mediated salt signaling in seed germination, Plant Signaling & Behavior 3(10): 877-879. Lefebvre, V., S.P. Kiani y M. Durand-Tardif (2009), A Focus on Natural Variation for Abiotic Constraints Response in the Model Species Arabidopsis thaliana, International Journal of Molecular Science 10: 3547-3582. Lu P.L, N.Z. Chen, R. An, Z. Su, B.S. Qi, F. Ren, J. Chen y X.C. Wang (2007), A novel drought-inducible gene, ATAF1, encodes a NAC family protein that negatively regulates the expression of stress-responsive genes in Arabidopsis, Plant Molecular Biology 63: 289-305. Ming R, S. Hou, Y. Feng, Q. Yu, A. Dionne-Laporte, J.H. Saw, et al. (2008), The draft genome of the transgenic tropical fruit tree papaya (Carica papaya Linnaeus). Nature 452(7190):991-996 119 Capítulo IV Morishita, T., Y. Kojima, T. Maruta, A. Nishizawa-Yokoi, Y. Yabuta y S. Shigeoka (2009), Arabidopsis NAC Transcription Factor, ANAC078, Regulates Flavonoid Biosynthesis under High-light, Plant Cell Physiology 50 (12): 2210-2222. Nakashima K., T. Kiyosue, K. Yamaguch-Shinozakl y K. Shinozaki (1997), A nuclear gene, erdl, encoding a chloroplast-targeted CIp protease regulatory subunit homolog is not only induced by water stress but also developmentally upregulated during senescence in Arabidopsis thaliana, Plant Journal 12(4): 851861. Nakashima, K., Y. Ito y K. Yamaguchi-Shinozaki (2009), Transcriptional regulatory networks in response to abiotic stresses in Arabidopsis and grasses, Plant Physiology 149: 88-95. Nakashima K., H. Takasaki, J. Mizoi, K. Shinozaki, K. Yamaguchi-Shinozaki (2012), NAC transcription factors in plant abiotic stress responses, Biochimica et Biophysica Acta, 1819: 97-103. Nogueira, F.T.S., P.S. Schlögl, S.R. Camargo, J.H. Fernandez, V.E. De Rosa Jr., P. Pompermayer y P. Arruda (2005), SsNAC23, a member of the NAC domain protein family, is associated with cold, herbivory and water stress in sugarcane, Plant Science 169: 93-106. Price MN, P.S. Dehal, A.P. Arkin (2007), Orthologous Transcription Factors in Bacteria Have Different Functions and Regulate Different Genes, PloS Computational Biology 3(9):1739-50 Smallwood, M., D.J. Bowles (2002), Plants in a cold climate, Philosophical Transactions of the Royal Society B Biology 357: 831-847. Tran, L.S., K. Nakashima, Y. Sakuma, S.D. Simpson, Y. Fujita, K. Maruyama, M. Fujita, M. Seki, K. Shinozaki, y K. Yamaguchi-Shinozaki (2004), Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promoter, Plant Cell 16: 2481-2498. 120 Capítulo IV Yamaguchi-Shinozaki K, y K. Shinozaki (1994), A novel cis-acting element in an Arabidopsis gene is involved in responsiveness to drought, low-temperature, or high-salt stress, Plant Cell 6: 251-264. Yamaguchi-Shinozaki, K., y K. Shinozaki (2006), Transcriptional regulatory networks in cellular responses and tolerance to dehydration and cold stresses, Annual Review of Plant Biology 57: 781-803. 121 Capítulo V CAPÍTULO V DETERMINACIÓN DE LA FUNCIONALIDAD DE LOS GENES NAC SELECCIONADOS 5.1 INTRODUCCIÓN El estrés abiótico, es el factor más importante que afecta negativamente el crecimiento y la productividad de las plantas, este puede reducir los rendimientos de un cultivo hasta en un 70% (Agrwal et al., 2006). Los tipos de estrés abiótico más comunes que afectan a las plantas son la sequía, las temperaturas extremas y la salinidad. A nivel mundial, cerca del 22% de la tierra utilizada para cultivo es salina (FAO, 2004) y la expansión de las áreas afectadas por la sequías se encuentran en aumento (Burke et al., 2006). Por otra parte, la transformación genética de plantas, la cual tiene sus orígenes en los años 90, se ha convertido en una herramienta indispensable en la biología molecular de plantas y en la investigación en el campo de la genómica funcional. (De Block et al., 1984). La tecnología de la transformación genética es considerada como una extensión de las tecnologías de mejoramiento en plantas (Zhong, 2001). Esta ofrece una oportunidad única de mejoramiento, con la que se puede introducir material genético foráneo, independientemente de las barreras entre especies, y mediante la cual poder crear fenotipos con las características deseadas, que no se encuentran disponibles en el germoplasma de las especies cultivables (Mishra y Slater, 2012). Estas herramientas han sido ampliamente usadas en la búsqueda de plantas tolerantes a los diversos tipos de estrés que impone el ambiente. Dentro de las estrategias de la biología molecular y la genética, se encuentra el uso de proteínas reguladoras capaces de modificar el metabolismo de la planta con el fin de poder sobrellevar dichas condiciones. Los factores de transcripción, son una opción altamente viable para estos fines, ya que desempeñan un rol importante en la regulación de la expresión de genes en respuesta a una condición dada, por tal motivo, son considerados como un poderoso blanco para la ingeniería genética en la tolerancia a la sequía, las temperaturas extremas y los suelo salinos, debido a que la sobreexpresión de estos puede desencadenar la regulación de un gran número de genes en respuesta a dichos estreses (Nakashima et al., 2009). Las proteínas NAC has demostrado estar involucradas en una amplia gama de procesos de desarrollo vegetal, así como participar en la regulación de respuestas a 123 Capítulo V distintos tipos de estrés abiótico. Numerosos estudios han demostrado que la sobreexpresión de algunas de estos factores conduce al mejoramiento de la tolerancia para un estrés dado. Wu et al., (2012) demostraron que la sobreexpresión del gen ANAC042/JUNGBRUNNEN1 conlleva a una tolerancia a varios factores abióticos, ya que este gen responsivo a daño mecánico, salinidad y a las especies reactivas de oxígeno (ROS), desencadena la expresión de genes DREB2C, HSP, acumulación de prolina y trehalosa, acumulación de citocininas, reducción en los niveles de antocianinas, y varios genes responsivos a las ROS. Liu et al., (2011) reportan que la sobreexpresión de un gen NAC de crisantemo DgNAC1 en tabaco incrementó la tolerancia a salinidad. Tran et al., (2004) demostraron que los genes ANAC019, ANAC055 y ANAC072 confieren mayor tolerancia a la sequía en Arabidopsis. El principal objetivo del uso de la ingeniería genética en este trabajo es la corroboración de la funcionalidad de dos de los genes NAC de C. papaya cv. Maradol seleccionados, debido a que dichos genes presentan perfiles transcripcionales responsivos a los tratamientos de estrés propuestos en el capítulo IV, y los ortólogos de estos genes en Arabidopsis presentan características muy marcadas ante el estrés. Para dicho fin, se recurrió a la transformación genética de plantas de N. tabaccum con los genes CpNAC4 y CpNAC5, y se obtuvieron plantas de progenie F1 para su subsecuente evaluación ante diversas condiciones estresantes. 124 Capítulo V 5.2 MATERIALES Y MÉTODOS 5.2.1 SOBREEXPRESIÓN EN N. tabaccum. 5.2.1.1 ESTANDARIZACIÓN DE LA TRANSFORMACIÓN GENÉTICA DE TABACO Se realizó la estandarización de la transformación de discos foliares de tabaco para la expresión de la β-glucuronidasa (GUS) mediante el vector binario pCambia2301 conteniendo el gen gusA de E. coli. La cepa de A. tumefaciens (EHA105 + pCambia230135SGUS) fue crecida en medio YEP con 50 mg L-1 Kanamicina y 100 mg L-1 Rifampicina. Se siguió el protocolo de Clemente, 2006. Para la infiltración con Agrobacterium, se pusieron los explantes de tabaco en medio líquido de infiltración y se colocaron en la cámara de vacio a 40cm Hg durante 5 min, la infiltración se realizó tres veces. Posteriormente, los explantes fueron colocados en medio sólido de inducción de brotes sin antibióticos y se dejó co-cultivando con la bacteria durante tres días a 25ºC en oscuridad. Después del co-cultivo con A. tumefaciens, todos los explantes fueron lavados con agua destilada estéril, por tres veces, para remover los residuos de bacterias, y durante 5 min con una solución al 0.9%de NaCl. Subsecuentemente los explantes -1 fueron colocados en medio sólido de -1 selección/inducción, con 100 mg L de Cefatoxima, 200 mg L de Timentina y 150 mg L-1 de Kanamicina. Posteriormente las plantas se pasaron a frascos gerber con medio sólido de regeneración. 5.2.1.2 VECTOR DE TRANSFORMACIÓN PARA SOBREEXPRESIÓN DEL GEN DE INTERÉS Para la elaboración de la construcción o cassette de transformación, se usó el sistema de clonación por PCR "Gateway®Tecnology" (Cat. 12535-019, Invitrogen). Dicha tecnología altamente eficiente y rápida, facilita la construcción y expresión de un gen de interés mediante la recombinación en sitios específicos de un clon, permitiendo la clonación de múltiples fragmentos de material genético en un orden y una orientación definida; presenta una manera eficiente de mover una secuencia de ADN dentro de un sistema de múltiples vectores con el cual poder llevar a cabo diversos tipos de análisis funcionales y de expresión de proteínas. Para dicha elaboración se siguieron las indicaciones del proveedor. 125 Capítulo V 5.2.1.3 TRANSFORMACIÓN GENÉTICA DE N. tabacum CON LOS GENES CpNAC’s Para llevar a cabo la transformación genética de tabaco se usó la cepa de Agrobacterium tumefaciens "EHA 105". Para dicha transformación se empleó el protocolo de Clemente (2006) modificado mediante infiltración al vacio. Para este experimento se siguieron los lineamientos básicos descritos en dicho protocolo. Las líneas transgénicas generadas fueron verificadas mediante PCR contra el gen nptII (Neomicina fosfotransefrasa), el cual es parte del cassette de transformación insertado en el genoma vegetal. 5.2.2 LOCALIZACIÓN NUCLEAR DE LAS PROTEÍNAS CpNAC-GFP Las proteínas CpNAC’s fueron fusionadas en la región C-terminal de un vector de sobreexpresión de la tecnología Gateway, el cual incluye una región codificante para GFP (exitación 488 nm – emisión 505-530 nm). Plantas transgénicas de las lineas CpNAC4 y CpNAC5 de 5 días post-germinación, se fijaron en FAA (Formaldehído 10%, Ac. Acético 5% y Etanol 50%) durante 30 minutos en oscuridad a 4°C, posteriormente las plántulas se sometieron a lavados con etanol al 30%, 50%, 70%, 95% y 100% durante dos hora en cada paso de lavado a 4°C, dando un último lavado con etanol al 100%. Posteriormente las muestras fueron montadas en un portaobjetos a las cuales se les añadió VECTASHIELD® Mounting Media DAPI (VECTOR Laboratories) durante 30 minutos, y posteriormente fueron fijadas con un cubre objeto y selladas con esmalte comercial. Las muestras fueron visualizadas en un microscopio confocal marca Olympus Fluoview FV1000. Se utilizaron plantas no transformadas como grupo control. 5.2.3 ENSAYOS DE ESTRÉS EN LÍNEAS TRANSGÉNICAS DE TABACO Semillas transgénicas de N. tabacum fueron crecidas en medio de selección (sales MS, 3% sacarosa, 10 ml L-1 Vitamins B5, 200 mg L-1 Timentina, 150 mg L-1 Kanamicina y 3g L-1 Gelzan) de acuerdo con el protocol descrito por Clemente (2006). Plántulas (transformadas y no transformadas) fueron transferidas en botes con mezcla de Peat moss-Sunshine-Vermiculita-agrolita (1:1:1:2), y posteriormente crecidas bajo un régimen de fotoperíodo de 16h luz/8 h oscuridad a 25 °C durante seis semanas. Para los ensayos de germinación en ABA (Ácido abscísico), plántulas de diferentes líneas 126 Capítulo V fueron germinadas en medio MS (1/10) conteniendo ABA a una concentración de 0.1 µM, y crecidas bajo un régimen de fotoperíodo de 16h luz/8 h oscuridad a 25 °C durante 24 días. Para los ensayos de elongación de la raíz en condiciones de estrés salino, plántulas de 20 días post-germinación, se colocaron en medio MS (1/10) con diferentes concentraciones de NaCl (40 mM, 100 mM y 300 mM) bajo un régimen de fotoperíodo de 16h luz/8 h oscuridad a 25 °C durante 7 días. Para los ensayos de temperatura en placas, las semillas de tabaco fueron germinadas en medio MS (1/10) y posterior a los 15 días de germinación las placas fueron puestas en una cámara de temperature controlada a 42°C durante 8 horas. Para dicho análisis de utilizaron 20 plantulas para cada una de las líneas transgénicas, así como para el control. Para el ensayo de temperatura, plantas de 45 días post-germinación (transformadas y no transformadas) fueron puestas en una cámara de temperatura controlada a 44 ±1°C durante 7 días. Las plantas fueron regadas con 200 mL de agua diariamente. 127 Capítulo V 5.3 RESULTADOS 5.3.1 TRANSFORMACIÓN GENÉTICA DE PLANTAS DE TABACO Como resultado de los experimentos de estandarización de la transformación de tabaco (Figura 5.1), se obtivueron diversas líneas transformadas con el gen marcador gusA. Dichos explantes fueron regenerados en medio selectivo con el antibiótico kanamicina, para evitar el crecimiento inespecífico de tejido no transformado. Figura 5. 1 Explantes de tabaco transformados en medio semisólido de inducción de brotes, con los respectivos antibióticos para cada tratamiento. Después de tres meses de regeneración, diferentes hojas y raíces de las plántulas de tabaco, se cortaron para la posterior verificación de la transformación. En las figura 5.2 se aprecian hojas, tallos y raíz de tabaco debidamente transformados con el gen marcador gusA. 128 Capítulo V Figura 5. 2 Plantas de N. tabacum transformadas con el gen gusA, mediante el protocolo de Clemente, 2006. Se obtuvieron diferentes plantas de tabaco transformados con los genes CpNAC4 y CpNAC5, usando el vector de sobreexpresión PK7FWG2.0, bajo el control del promotor 35S y teniendo a la GFP como proteína marcadora. En la figura 5.3 se pueden observar el proceso de crecimiento de las plantas transformadas así como los fenotipos adquiridos durante la fase de inducción-regeneración de plántulas de tabaco. 129 Capítulo V A) B) Figura 5. 3 Desarrollo de plantas de tabaco transformadas con genes CpNAC4 y CpNAC5 de C. papaya. A) Regeneración mediante organogénesis directa de plantas transformadas, B) plantas de tabaco transformadas de 8 semanas en medio de enraizamiento. Se obtuvieron distintas líneas transgénicas para cada gen. En la Figura 5.4 se pueden apreciar plantas de tabaco de 5 meses, transformadas con los genes NAC de papaya, sembradas en una mezcla de sustrato posterior a su aclimatación, con el fin de obtener las líneas transgénicas de la progenie F1. Figura 5. 4 Plantas transgénicas de N. tabacum (progenie F0) después de su aclimatación 130 Capítulo V 5.3.2 LOCALIZACIÓN NUCLAR GFP-CpNAC’s Para examinar la localización de las proteínas NAC, las plantas de tabaco sobreexpresantes de las proteínas CpNAC4 y CpNAC5, fusionadas a GFP, fueron preparadas para su posterior visualizacíon (ver Materiales y Métodos) mediante microscopia confocal. Se determinó que ambas proteínas NAC de papaya se localizaron en los estomas de las hojas, no habiendo ninguna señal de GFP para el tejido control (Figura 5.5). Para todos los casos se puede apreciar claramente los núcleos de las células mediante la tinción de DAPI. Figura 5. 5 Localización de la proteína CpNAC4 y CpNAC5 en hojas de tabaco. Proteínas de papaya fusionadas a la proteína GFP bajo el control del promotor 35S. En raíz, las proteínas CpNAC4 y CpNAC5 se localizaron en los nucleos de las células (Figura 5.6) señalando una actividad intrínseca en dicho organelo. De igual manera, se puede observar los núcleos celulares teñidos con el reactivo DAPI. 131 Capítulo V Figura 5. 6 Localización nuclear de la proteína CpNAC4 y CpNAC5 en raíz de tabaco. Proteínas de papaya fusionadas a la proteína GFP bajo el control del promotor 35S. 5.3.3 ENSAYOS DE ESTRÉS ABIÓTICO EN LAS LÍNEAS TRANSGÉNICAS DE TABACO En la Figura 5. 7 se pueden observar tres líneas de tabaco para el gen CpNAC5 (a, b y c) sometidas a estrés por temperatura a 42°C durante ocho horas. Las plántulas de tabaco pertenecientes a la líneas CpNAC5 presentaron un mayor daño con respecto al control (Wild-type) no transformado, siendo las líneas b y c las que mostraron evidencia de clorosis y un mayor deterioro de las hojas. 132 Capítulo V Wild type CpNAC5c CpNAC5a CpNAC5b Figura 5. 7 Trantamiento de estrés por temperatura (42°C) para plantas de tabaco sobreexpresantes del gen CpNAC5 de papaya. Tres líneas pertenecientes al gen CpNAC5 (a, b y c) fueron sometidas junto con un grupo control a un ensayo por calor durante 8 horas. En la Figura 5. 8 se aprecian las tres líneas de tabaco pertenecientes al gen CpNAC5, sometidas a estrés por salinidad en diferentes concentraciones de NaCl. En un recuadro rojo se señalan las diferencias más marcadas para las plantas sobreexpresantes. Como se puede apreciar, las plantas transformadas de tabaco mostraron una menor enlongación de la raíz en presencia de 40 mM de NaCl, con respecto a la planta de taba control no transformada. A los 100 mM de NaCl el crecimiento de la raíz es menor para todas las plantas, pero sinendo más afectada las líneas transgénicas CpNAC5. Para 300 mM no se percibe cambio alguno en el crecimiento radicular ni de la parte aérea de las plantas de tabaco . 133 Capítulo V Figura 5. 8 Tratamiento de salinidad para plantas de tabaco sobreexpresantes del gen CpNAC5 de papaya. En cajas rojas se señalas las diferencias más notorias en la afectación del crecimiento de la raíz en las líneas transgénicas de tabaco. En recuadro verde (100 mM) se muestra la diferencia del crecimiento de la parte aérea de la planta control con respecto a las sobreexpresantes. En los ensayos de germinación para el gen CpNAC4 (ortólogo a ANAC072), en medio con 0.1 µM de ABA, seis diferentes líneas de tabaco sobreexpresantes (CpNAC4_1, CpNAC4_3, CpNAC4_4, CpNAC4_5, CpNAC4_6 y CpNAC4_8) fueron puestas a germinar durante 6 días en medio MS (1/10) adicionado con ABA (+ ABA), y se les tomó registro del crecimiento a los 18, 21 y 24 dias post-germinación. En la figura 5.9 se puede observar que la línea CpNAC4_5 no germinó en el medio control sin ABA (– ABA), (B). Por otro lado, las líneas CpNAC4_1 y CpNAC4_3 presentaron un mayor crecimiento que las demás líneas y que el control no transformado (al centro de la placa). CpNAC4_1 sin embargo, mostró una notable diferencia en crecimiento al final del tratamiento (G y H). 134 Capítulo V Figura 5. 9 Tratamiento de germinación de plantas de tabaco transformadas con el gen CpNAC4 de papaya. A) Disposición de las líneas transgénicas y el control (wild-type) en la placa; B) placa con medio MS sin ABA a los 18 días; C y D) placas con 0.1 µM de ABA a los 18 135 Capítulo V días; E y F) placas con 0.1 µM de ABA a los 21 días de germinación; G y H) placas con 0.1 µM de ABA a los 24 días de germinación. Por otro lado, para los ensayos de temperatuda a 44°C, las plantas de tabaco de la línea CpNAC4_1 que fueron sometidas a estrés durante siete días, no presentaron daños visibles mayores en comparación con el grupo control no transformado (Figura 5. 10). La sobreexpresión de este gen, demostró su importante participación en el sistema de regulación molecular que desencadena respuestas favorables ante estas condiciones desfavorables para la planta. Figura 5. 10 Fenotipos resultantes de plantas de tabaco no transformadas y plantas sobreexpresantes del gen CpNAC4_1 después de siete días de estrés por temperatura a 44°C. A) Plantas no transformadas de tabaco después de siete días de estrés; B) Plantas de tabaco que sobreexpresan el gen CpNAC4_1 despues de siete días a 44°C. Las plantas fueron regadas diariamente con 200 mL de agua. 136 Capítulo V 5.4 DISCUSIÓN La tecnología de la transformación genética tiene aplicaciones potenciales para conferir caracteres deseados en plantas de importancia agroeconómica, como lo es C. papaya. Dentro dichos caracteres deseados, se encuentra la tolerancia a enfermedades ocasionadas por patógenos, la tolerancia a sequía o estrés hídrico, bajas temperaturas, entre muchas otras más. La transformación de plantas representa hoy en día una gran ventaja para el mejoramiento de los cultivos como por ejemplo; en el área nutricional dichos cultivos pueden incrementar el valor nutricio y la calidad de las bebidas, por otra parte el uso de estos cultivos híbridos en la agricultura molecular (Molecular Farming) pueden reducir el tiempo de crecimiento y aumentar productividad de los cultivos de interés. La identificación de genes candidatos para la aplicación de dichas herramientos moleculares, es uno de los prerrequisitos de mayor importancia para el desarrollo de cultivos transgénicos (Mishra y Slater, 2012). La introducción de genes, mediante la transformación genética, que conlleven a la tolerancia de múltiples tipos de estrés abiótico, sigue siendo un reto para los grupos enfocados en el estudio de estos caracteres deseados. Diversos grupos de investigación, se encuentran hoy en día, llevando a cabo estudios orientados a identificar nuevos genes involucrados en la tolerancia al estrés biótico y abiótico. El enfoque más prometedor de la ingeniería genética, para la tolerancia a los estreses como la sequía y las temperaturas extremas incluye el uso de genes funcionales o regulatorios, como es el caso de los factores de transcripción (Chaves et al., 2003). Numerosos estudios han demostrado que la familia de proteínas NAC desempeña un rol importante en la tolerancia al estrés hiperosmótico. Tran et al, (2004) reportaron que los genes ANAC019, ANAC55 y ANAC072 de Arabidopsis confieren una mayor tolerancia a la sequía en esta planta modelo. En este capítulo reportamos la transformación genética de dos genes de la familia NAC de C. papaya en la planta modelo N. tabacum. Nuestro gen de papaya CpNAC4 fue elegido de acuerdo a su actividad transcripcional a la alza en los diferentes expretimentos de estrés propuestos en el Capítulo IV. CpNAC4 es el gen ortólogo a ANAC072 de Arabidopsis, el cual confiere tolerancia a las plantas de tabaco expuestas a temperaturas extremas (44 °C) durante siete días. Este gen de papaya mostró tener un comportamiento similiar a su ortólogo en Arabidopsis, señalando una conservación funcional dentro este orden 137 Capítulo V taxonómico, y llevando su función más allá de su grupo taxómico hasta la subcalse de las Asteridas dentro la cual se encuentra Nicotiana. Otros estudios en monocotiledóneas señalan que los genes SNAC1 y OsNAC10 aumentan significativamente la tolerancia ante estrés por sequía en plantas de arroz (Jeong et al., 2010). Nakashima et al., (2007) demostraron que la sobreexpresión de SNAC2/OSANC6, OsNAC45 y OsNAC063 resulta en el aumento en la tolerancia a múltiples tipos de estrés abiótico. Por otro lado, el gen de papaya CpNAC5, el cual es ortólogo al gen ANAC002, desmostró tener una redundancia funcional con respectoa su ortógolo en Arabidopsis. El gen ANAC002 actúa como un represor transcripcional ante diversas condiciones de estrés, siendo sus genes blancos las proteínas COR47, ERD10, KIN1, RD22 y RD29, involucradas en diferentes procesos que conllevan a la adaptación o tolerancia ante situaciones ambientales adversas. La sobreexpresión de este gen resulta en fenotipos sensibles al estrés abiótico (Lu et al., 2007). Nuestro gen CpNAC5 produjo fenotipos sensibles ante estrés por temperatura, y por otra parte las raíces de las líneas transgénicas para este gen, mostraron una inibición en el crecimiento y elongación de estas antes condiciones de estrés salino. Al igual que el gen CpNAC4, el gen CpNAC5 mostró tener una función conservada dentro las diferentes subclases taxonómicas de las Asteridas y las Eurosidas. Los estudios realizadon en este capítulo, son una primera aproximación a la funcionalidad de nuestros genes candidatos, los cuales podrían tener efectos pleiotrópicos perjudiciales en el desarrollo de la plántula, al estar regulados por un promotor constitutivo como es el 35S, lo cual podría conllevar a fenotipos no deseados. Diversos estudios señalan la importancia del uso de promotores inducibles, los cuales acumulen el producto transgénico solamente bajo la condición deseada. Los promotores inducibles por estrés son considerados como los ideales para regular la expresión de genes candidatos para lo tolerancia a estrés abiótico (Ganguly et al., 2011). El tema de los transgénicos es ampliamente debatido por expertos y por la misma sociedad, debido a la falta de información de calidad. En el caso de café, el cual se encuentra en su estado inicial de comercialización, debe integrarse a los programas de 138 Capítulo V mejoramientos para su evaluación, lo que tardará de 15-20 años por lo menos para su liberación en el campo. Sin embargo, el principal obstáculo será la aprobación del consumidor y la aceptación de un cultivo genéticamente modificado. Con un rápido aumento en la labranza de diversos cultivos transgénicos alrededor del mundo, la percepción de los consumidores hacia los transgénicos podría ser más positiva de lo que es hoy día. Indudablemente, los organismos genéticamente modificados (OGM) deben someterse a pruebas rigurosas, sobre los efectos sanitarios y ambientales antes de ser liberados para su comercialización. La expresión del transgen debe ser monitoreada en todos los estados del desarrollo de la planta. Adicional a esto, la tecnología genómica como lo es la transgénesis, el mejoramiento asistido por marcadores moleculares, la genómica, la proteómica y la metabolómica deben complementar los esfuerzos del mejoramiento tradicional para acelerar el mejoramiento de plantas de importancia agronómica (Mishra y Slater, 2012). Un punto que no podemos pasar por alto, es la integración de los programas de mejoramiento y de investigación a la inversión pública y a las compañías privadas. Al mismo tiempo, los investigadores y los científicos deben hacer un esfuerzo para educar a la sociedad y ayudar a comprender las grandes ventajas y riesgos asociados con el uso de OGM. 139 Capítulo V 5.5 REFERENCIAS Agrwal, P.K., P. Agarwal, M.K. Reddy y S.K. Sopory (2006), Role of DREB transcription factors in abiotic and biotic stress tolerance in plants, Plant Cell Reports 25: 1263-1274. Burke, E.J., S.J. Brown y N. Christidis (2006), Modeling the recent evolution of global drought and projections for the twentyfirst century with the Hadley centre climate model, Journal of Hydrometeorology 7: 1113.1125. Chaves, M., J.P. Maroco, y J.S. Pereira (2003), Understanding plant responses to drought from genes to the whole plant, Functional Plant Biology 30(3): 239-264. Clemente T. (2006), Nicotiana (Nicotiana tobaccum, Nicotiana benthamiana), Methods in Molecular Biology 343: 143-54. De Block M., L. Herrera-Estrella, M. van Montagu, J. Schell, y P. Zambryski, (1984), Expression of foreign genes in regenerated plants and in their progeny, The EMBO Journal 3(8): 1681-1689. FAO (Food, Agriculture Organization of the United Nations, 2004), FAO production yearbook. Rome: FAO. Ganguly, M., A. Roychoudhury, S.N. Sarkar, D.N. Sengupta, S.K. Datta y K. Datta (2011), Inducibility of three salinity/abscisic acid-regulated promoters in transgenic rice with gusA reporter gene, Plant Cell Reports 30: 1617-1625. Jeong JS, Y.S. Kim, K.H. Baek, H. Jung, H. SH, C. Do, M. Kim, C. Reuzeau, y J.K. Kim (2010), Root-specific expression of OsNAC10 improves drought tolerance and grain yield in rice under field drought conditions, Plant Physiology 153: 185-197. Liu, Q.L., K.D. Xu, L.J. Zhao, Y.Z. Pan, B.B. Jiang, H.Q. Zhang y G.L. Liu (2011), Overexpression of a novel chrysanthemum NAC transcription factor gene enhances salt tolerance in tobacco, Biotechnology Letters 33: 2073-2082. 140 Capítulo V Lu P.L, N.Z. Chen, R. An, Z. Su, B.S. Qi, F. Ren, J. Chen y X.C. Wang (2007), A novel drought-inducible gene, ATAF1, encodes a NAC family protein that negatively regulates the expression of stress-responsive genes in Arabidopsis, Plant Molecular Biology 63: 289-305 Mishra M.K. y A. Slater (2012), Recent Advances in the Genetic Transformation of Coffee, Biotechnology Research International, Article ID 580857, doi:10.1155/2012/580857. Nakashima K., L.S. Tran, D. Van-Nguyen, M. Fujita, K. Maruyama, D. Todaka, Y. Ito, N. Hayashi, K. Shinozaki, K. Yamaguchi-Shinozaki (2007), Functional analysis of a NAC-type transcription factor OsNAC6 involved in abiotic and biotic stressresponsive gene expression in rice, Plant Journal 51, 617–630. Nakashima, K., Y. Ito, y K. Yamaguchi-Shinozaki (2009), Transcriptional Regulatory Networks in Response to abiotic stresses in Arabidopsis and grasses, Plant Physiology 149: 88-95. Tran, L.S., K. Nakashima, Y. Sakuma, S.D. Simpson, Y. Fujita, K. Maruyama, M. Fujita, M. Seki, K. Shinozaki, y K. Yamaguchi-Shinozaki (2004), Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promoter, Plant Cell 16: 2481–2498. Wu, A., A.D. Allu, P. Garapati, H. Siddiqui, H. Dortay, M.I. Zanor, M.A. Asensi-Fabado, S. Munne-Bosch, C. Antonio, T. Tohge, A.R. Fernie, K. Kaufmann, G.P. Xue, B. Mueller-Roeber y S. Balazadeha (2012), JUNGBRUNNEN1, a Reactive Oxygen Species–Responsive NAC Transcription Factor, Regulates Longevity in Arabidopsis, Plant Cell doi/10.1105/tpc.111.090894 Zhong G.Y. (2001), Genetic issues and pitfalls in transgenic plant breeding, Euphytica 118(2): 137-144. 141 Capítulo VI CAPÍTULO VI 6.1 DISCUSIÓN GENERAL En este trabajo se tuvo como objetivo esclarecer el origen, la diversificación y el papel que desempeñan una de las familias de factores de transcripción con mayor número de miembros y con mayor diversificación funcional. Las proteínas NAC han jugado un papel enmascarado en las funciones vitales de las plantas debido a la escasa información que se tenía sobre ellas desde la última década. Sin embargo, en los últimos años, diversos grupos de investigación en todo el mundo se han enfocado en esclarecer las relaciones y mecanismos funcionales de estás protínas en la regulación del metabolismo y desarrollo vegetal. En este trabajo se determinó el número de genes pertenecientes a esta familia de FT NAC en 24 plantas, dentro de estas se encontraban 22 Angiospermas, una licofita y un musgo, no encontrando evidencia en algas y microorganismos. Si bien esta familia de Factores de transcripción es específica para plantas, encontramos una gran expansión de estás secuencias durante su historia evolutiva, poco antes de la rápida radiación de las Angiospermas. Estas proteínas, muy probablemente desempeñaron un rol fundamental en la adaptación y supervivencia del linaje de las plantas con flores, las cuales se expandieron mediante los diversos mecanismos de duplicación permitiendo lidiar de esta forma con los diversos factores ambientales adversos y lograr su establecimiento y diversificación Los análisis de genómica comparativa, junto con el análisis funcional de genes de la familia NAC, han arrojado luz sobre como las duplicaciones de los genes y de los genomas, han contribuido a la rápida diversificación de esta familia en Angiospermas mediante innovaciones funcionales, como es el caso de rutas claves ligadas al origen de esta familia. Este patrón se hace evidente al observar el incremento gradual en el número de genes, desde la especie ancestral P. patens hasta árboles más complejos como el Álamo. El conocimiento de cómo las proteínas regulatorias adquieren nuevas funciones moleculares, es esencial para el entendimiento de cómo los organismos se adaptan a nuevos nichos ecológicos. La familia NAC representa un marco de referencia útil para dar respuesta a estas interrogantes. Este trabajo es un punto de partida para la caracterización de la función de múltiples secuencias NAC que han sido descuidadas y el cual nos ha proveído de un mejor entendimiento del origen y evolución de esta familia. 143 Capítulo VI En este trabajo, de acuerdo con las filogenias elaboradas, se determinaron seis principales familias de secuencias NAC con características definidas ante diversos patrones de desarrollo vegetal. Dentro de estos grupos, la familia V alberga a la subfamilia “Stress-related family”, la cual contiene múltiples secuencias involucradas en procesos en respuesta a estrés abiótico para diversas especies. Para nuestro modelo de estudio, C. papaya, se identificaron 77 secuencias con el dominio conservado NAC, las cuales fueron nombradas bajo el prefijo CpNAC. Dentro de estas secuencias, dos de ellas presentaban una alta similitud con respecto a proteínas de otras especies involucradas en procesos de tolernacia a múltiples estreses abióticos, las cuales se agruparon dentro de la subfamilia “Stress-related family” del grupo V. Como pudimos constatar para el caso de nuestros dos genes seleccionados de papaya (CpNAC4 y CpNAC5), pertenecientes a la subfamilia “Stress-related family”, estos genes presentaron una respuesta transcripcional a la alza ante múltiples tratamientos de estrés abiótico. Dichas secuencias de papaya al ser ortólogas de genes de Arabidopsis involucrados en procesos en respuesta a estrés abiótico, y sabiendo que, genes ortólogos presentan un menor cambio entre sus secuencias y por lo tanto una menor distancia evolutiva, pudimos inferir su probable participación en procesos responsivos al estrés ambiental. Por otra parte, ambas species pertenecen al orden de las Brassicales, lo cual es una característica de vital importancia al momento de seleccionar genes canditados para el estudio. Los análisis en plantas de tabaco sobreexpresantes de los genes de papaya, nos confirmaron que la distancia evolutiva juega un papel primordial en la función de los genes, ya que para ambos genes encontramos la respuesta esperada en los fenotipos. CpNAC4 al igual que ANAC072 son genes que actúan confiriendo tolerancia ante diversas situaciones ambientales estresante, por otro lado, CpNAC5 al igual que ANAC002 actúan como represores transcripcionales en situaciones de estrés, cuya sobreexpresión lleva a la planta a un proceso de muerte celular acelerado. La determinación de las funciones de esta familia de genes es de vital importancia para lograr una pronta tolerancia en cultivos susceptibles a factores ambientales adversos. La selección de promotores específicos en respuesta al estrés abiótico se hace necesaria para maximizar los efectos positivos de los transgenes y minimizar los negativos La combinación de herramientas tales como la genética reversa, la 144 Capítulo VI genómica, la proteómica y los avances en la secuenciación de última generación nos permitirá tener un panomara más completo del complejo sistema de regulación vegetal, dentro el cuál las proteínas NAC juegan un papel crítico en la adaptación, diversificación y permanencia de las plantas en distintos hábitats. Dicha información nos permitirá poder generar un conocimiento más detallado con el cual poder tener planteamietos más certeros para la elaboración de nuevos proyectos biotecnológicos y una mayor asertividad en la búsqueda de plantas tolerantes al estrés abiótico en un medio ambiente cada díá más severo. Para esto es necesario continuar con el uso de estas herramientas genómicas e insistir en la educación y difusión del conocimiento a las futuras generaciones. , 145 Capítulo VI 6.2 CONCLUSIONES GENERALES 1. Se determinaron las expansiones génicas de la familia de FT NAC en 24 plantas, así como la historia evolutiva de esta familia a través del linaje de las Angiospermas. 2. Se determinaron las secuencias ortólogas de la familia NAC en 22 especies de Angiospermas y en el musgo P. patens, así como las posibles secuencias parálogas para cada espeice. 3. Se presentó por primera vez las secuencias de la familia NAC de C. papaya, así como los posibles genes incolucrados en procesos en respuesta a estrés abiótico. 4. En este estudio se analizó el patrón transcripcional de cinco genes NAC de C. papaya, en respuesta a cuatro diferentes tipos de estrés abiótico (sequía, salinidad y temperaturas extremas), y se determinó que todos ellos presentan un aumento en su expresión durante el estrés. 5. En este estudio se determinó la participación del gen CpNAC4 de papaya, en el mecanismo de tolerancia al estrés por temperatura extrema (44°C), mediante su sobreexpresión en N. tabaccum. 6. Se determinó la acción del gen CpNAC5 de papaya, como un represor transcripcional de posibles vías de señalización en la tolerancia al estrés, mediante su sobreexpresión en plantas de N. tabaccum expuestas a conciciones de estrés por temperatura extrema. 146 Capítulo VI 6.3 PERSPECTIVAS Este trabajo abre la posibilidad para plantear nuevas preguntas con respecto al mecanismo de acción de las proetinas NAC de papaya, y su participación en la regulación de los procesos de tolerancia al estrés. Como perspectivas de este trabajo, tenemos las siguientes apremiantes: 1. Caracterizar los promotores de los genes reportados en este esudio, con una actividad transcripcional a la alza ante múltiples eventos de estrés abiótico. 2. Elaborar construccioens de vectores de transformación para plantas, guiados por promotores específicos para cada situación estresante, como es el caso de los promotores de las proteínas NAC de papaya. 3. Generación de plantas inter y cisgénicas de papaya cv. Maradol, que sobreexpresen los genes NAC previamente caracterizados en este estudio. 4. Caracterizar esta familia de FTs en otros modelos vegetales de importancia económica, como lo es tomate y caña de azúcar. 147 Anexos ANEXO 1 REGIONES INTRÓNICAS DE LOS CINCO GENES PREDICHOS EN C. papaya Gene Phytozome C. papaya ID Intrones 5'GTGAATTTCTTATTCTTTTTTTTTTTAAATGTTCT Posición Tamaño de de intrón intrón (pb) 4828-4946 119 960-4552 593 5104-5200 97 5469-5554 86 3589-3705 117 3182-3316 165 3112-3140 29 CGTGGTATTTTCGAAACATGTATGTTATGATGAT TAGTGAAATGAATTCATTATTTGTCGTTATTTTGA ATGGTGAAACTACAG-3' 5'GTACGGTTTCAGTTTTCTTCTTCCTCTTTCAGA TTATTAGTTTTAATTGTACAGTCACCTTTCTCTGC ATGATGAGCTTTGCTCCACGATGTGGAATTTGAA ATGACAATTTTGCCCCTTCACGCTGTTAAAGCCT GTAGGGGTCCACAACTGTCAATTTTCTTTTCGGC CpNAC5 evm.model.supercontig_ 64.115 GGCCGCAGAAGACAGCTAAGGATTTGACGGTAT ACCGAGGGAATTAGCCAATGGTATAACGTCGTC GGTAGATCCGTTTACCAACGGTGAACTGTATAG GGTCAGTAGATTTATAGTCGGTGGGGTTCTAGT GGTCCCCGCCATGGTTAATTGCGTGTGGTCCCC ATTTGGTACCAGTTATACGGCTAATAAATAATCC ACGTCATTGGAAAAAGGACGTCACCGTTTATATG TCTGAAGCAGTCGCCCGTCACATTAGCAAAACC CATCAATCAAATATTATTAATCTCCAGTTTAGGAA AATATTCCTTCTTATCTCCTCCGACGTGGGTGGC ACAAGGAGATAGCGATGAAATCAGATTTTCAAAT ATGTCAACATAATGCATTTTATTAGTGACTAAACC AACGGTGTTGATTTTGCAG-3' 5'GTAAGGAACCCTCAACCATTGCCAATTTTGAAT TTCTTCCGATTTTATCTTCTCTGGGTTTGGTTTG CpNAC4 evm.model.supercontig_ 80.93 GTAAATAGAATTCGTTTGATATTTTGACAG-3' 5'GTACGAATTTACGGAAACTCATGAATTATTTAT CACGTTTTTTGATGTTGAGCGCGAGTGGTGAGT TGACGCGGTGTCTTTTGCAG-3' 5'GTTTGTAACCAAACATTCCTCTCCTCATTCATTT TATTTCGTTTTTACTAAAATATTAACTGACTGTAC ATAAATATATATATATATATATGTGTGTGTGTGTG TATACATATACAG-3' CpNAC1 evm.model.supercontig_ 5'GTGCGTTTCTCTTTTTTTCTCTTTTTTCGTAGTT 1.48 AGATCGTCAAACATTATGTTATTTGAATCAAATAC GTATAATTTTTTCACATTCCATTTTTACTTACTGG TTGCATATGCTTTTGTTTTTGTGAGTTTCAG-3' 5'GTCAAAAGTTTTGGAATCTCATAAATTAG-3' 148 Anexos 5'GTTCGGAATTTCATTTCCTTTCTCTTCACCTCTT TTAATTTATCTTCTGCTTCTGCTTCTGTTTCTTTC 8036-9141 1106 9397-9899 503 TTTACTTCTTAAATTTAACTCTTTTTTAAAATTAAT AGAAAAAGGAAAATCTGAGAGACGAACTTAATAC CCGCCATAATTAAGTCTGAGTTAAACATTTAATG GTAAATACTTAAATTTTTGTAAATATCTTTGTTTTT TTTTGTTAGAAATTAGTTTTTGATCTTTTAAAATT GTTTCAGAACAGAATCACCGATTAACTGTTACAG GATGGTAACTTTTCTTCCTCAATCCTGATCCTCT CTCTTCTCTCCCTGTTTCACTGTTTCGTGAAAAG GATTTCACTTCATCAAATCTCCTTCTGCTCGACC ACTTGTTTATCTGAAAACAAACCCACCTATACCC TATTTCACTATCGGAAAAACAAATACTCGTAGCT TGTCCTGGAGCTCGGTCGCGTTCGGGTTGCCAT TGTCCGAATCCCCGTTGCTCTGTTTCTATGTTGC CCGAGGGAGAAGATGGGAACAGGGCAGGATCG GGGAGCAGTGAACAGAGCAATGACGCGACAGG GTTAGGTCCATGAGAGGAGGAGGGCAGAAGAG GATTCTGAACCCTCGATTTAAACAGTGAATTTTT ATATATTAAACTACTAAAAAGTTAAGATTAATAGA ACATAATCATTAAATGTATCATTCTCCTGCCAGA GCACGAACATATCTGAAAACCATTTTAAAATTTTA GTTTCACTCTCATCAGAAGTATTTTTGTTTCTGGT CpNAC39 evm.model.supercontig_ GATCTATTAGATTTCTGCTGTCTGATAATAATAGT 195.35 AATAGTAAAAAAAAAAGAAAAAAGAAATCGAATT ATCCTAAAAAATTAAGTTGATAAAAAATAGTATAG ATAAACCCACTAAATCTTGTGCAAAGTTGATTTTT GAATGAAACAAAGTTGTGAGGAAAACCATAGATC CCAGCCTTCTTGATGGCTAACTTCATAATTTTAC TTTAAGAATTTTAAATATGCAGAACACATGATTAT ATGCATTTTGATTGTCTTAGTAAAGTTGCTGTATA TCTGGGTACGGCAACTGATGTGCT CATTTATTTAATCATGATCAG-3' 5'TGACATTTCTTCCTTGTCTTTCTGATTCTTTTTT CATTTCTGATAAGCTTTCGTTTGAATTGTTGCTC GTATGTCATCTTTAACGAGATTAAAGTTGGTTTA AGACGTCGGGTTGGAAGGTTTGCCGTGTAAGTT TTCACTTTGGCTGCTGTATTTCAGTTCCTTAGAG CTGCCTTATGCATGCCTTTGTACTTTGATGTGTA AAAGAGTCATTACTTGTTAGGACAATTTTGTACTT GGAAGGGCCTTTTTGGACCAGAATGATCCGTCT TCAATCGCTCTATACAAGACAGCCGAGAGGCAA TCAAAACGATGATGATTATGCTGAGAAGATCAGT TACACTGCTATTTCTTATATGTGGTAGAGAGTTTT TACTAGAAGAAATTCTCTGATTTATGAGATGTGT GAATTGTTAAGGAATACGACATGGGATTAACTCG AAAGCTTTGGCCTGAACTGATCACTAGTATTAAT 149 Anexos TTGCCATTCTTTATTGCAAACTTGAAGG-3' 5'TATGTTTGAGTATTTGTTGGTTTAAATTTCATGA 1019-1027 80 5246-5331 86 5609-5710 102 ATACACAATAACTAACCGTTGTATCTAAACTAAA CCCAATTCCAGG-3' 5'TAAGTTTTGTCTGAATTCAAATCTCTTTTACACC CAGAACAAATATATATGTAAGTAACAATTTTTTGG CpNAC12 evm.model.supercontig_ 14.101 GTTTTGTTGAATGAAGG-3' 5'GTAAAATTTATTTCTATCTCTTTCTTTGTTTCCA AACACCTTTTTAGTTTTGAATATTATTTTGAGATT TCTTTGCTTCTTTTTCTTGTTTTGTTTTTGCAG-3' 150