1、新疆紫草AP2ERF转录因子的电子克隆和生物信息学分析新疆紫草AP2ERF转录因子的电子克隆和生物信息学分析 摘要 应用电子克隆技术,以紫草AP2/ERF序列为探针,获得了新疆紫草的1条876 bp AP2/ERF的序列,包含1个1 077 bp的开放阅读框编码205个氨基酸,命名为AeAP2/ERF。采用生物信息学方法,对该基因所编码的蛋白从氨基酸组成、理化性质、亚细胞定位、跨膜结构域、疏水性/亲水性、高级结构及功能域等方面进行预测和分析,结果显示该基因编码蛋白定位于细胞核,为水溶性蛋白,可以调控代谢、转导信号。 关键词 电子克隆;新疆紫草;AP2/ERF基因;生物信息学 电子克隆技术(in
2、 silico cloning)是一项通过序列的拼接和组装,克隆新基因的技术1,具有高效、快速、实验成本低2,并可以为实验克隆提供精确的参考序列等优点3,目前,电子克隆新基因是国内外研究的热点,涉及小麦4、木瓜5、大豆6等多种植物,果蝇7、蜘蛛8以及衣藻9、RNA病毒10等微生物的基因克隆和生物信息分析,但在中药方面的研究报道甚少。 新疆紫草Arnebia euchroma (Royle) Johnst是传统中药材紫草Arnebiae Radix的重要来源和道地药材11,其主要成分紫草素具有很高的工业价值和药用价值,但是目前关于新疆紫草和调控紫草素合成的转录因子的研究基本空白12-13。 AP
3、2/ERF转录因子是仅存在于植物中的一个超级基因家族14,参与了花15、果实16和种子发育17等植物生长发育中的多种生物学过程,在植物抵抗干旱18、高盐19、低温20等非生物胁迫和真菌、细菌、病原体等生物胁迫方面有重要作用21-22,并且是水杨酸23、茉莉酸24、乙烯25等多种信号通路交叉互作的连接因子,是目前研究的热点之一。 本研究基于NCBI数据库和生物信息学手段,对新疆紫草中AP2/ERF基因进行电子克隆和序列分析,而后对该基因以及编码的蛋白从氨基酸组成、理化性质、跨膜结构域、卷曲螺旋、亚细胞定位、信号肽、功能域及高级结构等方面进行了预测和分析,为该基因下一步的实验克隆、功能鉴定及其应用
4、奠定基础,并为电子克隆技术在中药领域的应用提供参考。 1 材料与方法 1.1 电子克隆获得新基因序列 电子克隆获得新疆紫草AP2/ERF基因序列以紫草Lithospermum erythrorhizon AP2/ERF基因(ACX71873)作为探针,使用Blastn工具检索NCBI中新疆紫草EST序列构建的本地数据库,得到与探针序列同源性较高的新疆紫草EST序列,使用在线工具CAP3进行拼接,然后以拼好的重叠群(Contig)为探针,再次Blast检索,直到没有新的EST序列可供拼接,Contig不能延伸为止。 1.2 新疆紫草AP2/ERF基因序列的生物信息学分析 利用本地或在线生物信息软
5、件,基于Swiss-Prot,TrEMBL,PIR-PSD,PDB等蛋白质数据库,对新疆紫草AP2/ERF进行开放读码框预测、理化性质分析、结构预测、信号肽分析、疏水性/亲水性预测、亚细胞定位、氨基酸同源性分析等生物信息分析,本文所用到的生物信息分析工具,见表1。 2 结果与讨论 2.1 新疆紫草AP2/ERF基因的获得和ORF预测 用紫草的AP2/ERF基因(ACX71873)作探针,对 新疆紫草EST的本地数据库Blastn工具检索,将高相似度的EST序列使用CAP3进行拼接,最终得到1条1 077 bp Contig,命名为AeAP2/ERF。使用NCBI提供的ORF Finder软件,
6、根据标准遗传代码(The Genetic Codes)查找AeAP2/ERF的开放读码框(open reading frame,ORF),结果显示,其开放读码框长度为1 077 bp,编码了205个氨基酸,见图1灰色字体。 2.2 新疆紫草AP2/ERF转录基因编码蛋白质一级结构预测 在线软件ProtParam,基于蛋白数据库,对新疆紫草AP2/ERF转录基因编码的蛋白质(记为 AeAP2/ERF)的结构预测见表2。AeAP2/ERF蛋白分子式为C1015H1595N293O318S5,等电点(PI) 5.87,根据Guruprasad等人的二肽不稳定性权值(DIWV)计算该蛋白质不稳定系数为
7、63.24,而当一个蛋白质的不稳定系数40时,蛋白质可能是不稳定26。由此可预测,新疆紫草AP2/ERF基因编码的蛋白质可能是不稳定的酸性蛋白质。 2.3 新疆紫草AP2/ERF蛋白质亲疏水性分析 通过在线软件ProtScale,基于蛋白数据库,对新疆紫草AP2/ERF蛋白质序列进行亲疏水性预测,采用Kyte&Doolittle标度计算并把窗口设置为20,构建线性质量差异模型(linear weight variation model),得到了较明显的亲疏水信号,见图2。图2中纵坐标正值为疏水性,负值为亲水性,横坐标表示205个氨基酸。从ProtScale分析的结果来看,该蛋白存在末端具有明显
8、的亲水性,再次说明了新疆紫草AP2/ERF蛋白质结构可能是不稳定的27。 2.4 新疆紫草AP2/ERF蛋白质跨膜结构预测 利用在线跨膜蛋白结构预测TMpred软件,基于蛋白数据库,对AeAP2/ERF蛋白氨基酸的跨膜结构域进行预测的结果见图3。一般而言,纵坐标分值(score)大于500被认为是可能性较高的跨膜结构28(横坐标表示205个氨基酸),图3显示该蛋白没有内到外螺旋和外到内的螺旋,即未形成跨膜螺旋区域,说明该蛋白可能不具有跨膜转运信号,不会与生物膜结合参与到信号传递过程中。 2.5 新疆紫草AP2/ERF蛋白的亚细胞定位 使用Psort在线软件,基于蛋白数据库,对AeAP2/ERF
9、蛋白进行亚细胞定位其在细胞中的定位。结果显示,AeAP2/ERF蛋白质在细胞核的概率最大,达到70%,远大于在溶酶体10%、线粒体基质10%和内质网(膜)10%等的概率,说明新疆紫草AP2/ERF蛋白很可能定位于细胞核。 2.6 新疆紫草AP2/ERF蛋白信号肽预测与分析 采用SignaIP 4.1 Server,基于蛋白数据库,预测新疆紫草AP2/ERF的信号肽,Positional limits设定为0,D-cutoff values(用于优化马修斯相关系数-MCC,进而获得更为准确的预测结果)取默认值29,结果输出见表3,图4。AeAP2/ERF基因的编码蛋白质在氨基酸序列的166位置上
10、有一个潜在的信号肽断裂位点,概率为0.128。并且,C最大值与Y最高峰以及S最高值不处于同一区域,因此,预测AeAP2/ERF可能不含有信号肽,由于氨基酸残基的原始剪切位点和信号肽的分值均较小(0.5),可推测AeAP2/ERF基因所编码的蛋白可能不存在信号肽,为非分泌蛋白,该蛋白在细胞质中合成后,不进行蛋白转运。 2.7 新疆紫草AeAP2/ERF蛋白质二级结构预测 通过在线软件SOPMA,基于蛋白数据库,对新疆紫草AP2/ERF蛋白进行二级结构预测见图5,结果显示无规则卷曲占的比例最高为59.51%,-螺旋和延伸链分别占26.34%,10.24%,由此可推测,无规卷曲是AeAP2/ERF蛋
11、白二级结构中最大量的结构元件,-螺旋和延抻链分散于整个蛋白质中30。 2.8 新疆紫草AP2/ERF蛋白质三级结构预测 将新疆紫草AP2/ERF编码蛋白序列提交至SWISS-MODEL,采用同源建模法31,见图6。该蛋白主要由-螺旋、延伸链和无规则卷曲组成,与二级结构预测结果基本一致。 2.9 新疆紫草AP2/ERF蛋白质结构域分析 通过在线软件InterProScan,基于蛋白数据库,对新疆紫草AP2/ERF蛋白进行结构域分析32-33,见图7。发现其DNA-结合位点存在于植物转录调节蛋白AP2/ERF中,结果显示该序列具有完整的AP2/ERF家族蛋白功能域和DNA结合位点,这表示AeAP2
12、/ERF蛋白很可能属于AP2/ERF超家族。 2.10 新疆紫草AeAP2/ERF进化分析 从NCBI网站下载16个物种:母菊Matricaria chamomilla、黄瓜Cucumis sativus、毛果杨Populus trichocarpa、丹参Salvia miltiorrhiza、鹰嘴豆Cicer arietinum、葡萄Vitis vinifera、可可Theobroma cacao、大豆Glycine max、猕猴桃Actinidia eriantha、青蒿Artemisia annua、紫草Lithospermum erythrorhizon、拟南芥Arabidopsis
13、thaliana、蓖麻Ricinus communis、紫花苜蓿Medicago sativa、巴西橡胶树Hevea brasiliensis、百脉根Lotus japonicus,同新疆紫草Arnebia euchroma的AP2/ERF蛋白用MEGA 6.06软件构建Neighbor-Joining系统发育树,见图8。结果表明,AeAP2/ERF与紫草在进化上的距离最短,亲缘关系最近,其次是唇形科的丹参。 2.11 新疆紫草AP2/ERF蛋白质功能预测 在线软件ProtFun 2.2,基于蛋白数据库,对新疆紫草AP2/ERF基因编码蛋白质的功能分析结果见表4,调控转录的机率为8.8%,转导
14、信号的机率为7.1%,作为生长因子的机率为4.6%,其他功能的预测机率过低,说明其AeAP2/ERF蛋白质很可能具有调控转录和信号转导方面的功能34-35。 3 讨论 鉴于电子克隆技术还是以EST数据库为基础,植物EST数据库和序列资料的完善与否和丰富度在一定程度上会限制和决定电子克隆目标基因的准确性和可行性,故此,在植物领域基因的克隆还是以常规的实验方法为主36,但是,电子克隆技术所特有的快速、高效和实验成本低廉的优势,随着生物信息的积累和爆炸电子克隆技术将会在植物,尤其在药用植物领域有非常广阔的应用前景37。 新疆紫草野生资源匮乏38-39,生物工程合成紫草素是缓解资源压力的途径之一40。
15、但是目前紫草素的生物合成率还有很大的提升空间,新疆紫草AP2/ERF转录因子的电子克隆研究将为新疆紫草资源的保护、利用和紫草素的生产提供更多的理论依据。 4 结论 基于本地新疆紫草EST数据库的电子克隆得到的新疆紫草AP2/ERF转录因子,其编码的蛋白含有AP2/ERF保守功能域。生物信息学预测分析后,推测该基因编码蛋白可能不存在信号肽,为亲水性的酸性蛋白,二级结构原件多为-螺旋和无规卷曲,含有一个保守功能域AP2/ERF,亚细胞定位显示该蛋白很可能位于细胞核内,功能预测结果显示其主要功能为调控转录和信号转导。本研究的结果,为将来新疆紫草AP2/ERF家族基因的实验克隆、功能鉴定及其在新疆紫草
16、基因工程以及电子克隆技术在中药基因中的应用奠定了一定的基础,也为电子克隆技术在中药领域的广泛使用和中医药的发展提供参考。 参考文献 1Sandro Banfi,Alessandro Guffanti,Giuseppe Borsani. How to get the best of dbESTJ. Trends Genet,1998,14:80. 2Huminiecki L,Bicknell R. In silico cloning of novel endothelial-specific genesJ. Genome Res,2000,10(11):1796. 3Gill R W,Sanse
17、au P. Rapid in silico cloning of genes using expressed sequence tags (ESTs)J. Biotechnol Annu Rev,2000,5:25. 4武安泉,王俊生,张玉玺,等. 小麦Cyp450基因的电子克隆与生物信息学分析J. 中国农学通报,2013,29(18):38. 5Idrovo Espin F M,Peraza-Echeverria S,Fuentes G,et al. In silico cloning and characterization of the TGA (tgacg motif-binding
18、factor) transcription factors subfamily in Carica papayaJ. Plant Physiol Biochem,2012,54:113. 6魏琦超,畅丽萍,薛晓锋,等. 大豆异戊烯焦磷酸异构酶基因的电子克隆及生物信息学分析J. 生物技术通报,2010,11:96. 7Prigent C,Gill R,Trower M,et al. In silico cloning of a new protein kinase,Aik2,related to Drosophila aurora using the new tool: EST BlastJ.
19、In Silico Biol,1999,1(2):123. 8Veenstra J A,Rombauts S,Grbic M. In silico cloning of genes encoding neuropeptides,neurohormones and their putative G-protein coupled receptors in a spider miteJ. Insect Biochem Mol Biol,2012,42(4):277. 9Herrera-Valencia V A,Macario-Gonzlez L A,Casais-Molina M L,et al.
20、 In silico cloning and characterization of the glycerol-3-phosphate dehydrogenase(GPDH) gene family in the green microalga Chlamydomonas reinhardtiiJ. Curr Microbiol,2012,64(5):477. 10Liu H,Fu Y,Xie J,et al. Discovery of novel dsRNA viral sequences by in silico cloning and implications for viral div
21、ersity,host range and evolutionJ. PLoS ONE,2012,7(7):e42147. 11黄璐琦,王康才. 药用植物生理生态学M. 北京:中国中医药出版社,2012:263. 12王升,谢腾,郭兰萍,等. 两种新疆紫草细胞系表型分析和悬浮培养生长及紫草素类化合物积累的动力学研究J. 中国中药杂志,2013,28(7):1138. 13王升,李璇,郭兰萍,等. 紫草素及其衍生物合成相关基因及信号传导研究进展J. 中草药,2012,43(6): 1219. 14Velasco R,Zharkikh A,Affourtit J,et al. Tomato tran
22、scription factors pti4,pti5,and pti6 activate defense responses when expressed in ArabidopsisJ. Plant Cell,2002,14:817. 15Irish V F,Sussex I M. Function of the Apetala-1 gene during Arabidopsis floral developmentJ. Plant Cell,1990,2(8):741. 16Chung M Y,Vrebalov J,Alba R,et al. A tomato (Solanum lyco
23、persicum) APETALA2/ERF gene,SlAP2a,is a negative regulator of fruit ripeningJ. Plant J,2010,64(6): 936. 17Ohto M A,Fischer R L,Goldberg R B,et al. Control of seed mass by APETALA2J. Proc Natl Acad Sci USA,2005,102(8): 3123. 18Song C P,Agarwal M,Ohta M,et al. Role of an Arabidopsis AP2/EREBP-type tra
24、nscriptional repressor in abscisic acid and drought stress responsesJ. Plant Cell,2005,17(8): 2384. 19Liu Q,Kasuga M,Sakuma Y,et al. Two transcription factors,DREB1 and DREB2,with an EREBP/AP2 DNA binding domain,separate two cellular signal transduction pathways in drought and low temperature-respon
25、sive gene expression,respectively,in ArabidopsisJ. Plant Cell,1998,10(8):1391. 20Peng X,Ma X,Fan W,et al. Improved drought and salt tolerance of Arabidopsis thaliana by transgenic expression of a novel DREB gene from Leymus chinensisJ. Plant Cell Rep,2011,30(8): 1493. 21Park J M,Park C J,Lee S B,et
26、al. Overexpression of the tobacco Tsi1 gene encoding an EREBP/AP2-type transcription factor enhances resistance against pathogen attack and osmotic stress in tobaccoJ. Plant Cell,2001,13(5): 1035. 22Shin R,Park J M,An J M,et al. Ectopic expression of Tsi1 in transgenic hot pepper plants enhances hos
27、t resistance to viral,bacterial,and oomycete pathogensJ. Mol Plant Microbe Interact,2002,15(10): 983. 23Gu Y Q,Wildermuth M C,Chakravarthy S,et al . Tomato transcription factors pti4,pti5,and pti6 activate defense responses when expressed in Arabidopsis defense against Botrytis cinerea in Arabidopsi
28、sJ. Plant Cell,2002,14:817. 24Moffat C S,Ingle R A,Wathugala D L,et al. ERF5 and ERF6 play redundant roles as positive regulators of JA/EtmediatedJ. PLoS ONE,2012,7(4):e35995. 25Zhang L,Li Z,Quan R,et al . An AP2 domain-containing gene,ESE1,targeted by the ethylene signaling component EIN3 is import
29、ant for the salt response in ArabidopsisJ. Plant Physiol,2011,157:854. 26Guruprasad K,Reddy B V B,Pandit M W. Correlation between stability of a protein and its dipeptide composition: a novel approach for predicting in vivo stability of a protein from its primary sequenceJ. Protein Eng,1990,4:155. 2
30、7Kyte J,Doolittle R F. A simple method for displaying the hydropathic character of a proteinJ. Mol Biol,1982,157:105. 28Kay Hofmann K,W S Toffel. TMbase-A database of membrane spanning protein segmentsJ. Biol Chem,1993,374:166. 29Petersen T N,Brunak S,von Heijne G,et al. Signal P 4.0: discriminating
31、 signal peptides from transmembrane regionsJ. Nat Methods,2011,8(10): 785. 30Geourjon C,Deleage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignmentsJ. Comput Appl Biosci,1995,11(6):681. 31Kushwaha H,Gupta S,Singh V K,et al. In silico characterization and prediction of three dimensional structure of SbDof1,SbDof19,SbDof23 and SbDof24 proteins from Sorghum Sorghum bicolor (L. ) MoenchJ. Mol Biotechnol,2013,54(1):1. 32Sarah Hunter,Philip Jones,Alex Mitchell,et al. InterPro in 2011:new