基因序列分析软件DNAStar简介资料下载.pdf
- 文档编号:5971672
- 上传时间:2023-05-05
- 格式:PDF
- 页数:64
- 大小:2.26MB
基因序列分析软件DNAStar简介资料下载.pdf
《基因序列分析软件DNAStar简介资料下载.pdf》由会员分享,可在线阅读,更多相关《基因序列分析软件DNAStar简介资料下载.pdf(64页珍藏版)》请在冰点文库上搜索。
EditSeq能读取大部分的序列格式包括FASTA,GenBank,ABI、GCG和ASCII格式。
你可以使用菜单命令或拖拽方式输入序列文件。
另外,序列也许通过使用键盘输入,或者从其他地方复制、粘贴得到。
经Entrez或BLAST检索得到的序列可以直接从因特网或企业内部互联网服务器下载。
序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反翻译,寻找开放读框,还可以进行阅读校对。
另外,EditSeq能以GenBank,FASTA和GCG格式输出序列。
如果在使用这软件中需要帮助,可以和DNASTAR联络。
电话:
(608)258-7420,传真:
(608)258-7439,电子信件:
,或者经http:
/。
2打开已有序列用Windows打开“tethis21.seq”开始假设序列的末尾有载体序列污染我们在用EditSeq打开序列的同时,用SetEnds命令去除5和3污染序列从文件菜单(FILEMENU),选择Open打开文件夹“DemoSequences”单击选定序列“TETHIS21”单击位于对话框右下角的SetEnds按钮SetEnds被打开(如右)在5框和3框中键入50和850,点击OK单击Open打开序列当EditSeq窗口打开时,序列长度显示在右上角通过“settingends,”现在你只有最初序列中的801bp的片段SetEnds选择在全部Lasergene应用程序中都可以使用(图1)。
图1选择Open打开文件夹“DemoSequences”单击选定序列“TETHIS21”3寻找开放读框在这入门的一部分中,我们将确定序列中最大的ORF,并翻译它。
从SEARCHMENU找到ORF,点4第6卷2004(4)击打开会出现右边的对话框。
单击FindNext寻找第一个ORF的位置。
继续点击FindNext直到你把ORF的位置选定在位置183-455。
ORF的坐标会出现在EditSeq窗口的顶端附近(图2)。
图2单击FindNext寻找第一个ORF的位置4DNA序列翻译这一节中我们介绍如何翻译我们的ORF,不过任何序列中的读框内部分都可以用下面的方法进行翻译。
如果你的选择是在三联码的读框内,三联码指示棒显示为实心黑线(如左图)。
如果你的选择是不在三联码的读框内,左边的箭头和右面的箭头显示向左或向右移动一个bp,以使所选序列成为三的倍数。
选定ORF,从GOODIESMENU菜单中选择翻译(Translate)。
翻译的蛋白质序列出现在一个新的未命名窗口中(如右图)。
它是使用标准的遗传密码翻译的。
福建农业生物技术通讯5图3图45使用其它遗传密码根据你的序列的来源,你可以选择使用非标准的遗传密码进行翻译等操作。
在这节中,我们将标准的遗传密码转换成CiliateMacronuclear密码。
从GOODIESMENU菜单选择GeneticCodes打开,子菜单显示如左。
单击“CiliateMacronuclear”就实现了遗传密码的转换,EditSeq现在使用的就是CiliateMacronuclear的遗传密码。
同样可以将遗传密码转换为其它类型。
图56遗传密码的编辑这一节中我们修改CiliateMacronuclear的遗传密码。
从GOODIESMENU菜单选择EditSelectedCode。
这将打开右面的窗口,窗口显示遗传密码是怎样翻译DNA和RNA序列的。
如以DNA形式展示密码,点击DNA按钮。
编辑时,单击任何要编辑的密码,从其目前的位置拖到新氨基酸对应的位置则可。
如使用不同的启始密码子,单击SetStarts按钮。
第二的遗传密码窗就会被打开,可以进行起始密码子选择。
单击任何氨基酸(或者codon位置),该密码子就会变成绿色,而且旁边出现一个箭头,它就被设定为起始密码子了。
如要去除,只需单击它即可。
如不保存,则单击取消;
如要保存,单击保存为。
图66第6卷2004(4)7序列的反向互补及反向转换下面的步骤可以用于反向测定的序列的正确输入。
选定序列。
从GOODIESMENU菜单,选反向互补序列(ReverseComplement),或者把序列颠倒过来(ReverseSequence)命令,则被选定的序列就被翻转互补或翻转过来了。
8BLAST检索下面我们将在NCBI的BLAST服务器上对TETHIS21序列进行相似性比较。
注意为了进行BLAST查找必须保证因特网的连接。
如果你没有连接因特网,跳过这部分,继续下一部分。
选定序,或者从EDIT菜单中选择SelectAll。
从网络检索菜单(NETSEARCHMENU),选择BLAST查找。
BLAST对话框就会出现。
程序默认为blastn,数据库默认是nr,参数转换请参照帮助。
单击OK开始查找。
寻找结果显示为两部分(如下)。
上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。
图7图8有关“score”和“expectation”的详细的信息在NCBIs网点http:
/www.ncbi.nlm.nih.gov/BLAST.可以找到。
一般来说,更主要的score和更低的expectation提示较好的相似性。
BLAST结果窗最上边的3钮被用来打开,或者保存检索到的序列,或者让你了解更多的有关信息。
下面我们从用“CreateDocument”钮来打开评分最高的5序列开始:
单击CreateDocument。
一个小的对话框出现。
在左上角有一个下拉菜单显示默认(default)。
单击下拉菜单,选顶端(Top)。
并在右面的文本框中写入5。
单击OK,EditSeq自动查对多余序列。
如果EditSeq提示至少2序列是同一个,请点击OK。
EditSeq将从因特网数据库下在单一的序列,并分别打开一个单独的EditSeq窗口。
下面我们用“BatchSave”钮将3-10序列保存为EditSeq文件:
选定从顶端起第3个序列。
单击BatchSave。
小的灰色的对话框出现。
图9图10单击下拉菜单,选Next。
并在右面的文本框中写入8。
点击SetLocation,显示文件夹对话框。
选定福建农业生物技术通讯7你要保存序列的位置。
单击OK回到灰色的对话框。
单击OK保存序列,文件扩展为“.seq”。
下载过程期间,EditSeq自动查对重复的序列。
除非你收到错误信息,否则可以认为你的序列已经成功下载。
最后我们可以使用“LaunchBrowser”钮查看序列的详细信息选定序列。
选择LaunchBrowser。
你的网络浏览器将打开右面的窗口。
9序列信息查看现在我们要使用EditSeq菜单指令查看有关打开的TETHIS21序列的信息。
选定序列的一部分。
如果你倒是希望全选序列,从EDITMENU菜单,选择SelectAll。
从GOODIESMENU菜单,选DNAStatistics。
就会出现右面的窗口,显示序列信息。
图1110序列校读在我们学习保存和输出序列之前,下熟悉一下EditSeq的校读功能这功能能帮助你校正测序胶中的错读。
单击校对发音图标(序列窗口底部张开的嘴),或者从SPEECHMENU,选Proof-ReadSequence。
电子的音声就会开始朗读所选的序列。
(注:
如果你听不见任何声音,检查你的计算机的喇叭是否已经打开。
)要改变音声read-back的速度,从SPEECHMENU菜单,选择FasterorSlower。
要停止校读,点击图标(手),或者从SPEECHMENU菜单,选择Proof-ReadSequence。
序列的保存与输出首先创建一个用于保存的序列。
从文件菜单,选New中的NewDNA,或者NewProtein。
将序列写入出现的窗口。
如果你输入非法字符,计算机会发出警告。
然后,我们将序列保存为EditSeq文件:
从文件菜单,选Save。
选定保存位置。
给序列命名。
单击保存则可。
以GenBank或GCG格式保存序列:
从文件菜单,选Export。
为sequence(s)选格式。
给sequence(s)命名。
以FASTA格式保存序列:
从文件菜单,选Export(1个序列),或者ExportAllAsOne(多个序列)。
当使用ExportAllAsOne的时候,如果DNA和蛋白质文件同时存在,激活窗口的序列类型与你保存的类型是一致的。
EditSeq仅仅将写入的序列保存为FASTA格式。
选FASTA格式。
8第6卷2004(4)基因序列蛋白质结构分析软件基因序列蛋白质结构分析软件Protean使用技术使用技术朱育菁,刘波,郑伟文,林营志,曹宜,苏明星,蓝江林,车建美,郑斯平,陈坚(福建省农科院生物技术中心)1Protean功能简介Protean可以使用多种方法分析、预测蛋白质结构,并以图形化的方式展示出来。
预测蛋白质结构。
各类方法按照科学概念进行分类。
几个方法可以同时存在于一个概念群中,如用于分析疏水性概念的方法就有好几种,不过有的概念只有一种方法可供选择,如柔韧性。
你可以按照任何顺序在Protean文件上展示各种方法计算的结果。
另外,Protean可以输入来自蛋白质数据库中标注序列特点,而且允许你注释新特点。
和其他Lasergene应用程序一样,Protean也提供整合的BLAST查找功能。
/.2创建蛋白质分析文件这一节,我们将为人的钙调蛋白序列创建一个新Protean分析文件。
从文件菜单选择New打开右面的对话框,然后打开名为“DemoSequences.”的文件夹。
双击“HumanCalmodulin”(或“HumanCalmodulin.pro”),这样就打开下面的分析文件窗口。
图1图2福建农业生物技术通讯93Proteans蛋白质分析方法打开序列后就是选择应用方法。
方法结果的图形显示可以帮助你选择感兴趣序列的特点。
对于我们打开的序列,你会发现只有下面方法中的几个被展示出来了,下列方法都可以使用:
Title-给文件取名。
Ruler-给文件加标尺。
Sequence-显示序列。
ProteaseMap-识别序列上的蛋白酶酶切位点,并且显示酶切图谱。
Patterns-Prosite数据库-在Prosite数据库中检索你的序列。
Patterns-Ariadne文件-在序列上寻找用户指定Patterns。
电荷密度-电荷-预测电荷在特定的序列范围上的分布。
二级结构-CoiledCoil-预测跨膜区的阿尔法螺旋。
二级结构-Garnier-Robson-计算特定氨基酸残基在特定结构内部的可能性。
二级结构Deleage-Roux-蛋白质的二级结构类型预测。
二级结构-Chou-Fasman-通过序列氨基酸残基的晶体结构来预测蛋白质二级结构。
Hydropathy-Goldman-Engleman-Steitz-预测可以跨过细胞膜的非极性阿尔法螺旋。
Hydropathy-Kyte-Doolittle-根据序列的氨基酸组成预测蛋白质的疏水区和亲水区。
Hydropathy-Hopp-Woods-通过计算蛋白质序列上的最大局部亲水性寻找蛋白质的抗原决定簇。
Antigenicity-SetteMHCMotifs-预测短肽上与老鼠MHCIId型蛋白质相互作用的抗原位点。
Antigenicity-AMPHI-根据序列预测免疫优势辅助性T淋巴细胞抗原位点。
Antigenicity-Rothbard-Taylor-预测含有特定基序(motif)的潜在T淋巴细胞抗原决定簇。
Antigenicity-Jameson-Wolf-通过联合现有的蛋白质结构预测方法预测潜在的蛋白质抗原决定簇。
Amphiphilicity-Eisenberg-预测EisenbergMoment。
表面可能性-Emini-预测特定区域位于蛋白质的表面的可能性。
柔韧性-Karplus-Schulz-预测蛋白质骨架区的柔韧性。
4分析方法应用应用新Protean方法的步骤是:
把所用方法从MoreMethods菜单移入方法帘,然后拖入分析窗口,基本上与前面介绍的GeneQuest方法相同。
在这一节中,我们将练习使用Deleage&
Roux分析方法预测蛋白质结构。
从分析菜单(ANALYSISMENU)选择ShowAvailable,或拖动分析窗口左上的小环打开方法帘。
方法帘中包括了全部已用于分析你的序列的方法。
你会发现Deleage&
Roux方法并不在其中。
从方法帘的顶端,点击MoreMethods打开下面的子菜单,里面有所有可以使用的方法。
从SecondaryStructure的子菜单中单击Deleage&
Roux,这样Deleage&
Roux就进入方法帘。
单击方法左边的三角形打开方法如右,如果有数字挨着图标,说明该方法已经被用于分析,否则没有被用于序列分析,数字的多少代表方法正在被使用的次数。
由于我们还没有把Deleage&
Roux用于序列分析,所以其左侧没有数字。
点击方法左边的空白区域去除对方法的选择。
然后单击“Alpha,Regions,”,并将它拖入分析窗口。
预测的蛋白质阿尔法螺旋区域即展示在分析窗口中。
图3图410第6卷2004(4)5改变方法参数下面我们改变Deleage&
Roux方法的参数,然后看一看参数改变前后这个方法预测的结果有什末不同。
重复上述操作将另一个Deleage&
Roux方法应用于分析窗口,并将两个Deleage&
Roux放在一起。
可以看出现在有两个完全相同的预测结果。
双击其中一个会打开一个参数对话框,选择A+B,单击同意。
此时在分析窗口上,相应的区域由于计算参数的改变立即发生相应变化。
现在你可以比较两个参数计算结果的差别。
此时,如果你把最初的方法再用于分析窗口,则改变的参数自动应用于新加入的方法。
)图56优化结果显示(与GeneQuest相似,这里省略)7使用蛋白酶消化与SDSPAGE电泳Protean可以识别蛋白序列上的蛋白酶酶切位点,并将酶切片段的电泳结果以图形展示出来。
从MoreMethods菜单中将Protease-ProteaseMap方法移动到方法帘。
单击挨着方法名字的蓝色三角形查看蛋白酶一览表。
点击方法左边的空白区域去除对蛋白酶的选择。
选择“Chymotrypsin”和“CNBr.”,将它们拖入分析窗口。
两种蛋白酶的识别位点显示如右。
现在至少一种蛋白酶被应用,我们可以模拟凝胶分离。
单击调色板工具中的范围选择器(RangeSelector)(箭图标)去除对应用的蛋白酶方法的选择。
从SITES&
FEATURES菜单,选择SDSPAGEGelSimulation。
酶切片段的分离结果会自动显示出来(如右)。
在每个上面凝胶柱对应蛋白酶的名字和分子量。
当光标在凝胶上面移动时,你可以随时查看到相应位置的蛋白质分子量。
移动光标到任何片段上。
窗口最上边的标题显示片段的范围,大小,分子量,等电点和HPLC滞留时间。
为了继续一节,关上SDSPAGEGelSimulation窗口。
图6图78Features注释(与GeneQuest中讲解的相似,这里从略)福建农业生物技术通讯119进行BLAST检索Protean允许你通过因特网或企业内部互联网进行序列数据库检索。
在这一节中,我们将在NCBI的BLAST服务器上检索与人的钙调蛋白序列相似的序列。
注意电脑必须与因特网相连接,否则,跳过这一的部分,继续下一部分。
单击调色板工具中的范围选择器(箭图标),在序列上选择你想进行检索的部分。
由于我们的序列比较短,所以我们选择全序列进行比较。
从EDITMENU选择SelectAll。
从网络检索菜单,选择BLAST查找。
BLAST对话框出现(如左),默认的数据库是nr。
单击同意开始查找。
BLAST结果显示为一个二分窗口(如下,结构、内容与相关操作参见GeneQuest的BLAST结果)。
现在我们选择三个BLAST序列,在Protean中打开他们。
在BLAST结果窗中选择一个结果。
单击CreateDocument,保存对话框窗打开(如左)。
从保存的下拉菜单选择Next(默认为Selected)。
在“Sequences.”的左边文本框输入数字“3”。
单击同意,打开三个新的选定序列的Protean的分析文件。
现在关上BLAST结果窗。
图8图910二级结构模拟Protean能够展示诸如螺旋轮,螺旋网和beta片层等基本元件的二级结构。
另外,它能以线性的space-fill样模型或者化学公式样模型展示蛋白质序列。
在这一节中,我们做一个阿尔法区域的螺旋轮二级结构。
二级结构Garnier-Robson方法已经应用于我们序列,阿尔法螺旋也已展示出来。
选定其中的一个阿尔法区域后,我们就能以螺旋轮展示其二级结构。
图10图11单击调色板工具中的范围选择器(箭图标)。
点击Protean文件最上边的Garnier-Robson分析结果中的一个阿尔法区域。
从分析菜单,选择ModelStructures中的HelicalWheel,就会出现左边的二级结构预测图。
为继续这一节,关上螺旋轮窗口。
12第6卷2004(4)11展示滴定曲线下面,我们将查看全蛋白质序列的滴定曲线。
单击Proteans调色板工具右边的白色空间。
这使得选择回到起始位置,如果没有选中的序列,在绘制滴定曲线时,Protean就会默认是对全序列进行计算。
从分析菜单,选择TitrationCurve。
打开序列的滴定曲线窗口(如上)。
Protean会在等电点处加一个蓝色的“crosshairs”,以显示pH和所带电荷(图11)。
12保存分析的文件(略)。
福建农业生物技术通讯13基因序列基因序列蛋白质配对软件软件MegAlign使用技术使用技术林营志,刘波,郑伟文,曹宜,苏明星,朱育菁,蓝江林,车建美,郑斯平,陈坚(福建省农科院生物技术中心)1MegAlign功能简介MegAlign提供6列队(aligment)方法,进行DNA和蛋白质序列的配对和多序列比较(multiplealigment)。
多序列比较(multiplealigment)可以在MegAlign的worktable进行查看和编辑。
可以根据队列(aligment)的结果制作进化树(Phylogenetictrees),并且,有关序列距离的数据和残基替代可以容易地作成表格。
一般多序列比较(multiplealigment)的结果展示于队列(aligment)窗口,相似性和差异用彩色的直方图展示。
和全部Lasergene的应用程序一样,MegAlign也提供整合的BLAST查找功能。
/.2创建队列文件MegAlign提供两种基本的队列方法:
配对比较和多序列比较。
配对比较可以比较任何2个选定的序列的相似性,而多序列比较对在W
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 序列 分析 软件 DNAStar 简介
![提示](https://static.bingdoc.com/images/bang_tan.gif)