人的B7H3蛋白3D建模Word文档格式.docx
- 文档编号:4453959
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:43
- 大小:2.67MB
人的B7H3蛋白3D建模Word文档格式.docx
《人的B7H3蛋白3D建模Word文档格式.docx》由会员分享,可在线阅读,更多相关《人的B7H3蛋白3D建模Word文档格式.docx(43页珍藏版)》请在冰点文库上搜索。
建模序列25
通过PSI-BLAST搜索同源25
通过mgenthreader进行折叠相似搜索26
通过ProDom划分domain27
通过Modeller进行蛋白三维模拟28
附录36
之前的2RCJ序列与4ig比对情况部分截图36
3bis与human_b7h3_4ig_cyt-out序列和比对信息41
一、序列获取
Name
TranscriptID
Length(bp)
ProteinID
Length(aa)
Biotype
CCDS
CD276-001
ENST00000318424
2815
ENSP00000320058
316
ProteincodingAproteincodingtranscriptisasplicedmRNAthatleadstoaproteinproduct.
CCDS10251
CD276-002
ENST00000318443
3469
ENSP00000320084
534
CCDS32288
CD276-201
ENST00000379823
1614
ENSP00000369151
493
-
Human_b7h3_2ig序列
>
ENST00000318424peptide:
ENSP00000320058pep:
KNOWN_protein_coding
MLRRRGSPGMGVHVGAALGALWFCLTGALEVQVPEDPVVALVGTDATLCCSFSPEPGFSL
AQLNLIWQLTDTKQLVHSFAEGQDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSF
TCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYRGYPEAEVFWQD
GQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVRNPVLQQDAHGSVTITGQ
PMTFPPEALWVTVGLSVCLIALLVALAFVCWRKIKQSCEEENAGAEDQDGEGEGSKTALQ
PLKHSDSKEDDGQEIA
Human_b7h3_4ig序列
ENST00000318443peptide:
ENSP00000320084pep:
TCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYQGYPEAEVFWQD
GQGVPLTGNVTTSQMANEQGLFDVHSILRVVLGANGTYSCLVRNPVLQQDAHSSVTITPQ
RSPTGAVEVQVPEDPVVALVGTDATLRCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFTEG
RDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPY
SKPSMTLEPNKDLRPGDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLF
DVHSVLRVVLGANGTYSCLVRNPVLQQDAHGSVTITGQPMTFPPEALWVTVGLSVCLIAL
LVALAFVCWRKIKQSCEEENAGAEDQDGEGEGSKTALQPLKHSDSKEDDGQEIA
二、Human_b7h3_2ig蛋白三维建模过程
通过SingalP预测信号肽
网址http:
//www.cbs.dtu.dk/services/SignalP/
从以上结果可以发现存在信号肽序列部分,三维建模时需要去除掉该段序列,即去除信号肽序列(MLRRRGSPGMGVHVGAALGALWFCLTGA)得到的处理序列如下:
human_b7h3_2ig
LEVQVPEDPVVALVGTDATLCCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFAEGQDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVRNPVLQQDAHGSVTITGQPMTFPPEALWVTVGLSVCLIALLVALAFVCWRKIKQSCEEENAGAEDQDGEGEGSKTALQPLKHSDSKEDDGQEIA
通过SOSUI预测膜蛋白和跨膜区
网址:
http:
//bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html
)
建模序列
从上面结果得到胞外序列进行建模如下:
human_b7h3_2ig_cyt-out
LEVQVPEDPVVALVGTDATLCCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFAEGQDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVRNPVLQQDAHGSVTITGQPMTFPPE
通过PSI-BLAST搜索同源
//blast.ncbi.nlm.nih.gov/Blast.cgi?
PROGRAM=blastp&
BLAST_PROGRAMS=blastp&
PAGE_TYPE=BlastSearch&
SHOW_DEFAULTS=on&
LINK_LOC=blasthome
通过mgenthreader进行折叠相似搜索
//bioinf4.cs.ucl.ac.uk:
3000/psipred/result/49728
结构比对图:
经过NCBI查询,3bisA与3bikA为相同的序列,即3BIS与3BIK他们的A链相同,信息如下:
//www.ncbi.nlm.nih.gov/sites/entrez?
cmd=Retrieve&
db=protein&
dopt=GenPept&
RID=Z1P9NW9B01N&
log%24=prottop&
blast_rank=2&
list_uids=168988884
PDB:
3BISA
ChainA,CrystalStructureOfThePd-L1
gi|168988887|pdb|3BIS|AChainA,CrystalStructureOfThePd-L1
AFTVTVPKDLYVVEYGSNMTIECKFPVEKQLDLAALIVYWEMEDKNIIQFVHGEEDLKVQHSSYRQRARL
LKDQLSLGNAALQITDVKLQDAGVYRCMISYGGADYKRITVKVNAPYNKINQRILVVDPVTSEHELTCQA
EGYPKAEVIWTSSDHQVLSGKTTTTNSKREEKLFNVTSTLRINTTTNEIFYCTFRRLDPEENHTAELVIP
ELPLAHPPNERT
3BIKA
ChainA,CrystalStructureOfThePd-1PD-L1Complex
gi|168988884|pdb|3BIK|AChainA,CrystalStructureOfThePd-1PD-L1Complex
通过Modeller进行蛋白三维模拟
//www.uohyd.ernet.in/modellergui/
(一)、3bik.pdb为模板(DOPEscore较下面低,理论上好点)
首先以下载的3bik.pdb为模板,进行建模,结果如下:
此图黄色区域结构显示的是3bik中A链的三维结构
当以上面的3bik为模板,对human_b7h3_2ig_cyt-out序列进行三维建模,结果如下:
第一步:
performalignmentresult:
_aln.pos102030405060
template1AAFTVTVPKDLYVVEYGSNMTIECKFPVEKQLDLAALIVYWEMEDKNIIQFVHGEEDLKVQHSSYRQ
query-LEVQVPEDPVVALVGTDATLCCSFSPEPGFSLAQLNLIWQL--TDTKQLVHSFAEGQDQGSAYAN
_consrvd********************
_helix99999
_beta99999999999999999999999999999999
_aln.pos708090100110120130
template1ARARLLKDQLSLGNAALQITDVKLQDAGVYRCMISYGGADYKRITVKVNAPYNKINQRILVVDPV--
queryRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRP
_consrvd******************
_helix99999999
_beta999999999999999999999999999999999999999
_aln.pos140150160170180190
template1ATSEHELTCQA-EGYPKAEVIWTSSDHQVLSGKTTTTNSKREEKLFNVTSTLRINTTTNEIFYCTFR
queryGDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVR
_consrvd***********************
_helix
_beta99999999999999999999999999999999999999999999999999
_aln.pos200210220
template1ARLDPEENHTAELVIPE--L-----
queryNPVLQQDAHGSVTITGQPMTFPPE
_consrvd*
_beta99999999999999
第二步:
generatemodelresult:
(勾选includehetroatom)
得到初步的建模序列文件query.B99990001.pdb
第三步:
Automaticloopmodelling:
得到进一步优化模型query.BL00010001.pdb
第四步:
modeoptimization(模型进一步动力学优化performitsdynamics!
)结果:
(二)、3bis.pdb为模板
此图黄色区域结构显示的是3bis中A链的三维结构
当以上面的3bis为模板,对human_b7h3_2ig_cyt-out序列进行三维建模,结果如下:
template1AFTVTVPKDLYVVEYGSNMTIECKFPVEKQLDLAALIVYWEMEDKNIIQFVHGEEDLKVQHSSYRQR
queryLEVQVPEDPVVALVGTDATLCCSFSPEPGFSLAQLNLIWQL--TDTKQLVHSFAEGQDQGSAYANR
_consrvd*********************
_beta999999999999999999999999999999
template1AARLLKDQLSLGNAALQITDVKLQDAGVYRCMISYGGADYKRITVKVNAPYNKINQRILVVDPV--T
queryTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPG
_consrvd*****************
_beta999999999999999999999999999999999999999
template1ASEHELTCQA-EGYPKAEVIWTSSDHQVLSGKTTTTNSKREEKLFNVTSTLRINTTTNEIFYCTFRR
queryDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVRN
_beta99999999999999999999999999999999999999999999999999
template1ALDPEENHTAELVIPE----LP--
queryPVLQQDAHGSVTITGQPMTFPPE
_consrvd**
_beta9999999999999
得到advanced.pdb.D99990000.pdb文件
三、Human_b7h3_4ig蛋白三维建模过程
human_b7h3_4ig
LEVQVPEDPVVALVGTDATLCCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFAEGQDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYQGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSILRVVLGANGTYSCLVRNPVLQQDAHSSVTITPQRSPTGAVEVQVPEDPVVALVGTDATLRCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFTEGRDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVRNPVLQQDAHGSVTITGQPMTFPPEALWVTVGLSVCLIALLVALAFVCWRKIKQSCEEENAGAEDQDGEGEGSKTALQPLKHSDSKEDDGQEIA
3000/psipred/result/55013
human_b7h3_4ig_cyt-out
LEVQVPEDPVVALVGTDATLCCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFAEGQDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYQGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSILRVVLGANGTYSCLVRNPVLQQDAHSSVTITPQRSPTGAVEVQVPEDPVVALVGTDATLRCSFSPEPGFSLAQLNLIWQLTDTKQLVHSFTEGRDQGSAYANRTALFPDLLAQGNASLRLQRVRVADEGSFTCFVSIRDFGSAAVSLQVAAPYSKPSMTLEPNKDLRPGDTVTITCSSYRGYPEAEVFWQDGQGVPLTGNVTTSQMANEQGLFDVHSVLRVVLGANGTYSCLVRNPVLQQDAHGSVTITGQPMTFPPE
3000/psipred/
通过ProDom划分domain
//prodom.prabi.fr/prodom/current/cgi-bin/request.pl?
SSID=1275614364_3305&
db_ent1=PD985010
因为3bis对应的两条链三维结构3bisA与3bisB同查询的B7H3_4ige-value数值都等于0,
且在前面的mgenthreader结果中3bis也排在比较前位置,故而选3bis为模板进行建模。
3bis.pdb为模板
Manualloopmodelling:
因为2ig与4ig序列不同的7个碱基RSPTGAV其比对模板序列中1igt有一段与其相近,而1igt在mgenthreader结果中存在,也与其是结构相似序列,因此选取它来修饰模板序列3bis中缺失的该段结构。
考虑到整个二级结构比较近似,后面也将会以1igt为模板在进行下建模比较。
模型最后一段,如上显示,在二级结构预测中应该是跨膜区
在DOPEscore(为负数)上通常是越小模型较好,上面的得分值为-31512….
下面的为-28188.,因此理论上可能这个模型比下面的稍好。
1igt.pdb为模板
这一段也正好是跨膜区,不过感觉显然其跨膜区段包含了太多IgC的序列
以下是不同的RSPTGAV在模型上的结构位置显示,根据前面的domain分析,这里是个受体结合位点部位可能性较高。
附录
之前的2RCJ序列与4ig比对情况部分截图
2RCJ
EVQLVQSGGGVVQPGRSLRLSCSSSGFI
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- B7H3 蛋白 建模
![提示](https://static.bingdoc.com/images/bang_tan.gif)