南开大学生物化学基因部分.docx
- 文档编号:17021751
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:31
- 大小:37.12KB
南开大学生物化学基因部分.docx
《南开大学生物化学基因部分.docx》由会员分享,可在线阅读,更多相关《南开大学生物化学基因部分.docx(31页珍藏版)》请在冰点文库上搜索。
南开大学生物化学基因部分
第十二章基因组学与医学
第一节基因组学概念及研究范畴
基因组学概念
基因组(genome):
泛指一个细胞或一个生物体的全部遗传信息。
在真核生物,基因组是指一套(单倍体)染色体DNA。
基因组学(genomics):
从基因组水平(分子整体水平)研究遗传的学科。
主要是发展和应用DNA制图、测序新技术及计算机程序,分析生命体全部基因组的结构及功能。
人类基因组计划(HGP)及基因组学概念的提出
4人类基因组计划是由美国科学家于1985年率先提出、于1990年正式启动的。
旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。
4美国、英国、法国、德国、日本和中国科学家共同参与了这一价值达30亿美元的研究计划。
基因组学研究的常用方法
(1)脉冲场凝胶电泳(PFGE)
(2)毛细管电泳(3)基因芯片技术(4)全基因组测序(5)生物信息学(6)双向电泳(7)质谱
基因组学的主要研究内容
结构基因组学(structuralgenomics):
通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。
功能基因组学(functionalgenomics):
利用结构基因组学提供的信息,进行基因和非基因序列功能的研究。
比较基因组学(comparativegenomics):
比较不同生物间基因和基因组结构的差异,以增进对基因功能的了解、阐明物种进化关系。
一、基因组及其组织结构
“基因组(genome)”一词是1920年Winkles从GENes和chromosOMEs组成的。
泛指一个细胞或一个生物体的全部遗传信息。
在真核生物,基因组是指一套(单倍体)染色体DNA。
人类基因组是指人的24条染色体(22条常染色体+2条性染色体)内的全部DNA和线粒体DNA,其中蕴藏的信息决定了人类个体发育、生殖、生长、疾病、衰老、死亡等所有生命现象。
真核生物基因组的特点
1.基因组含有更大的DNA分子,以染色体形式储存于细胞核内,体细胞内的基因是双份的。
2.基因组结构复杂,有多个复制原点,但每个复制子的长度较小。
3.基因是不连续的。
4.转录单位一般是单顺反子。
即一个基因一种mRNA一种蛋白质,但蛋白质的最终产物可因剪接方式的不同而有差异(如Bcl-x:
Bcl-x1;Bcl-xs)
5.存在重复序列
v高度重复序列(>105次)
(1)卫星DNA(satellite):
+小卫星DNA(可变数目串联重复序列,VNTRs):
重复长度5-50bp,重复次数可变,有高度特异性。
+微卫星DNA(MS;又称简单串联重复序列,STRs):
重复长度1-4bp,主要为二核苷酸重复序列如(CA)n,存在个体间的高度变化,是DNA指纹的形成基础。
(2)倒位(反向)重复序列
(3)较复杂的重复单位组成的重复顺序
v中度重复序列(<105次)
重复片段长100-几千bp,编码细胞需要量大的分子
+rRNA基因:
重复数百次,可用作遗传标志。
+tRNA基因
+组蛋白基因
+Alu家族:
有3万个成员,平均每6kb就有一个,长度约300bp,因在170bp处有一AluⅠ位点(AG/CT)而得名。
具有种的特异性。
+KpnⅠ家族:
人和灵长类DNA经KpnⅠ酶解后,产生4个片段(1.2,1.5,1.8,1.9kb),被命名为KpnⅠ家族。
人类基因组中KpnⅠ序列约在3-6%,散在分布。
+单一序列
单拷贝,在基因组中占50-80%,人基因组中约有60-65%的单一序列。
6.基因类型多样
(1)断裂基因/不连续基因
(2)非剪接基因/连续基因(3)基因家族
多基因家族(multigenefamily):
亦称基因家族,是指一组具有类似功能,核苷酸序列又有同源性的基因。
超基因家族(supergenefamily):
由多基因家族及单基因组成的更大的基因家族。
成员间有不同程度的同源,但功能并不相似。
如Ig超家族。
(4)假基因:
在多基因家族中,不产生有功能产物的基因。
即序列与有功能的基因相似,但或者不能转录,或者转录后生成无功能的基因产物。
用Ψ表示。
假基因往往缺少正常基因的内含子,两侧有顺向重复序列。
(5)基因重叠
7、自私DNA(selfishDNA):
指非编码序列,包括分散的高度、中度重复序列,内含子和间隔序列等。
有些自私DNA通过转录mRNA,生成cDNA,再转位插入到基因组,有人称之为寄生DNA(parasiteDNA)。
☜但自私DNA并非毫无功能,可参与基因表达调控等。
8.DNA序列组织的可变性(基因组不稳定性)
(1)基因重排
(2)跳动(跃)基因(转座子):
可在DNA分子间进行转移的DNA片段。
通常只是把一个新合成的复本插入到另外的位置上,转移后仍保留原来位置上的DNA序列。
结构基因组学
Ø物理制图遗传制图基因组DNA序列测定创建计算机分析管理系统
基因组作图
Ø遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。
Ø根据使用的标志和手段不同,有4种作图类型:
遗传图谱、物理图谱、序列图谱、基因图谱。
人类基因组作图
1、遗传图(geneticmapping)/连锁图(linkagemap)
✧通过计算连锁的遗传标志之间的重组频率,确定连锁标志在染色体上的线性排列顺序及其相对遗传距离
距离单位:
厘摩(cM),1cM表示每次减数分裂的重组频率为1%
第一代DNA多态性标志:
限制性片段长度多态性(RFLPs)、随机引物扩增多态性(RAPD)、扩增片段长度多态性(AFLP)
v第二代DNA标志:
可变数目串联重复序列(VNTRs;又称小卫星)、短串联重复序列(STRs;又称微卫星,MS)
第三代DNA标志:
单核苷酸多态性(SNP)
2、物理作图(physicalmapping):
v确定遗传标志间的物理距离,一般用bp/kb/Mb表示。
v1cM的遗传距离大致上相当于1Mb的物理距离。
(1)荧光原位杂交图(FISHmap)
(2)限制性酶切图(restrictionmap):
Ø选用合适的限制性核酸内切酶对基因组DNA或部分基因组DNA进行酶切,获得以酶切位点为标记的物理图。
(3)辐射杂交细胞图(RHmap)
(4)连续克隆系(clonecontig)图:
是最重要的一种。
Ø序列标签位点(sequencetaggedsites,STSs):
在染色体上定位明确,而且可用PCR扩增的单拷贝序列,通常为200-500bp。
二、大规模测定基因组DNA序列
(LargeScaleDNASequencing)
1.基于BAC连续克隆系的测序2.全基因组的“鸟枪法”(shotgun)测序3.cDNA测序
三、DNA序列的生物信息学分析(BioinformaticsAnalysisofDNASequences)
1、遗传图谱(geneticmap)/连锁图谱(linkagemap)
指基因或DNA标志在染色体上的相对位置与遗传距离。
它以具有多态性的遗传标记为“路标”,以重组频率为图距的基因组图。
遗传图谱的建立为基因识别和完成基因定位创造了条件。
Ø遗传多态性:
在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%
Ø遗传标记:
等位基因、RFLP、MS、SNP等
Ø遗传距离:
在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1“厘摩(centi-Morgan,cM)”
限制性片段长度多态性(restrictionfragmentlengthpolymorphisms,RFLPs):
用一种或几种限制性内切酶切割基因组DNA,用探针杂交并放射自显影。
由于DNA酶切位点的变异所造成的“能切”与“不能切”两种状况,可产生不同长度的片段(等位片段),可用凝胶电泳显示多态性。
Ø数量可变串联重复(VNTR)/小卫星
Ø短串联重复(STR)/微卫星(MS):
使遗传图的精度提高;可作为物理图谱的标志,促进了遗传图谱与物理图谱的整合。
单核苷酸多态性(SingleNucleotidePolymorphisms,SNPs)不同个体间在基因水平上的单核苷酸变异。
平均每500~1000bp出现一个碱基差异,如果一个碱基位置发生的变异在1%以上的人群中存在,这个位点就被定义为SNP位点。
位于编码区的SNP称为cSNP。
2个无关个体间有300万SNPs.
2、物理图谱
指DNA序列上各遗传标志间的实际距离,是把遗传图谱中克隆群上的DNA片段按实际的物理位置进行排序所构建的图谱。
距离单位为bp/kb/Mb。
Ø物理图谱反映的是DNA序列上两点之间的实际距离,而遗传图谱则反映这两点之间的连锁关系。
Ø在DNA交换频繁的区域,两个物理位置相距很近的基因或DNA片段可能具有较大的遗传距离,反之亦然。
染色体显带技术:
通过各种染色法,以染色体上显示的深浅不同的带型确定DNA序列分布和位置,可区分107bp范围。
荧光原位杂交图(fluorescentinsituhybridizationmap,FISHmap):
用不同波长荧光标记的各种DNA序列(探针),与染色体上的互补序列杂交而不破坏染色体的整体形态,显微镜下观察、辨认荧光标记在染色体上的定位并绘制图谱。
辐射杂交细胞图(radiationhybridmap,RH):
利用X射线照射人细胞,使染色体随机断裂,然后与啮齿动物细胞杂交克隆,人的染色体片段便被整合到啮齿动物染色体上。
两个相邻基因或DNA标志的距离越近,越可能出现在同一片段,进入同一杂交细胞。
通过识别、定位技术和统计学分析,可计算人DNA标志的连锁关系及其在染色体上的排列。
ØHudsonTJ等构建的相隔199kb含有15086个STS图谱标志着人类基因组计划的物理图谱已初步完成。
2序列标签位点(sequencetaggedsites,STSs):
在染色体上定位明确,而且可用PCR扩增的单拷贝序列,通常为200-500bp。
3、序列图谱
以某一染色体上所含的全部碱基顺序绘制的图谱。
既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。
连续克隆系逐个克隆法(公共领域测序计划)
(1)建立插入人类基因组片段的酵母人工染色体(YAC)克隆群。
(2)利用高频分布、易于检索的DNA标志或者DNA指纹图谱建立克隆之间的联系,组成有序排列的连续克隆系,最常使用的DNA标志有STS和表达的序列标签(expressedsequencetag,EST)。
(3)将克隆群定位于染色体的不同区域,构成完全基因组物理图谱。
(4)进行次级克隆,序列分析。
全基因组鸟枪法(美国Celera公司)
✧直接将基因组分解成小片段随机测序,利用超级计算机进行组装
①用机械方法打断DNA,建立插入片段约2kb的高度随机基因组文库。
②高效、大规模的两末端测序。
③用有关软件对测序克隆片段进行序列集合。
④用适当方法填补缺口。
4、基因图谱
✧基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。
最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。
对基因转录表达产物mRNA互补的cDNA(其片段称为表达序列标签,EST)进行大规模测序是序列标签位点的主要来源,并以此构建人类基因组转录图(基因图)。
功能基因组学
Ø鉴定(注释)基因
Ø分析基因功能
Ø鉴定基因变异
Ø描述基因表达模式
Ø生物信息学
一、概念及特点
1.概念:
利用结构基因组学提供的信息,以高通量,大规模实验方法及统计与计算机分析为特征,全面系统地分析全部基因及其编码蛋白的功能。
包括:
生物学功能、细胞学功能、发育学功能等。
二、研究内容
1、鉴定DNA序列中的基因。
2、确定基因功能。
(1)利用同源搜索分析基因功能。
(2)实验分析基因功能。
3、描述基因表达模式:
基因表达的时空性
Ø转录组(transcriptome):
指一个细胞内的一套mRNA转录物,包含了在某一环境条件、某一生命阶段、某一生理或病理(功能)状态下,生命体的细胞或组织所表达的基因种类和水平。
Ø蛋白质组(proteome):
指一个细胞内的全套蛋白质,反映了特殊阶段、环境、状态下细胞或组织在翻译水平的蛋白质表达谱。
4、基因产物的结构与功能预测
5、人类基因组序列变异性
6、生物信息学
研究内容:
(一)基因的表达及其调控
Ø人类基因信息的识别和鉴定。
Ø基因功能的识别和鉴定。
Ø在全细胞的水平,识别所有基因组表达产物:
–mRNA:
cDNA阵列
–蛋白质:
二维电泳+质谱
Ø研究生物大分子相互作用:
阐明基因组表达的时、空的整体调控网络。
Ø功能蛋白质组学:
高通量解析蛋白质的高级结构,是连接基因组功能研究和新药开发的桥梁。
1、鉴定DNA序列中的基因
Ø计算机全基因组扫描,寻找ORF,确定多肽链序列。
Ø可译框(开放阅读框openreadingframes,ORF):
人类基因组序列中所有可能编码蛋白质的基因。
含有翻译的起始密码子、外显子及内含子剪接信号、翻译终止信号和3'poly(A)加尾信号。
Ø孤儿基因:
ORF中尚不完全了解的基因框架.
2、基因功能的识别与鉴定
✧同源搜索:
将ORFs预测的基因序列与数据库中基因序列资料进行比较,鉴定预测基因与已知(其他生物)基因序列的匹配程度,推测预测基因的某些功能。
✧根据该基因预测编码蛋白质的氨基酸序列,分析其功能结构域及可能的空间结构,再结合染色体定位,研究与同样定位在该染色体区带上的遗传性状或疾病的联系,确定其功能。
✧在实验动物中寻找它的同源基因,进行基因“敲除”,观察实验动物的生物学改变,以了解该基因的功能。
✧设计实验阻断基因表达,观察细胞和整体所发生的表型变化。
(1)基因转导技术
(2)反义核酸技术
(3)RNA干扰技术(RNAi):
v将一段dsRNA导入机体或细胞后,与它有同源序列的基因的表达被干扰或抑制。
(4)转基因动物技术
(5)基因敲出和基因敲入技术
(6)反向遗传学:
在已知基因序列的基础上研究基因的生物学规律。
通过功能丧失突变体研究其表型效应。
+传统遗传学(正向遗传学)主要研究自发或诱发突变体中某一性状的遗传行为,如控制突变性状的基因数目及其在染色体上的位置、突变性状在后代中的传递规律等。
+反向遗传学筛选到的突变体有时无突变表型效应:
突变表型效应需在特定环境中才表现;基因家族中其他基因功能的代偿。
3、描述基因表达模式
✧基因表达模式(geneexpressionpatterns)/基因表达谱(geneexpressionprofiles):
在细胞水平上全面评价基因的表达情况。
(1)转录组(transcriptome)与转录图谱
Ø转录图谱:
细胞在某一环境条件、生命阶段、生理或病理(功能)状态下的所有mRNA转录物,代表了特定时空生命体细胞或组织所表达的基因种类和水平。
Ø技术:
用已定位的YAC或BACDNA为探针,与所有可能相关的各组织cDNA文库杂交,寻找其同源克隆并做进一步分析。
(2)蛋白质组(proteome)与蛋白质图谱
蛋白质组学(Proteomics):
Ø研究细胞或组织基因表达的全部蛋白质(表达蛋白质组学,Expressionproteomics)
Ø通过细胞内蛋白质复合物研究蛋白质与蛋白质的相互作用(细胞作图蛋白质组学,Cell-mapproteomics)
主要蛋白质分离和鉴定技术:
Ø双向聚丙烯酰胺凝胶电泳(2D-PAGE)。
Ø激光解吸质谱、电喷雾质谱:
高效、精确地测量生物大分子的质量并进行部分测序。
Ø“肽质指纹图谱与肽序列标签”技术:
利用质谱快速、准确、自动化、大规模地鉴定蛋白质。
比较基因组学
比较基因组学涉及比较不同物种的整个基因组,以便深入理解每个基因组的功能和进化关系。
对模式生物和病原生物等进行全基因组序列分析。
迄今至少已有5种真核生物,38种微生物完成全基因组序列分析
通过对进化不同阶段的生物体基因组序列的比较,发现基因组结构组成和功能调节的规律
利用酵母、线虫、果蝇、斑马鱼、
小鼠等模式生物体进行基因的剔除
或转基因的研究,从而在整体
水平认识基因的功能。
第二节基因组学与医学(GenomicsandMedicine)
Ø筛选疾病相关基因
Ø基因检测
Ø药物设计
Ø基因治疗
人类基因组草图初步结论
Ø全部人类基因组约有2.91Gbp
Ø基因数量约3-4万(26383-39114)。
目前已定位了2.6万多个基因,但其中尚有42%的功能不明。
Ø人类基因组中存在“热点”和大片“荒漠”。
编码序列约占3%,非编码序列约占97%。
Ø35.3%的基因组包含重复的序列。
Ø人与人之间99.99%的基因密码是相同的。
Ø仅1%-1.5%的人类基因带有制造蛋白质的指令
Ø大约有223个基因可能是人类的脊椎动物祖先生存时由细菌插入的顺序。
Ø男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。
(二)人类基因组序列变异性及人类基因组多样性计划
现代人群的不均一性
传统人群和民族的划分
体质学特征
语言
文化历史背景
其他特征
问题:
现代人群的起源?
人群间的相互关系?
人群间差别的生物医学意义和遗传学基础?
人类基因组多样性计划
¡人类基因组多样性计划主要研究人类分子多态性和表型多样性的变化规律及不同群体和个体之间疾病易感性和抗性的差异原因。
从分子水平探索生物起源、进化的规律性。
¡FRLP、微卫星、SNP等分子多态是人类基因组多样性的遗传基础并与人类进化有密切联系。
线粒体DNA(mtDNA)在不同地区人群中具有一定的差异,人类的进化和亲缘关系与mtDNA密切相关,其研究结果支持人类起源于非洲祖先的结论。
DNA多态性
序列多态性(SNPs–单碱基多态性)
同源染色体5-GGTTTACACCTAA-
同源染色体5-GTTTTAAACCGAA-
长度多态性(VNTR-可变的串联重复顺序)
同源染色体5-AATCAATCAATC-
同源染色体5-AATCAATCAATCAATCAATC--
1985年Jeffreys
应用RFLP进行亲子鉴定,创建DNA指纹分析方法
人类遗传多态性的意义
Ø与性状相关;
Ø与疾病相关,可用于预测发病风险;
Ø个体医学发展的基础;
Ø可作为遗传标志,用于疾病连锁诊断;
Ø作为个人身份识别标识用于法医学。
(三)生物信息学(Bioinformatics)
✧生物信息学(bioinformatics):
用数理和信息科学的观点、理论和方法研究生命现象,组织和分析现今呈指数增长的生物学数据的一门科学。
该技术主要由数据库、计算机网络和应用软件组成。
✧对人类基因组计划的生物信息量必须借助生物信息学才能进行采集、管理、保存、检索、处理、利用、服务、应用、开发。
✧三大数据库:
EMBL(欧洲分子生物学实验室)、GenBank(美国国家生物情报中心,NCBI)、DDBJ(日本核酸数据库)。
✧大大提高了实验数据的处理速度并将改变传统实验科学的运作方式,使人类基因组计划和后基因组计划的进程大大加快。
第五节基因组学对医学的影响
–发现新的致病基因
–发展一些复杂疾病的早期基因诊断方法
–疾病易感基因的识别及对风险人群进行生活方式、环境因子的干预
–人类基因组多样性与个体化医学
–遗传多态性在身份识别方面的应用
–通过基因治疗解决传统方法无法解决的疑难杂症
–基因工程药物
–诊断和研究试剂产业:
基因和抗体试剂盒、生物芯片、疾病和筛药模型
–筛选新药和药物的靶点,分析药理过程
–进行药物设计,对基因蛋白产物的高级结构分析、预测、模拟药物作用“口袋”
–个体化药物治疗:
药物基因组学
–胚胎和成年期干细胞、克隆技术、器官再造
人类的疾病原因
内在因素(主要是遗传因素)外在因素(环境因素)外在因素+内在因素
一、“基因病”(GeneDisease)的概念
1、单基因病:
是指某种疾病的发生主要由一对等位基因的一个或两个基因位点存在缺陷而引起,其遗传方式遵循孟德尔遗传规律。
2、多基因病:
这类疾病发病的基因机制理十分复杂,涉及一个以上的等位基因以及基因与环境因素的相互作用,又称为多因子疾病。
3、获得性基因病:
这类疾病由病原微生物感染引起,不符合孟德尔遗传规律。
“基因病”概念:
–基因相关论:
所有疾病都与人类基因有关
–基因修饰论:
所有药物都是通过修饰基因本身结构、改变基因的表达调控、影响基因产物的功能而起作用的
–基因的多态性
除外伤外,所有的疾病,都可以说是基因病?
?
二、疾病相关基因的鉴定
1、SNPs筛选
2、染色体制图定位及疾病相关基因克隆
3、疾病相关基因表达谱筛选及疾病相关基因网络的确定
疾病相关基因的鉴定
1、定位克隆:
染色体制图克隆致病基因
2、候选克隆:
差异基因表达谱等筛选候选致病基因,确定疾病相关基因网络
3、定位候选克隆:
电脑分析定位中的候选基因
4、分子表型克隆:
SNPs等筛选致病基因
S功能克隆:
分析功能蛋白
三、基因检测(GeneTesting)
Ø基因检测:
适应分子医学发展需要产生的一种新型的个体基因异常检测手段,直接检测DNA。
1、法医鉴定
2、遗传病诊断:
携带者;疾病风险预测;产前诊断和新生儿筛查
3、感染病诊断
4、基因治疗
四、药物靶标和药物设计
Ø常见的药物靶标是细胞特定信号传导通路中的功能生物分子,如G蛋白偶联受体家族分子、蛋白酶、蛋白激酶、磷酸酶等。
Ø分泌型激素、生长因子、化学激酶、可溶性受体和诱饵既可作为药物,又可作为药物靶标。
Ø根据基因的特性为某个群体或个人设计药物。
五、环境与疾病
重要内容:
1.重要名词:
genome;genomics;humangenomeproject(HGP);bioinformatics;genetic/linkagemapping;physicalmapping;sequencetaggedsites(STSs);transcriptome;proteome
2.人类基因组计划的主要内容
3.功能基因组学的主要内容
4.遗传标记及其利用)
5.基因组学在医学中的应用
第十三章基因诊断与基因治疗
基因变异致病类型
内源基因的变异基因结构突变基因表达异常外源基因的入侵
第一节基因诊断
一、基因诊断的概念和特点
定义利用现代分子生物学和分子遗传学的技术和方法,直接检测基因结构及其表达水平是否正常,从而对疾病作出诊断的方法。
特点
针对性强特异性强灵敏度高适应性强
基因检测(GeneTesting)
Ø基因检测:
适应分子医学发展需要产生的一种新型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 南开大学 生物化学 基因 部分
![提示](https://static.bingdoc.com/images/bang_tan.gif)