RAID.docx
- 文档编号:15576355
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:12
- 大小:54.09KB
RAID.docx
《RAID.docx》由会员分享,可在线阅读,更多相关《RAID.docx(12页珍藏版)》请在冰点文库上搜索。
RAID
RAID
目录·概述
·RAID的工作原理
·技术规范
·RAID的应用
概述
RAID是“RedundantArrayofIndependentDisk”的缩写,中文意思是独立冗余磁盘阵列。
冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。
RAID磁盘阵列(RedundantArrayofIndependentDisks)
简单地解释,就是将N台硬盘透过RAIDController(分Hardware,Software)结合成虚拟单台大容量的硬盘使用,其特色是N台硬盘同时读取速度加快及提供容错性FaultTolerant,所以RAID是当成平时主要访问Data的Storage不是BackupSolution。
在RAID有一基本概念称为EDAP(ExtendedDataAvailabilityandProtection),其强调扩充性及容错机制,也是各家厂商如:
Mylex,IBM,HP,Compaq,Adaptec,Infortrend等诉求的重点,包括在不须停机情况下可处理以下动作:
RAID磁盘阵列支援自动检测故障硬盘;
RAID磁盘阵列支援重建硬盘坏轨的资料;
RAID磁盘阵列支援支持不须停机的硬盘备援HotSpare;
RAID磁盘阵列支援支持不须停机的硬盘替换HotSwap;
RAID磁盘阵列支援扩充硬盘容量等。
一旦RAID阵列出现故障,硬件服务商只能给客户重新初始化或者REBUILD,这样客户数据就会无法挽回。
我们对RAID0、RAID1、RAID5以及组合型的RAID系列磁盘阵列数据恢复具有丰富的实践经验,出现故障以后只要不对阵列作初始化操作,我们就有能力恢复出故障RAID磁盘阵列的数据。
RAID的工作原理
RAID如何实现数据存储的高稳定性呢?
我们不妨来看一下它的工作原理。
RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的。
整个的RAID结构是一些磁盘结构,通过对磁盘进行组合达到提高效率,减少错误的目的,不要因为这么多名词而被吓坏了,它们的原理实际上十分简单。
问了便于说明,下面示意图中的每个方块代表一个磁盘,竖的叫块或磁盘阵列,横称之为带区。
技术规范
(1)RAID技术规范简介
冗余磁盘阵列技术最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。
过去RAID一直是高档服务器才有缘享用,一直作为高档SCSI硬盘配套技术作应用。
近来随着技术的发展和产品成本的不断下降,IDE硬盘性能有了很大提升,加之RAID芯片的普及,使得RAID也逐渐在个人电脑上得到应用。
那么为何叫做冗余磁盘阵列呢?
冗余的汉语意思即多余,重复。
而磁盘阵列说明不仅仅是一个磁盘,而是一组磁盘。
这时你应该明白了,它是利用重复的磁盘来处理数据,使得数据的稳定性得到提高。
(2)RAID技术
主要包含RAID0~RAID7等数个规范,它们的侧重点各不相同,常见的规范有如下几种:
RAID0:
无差错控制的带区组
要实现RAID0必须要有两个以上硬盘驱动器,RAID0实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。
因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。
如果刚好所需要的数据在不同的驱动器上效率最好。
它不需要计算校验码,实现容易。
它的缺点是它没有数据差错控制,如果一个驱动器中的数据发生错误,即使其它盘上的数据正确也无济于事了。
不应该将它用于对数据稳定性要求高的场合。
如果用户进行图象(包括动画)编辑和其它要求传输比较大的场合使用RAID0比较合适。
同时,RAID可以提高数据传输速率,比如所需读取的文件分布在两个硬盘上,这两个硬盘可以同时读取。
那么原来读取同样文件的时间被缩短为1/2。
RAID0
目录·RAID0简介
·RAID0的工作原理
·RAID0的优缺点
·RAID技术及发展趋势探讨
·4种磁盘阵列
RAID0简介
RAID0又称为Stripe或Striping,它代表了所有RAID级别中最高的存储性能。
RAID0提高存储性能的原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。
这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。
RAID是英文RedundantArrayofInexpensiveDisks的缩写,中文简称为廉价磁盘冗余阵列。
RAID就是一种由多块硬盘构成的冗余阵列。
虽然RAID包含多块硬盘,但是在操作系统下是作为一个独立的大型存储设备出现。
利用RAID技术于存储系统的好处主要有以下三种:
1.通过把多个磁盘组织在一起作为一个逻辑卷提供磁盘跨越功能;
2.通过把数据分成多个数据块(Block)并行写入/读出多个磁盘以提高访问磁盘的速度;
3.通过镜像或校验操作提供容错能力。
最初开发RAID的主要目的是节省成本,当时几块小容量硬盘的价格总和要低于大容量的硬盘。
目前来看RAID在节省成本方面的作用并不明显,但是RAID可以充分发挥出多块硬盘的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。
除了性能上的提高之外,RAID还可以提供良好的容错能力,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。
RAID技术分为几种不同的等级,分别可以提供不同的速度,安全性和性价比。
根据实际情况选择适当的RAID级别可以满足用户对存储系统可用性、性能和容量的要求。
常用的RAID级别有以下几种:
NRAID,JBOD,RAID0,RAID1,RAID0+1,RAID3,RAID5等。
目前经常使用的是RAID5和RAID(0+1)。
RAID0的工作原理
如图所示:
系统向三个磁盘组成的逻辑硬盘(RADI0磁盘组)发出的I/O数据请求被转化为3项操作,其中的每一项操作都对应于一块物理硬盘。
我们从图中可以清楚的看到通过建立RAID0,原先顺序的数据请求被分散到所有的三块硬盘中同时执行。
从理论上讲,三块硬盘的并行操作使同一时间内磁盘读写速度提升了3倍。
但由于总线带宽等多种因素的影响,实际的提升速率肯定会低于理论值,但是,大量数据并行传输与串行传输比较,提速效果显著显然毋庸置疑。
RAID0的优缺点
RAID0的缺点是不提供数据冗余,因此一旦用户数据损坏,损坏的数据将无法得到恢复。
RAID0具有的特点,使其特别适用于对性能要求较高,而对数据安全不太在乎的领域,如图形工作站等。
对于个人用户,RAID0也是提高硬盘存储性能的绝佳选择。
RAID技术及发展趋势探讨
随着计算机技术的发展,CPU的处理速度成几何级数跃升,内存的存取速度亦大幅增加,而磁盘的存取速度相比之下则显得甚为缓慢。
整个I/O吞吐量不能和系统匹配,形成计算机整个系统的瓶颈,降低了计算机的整体性能。
为了改进磁盘的存取速度,大型服务器的磁盘多采用RAID技术(RedundantArrayofInexpensiveDisks,廉价冗余磁盘阵列)。
RAID技术把多个物理磁盘组成一个阵列,作为一个逻辑磁盘组,将数据以分段的方式存储在这个逻辑磁盘组的不同物理磁盘上,进行数据存取时,阵列中的相关磁盘并行工作,大幅减低了数据存取的时间,同时有更佳的空间利用率。
RAID技术发展的很大原因在于:
许多大型机构的数据十分宝贵,如银行的存取款信息、电信的收费记录、国税局的纳税人档案等,这些机构在实施企业信息化时,就要考虑到数据的安全性。
目前,很多服务器都会不间断地工作,由于长时间服役,一些磁盘会出现故障,如果没有保护措施,大量重要数据就会丢失。
在这种情况下,磁盘阵列的容错功能可以保护这些重要数据的安全。
为了加强容错功能以及使系统在磁盘故障的情况下能迅速地重建数据,以维持系统的性能,一般的磁盘阵列系统都使用热备份的功能。
所谓热备份,是在建立磁盘阵列系统时,将其中一个磁盘指定为后备磁盘,这个磁盘在平常并不操作,当阵列中某一个磁盘发生故障时,磁盘阵列立即让后备磁盘取代故障磁盘,并自动将故障磁盘的数据重建在后备磁盘之上,因为反应快速,加上内存减少了磁盘的存取,所以数据重建很快便能完成,对系统的性能影响不大。
对于要求不停机的大型数据处理中心或控制中心,热备份更是一项重要的功能,因为它可避免晚间或无人守护时发生磁盘故障所引起的种种不便。
4种磁盘阵列
RAID是一种工业标准,各厂商对RAID级别的定义也不尽相同。
目前对RAID级别的定义可以获得业界广泛认同的有4种:
RAID0、RAID1和RAID5和RAID7。
其中RAID0:
没有容错设计的条带磁盘阵列。
RAID1:
镜象结构
对于使用这种RAID1结构的设备来说,RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。
通过下面的结构图您也可以看到必须有两个驱动器。
因为是镜象结构在一组盘出现问题时,可以使用镜象,提高系统的容错能力。
它比较容易设计和实现。
每读一次盘只能读出一块数据,也就是说数据块传送速率与单独的盘的读取速率相同。
因为RAID1的校验十分完备,因此对系统的处理能力有很大的影响,通常的RAID功能由软件实现,而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。
当您的系统需要极高的可靠性时,如进行数据统计,那么使用RAID1比较合适。
而且RAID1技术支持“热替换”,即不断电的情况下对故障磁盘进行更换,更换完毕只要从镜像盘上恢复数据即可。
当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。
镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,但带来的后果是硬盘容量利用率很低,只有50%,是所有RAID级别中最低的。
RAID1
目录·raid1简介
·raid1的工作原理
·raid1的优缺点
·raid1的制作
raid1简介
RAID1又称为Mirror或Mirroring(镜像),它的宗旨是最大限度的保证用户数据的可用性和可修复性。
RAID1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。
raid1的工作原理
如图所示:
当读取数据时,系统先从RAID1的源盘读取数据,如果读取数据成功,则系统不去管备份盘上的数据;如果读取源盘数据失败,则系统自动转而读取备份盘上的数据,不会造成用户工作任务的中断。
当然,我们应当及时地更换损坏的硬盘并利用备份数据重新建立Mirror,避免备份盘在发生损坏时,造成不可挽回的数据损失。
raid1的优缺点
由于对存储的数据进行百分之百的备份,在所有RAID级别中,RAID1提供最高的数据安全保障。
同样,由于数据的百分之百备份,备份数据占了总存储空间的一半,因而Mirror(镜像)的磁盘空间利用率低,存储成本高。
Mirror虽不能提高存储性能,但由于其具有的高数据安全性,使其尤其适用于存放重要数据,如服务器和数据库存储等领域。
raid1的制作
前提:
选购好一点的raid卡,主流产品为台湾的promisefasttrak100价格在320左右,支持raid0、1、0+1,自己用可以用差一点,例如promisesmart什么的,才要130元。
1.物理联接:
二个硬盘都要跳成主盘分别用数据线(最好是RAID卡自带的)接到RAID卡的IDE1、IDE2上,
2.接好并插到服务器上开机会检测到RAID卡的状态的,出现“NoArrayisdefined......”,表示没有建立任何RAID方式,
3.此时按下CTRL+F,
4.进入操作界面,
5.按下[1]AutoSetup,
6.进入到[AutoSetupOptionsMenu]中,
7.利用左右方向键或空格键,
8.将OptimizeArrayfor:
设成Security这项,
9.然后按下CTRL+Y保存,
10.出现确定选项,
11.按Y继续,
12.选择源盘,
13.请[PleaseSelectASourceDisk]中将亮条移动到源盘上按下ENTER按键,
14.准备插入软盘,
15.建立镜像,
16.按Y继续,
17.制作要一个过程,18.40G要20分钟左右,
19.80G要40分钟左右,
20.完成了,
21.按下任意键重启,
22.重启后看到如下画面,array...
23.表示RIAD建立正常,
24.正常建立以后,要用sfdisk分区,
25.安装操作系统时会提示有没有SCSI设备,在此时按下功能键F6什么的。
安装promise的驱动(自带的那两张软盘),然后正常安装即可。
RAID2:
带海明码校验
从概念上讲,RAID2同RAID3类似,两者都是将数据条块化分布于不同的硬盘上,条块单位为位或字节。
然而RAID2使用一定的编码技术来提供错误检查及恢复。
这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID2技术实施更复杂。
因此,在商业环境中很少使用。
下图左边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上,具体情况请见下图。
由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。
它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码ECC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。
没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。
输出数据的速率与驱动器组中速度最慢的相等。
RAID3:
带奇偶校验码的并行传送
这种校验码与RAID2不同,只能查错不能纠错。
它访问数据时一次处理一个带区,这样可以提高读取和写入速度。
校验码在写入数据时产生并保存在另一个磁盘上。
需要实现时用户必须要有三个以上的驱动器,写入速率与读出速率都很高,因为校验位比较少,因此计算时间相对而言比较少。
用软件实现RAID控制将是十分困难的,控制器的实现也不是很容易。
它主要用于图形(包括动画)等要求吞吐率比较高的场合。
不同于RAID2,RAID3使用单块磁盘存放奇偶校验信息。
如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。
如果奇偶盘失效,则不影响数据使用。
RAID3对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。
RAID3
RAIDLevel3采用Byte-interleaving(数据交错存储)技术,它需要通过编码再将数据位元分割后分别存在硬盘中,而将同位元检查后单独存在一个硬盘中,但由于数据内的位元分散在了不同的硬盘上,因此就算要读取一小段数据资料都可能需要所有的硬盘进行工作,所以这种规格比较适于读取大量数据时使用
RAID4:
带奇偶校验码的独立磁盘结构
RAID4和RAID3很象,不同的是,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。
在图上可以这么看,RAID3是一次一横条,而RAID4一次一竖条。
它的特点的RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
RAID5:
分布式奇偶校验的独立磁盘结构
从它的示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的p0代表第0带区的奇偶校验值,其它的意思也相同。
RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
因为奇偶校验码在不同的磁盘上,所以提高了可靠性。
但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID3与RAID5相比,重要的区别在于RAID3每进行一次数据传输,需涉及到所有的阵列盘。
而对于RAID5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。
在RAID5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。
RAID5
RAID5是一种存储性能、数据安全和存储成本兼顾的存储解决方案。
以四个硬盘组成的RAID5为例,其数据存储方式如图4所示:
图中,P0为D0,D1和D2的奇偶校验信息,其它以此类推。
由图中可以看出,RAID5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。
当RAID5的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。
RAID5可以理解为是RAID0和RAID1的折衷方案。
RAID5可以为系统提供数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。
RAID5具有和RAID0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。
同时由于多个数据对应一个奇偶校验信息,RAID5的磁盘空间利用率要比RAID1高,存储成本相对较低。
RAID6:
带有两种分布存储的奇偶校验码的独立磁盘结构
名字很长,但是如果看到图,大家立刻会明白是为什么,请注意p0代表第0带区的奇偶校验值,而pA代表数据块A的奇偶校验值。
它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合。
当然了,由于引入了第二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。
我想除了军队没有人用得起这种东西。
RAID7:
优化的高速数据传送磁盘结构
RAID7所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性,提高系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。
允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。
可以连接多台主机,因为加入高速缓冲存储器,当多用户访问系统时,访问时间几乎接近于0。
由于采用并行结构,因此数据访问效率大大提高。
需要注意的是它引入了一个高速缓冲存储器,这有利有弊,因为一旦系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作。
当然了,这么快的东西,价格也非常昂贵。
RAID10:
高可靠性与高效磁盘结构
这种结构无非是一个带区结构加一个镜象结构,因为两种结构各有优缺点,因此可以相互补充,达到既高效又高速还可以的目的。
大家可以结合两种结构的优点和缺点来理解这种新结构。
这种新结构的价格高,可扩充性不好。
主要用于容易不大,但要求速度和差错控制的数据库中。
RAID10
RAID10也被称为镜象阵列条带。
象RAID0一样,数据跨磁盘抽取;象RAID1一样,每个磁盘都有一个镜象磁盘。
RAID10提供100%的数据冗余,支持更大的卷尺寸,但价格也相对较高。
对大多数只要求具有冗余度而不必考虑价格的应用来说,RAID10提供最好的性能。
使用RAID10,可以获得更好的可靠性,因为即使两个物理驱动器发生故障(每个阵列中一个),数据仍然可以得到保护。
RAID10需要4个磁盘驱动器,而且只能通过HPNetRaid磁盘控制器实现。
RAID53:
高效数据传送磁盘结构
越到后面的结构就是对前面结构的一种重复和再利用,这种结构就是RAID3和带区结构的统一,因此它速度比较快,也有容错功能。
但价格十分高,不易于实现。
这是因为所有的数据必须经过带区和按位存储两种方法,在考虑到效率的情况下,要求这些磁盘同步真是不容易。
RAID0+1:
把RAID0和RAID1技术结合起来,即RAID0+1。
数据除分布在多个盘上外,每个盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读/写能力。
要求至少4个硬盘才能作成RAID0+1。
RAID0+1
把RAID0和RAID1技术结合起来,即RAID0+1。
数据除分布在多个盘上外,每个盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读/写能力。
要求至少4个硬盘才能作成RAID0+1。
(3)JBOD模式
JBOD通常又称为Span。
它是在逻辑上将几个物理磁盘一个接一个连起来,组成一个大的逻辑磁盘。
JBOD不提供容错,该阵列的容量等于组成Span的所有磁盘的容量的总和。
JBOD严格意义上说,不属于RAID的范围。
不过现在很多IDERAID控制芯片都带着种模式,JBOD就是简单的硬盘容量叠加,但系统处理时并没有采用并行的方式,写入数据的时候就是先写的一块硬盘,写满了再写第二块硬盘……
JBOD
JBOD(JustBundleOfDisks)译成中文可以是"简单磁盘捆绑"或者“磁盘簇”,通常又称为Span。
JBOD不是标准的RAID级别,它只是在近几年才被一些厂家提出,并被广泛采用。
以三个硬盘组成的Span为例,其数据存储方式如图所示:
Span是在逻辑上把几个物理磁盘一个接一个串联到一起,从而提供一个大的逻辑磁盘。
Span上的数据简单的从第一个磁盘开始存储,当第一个磁盘的存储空间用完后,再依次从后面的磁盘开始存储数据。
Span存取性能完全等同于对单一磁盘的存取操作。
Span也不提供数据安全保障。
它只是简单的提供一种利用磁盘空间的方法,Span的存储容量等于组成Span的所有磁盘的容量的总和。
如图例.
(4)我们能够用得上的IDERAID
上面是对RAID原理的叙述,而我们Pcfans最关心的是RAID的应用。
我们日常使用IDE硬盘,而且很容易买到IDERAID卡和集成RAID芯片的主板。
所以跟我们最贴近的是IDERAID。
限于应用级别很低,IDERAID多数只支持RAID0,RAID1,RAID0+1,JBOD模式。
RAID的应用
开始时RAID方案主要针对SCSI硬盘系统,系统成本比较昂贵。
1993年,HighPoint公司推出了第一款IDE-RAID控制芯片,能够利用相对廉价的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- RAID
![提示](https://static.bingdoc.com/images/bang_tan.gif)