现在的位置: 首页 > 自动控制 > 工业·编程 > 正文

试论存储设备历史源流

2013-04-20 08:45 工业·编程 ⁄ 共 11046字 ⁄ 字号 暂无评论
        由于公司业务的关系,本人接触存储设备已经有段时间了,也看了先人前辈们关于存储设备的心得体会。现将自己所学所得汇聚成文,非为上品,只想将所学零散的知识通过本文的编写得到疏理。使慨念更加清晰,也想为以后的学习工作,及了解存储本源找到方向。
         之前我拜读并参考了《大话存储》一书,从盘古开天讲到现在,从上古神话时代人们如何存储信息说到当今社会存储设备,每个知识点的讲解角度都是标新立意,这位仁兄可谓大才,余以为此书受"博大精深"四字亦不为过,不胜钦佩向往之。同样事物每个人所讲角度与方向不同,如果让我也从神话时代说起,那没准就真说成神话故事了。所谓这个切入点我想从硬盘说起,现在PC的普及率就不用说了,基本家家必备,那么有PC必有硬盘,我就从硬盘开始说。而且本文也并不想写成像"资治通鉴"一样的编年体史书,那些什么哪年谁谁谁发明了什么东东,虽说前事不忘后事之师,我想我们应该记住的是前事的因果而并非死记年限。还有,存储设备所涉及到的知识点很多,如硬盘原理、接口、文件共享等等很多很多,说到的时候会用简练的语言提及一些,但不会主要细说哪一块,真要那样一篇文章得写个好几年。好了,闲言少叙,书归正传!

         硬盘,基本上家里有PC的都知道硬盘,做什么用的,都知道存数据用的。它怎么来存呢,这就涉及到硬盘原理。其实把硬盘打开看到硬盘的盘体,就像一落光盘一样只是边上多了一个机械部件:
         与光盘不同的是,硬盘的盘体上面和下面都可以写数据。拿什么来写,自然是盘体上放置的磁头,每个盘体都有,而且上下面都有,这可是十分精密的机器设备,因为磁头与盘体是有距离的,有多远?呵呵,你头发的粗细与这个距离相比算巨人了,哈。应往哪里写呢,就像一张纸,如果有格式我们就可以根据格式往上写字,硬盘也是一样,盘体是圆形,从最外围到最里边,可以看成好多个圈圈,叫磁道。每个圈圈又划分了好多个段落,叫做扇区。硬盘通电后盘体开始高速旋转,写数据时,先找是哪个盘体,是上面是下面,再找哪个磁道,最后找到扇区往里写数据,读数据也是一样。关于原理就说这么多,有兴趣可以去翻翻书:)
         怎么读写数据知道了,那么数据从哪里来呢。看到图中盘体边上的接口了吗,就从接口传输进来。从这里就引出了硬盘接口的类型,以中国来看从九十年代末期到现在共有这么几种类型:
IDE
       IDE的英文全称为“Integrated Drive Electronics”,即“电子集成驱动器”,一个IDE接口只能接两个外部设备。一般用于PC机,最高转速7200转。传输速度为:最高133MB/s硬盘容量最高达500G,据说有1TB,此接口现已淘汰。
SCSI

       小型计算机系统接口(Small Computer System Interface),一个SCSI可连接最多15个外设(包括磁盘磁带CD-ROM、可擦写光盘驱动器打印机扫描仪和通讯设备等)。连接外平等占有总线,现在为止接口传输速度最高可达640MB/s,转速7200转、10000转、15000转都有,10000转性价比最高。连接电缆可以长达6m。容量最高300G,现已基本淘汰。
 
SATA

SATA一种基于行业标准的串行接口(Serial Advanced Technology Attachment),来头不小,是由Intel、IBM等等多家硬盘大佬们共同提出的硬盘接口规范。接口需主板芯片组支持。支持热插拔,传输速度快,执行效率高。现在SATAIII的接口速度最高可达600MB/s;转速7200转。容量现最高4TB。是现在PC机与部分存储设备使用的主流硬盘! 
SAS

SAS(Serial Attached SCSI)即串行连接SCSI,是新一代的SCSI技术,改善原SCSI的效能、可用性和扩充性,提供与SATA接口的兼容性。为适合不同硬件环境,接口尺寸有3.5英寸和2.5英寸两种,同样转速7200转、10000转、15000转都有,容量现最高2TB。传输速度300MB/s,这只是刚起步,预计将来会更高。
NL-SAS
NL-SAS和SAS从技术上来说,没什么太大区别。说白了就是使用SATA的盘体,但接口标准是SAS标准。所以转速最高7200转,容量最大是3TB
 
固态硬盘

固态硬盘(Solid State Disk)用固态电子存储芯片阵列而制成的硬盘。接口规范和定义、功能及使用方法上与普通硬盘的完全相同,在产品外形和尺寸上也完全与普通硬盘一致。普遍采用SATA-2接口及SATA-3接口,最大容量128GB,理论最高速度6Gb/s。分为两种:
       一种是采用闪存FLASH芯片)作为存储介质,即我们常说的SSD。最大的优点就是可以移动,而且数据保护不受电源控制,能适应于各种环境,但是使用年限不高;
       另外一种是采用DRAM作为存储介质。 仿效传统硬盘的设计,可被操作系统文件系统工具进行卷设置和管理,可分为SSD硬盘和SSD硬盘阵列两种应用。高性能的存储器,使用寿命很长,但需要独立电源来保护数据安全。属非主流固态硬盘!
 
FC

拥有光纤通道接口(FC, Fibre Channel)的硬盘, 此接口最初为互联网设计,后应用于硬盘接口。硬盘在使用光纤联接时具有热插拔性、高速带宽(4Gb/s)、远程连接等特点,可持续性数据传输171MB/s。使用多模光纤联接时最远可达500米;使用单模光纤联接时最远可达10千米。转速15000转,容量最高限制于其高昂的售价, 通常用于高端服务器领域(本身设计初衷也非民用).
 
硬盘及接口可算说完了。搞这么多似乎有点抢戏,呵呵。因为存储本身故名思义,就是存储数据,所以接的都是硬盘,不先说清楚后边也没法讲。就算这样其实各种接口还是没能够说清楚,看来就硬盘应该单开一文多方参考而后撰之~-~
如果上述看不懂也关系,因为都知道PC机内有硬盘,而高端的设备如服务器、小型机、大型机等等也是一样,不过配置有高有低;有简单有复杂罢了。那么我们试想一下,以服务空为例:在一个生产环境,服务器如果只把数据存在本地硬盘里,那么需要多少硬盘?多少台服务器?我的邮件服务器存邮件数据;文件服务器存大批工作文件;网站服务器存站点程序;数据库服务器存DB数据;要是本地硬盘容量不够,可不仅仅是加硬盘就行的事情,像一些大型网站或数据中心,数据以TBPB计,这要加多少块硬盘才够?呵呵。服务器本身要工作,还要有频繁的重要数据读写,要是服务器哪一个部件出了问题,当机了还算幸运,要是造成数据的损坏可就麻烦了,医院的病历、药品信息;金融的各种金融数据;企业的保秘数据;甚至一个国家的。。。。。。天哪,这得造成多大的损失!一张纸要800年才会自然毁灭,还不如纯人工手记呢,哈哈。而且搞得数据这里一份,那里一份,管理起来相当麻烦。怎么办?这个时候,存储设备就应运而生。
服务器该工作还工作你的,我们将所有的数据归拢统一到一个设备或一批设备里,用一种快捷方便且相对安全的保护机制来保存数据,而且别的不干只存数据,心无旁骛自然一日千里,这就是存储设备产生的初衷。内部构造先别想的多复杂,跟服务器差不多,只不过服务器能连接的硬盘有限,存储设备呢,除了主板啊CPU啊等这些主机设备外,毕竟以存数据为主要工作,所以有这么一个专门设备(说白了就是一电路板)连接好多块硬盘,只不过这里管插多少块硬盘叫多少位,8位就是8块,12位就是12块,以此类推~接硬盘的电路板可以叫它硬盘插槽,8位也叫8槽位
从存储设备的前边来看,瞧瞧,这就是存储设备的槽位!
而主机设备在这里叫做控制器,是由控制器来把外部数据放入到这老些硬盘里的;当然要想工作必须通电,所以还有电源。简单地说,存储设备从硬件来看就这几样:控制器、硬盘插槽、硬盘、电源。
这张图是从存储的边后来看,左边就是控制器,而右边的是电源
 
从软件来看呢?刚刚说过,快捷方便且相对安全的保护机制,这种保护机制叫做RAID
独立磁盘冗余阵列(RAID,redundantarray of independent disks,redundantarray of inexpensive disks)怎么用的呢,那么多硬盘不能都闲着,把相同的数据存储在多个硬盘的不同的地方。通过把数据放在多个硬盘上,输入输出操作能以平衡的方式交叠,改良性能。因为多个硬盘增加了平均故障间隔时间,储存冗余数据也增加了容错。而这种功能也会软件两种:
RAID

磁盘阵列卡-拥有一个专门的处理器与存贮器,用于高速缓冲数据。使用磁盘阵列卡对磁盘的操作直接通过阵列卡来进行处理,因此不需要大量的CPU及系统内存资源。但对实施人员水平会有要求。实物见下图:
RAID
即通过软件方式来达到硬RAID功能,不同的是需要使用CPU及系统内存资源。对实施人员水平倒没多少要求,其实WINDOWS的磁盘管理就能做,哈。
分类是这两种,那么RAID具体的实现方式是什么呢?就是业内人士常说的什么raid1raid0raid5啥的。在《大话存储》这本书里介绍的较全,我只列出常用的几种:
raid0:最早的raid实现方式,其实很简单,好比说存储有8块硬盘,我把数据分散存到这8块硬盘上,不是分文件而是分散,一个文件被拆成多个部分分别存在多个硬盘上。但在应用层看到还是完整的文件,至少需块盘。缺点是万一哪块硬盘坏了,全完了,哈哈。
raid1:叫做磁盘镜像,数据在写入一块磁盘的同时,会在另一块闲置的磁盘上生成镜像文件,保证系统的可靠性和可修复性,只要系统中任何一对镜像盘中至少有一块磁盘可以使用,系统都可以正常运行,至少也需块盘。虽然这样对数据来讲很安全,但是成本也会明显增加,甚至造成浪费!
raid1与raid0配合使用:上述raid1的缺点,在同一时间内只能向一块磁盘写入数据,不能充分利用所有的资源。为了解决这一问题,我们可以把RAID0和RAID1技术结合起来,有raid1+0raid0+1两种模式。
raid1+0—是先做镜像再做条带,以四块硬盘为例,两组raid1,再将两个盘组做raid0,raid1两盘组各坏一块盘还能用继续用。所以至少需四块硬盘。
raid0+1—是先做条带再做镜像,同样以四块硬盘为例,两组raid0,将两盘组做raid1,若两盘组各坏一块盘就不能用了,但如果一个盘组的两块盘都坏了,还是可以继续用。
相比之下,raid10比raid01要可靠,raid01的写速度要快。
raid5:分布式奇偶校验的独立磁盘结构,好复杂的名字。。。。。每块盘的数据有其对应的奇偶校验信息,RAID 5不对存储的数据进行备份,而是把数据和与其相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。最少块盘!
raid6:带有两种分布存储的奇偶校验码的独立磁盘结构,更复杂的名字。。。。。天。与RAID 5相比,RAID 6增加了第二个独立的奇偶校验信息块。两个独立的校验系统使用不同的算法,即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给奇偶校验信息更大的磁盘空间,所以与RAID5相比,实际应用不多。至少需块盘
说到这里,存储设备的硬件和软件大至聊完了,其光是存储的内设与raid也够写好几篇博客了,哈,有空再说。简单地说就是一大堆硬盘和主机设备在一起通过raid方式存储数据。那这些数据是怎么的呢?自然是通过服务器与存储进行数据通迅来的,如何进行数据通迅的呢?这又引出了存储与服务器的连接!
最早的存储设备,咱们追溯到IDE硬盘的年代,那个时候服务器硬盘很多都是SCSI接口,在服务器的主板PCI接口上插入SCSI,SCSI卡的接口用数据线与SCSI硬盘连接。而存储呢,那个时候直接连服务器,用的什么呀?自然也是SCSI接口连接服务器的SCSI卡,叫做直连存储
图为SCSI
后来随着互联网的兴起,才有了应用到网络的存储设备,说白了就是SCSI接口改了RJ45口,服务器与存储设备都连接交换设备进行数据通迅,而SCSI卡自然就免了。再到后来(其实也没多久),因为百兆网络升级成千兆以极万兆或光纤环境,那RJ45口自然也跟着升级,所以存储设备后来也有千兆接口的、光纤口的。这些除了光纤与万兆口外,其它两个看着差不多:
如上图所示:百兆、千兆口就是那两个RJ45口,外表没什么变化,只是接口速度不同。百兆是100Mb/s,实际应用上10MB到头了;千兆是1000Mb/s,实际应用也就100MB
而图中右边的个接口,看着跟8个窟窿眼儿外加铁架子一样的就是光纤口。要说起光纤口那又多了去了,也是从互联网技术而来。我只说现在存储常用的光纤口,纯光纤与模块光纤。
先说纯光纤:FC(Fiber Channel),应用光环境的存储设备与服务器。在整个网络传输时,一般像文件共享啦、FTP啥的,走的都是微软的TCP/IP。而FC协议不在这之内,从物理层到应用层有自己的数据传输协议,叫做类以太网协义。也是基于网络实现的。而纯光纤接口,也叫FC口,是固化在存储控制器主板上的。速度8Gb/s

模块光纤:与纯光纤口同理,模块是指可以将光纤接口取出,换成RJ45网络模块
 
咱们在看一个存储设备参数时,如果有万兆网口,这个接口就是插槽,可以插光纤模块,也可以换成的RJ45的万兆模块,万兆模块长什么样,接口就是RJ45,身体跟上图光模块一样。速度嘛,10000Mb/s1000MB左右。
到这里,算是简单说完了存储设备与服务通迅的接口,其实每一个都有不低的技术含量,互联网技术与存储技术的相互融合带来了存储通迅上相当大的飞越!但光是存储飞越不行,同样的环境,服务器也要有相应的设备才能同时飞越,存储是光口,存储还是网口,根本就无法工作。
       千兆网环境,存储的网口要是千兆的;交换设备接口要是千兆的;服务器网卡要是千兆的;甚至连网线也要六类线才行。
       万兆网环境同理,只不过物理线路还没有那么快,只是接口速度提升了。
从这里引申出一概念叫做SAN存储区域网络,不单止一台存储,而是多台存储设备组成的工作局域网,而网络环境是上述千兆或万兆,物理线路是网线的叫做IP SAN
       光环境,这里要说一下,不管存储是纯光纤接口亦或是光纤模块,交换设备接口必须是光纤口;而服务器方面要在主板上插光纤卡,叫做HBA卡。
关于HBA卡:(Host Bus Adapter)光纤存储卡,用于服务器与光纤阵列规的连接
上图的HBA卡,左边为双接口带一个冗余接口,就是一个坏了还能继续用;右边的不多说了。将HBA卡接到服务器主板上,装好驱动就可以用了。
而在光环境下的存储设备—交换设备—服务器的连接线是什么呢?自然是光纤线,见下图:
上边所提到的存储区域网络,多台存储设备组成的工作局域网,网络环境是光纤,光交换设备、光纤接口,物理线路是光纤线,叫做FC SAN
 
各种环境的连接应用也算简单说完了,至于具体的参数啊型号啊,要是再说这些估计还没说完我就完了,个人认为一边深入了解原理一边根据需求看型号参数比较好。好的,以上说完了存储的硬件、存数据的方式、各种应用环境,不同的应用环境自然设备不同,那么存储设备在对应不同的应用环境会有哪些不同的设备,这是接下来也是最后一个话题,存储的分类!
 
正所谓物以类聚,人以群分。现在来说说存储设备的分类,任何产品都有不同的受众群,同样一本"西游记"也有少儿读本与成年人读本之分;像PC或笔记本适合普通大众;服务器适合工程使用;哪怕说人-还分三六九等呢,是不是。存储设备也是一样,但怎么来区分呢?就两个字:需求!家里就上上网看看电影啥的,买台服务器回家?新浪网的访问量如此之大,就用PC当做网站服务器?那真是吃饱了撑的,这些当然是不合适的。所以说要根据不同的应用环境与技术标准来决定产品的受众与分类。存储设备的分类从需求来说分为三种:
在线存储

在线存储也称做盘阵,故名思义就是要时刻保持在线状态,读写数据频繁,工作环境对存储的性能要求颇高。所谓颇高是指控制器的配置要高;而且最少都是双控制器(以上),可以外接扩展柜;接口基本上使用的是FC接口;硬盘嘛,SATA的有,SASNL的有,SAS的有,光纤接口硬盘的也有。所以其工作环境,交换设备基本都是光纤或千兆网(包括万兆)设备,服务器自然也配有光纤卡(HBA),从应用层认到的存储设备是SCSI卷。盘阵的raid机制都是raid
还有一种叫做iSCSI盘阵,控制器与硬盘与上述相同,也是做raid但接口都是千兆网或万兆网,这就说明网络协议走的都是TCP/IP协义,应用层认到的设备是iSCSI设备。说到这里有几名词需要解释:
扩展柜—就是安装硬盘用的柜子,只是作为容量扩展单元,不能做为独立部件使用。 一般与存储设备配合工作;外型有塔式、全铝合金桌面型设计,可以容纳5-12颗硬盘,与再购买一台存储相比,更能节省机柜的空间。
SCSI设备-SCSI硬盘已经聊过了,那么SCSI设备是什么,盘阵将所有硬盘空间做成raid存储方式,这时应用层所看到和真正使用用的是一块盘或几块SCSI硬盘注意:不是分区!而且将存储设置好之后,在服务器应用层是自动认到,好比说在windows的磁盘管理里会自动跳出认出新设备的窗口:)至于iSCSI是什么,这就要说到近线存储
 
近线存储 

指将那些并不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上。近线存储对性能要求相对来说并不高,由于不常用的数据要占总数据量的比较大的比重,这就要求近线存储设备的容量需求相对较大。好比说给一些长期保存的不常用的文件做归档。上述实现这种概念的设备叫做NAS,即网络附加存储
归档—就像我们把不常用的东西收拾起来装好一样,这透出一个归字。数据也是一样,我本身的盘阵不留这些数据,将这些数据归档存储到近线设备上。只是这里需求不同,有些环境归档不要求时常能读取到这些数据;有些是要求的;而有些不仅要求还要与在线数据同步。其实归档只是个概念或目地,实现其目地的技术手段统称叫做备份。既然提到了归档,那索性就再说说备份的几种机制。
备份—其实无论是什么存储设备,目地都是存数据,除了最原始的拷贝之外,还有几种很智能的备份机制。
增量备份—我们先把数据备份到存储设备上来,下一次再备份的时候如果只是拷贝过来,那么会有大量地数据重复覆盖。增量备份的机制就是已有的数据不备份,只备份新增加的数据。
数据同步—要求存储设备上备份的数据与原始数据保持一致,它增我增,它减我也减。
实际上述几种备份机制时,还可以根据时间即年、月、日,甚至有的设备还提供时、分时间机制,可定时做备份。
NAS一般提供最基本的两种服务,iSCSI盘与文件共享。先说文件共享,因为大多数人离这个名字较近,用过WINDOWS的人基本上或多或少接触过共享目录共享分区,只不过NAS所以提供的更多,除WINDOWS外,Linux的NFS、MAC的AFP,还有telnetFTP等等。
iSCSIInternet 小型计算机系统接口 (Internet Small Computer System Interface)是IBM大佬研发的,该技术是将现有SCSI接口以太网络(Ethernet)技术结合,供硬件设备使用实现在IP网络上运行SCSI协议,使其能够在以太网上使服务器可与使用IP网络的储存装置互相交换资料。在需访问资源的客户端应用层认到的是iscsi,不过这可不像盘阵,需要应用层用iscsi发起器来扫描并连接设备,发起器在windows7有自带,Linux有相关命令。
除上述两种功能外,NAS还提供相应的优化存储资源的功能,比如说像数据删重,即将重复数据取出,这样可以节省空间;在线扩容,不间断工作,更换NAS的硬盘等等。这些功能同指化严重,基本上企业级NAS都有,只不过有些NAS需要购买序列号激活功能而有些不用罢了。
除功能以外,NAS不像盘阵,不光是机架式的,也有塔式的,如图所示:
所以其应用较广,除生产环境外,公司部门甚至个人用户也可以用得到。而控制器、接口、硬盘接口等性能方面,根据需求的不同,配置自然也不同,一般都分为低、中、高端三类,配置自然也是由低到高,甚至在特定的环境里高端NAS也可以当做低端盘阵来用。这一切要以需求出发,不过需说明NAS的raid机制,不像盘阵都是硬raid,有些是raid;有些是raid
 
离线存储
         离线存储设备在业内所有存储设备当中算是较特殊一种,可以说不管是与盘阵还是NAS相对独立(那二位好歹还有点关系)。先说说它的需求来源,即企业的大数据需长期保存。好比说金融行业的数据,我国规定是要保存十年以上,这是根据行业规则来的需求;再比如说医院的数据,不管是各项检查的数据还是病人病历以及药品数据,这些数据中的一部分是不经常读写,甚至会放置很久,这些数据如果只放在盘阵或NAS里,因为设备会经常有读写数据操作,我说过存储设备的安全机制是相对安全,对于在生产环境设备未来会出现什么问题,我们人为的预估只能占部分比例,毕竟这世上就没有什么绝对的事情,既然设备会经常有读写操作,那就难保会出问题,出问题的结果往往导致了数据损失,有些数据损失又会是致命的,所以怎么办呢,正所谓一动不如一静!真要保证数据安全的方法往往静止不动,要是这些需要长期保存而长时间不会读写的大量数据所放置的设备,不像盘阵或NAS那样经常被读写,只在需要的时候被导入到在线或近线亦或是服务器本地硬盘,这样问题就解决了,所以离线存储设备就这样应运而生。
         所用的设备是什么呢?在我国八十年代末九十年代初,录像机与录音带可以说是风靡大江南北,可以听歌、录像、看录像,其实所记录的音频与影像资料其实就是数据,所以加以改动一样可以应用到存储设备上,名称也不一样了。录像带叫磁带、录像机叫磁带机(也叫磁带驱动器)、后来又有了相对智能的磁带设备叫磁带库、再后来甚至有了用盘阵做为底层存储的虚拟带库。
磁带
         能够存储数据的磁带跟录像、录音带一样,也用的是胶片来记录数据,当开始写数据时,就像录音带开始录音一样,顺序写入,当开始随机检索时自然也像录音带一样倒带。只是为了与应用层配合使用,业内开发了多种可以数据交互的协议,比如说像常见的LTO即线性磁带开放协议,提供对磁带数据的写入、检索、纠错等等功能。说到这里,到底为什么使用磁带其实还不是完全清楚,上述说大数据量长期存储,基于这点就引发出两点原因,一是现在20TB以上和PB级的数据做离线来说,就磁带与硬盘相比较,磁带的性价比非常高;二是磁带与硬盘在应用上最大的不同是,磁带写满数据后,可以自动弹出然后保存起来,放保险箱里或安全妥帖的场所,这就符合了需求来源中所提到的一动不如一静!说到这里又产生了一个问题,那么磁带是被什么设备读写数据然后弹出的呢?这种设备叫磁带机!
 
磁带机

       磁带就像录像带;那么磁带机也就如同录像机。录像机把影像数据存到录像带上,也可以把录像带上的影像数据放映出来,录完像或放映完录像带从录像机里取;磁带机也同样能把数据写入到磁带上,同样可以把磁带上的数据恢复回来,磁带机也同样能把磁带弹出做离线保存。现在磁带机(也叫磁带驱动器)分两种,一种是手动将磁带放入磁带机;一种是自动放入,叫自动加载机,带磁带卡槽。从广议上来讲,自动加载机其实算不上真正意义上的磁带机,而应属于一种叫磁带库的产品。
磁带库
       磁带库,先理解'库'这个字的含义。像车库、库房之类,那么以此类推磁带库里应该会放置很多个磁带(即磁带卡槽)与磁带机,这很像上述所说的自动加载机:
       自动加载磁带机是一个位于单机中的磁带驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中(就是磁带卡槽位)拾取磁带并放入驱动器中,或执行相反的过程。可以备份100GB—200GB或者更多的数据。
       而磁带库是指像自动加载磁带机一样的基于磁带的备份系统,磁带库由多个磁带驱动器、多个槽、机械手臂组成,由机械手臂自动实现磁带的拆卸和装填(就像人手一样,拿出磁带放入磁带机)。它能够提供同样的基本自动备份数据恢复功能,并且可以多个驱动器并行工作,也可以几个驱动器指向不同的服务器来做备份,存储容量达到PB级,可实现连续备份、自动搜索磁带等功能,可在应用层管理软件的支持下实现智能恢复、实时监控和统计,可以说大型数据备份的主要设备。
虚拟带库VTL(Virtual Tape Library )
       说到磁带的时候提到过,磁带做离线备份的原因之一是因为大数据量存储,磁带与硬盘的性价比高。磁带机与磁带库是很昂贵的,但同样20T以上的数据量来看磁带还是比硬盘要便宜。那么随着硬盘价格的不断下降,业内也在寻找一种硬盘替代磁带的方法,毕竟磁带虽然比较实惠,但其保存环境较为严格,而且要是摔一下基本上不能用了。这个时候,虚拟带库就产生了,带库两个字指的就是磁带库,而虚拟二字指的是虚拟出来的磁带库!也就是说是以其它存储设备做实际数据存放,但存储方式是磁带库的备份方式。最开始的时候虚拟带库,是将盘阵与服务器直连,在应用层安装虚拟带库软件,将盘阵虚拟成磁带库设备,那么在应用层备份软件中所认到的设备就不是盘阵而是磁带库;后来随着IP SAN的应用,发展成虚拟带库的独立设备,将虚拟带库的软件写入到盘阵或其它非磁带设备的电路板芯片中,让其它自身提供虚拟磁带库工作模式,而不倚赖于应用层可自成一体。但虚拟带库有一个天然缺馅,既然是将盘阵做当底层存储设备,那么不能像磁带那样将磁盘取出,虚拟环境看到的是取出,但其实没有。除非虚拟带库连接真实磁带库才能做真正地底层设备离线。

小提一句:
       本来关于存储分类说到磁带设备应该就说完了,但最近我突然发现一个做离线的设备用的是虚拟带库的工作方式,可以做到将硬盘像磁带那样弹出,底层设备也能做到离线二字。特意在结尾小提一句,这个设备叫做RDXA8:
       这个设备有8个槽位,里面插入的是笔记本硬盘,只不过外边有一层扛摔的外壳,是SATA接口。设备的工作模式之一就可以提供虚拟带库的工作方式,虚拟出8个磁带卡槽、机器手,但磁带机只能虚拟出个,可见是做小数据量离线备份用的。
 
好了,长出一口气,这篇博客可算写完了,呵呵。我算了算时间,从2013年4月13日早上11点开始写,一直写到了。。。。现在是2013年4月14日14点34分,基本上用了一个工作日的时间。硬盘到存储设备的产生,再到设备接口与应用硬件环境,最后是存储设备分类,将整个历史源流疏理一遍。其实有很多没说清楚,像硬盘的各种接口、存储设备实际在工作时的数据走向流程,比较深挖的东西没有说到,还有像网络光纤与存储光纤的驱别种类这些也算是没说到的。但初衷还算达到了,我本来想整理的就是存储设备的源流,还是偏硬件一些;以后有机会会把这篇中提到的很多知识点细化再编写成文。有这方面的高手欢迎指点,余当虚心求教之,谢谢~!

给我留言

留言无头像?