主题:看不懂的硬盘行业:(一)小鱼吃大鱼 -- 达闻奇
可靠性上,光盘不如固态硬盘,固态硬盘不如磁盘,磁盘不如磁带
还是硬盘阵列,备份才是以磁带为主,主要是银行的数据备份是有规定的,一般上要求储存7-10年,到期的就会被送去销毁,磁带销毁起来也比硬盘容易.
现在还能读。
数据保存的最好方式是:备份、备份、在备份,用3M软盘备份 3次以上。
包括电影之类的,DVD的容量太小了。不过俺都是三处备份,家里台式机一份,移动硬盘一份,本本里一份。
先是光盘库,然后是磁带库(这个是必备的),上面这两个,都是一天一备。
现在开始做灾备中心的银行,都用灾备中心的机制做快照备份了。
银行的数据量,说起来,并不算大。
不是单纯的硬盘,EMC或者SHARK的。
晚上一般通过flush-copy做镜像备份,然后镜像再给备份机,备份机再备到磁带上,这样生产主机就比较容易实现24小时服务。
现在的发展趋势是两个。
一个是灾备中心,这个有多种方式,大银行自建,然后中金和农信银开始坐外包的。灾备中心提供了快照备份功能,也就是说,可以在特定的时间点的快照给备下来,这个比那种到晚上的日终备份要好很多。
另一个是数据中心,是由数据仓库技术引申出来的历史数据管理。这个的目标是将银行数据做5-10年(或者更长)的存储,而且不但要存储,更要能够进行历史数据的查询和统计。
上大学的时候经常看电脑硬件方面的杂志。那时候有个编辑答疑栏目,隔三差五总会出现这样的问题:我刚买的80G新硬盘(那时候80G是个很大的容量),插上去系统怎么显示只有78G啦??小编总是一遍遍不厌其烦的告诉读者:你好,你问的问题经常有人问,这里再次统一回答一下,硬盘厂商所说的1G是指1,000兆字节,而操作系统是以1024兆字节为1G的,所以会出现容量损失80000M/1024=78.1G,以后请不要再咨询此类问题了云云。
奇怪的是,内存也是论字节的,却决不会出现插上1G内存操作系统显示少了一部分的情况(如果有,十有八九你用的是主板集成显卡,共享了一部分内存为显存)。硬盘厂商为什么会搞这种和稀泥的把戏,让人不明白。据说是造硬盘的一开始就是这么计数的,一路沿袭了下来。可PC难道不是建立在二进制基础上的么?现在的硬盘越来越大,相应的容量损失也越来越多。一块1TB的硬盘,格式化出来只有930G左右,少掉的差不多是几年前一块主流硬盘的容量了,少掉的那部分哪去了?硬盘厂商给吃了!
大家知道,传统硬盘是通过在金属盘片(也曾用过其他材料,比如下文提到的IBM 75GXP和60GXP,都用玻璃作盘片基质,但是效果不好)上涂上磁性介质来保存数据的。所以,所谓增加容量也就是在盘片上多撒点磁粉而已,其实增加不了多少成本。有的厂商造硬盘时,比如60G、80G用的其实是一样的盘片,不过装好了后,屏蔽掉其中的一部分而已(也有其他的部件也会这么做,比如造CPU和GPU的,经常屏蔽掉芯片的一部分核心、管线等,或者砍掉缓存、通道的数目,借以拉开性能档次)。因此,硬盘厂商改用二进制来标计容量其实是举手之劳。可他们偏偏不这么做。这是为什么呢?
原因有二,首先,硬盘上不是所有的地方都能保存数据的。大家知道,硬盘用久了可能出现坏道。实际上,刚出场的硬盘也是有坏道的。这也很好理解,一个盘片上那么多保存数据的地方,不可能块块都是好的。硬盘出厂前都要经过厂家的测试,把其中的坏块标记出来,然后写死在ROM里。以后硬盘读写的时候,都不会碰到这些坏块上,保证了数据的可靠性。所以硬盘上的空间本来就是要有余量的,厂商只是合理利用了规则而已。
其次,硬盘扩容的道路一直很崎岖。我们知道,传统的台式机硬盘的尺寸定死了是3.5寸,在一定时期内,一个盘片上能存储的数据量是有上限的,要提升单碟容量,需要更高的技术。在技术没有大幅进步的情况下,硬盘制造商只能用增加盘片的方式来扩大容量。一般的台式硬盘的最高纪录是5个盘片装一个硬盘里。早期的IBM 75GXP系列就是这样来的,一个碟片15G,5片叠在一起就是75G。有趣的是,该系列的下一个系列叫60GXP,单碟容量20G,技术提升了,型号数字却变小了,原因是这一系列最多只装3个盘片,最大容量是60G,因此而得名。一般来说,盘片越多,硬盘控制的难度就越高,出故障的几率也越大。因此硬盘厂商一般不倾向使用过多的盘片。(说到这里插播一个有趣的东西。我们普通消费者数硬盘一般论“块”,装机商和代理商却喜欢论“片”,这“一片片”硬盘首先说明了流量大,在他们眼里硬盘跟哗哗流动的钞票没什么区别,另外深究起来,硬盘里最重要的部件也确实是一片片的盘片。)
PC硬盘的单碟容量一直在提升,但速度却远远赶不上其他部件的脚步。随着存储密度的不断加大,提升的脚步也越来越举步维艰。所以硬盘厂商需要给自己留一些余地。前几年固态硬盘刚出现的时候,其容量跟内存的计数方式保持一致,那时候一般都是32GB,64GB,128GB这样的型号。后来也学得跟传统硬盘一样滑头了,都叫个40G,80G什么的。实话讲,他们这么算无可厚非,但用户拿着“缩水”的硬盘那心里总不舒服。我们也只能期待硬盘厂商发发慈悲,能够照顾一下本来就比较拮据的PC用户。硕鼠硕鼠,无食我数!
而是读写头。
以前搞软件性能优化,有个说法,就是CPU比内存快1000倍,内存比硬盘快1000倍。现在内存比硬盘快了能有1M倍了吧。
硬盘主要有两个动作:盘片转动和磁头移动。其中盘片转动比磁头移动还快一点。所以程序里面最慢的就是这个磁头移动,也叫换道。说起换道,硬盘还是多片的时代,各个盘片的读写头在一个位置的时候,构成一个cylinder,如果文件的数据都在一个cyliner上面,就比较快一些,因为不需要移动磁头。当然多磁头也是硬盘故障的主要原因之一。所以大多数现在的硬盘,能用单片就用单片,成本也低。
说过机械硬盘,说说固态存储SSD。SSD目前成熟的技术是用flash。flash类似以前的EEPROM,不同点在于读写都是普通电压,工艺上面是绝缘层做的比较薄。但是flash有两个问题,一个是写了以后会brown out,就是时间长了会掉电,这个还不是太麻烦,除非准备存储很长时间;另外一个是电荷积累,每次清除以后都不是回到原来的状态,而是积累一些电荷,写的次数多了,就分不清0/1了,那块就坏了。所以需要在固件里面用算法把读写操作分布到不同的地方去,否则总是盯着一个地方读写,很快就坏了。
硬盘盘片、光盘盘片克服缺陷的方法是纠错码,而不是象flash靠标注坏块。这是因为硬盘盘片、光盘盘片都是模拟器件,本身单元成本很低,而读写部件可以做得很可靠。flash器件的读写器件本身是电路,其可靠性和存储器件本身差不多,所以用纠错码不划算。
说起来十五年前他老爸给他买第一台电脑的时候,高价买了个10MB的硬盘,如果同样的价钱算起来如果要买一个1TB的容量,要花 1Billion USD!!!
这个是网上找来的硬盘价钱历史
http://ns1758.ca/winch/winchest.html
真是硬件生意做不得啊。
15年前的主流是几百MB那个等级的,要知道Windows 95就要几十MB。10MB,那至少是90年左右的事了,因为DOS5就需要两张安装盘。