面向大众的精密工程产品:硬盘

现代硬盘驱动器(硬盘驱动器,HDD)存在一个有趣的矛盾。一方面,这是工程学的巅峰之作,是精密工程行业的有价值产品,已大量生产。另一方面,它们代表了一种受到所有人和各方面批评的数据存储技术。一旦它们不被称为名称,就记住,例如,它们使用氧化铁或简单地生锈。但是,尽管如此,在硬盘驱动器中,具有镜面光滑度的磁性板在整个使用寿命中都会安静地旋转。读/写头距离它们仅几纳米,其位置由特殊的电驱动器负责。它能够以高精度和高速度将磁头放置在微观磁道上。







尽管事实是,随着时间的推移,每平方毫米的磁盘上都会放置越来越多的磁道,并且读/写磁头每隔几年就会变得越来越复杂,但硬盘的可靠性却在不断提高。例如,数据存储公司Backblaze准备了一份2020年第二季度的报告,专门针对其中使用的硬盘驱动器。事实证明,与去年相比,每年的磁盘故障率已显着下降。



这是否意味着随着时间的推移,硬盘变得更加可靠?像MAMR和HAMR这样有前途的磁记录技术如何在未来几十年内影响硬盘的可靠性?



从“兆”到“兆”的路径



第一个硬盘在1950年代开始销售。这是一台IBM 350,容量为3.75 MB。该设备被装入152x172x74 cm的盒子中,该盒子包括50个直径为24英寸(610毫米)的圆盘。如果回到过去,事实证明,最好的现代3.5英寸硬盘驱动器(约14.7×10.2×2.6厘米)可以使用常规(非平铺)记录技术存储多达18 TB的数据。





IBM 350硬盘驱动器的内部机制



在IBM 350中,磁盘以1200 rpm的速度旋转。并且在最近的几十年中,硬盘已经朝着减小板的直径并增加其旋转速度发展(典型值为5400-15000 rpm)。其他改进包括将读/写头放置在靠近光盘表面的位置。



IBM 1301 DSU(光盘存储单元)存储设备于1961年问世。这是一个创新的设计,每个盘片都有自己的读/写头。该模型的另一个创新之处是,在空气动力的作用下,磁头浮在转盘表面上方。这使得可以减小磁头和磁盘表面之间的间隙。



经过46年的发展,IBM于2003年将其硬盘业务出售给了日立。到那时,硬盘驱动器的容量增加了48,000倍,而大小减少了29,161倍。功耗从超过2.3 kW降至约10瓦(台式机),每兆字节的价格从68,000美元降至0.002美元。同时,板的数量从几十个减少到最多两个。



增加存储密度



机械和电子设备以及计算机一直向小型化发展。1940年代和50年代的巨大电子管或中继计算机演变成体积较小的晶体管系统,然后发展成为基于专用集成电路的现代微型技术奇迹。硬盘驱动器遵循类似的路径。





1英寸Seagate MicroDrive HDD



内部硬盘控制电子设备经历了VLSI开发的所有乐趣,它们使用了越来越精确和经济的伺服驱动器。材料科学的进步导致具有更佳磁性涂层的更轻,更平滑的板(玻璃或铝)。记录密度增加。硬盘驱动器的创造者越来越擅长理解其各个元素(微电路,焊料,驱动器,读/写磁头)的特性,并且其特性的革命性改进不是立即发生,而是通过小幅改进逐渐实现。





六个开放式硬盘驱动器-从8“到1”(来源



尽管已经进行了至少两次尝试来使硬盘驱动器小型化,但采用的形式有1.3“ HP Kittyhawk1999” 1“ Microdrive。结果,他选择了3.5英寸和2.5英寸规格的机型。 Microdrive外形尺寸的驱动器被吹捧为基于NAND的CompactFlash卡的替代品,理由是它们的优势在于更高的存储容量和几乎无限的写入周期,这使其适合在嵌入式系统中使用。



与其他类似情况一样,对写入速度和随机访问数据时间的物理限制最终使HDD成为最理想的客户,而最重要的是能够廉价,可靠地存储大量信息。这使HDD市场能够适应台式机和服务器系统,以及视频监视和数据备份的需求(此处它们与磁带驱动器竞争)。



硬盘故障的原因



尽管硬盘驱动器的机械零件通常被认为是最薄弱的环节,但硬盘驱动器故障可能不仅仅是这些零件造成的。这些原因包括:



  • 人的因素。
  • 硬件故障(机械的,电子的)。
  • 固件损坏。
  • 环境因素(温度,湿度)。
  • 电源供应。


在电源关闭或操作过程中(磁盘旋转,读/写磁头未停放)对硬盘进行了抗冲击测试。如果光盘承受的压力比设计的承受的压力大,则负责磁头移动的驱动器可能会损坏,磁头可能会与光盘板的表面发生碰撞。如果磁盘未受到此类影响,则其故障的主要原因很可能是其自然磨损。硬盘驱动器制造商为他们提供了平均故障时间(MTBF,平均故障前时间),这可以使人们了解硬盘在正常情况下可以工作多长时间。



通过推断一段时间内的设备磨损数据可获得MTBF。有一些标准可用来计算该指标。硬盘的MTBF通常在100,000至1百万小时范围内。因此,为了真正测试磁盘,需要10到100年的时间才能观察到它。同时,制造商在为光盘指定MTBF时,应假设光盘可以在建议的条件下工作。这是Backblaze等存储公司的驱动器工作的地方。



显然,如果使硬盘驱动器受到强烈的冲击(例如,将其放在石头地板上),或者如果驱动器的电源发生严重故障(例如,电涌),则HDD的寿命将缩短。不太明显的是,硬盘驱动器的可靠性会受到并非硬盘驱动器特有的制造缺陷的影响。这就是为什么“可接受的故障率”这样的指标适用于大多数产品的原因。



与用户无关。关于生产线



硬盘驱动器显示出较高的MTBF值。可以理解的是,Backblaze努力确保其将近130,000的HDD可以快乐地“生存”到成熟的老年,并平静地退休进入更美好的世界(通常到废旧金属破碎厂)。但即使是像Backblaze这样的公司,截至2020年第一季度的年故障率(AFR)也仅为1.07%。幸运的是,这是自2013年他们开始发布此类报告以来的最低水平。例如,在2019年第一季度,他们的AFR为1.56%。



用我的材料之一据说在生产包括集成电路的设备时,可能会出现缺陷,这些缺陷不会立即显示出来,而是会在设备运行期间显示出来。随着时间的推移,因素诸如电,热应力,机械应力可能导致微电路的故障。因此,在微电路情况下,导线连接可能会断开,电迁移会损坏焊接连接和微电路本身(尤其是在暴露于静电放电设备之后)。



硬盘驱动器的机械零件取决于对技术公差的坚持准确性以及运动零件的润滑质量。以前,存在磁头块粘附在硬盘表面上的问题(粘连)。但是随着时间的流逝,润滑油的特性得到了改善,并且缸盖不再能够离开停车区。结果,今天已经或多或少地解决了这个问题。



但是,尽管如此,在生产过程的每个步骤中,都有机会破坏某些东西。最终,这会降低MTBF值。发生故障的硬盘驱动器位于故障率曲线的阴暗面。该曲线的特征是在开始时出现一个高峰值,表明由于严重的制造缺陷而导致的故障。然后缺陷的数量减少,并且看起来足够平静,直到设备过期,之后设备又恢复正常。



下一步是什么?









我们知道,这是HAMR Time Hard驱动器,它是微调制造过程最终结果的一个例子。在过去的五年中困扰这些设备的许多问题已得到解决或缓解。 HDD生产中相对显着的变化(例如改用氦气驱动器生产)尚未对其故障率产生重大影响。其他变化,例如从垂直磁记录( PMR)到热辅助磁记录( HAMR)的转变)不应严重影响硬盘的使用寿命。前提是新技术不会带来新的问题。



通常,从各种意义上讲,HDD的技术前景看起来都很无聊。它们将是低成本,大容量的存储设施,可以正常使用至少十年。当单个分子将发挥这些“部分”的作用时,创建硬盘驱动器的基本原理(特别是板的小部分的磁化)可以发展到这样的水平。而且,如果您在此处添加类似HAMR之类的东西,事实证明您可以期望HDD上信息的存储寿命显着增加。



与NAND相比,硬盘驱动器具有显着的优势,后者使用微小的电容器来存储电荷,并使用一种写入数据的方法来物理损坏这些电容器。这种内存的物理限制比适用于硬盘驱动器的限制更为严格。这导致了更复杂的存储器设计,例如,基于能够存储四个位的存储单元(四级单元,QLC)创建了驱动器。使用此类电池时,必须区分16个电压电平。由于QLC内存的复杂性,事实证明,在许多情况下,相应的SSD仅5400 rpm硬盘驱动器略快对于数据访问延迟尤其如此。



结果



我的第一个硬盘驱动器是IBM PS / 2(386SX)中的20或30 MB的Seagate。这台电脑是我父亲下班带给我的。他们改用了新的PC,可能还想从旧技术中解放仓库。在MS DOS时代,20-30 MB对于操作系统,一堆游戏,WordPerfect 5.1以及更多内容已经足够了。当然,到90年代末,这种数量的内存看起来可笑。然后,谈到硬盘,它们不再以兆字节为单位运行,而是以千兆字节为单位。



自那时以来,尽管我拥有许多台式机和笔记本电脑,但具有讽刺意味的是,可以说,唯一在我手中死掉的驱动器是SSD。这以及有关硬盘的出版物(例如Backblaze报告)使我坚信,最后一个HDD的盘片停止旋转的日子已经非常遥远了。也许只有当3D XPoint技术之类的东西可以创建足够大且价格合理的驱动器时,此预测才会改变在那之前,让一切顺其自然。



您是否遇到过硬盘故障?










All Articles