最小化硬盘驱动器故障和数据丢失/驱动器生命周期管理
某些品牌的驱动器比其他品牌更可靠。虽然特定型号的可靠性数据很难获得,但可以使用各种因素来估计驱动器的可靠性。这些因素包括产品评级以及一些适用性和物理属性。
显而易见,用户评级较高且评价良好的驱动器应该优先考虑。用户评级较低的驱动器不应购买,除非用于 RAID 环境。对于用户评级少于 5 个的型号,如全新型号,其可靠性更难估计。
Newegg 是提供许多驱动器用户评级和评论的网站之一。 Google 产品搜索 提供来自多个网站的用户评级和评论的汇总。
企业级驱动器被宣传为比标准台式机级驱动器具有略高的可靠性,当然价格也更高。
硬盘驱动器可以配备内置的恢复机制,在发生错误时尝试修复。此恢复周期尝试从有问题的区域恢复数据,然后重新分配专用区域来替换有问题的区域。[1] 此过程可能需要最多几分钟,具体取决于问题的严重程度。[1]
旨在用于 RAID 环境的驱动器必须具有一个功能,该功能可以防止它们进入长时间的恢复周期,否则 RAID 控制器会将驱动器从阵列中删除。此功能称为 限时错误恢复 (TLER)[1] (由 西部数据 制定),错误恢复控制 (ERC) (由 希捷 制定),以及命令完成时间限制 (CCTL) (由 三星 和 日立 制定)。
因此,可以在长时间恢复周期内进入的台式机驱动器不应在 RAID 环境中使用,虽然具有 TLER[1] / ERC / CCTL 的驱动器可以在非 RAID 环境中使用。
驱动器中的磁头数量与其故障率之间存在很强的正 相关性。[2] 因此,在选择两个容量和速度相同的驱动器时,应优先选择磁头数量较少的那个。但是,这一点可能没有用,因为具有相似功能的驱动器往往具有相同的磁头数量。
驱动器在其使用的前几个月内比平时更容易出现故障。这种提高的比率是由于组装、配置或组件级问题造成的。如果驱动器容易因此类问题而出现故障,那么在驱动器投入使用之前检测到此问题将是有益的。在老化测试期间,必须注意确保驱动器不会过热。
为了帮助解决这个问题,新驱动器首先可以通过使用专用软件进行简短的 老化测试 过程。此过程对驱动器执行读写压力测试。因此,它旨在发现可能导致驱动器过早故障的驱动器问题。一个用于 Windows 和 Linux 的商用软件应用程序可以执行此操作和其他老化测试,即 PassMark BurnInTest。
可以在老化测试之前和之后查询 S.M.A.R.T. 可靠性数据。如果在老化测试后发现新的错误,则可能表明驱动器容易出现过早故障。
虽然 计划功能性过时 是从销售产品的公司那里可以预期的,但在这种情况下,这是由消费者所必需的。较旧、较小的驱动器可以定期更换为较新、较大的驱动器。除了获得更大的存储容量外,由于较旧的驱动器是在其使用寿命结束之前很久就被更换的,因此减少了该驱动器中包含的数据丢失的风险。这尤其适用于需要越来越大存储量的消费者,因为他们从更大的存储容量中受益最多。
可以根据驱动器的功能、使用寿命或由 S.M.A.R.T. 参数确定的驱动器的健康状况来更换驱动器。
- ↑ a b c d "台式机版和 RAID(企业版)硬盘有什么区别?". 西部数据:知识库:常见问题解答. 西部数据. 检索于 2008-12-11.
如果您安装并使用连接到 RAID 控制器台式机版硬盘,硬盘可能无法正常工作,除非由企业 OEM 联合认证。 这是由于台式机版硬盘使用的正常错误恢复过程造成的。
当台式机版硬盘上发现错误时,硬盘将进入深度恢复周期,以尝试修复错误,从问题区域恢复数据,然后重新分配专用区域以替换问题区域。 此过程可能需要长达 2 分钟,具体取决于问题的严重程度。 大多数 RAID 控制器允许硬盘从错误中恢复非常短的时间。 如果硬盘花的时间过长才能完成此过程,硬盘将从 RAID 阵列中删除。 大多数 RAID 控制器允许 7 到 15 秒的错误恢复时间,然后才会将硬盘从阵列中删除。 西部数据不建议在企业环境(在 RAID 控制器上)中安装台式机版硬盘。
西部数据 RAID 版硬盘具有名为 TLER(有限时间错误恢复)的功能,该功能可阻止硬盘进入深度恢复周期。 硬盘将只花费 7 秒来尝试恢复。 这意味着硬盘不会从 RAID 阵列中删除。 虽然 TLER 是为 RAID 环境而设计的,但它与非 RAID 环境完全兼容,并且不会在非 RAID 环境中造成损害。
{{cite web}}
: 行尾字符在|quote=
处位置 280 (帮助) - ↑ Jon G. Elerath 和 Sandeep Shah (2003 年 1 月)。 "磁盘驱动器可靠性案例研究:对飞行高度和磁头数量的依赖性". 年度可靠性和可维护性研讨会论文集. 年度可靠性和可维护性研讨会. 第 608-612 页. http://rams.org/.