跳转到内容

操作系统设计/文件系统/故障

来自维基教科书,开放的书籍,开放的世界

在一般的工程领域中,容错是指在出现故障后,系统仍然能够继续运行(尽管可能以降低的性能)的能力。更具体地说,在文件系统设计中,它指的是文件系统即使在遇到硬件错误的情况下,也能可靠地存储数据的能力。

存储系统中可能出现许多错误,尤其是在带有移动部件的硬盘驱动器中。坏扇区只会阻止一小部分扇区的使用,而磁头撞击则可能永久损坏整个磁盘。其他类型的崩溃(软件错误、意外断电等)通常不会对磁盘造成物理损坏。此类崩溃通常会导致正在写入过程中的扇区(s)数据混乱。由于许多计算机系统会在将数据存储到非易失性介质之前在 RAM 中缓冲写入并重新排序写入顺序,因此此类崩溃通常会导致数据不一致。

在文件系统中提高容错能力的方法有很多

  • RAID,它会复制数据。
  • 日志记录,它可以帮助避免崩溃时出现的问题。
  • 处理坏块,它可以防止使用损坏的磁盘扇区。
华夏公益教科书