知识的荒漠

不积跬步无以至千里,不积小流无以成江海;千里之行,始于足下!

用户工具

站点工具


服务器:硬盘smart

smart信息解读

总结:主要看05 — cwz 2020/09/17 11:09

05(005 Reallocated_Sector_Ct):完好的硬盘,(05)项的数据肯定为零,当前值远大于临界值。如果数据不为零就表示已经有不良扇区被“重映射”,被重映射的扇区增加,当前值就会下降。如果当前值下降到接近临界值,就说明备用扇区将用尽。
c4(196 Reallocated_Event_Count):这个参数的数据值记录了将重映射扇区的数据转移到备用扇区的尝试次数,是重映射操作的累计值,成功的转移和不成功的转移都会被计数。因此这一参数与重映射扇区计数(05)相似,都是反映硬盘已经存在不良扇区。
c5(197 Current_Pending_Sector):不是太紧要,只是读取写入失败时增加映射会增加计数,映射取消后计数减少
c7(199 UDMA_CRC_Error_Count):如数据持续增长,更换数据线后在监测

因此,当你的硬盘发现(05)参数有了数据量后,并不需要任何操作,只要注意以后的发展。如果(05)的数据量不大,也不再增长,那这块硬盘还可继续使用。若(05)的数据不断上升,说明硬盘已处于不稳定状态,应当立即备份数据,调换硬盘了。因为备用扇区一旦用尽,再有不良扇区就会真的出现坏道导致数据丢失。即使使用专门的工具把坏道隔离出来,也不能保证不再出现新的坏道,而且硬盘容量会明显减少。
当前值:现在 最差值:最差 临界值:到达极限

ID

属性ID,通常是一个1到255之间的十进制或十六进制的数字。硬盘SMART检测的ID代码以两位十六进制数表示(括号里对应的是十进制数)硬盘的各项检测参数。目前,各硬盘制造商的绝大部分SMART ID代码所代表的参数含义是一致的,但厂商也可以根据需要使用不同的ID代码,或者根据检测项目的多少增减ID代码。一般来说,以下这些检测项是必需的:

01(001) Raw_Read_Error_Rate 底层数据读取错误率
04(004) Start_Stop_Count 启动/停止计数
05(005) Reallocated_Sector_Ct 重映射扇区数
09(009) Power_On_Hours 通电时间累计,出厂后通电的总时间,一般磁盘寿命三万小时
0A(010) Spin_Retry_Count 主轴起旋重试次数(即硬盘主轴电机启动重试次数)
0B(011) Calibration_Retry_Count 磁盘校准重试次数
0C(012) Power_Cycle_Count 磁盘通电次数
C2(194) Temperature_Celsius 温度
C7(199) UDMA_CRC_Error_Count 奇偶校验错误率
C8(200) Write_Error_Rate: 写错误率
F1(241) Total_LBAs_Written:表示磁盘自出厂总共写入的的数据,单位是LBAS=512Byte
F2(242) Total_LBAs_Read:表示磁盘自出厂总共读取的数据,单位是LBAS=512Byte

ATTRIBUTE_NAME

硬盘制造商定义的属性名。,即某一检测项目的名称,是ID代码的文字解释。

FLAG

属性操作标志(可以忽略)

当前值(value)

当前值是各ID项在硬盘运行时根据实测原始数据(Raw value)通过公式计算的结果,1到253之间。253意味着最好情况,1意味着最坏情况。计算公式由硬盘厂家自定。
硬盘出厂时各ID项目都有一个预设的最大正常值,也即出厂值,这个预设的依据及计算方法为硬盘厂家保密,不同型号的硬盘都不同,最大正常值通常为100或200或253,新硬盘刚开始使用时显示的当前值可以认为是预设的最大正常值(有些ID项如温度等除外)。随着使用损耗或出现错误,当前值会根据实测数据而不断刷新并逐渐减小。因此,当前值接近临界值就意味着硬盘寿命的减少,发生故障的可能性增大,所以当前值也是判定硬盘健康状态或推测寿命的依据之一。

最差值(Worst)

最差值是硬盘运行时各ID项曾出现过的最小的value。
最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。通常,最差值与当前值是相等的,如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历过恶劣的工作环境(如温度)。

临界值(Threshold)

在报告硬盘FAILED状态前,WORST可以允许的最小值。
临界值是硬盘厂商指定的表示某一项目可靠性的门限值,也称阈值,它通过特定公式计算而得。如果某个参数的当前值接近了临界值,就意味着硬盘将变得不可靠,可能导致数据丢失或者硬盘故障。由于临界值是硬盘厂商根据自己产品特性而确定的,因此用厂商提供的专用检测软件往往会跟Windows下检测软件的检测结果有较大出入。
硬盘的每项SMART信息中都有一个临界值(阈值),不同硬盘的临界值是不同的,SMART针对各项的当前值、最差值和临界值的比较结果以及数据值进行分析后,提供硬盘当前的评估状态,也是我们直观判断硬盘健康状态的重要信息。根据SMART的规定,状态一般有正常、警告、故障或错误三种状态。
SMART判定这三个状态与SMART的 Pre-failure/advisory BIT(预测错误/发现位)参数的赋值密切相关,当Pre-failure/advisory BIT=0,并且当前值、最差值远大于临界值的情况下,为正常标志。当Pre-failure/advisory BIT=0,并且当前值、最差值大于但接近临界值时,为警告标志;当Pre-failure/advisory BIT=1,并且当前值、最差值小于临界值时,为故障或错误标志

TYPE

属性的类型(Pre-fail或Oldage)。Pre-fail类型的属性可被看成一个关键属性,表示参与磁盘的整体SMART健康评估(PASSED/FAILED)。如果任何Pre-fail类型的属性故障,那么可视为磁盘将要发生故障。另一方面,Oldage类型的属性可被看成一个非关键的属性(如正常的磁盘磨损),表示不会使磁盘本身发生故障。

UPDATED

表示属性的更新频率。Offline代表磁盘上执行离线测试的时间。

WHEN_FAILED

如果VALUE小于等于THRESH,会被设置成“FAILING_NOW”;如果WORST小于等于THRESH会被设置成“In_the_past”;如果都不是,会被设置成“-”。在“FAILING_NOW”情况下,需要尽快备份重要 文件,特别是属性是Pre-fail类型时。“In_the_past”代表属性已经故障了,但在运行测试的时候没问题。“-”代表这个属性从没故障过。

原始值(RAW_VALUE)

制造商定义的原始值,从VALUE派生。
数据值是硬盘运行时各项参数的实测值,大部分SMART工具以十进制显示数据。
数据值代表的意义随参数而定,大致可以分为三类:
1)数据值并不直接反映硬盘状态,必须经过硬盘内置的计算公式换算成当前值才能得出结果;
2)数据值是直接累计的,如Start/Stop Count(启动/停止计数)的数据是50,即表示该硬盘从出厂到现在累计启停了50次;
3)有些参数的数据是即时数,如Temperature(温度)的数据值是44,表示硬盘的当前温度是44℃。
因此,有些参数直接查看数据也能大致了解硬盘目前的工作状态。

SMART参数(05,C5)

  硬盘SMART参数中(05)是非常重要的一项,称为重新映射扇区计数(Reallocated Sectors Count),它直接表示硬盘是否已经出现了不良扇区。
  以前的硬盘只要某磁道出现一个坏扇区,该磁道就算“坏磁道(Bad Track)”,修复时就整个磁道所有扇区一起“跳过(skipped)”。所以,坏磁道和坏扇区没有区别开,一起称为“坏道”。而现在的硬盘每个磁道划为数百上千个扇区,不能因为有一个坏扇区就丢掉整个磁道。再说硬盘在制造完成后本身就已有相当多的不良扇区(可能有成百上千之多),所以为了提高成品率,硬盘的设计容量是大于标称容量的,多余的那部分(用户不可见的)容量就是用来弥补“制造时已出现的”以及“以后使用时新增的”不良扇区的。这也是现代硬盘的一个自修复功能,只要这个功能在起作用,你就不会发现硬盘出现坏道,所以说“坏道”也是一个应该淘汰的老词了。
  这一自修复功能的原理是:当硬盘的某扇区持续出现读/写/校验错误时,硬盘固件程序会将这个不良扇区的地址重定向到预先保留的某个备用扇区,这就称为重新映射扇区。此后这个不良扇区不会再被使用,这等于将这个不良扇区屏蔽了,所以这样的硬盘容量不会减少,在Windows常规检测中也不会发现坏扇区,只有从SMART参数中才能发现已经有不良扇区被替换。
  完好的硬盘,(05)项的数据肯定为零,当前值远大于临界值。如果数据不为零就表示已经有不良扇区被“重映射”,被重映射的扇区增加,当前值就会下降。如果当前值下降到接近临界值,就说明备用扇区将用尽。
  与(05)项相配合的参数还有(C5)。(C5)是当前待映射扇区计数(Current Pending Sector Count),这一参数的数据表示了“不稳定”的扇区数,即“等待被映射”的扇区数量。因为扇区仅仅读取错误并不会导致立即重映射,只有在写入失败时才会发生重映射。
  所以,如果有扇区在读取时出现错误,(C5)就会有计数,表示有扇区不稳定。如果该扇区随后被读写成功,等待被映射的操作就会取消,(C5)的计数会下降。如果下一次对该扇区的写操作继续发生错误,就会产生重映射,然后(05)计数要增加,(C5)计数随之下降。如果以后长时间并未再对该扇区进行任何读写操作,那么(C5)的计数也会一直维持下去。
  因此,当你的硬盘发现(05)参数有了数据量后,并不需要任何操作,只要注意以后的发展。如果(05)的数据量不大,也不再增长,那这块硬盘还可继续使用。若(05)的数据不断上升,说明硬盘已处于不稳定状态,应当立即备份数据,调换硬盘了。因为备用扇区一旦用尽,再有不良扇区就会真的出现坏道导致数据丢失。即使使用专门的工具把坏道隔离出来,也不能保证不再出现新的坏道,而且硬盘容量会明显减少。
  由于不同硬盘的备用扇区数量并不相同,所以单看(05)的数据量并不能判断硬盘还可支持多长时间,还要注意(05)的当前值,即使(05)的数据量不大,但当前值下降很快,甚至接近临界值,也应果断调换硬盘。另外,有的硬盘(05)的数据量很大,但不再增长,而且当前值也下降很少,这样的硬盘最好也不要再使用,因为保留的备用扇区都是位于磁盘的尾部,大量使用保留扇区将大大增加磁头的寻道操作,使得读写效率下降,导致系统运行缓慢。

SMART参数(C7)

  (C7)参数也是比较引人注意的,这个参数的数据累计了通过接口循环冗余校验(Interface Cyclic Redundancy Check,ICRC)发现的数据线传输错误。如果这个值不为0而且持续增长,表示硬盘控制器→数据线→硬盘接口出现错误,劣质的数据线、接口接触不良都可能导致此现象,并将导致数据传输速度下降,与硬盘本身倒关系不大。
  唯一要了解的是,有些新硬盘的这一参数也有一定数据量,这并不表示硬盘有什么质量问题。因为(C7)参数的数据只会增长,不会归零。所以当你更换了数据线、清洁了接口后发现数据不再增长,即表示问题已解决。

服务器/硬盘smart.txt · 最后更改: 2020/09/17 14:50 由 caiweizhi