硬盘SMART参数

Linux下使用smartmontools

sudo smartctl -A /dev/sda

93328-lhocfxi7n8.png

ID & ATTRIBUTE_NAME

属性ID及描述(ID码的文字解释),对应HDtuneID

FLAG:属性操作标志(忽略它吧)

VALUE:当前值,对应HDtuneCurrent

当前值是各ID项在硬盘运行时根据实测原始数据(Raw value)通过公式计算的结果,1到253之间。253意味着最好情况,1意味着最坏情况。计算公式由硬盘厂家自定。
硬盘出厂时各ID项目都有一个预设的最大正常值,也即出厂值,这个预设的依据及计算方法为硬盘厂家保密,不同型号的硬盘都不同,最大正常值通常为100或200或253,新硬盘刚开始使用时显示的当前值可以认为是预设的最大正常值(有些ID项如温度等除外)。随着使用损耗或出现错误,当前值会根据实测数据而不断刷新并逐渐减小。因此,当前值接近临界值就意味着硬盘寿命的减少,发生故障的可能性增大,所以当前值也是判定硬盘健康状态或推测寿命的依据之一。

WORST:最差值

最差值是硬盘运行时各ID项曾出现过的最小的value。
最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。通常,最差值与当前值是相等的,如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历过恶劣的工作环境(如温度)。

THRESH:阈值(临界值)

在报告硬盘FAILED状态前,WORST可以允许的最小值。

临界值是硬盘厂商指定的表示某一项目可靠性的门限值,也称阈值,它通过特定公式计算而得。如果某个参数的当前值接近了临界值,就意味着硬盘将变得不可靠,可能导致数据丢失或者硬盘故障。由于临界值是硬盘厂商根据自己产品特性而确定的,因此用厂商提供的专用检测软件往往会跟Windows下检测软件的检测结果有较大出入。

硬盘的每项SMART信息中都有一个临界值(阈值),不同硬盘的临界值是不同的,SMART针对各项的当前值、最差值和临界值的比较结果以及数据值进行分析后,提供硬盘当前的评估状态,也是我们直观判断硬盘健康状态的重要信息。根据SMART的规定,状态一般有正常、警告、故障或错误三种状态。

SMART判定这三个状态与SMART的 Pre-failure/advisory BIT(预测错误/发现位)参数的赋值密切相关,当Pre-failure/advisory BIT=0,并且当前值、最差值远大于临界值的情况下,为正常标志。当Pre-failure/advisory BIT=0,并且当前值、最差值大于但接近临界值时,为警告标志;当Pre-failure/advisory BIT=1,并且当前值、最差值小于临界值时,为故障或错误标志

RAW_VALUE:原始值

制造商定义的原始值,从VALUE派生。
数据值是硬盘运行时各项参数的实测值,大部分SMART工具以十进制显示数据。
数据值代表的意义随参数而定,大致可以分为三类:
1)数据值并不直接反映硬盘状态,必须经过硬盘内置的计算公式换算成当前值才能得出结果;
2)数据值是直接累计的,如Start/Stop Count(启动/停止计数)的数据是50,即表示该硬盘从出厂到现在累计启停了50次;
3)有些参数的数据是即时数,如Temperature(温度)的数据值是44,表示硬盘的当前温度是44℃。
因此,有些参数直接查看数据也能大致了解硬盘目前的工作状态。

TYPE:属性的类型(Pre-fail或Oldage)

属性的类型(Pre-fail或Oldage)。Pre-fail类型的属性可被看成一个关键属性,表示参与磁盘的整体SMART健康评估(PASSED/FAILED)。如果任何Pre-fail类型的属性故障,那么可视为磁盘将要发生故障。另一方面,Oldage类型的属性可被看成一个非关键的属性(如正常的磁盘磨损),表示不会使磁盘本身发生故障。

UPDATED

表示属性的更新频率。Offline代表磁盘上执行离线测试的时间。

WHEN_FAILED

如果VALUE小于等于THRESH,会被设置成“FAILING_NOW”;如果WORST小于等于THRESH会被设置成“In_the_past”;如果都不是,会被设置成“-”。在“FAILING_NOW”情况下,需要尽快备份重要 文件,特别是属性是Pre-fail类型时。“In_the_past”代表属性已经故障了,但在运行测试的时候没问题。“-”代表这个属性从没故障过。

Win下使用HDtune或HDtunePro

运行HDtune,选择要查看的硬盘(硬盘必须通过 SATA 或 eSATA 连接,而不是 USB 连接,USB连接SMART参数显示不完全),选择“健康”标签,呈现的便是该硬盘的 SMART 参数。
实际使用下汉化版的,这里截图放的英文版主要是为的和smartmontools对应

58539-fbpku144ffk.png

ID:属性ID及描述,几个重要参数ID(05,C5,C6,C7)
Current:当前值
Worst:最差值
Threshold:阈值(临界值)
Data:数据
Status:状态

几个重要参数说明

smartmontools IDhdtune ID重要程度英文描述中文描述
101Raw_Read_Error_Rate底层数据读取错误率
404Start_Stop_Count启动/停止计数
505物理坏道,重要Reallocated_Sector_Ct重映射扇区数
909Power_On_Hours通电时间累计,出厂后通电的总时间,一般磁盘寿命三万小时
100ASpin_Retry_Count主轴起旋重试次数(即硬盘主轴电机启动重试次数)
110BCalibration_Retry_Count磁盘校准重试次数
120CPower_Cycle_Count磁盘通电次数
194C2Temperature_Celsius温度
197C5逻辑坏道,重要Current_Pending_Sector当前待映射的扇区计数
198C6比C5更重要,C5向05过渡的值Offline_Uncorrectable离线无法校正
199C7重要UDMA_CRC_Error_Count接口CRC错误计数
200C8Write_Error_Rate写入错误率

(05)重映射扇区计数。物理坏道,一旦出现,表示硬盘已出现了无法修复的物理坏道。这种情况,首先尽快备份数据,如在保修期内,马上更换。如过保了就将就用吧,只要(05)没有持续增加,直到数据值超过阀值,容量才开始减少,你可以通过一些工具屏蔽坏道,否则数据写入坏道就很难读出来了。而且如(05)持续增加,硬盘离坏也不远了,用不了多久就会超过阀值。

(C5)当前待映射的扇区数。逻辑坏道,这种情况比较多见。特别是停电、死机、蓝屏的次数比较多时,这项值出现机率就比较大。据体表现为拷贝时出现 CRC 冗余校验错误。一旦使用硬盘时出现 CRC 冗余校验错误,尽快用HDtune 查看的 C5 值,肯定不是0了。逻辑坏道一般是可以修复的。如果不重视,长期不修复,时间一长系统会把它当作物理坏道看待,直接写到(05)值里,那这个坏道就变成了物理坏道。

(C6)脱机无法校正的扇区数。比 C5 更重要,它是 C5 向 05 过渡的值。一旦出现,尽快备份数据,保修期则换,过保可尝试低格硬盘,可能会消除 C5 值而使 C6 不再增加,也不向 05 添加。

(C7)Ultra DMA CRC错误计数。这项值比较容易增加,原因多为SATA数据线有问题或与硬盘接口接触不良所至。如果此项值持续增加,换根数据线吧。

添加新评论

评论列表