在Linux下判断硬盘健康情况

仅供实体服务器,虚拟机/VPS/云服务器无效!

先安装Smartmontools工具

Debian/Ubuntu
sudo apt-get install smartmontools

RHEL/CentOS
sudo yum install smartmontools

先使用[sudo fdisk -l]查看硬盘

[root@N/A ~]# sudo fdisk -l

Disk /dev/sda: 500.1 GB, 500107862016 bytes, 976773168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes

这边以[sudo smartctl -A /dev/sda]举例

SMART

一般情况下S.M.A.R.T.这么多数据我们只要关心如下几个

Reallocated_Sector_Ct
Uncorrectable Sector Count -可能不显示
UDMA_CRC_Error_Count

[Reallocated_Sector_Ct]数值不为0(RAW_VALUE下方)时硬盘就需要更换了,尤其是在RAID5/6

可以看到THRESH下[Reallocated_Sector_Ct]的临界值为140 超过数值后硬盘将变得完全不可靠!!

[Reallocated_Sector_Ct] 数值越大数据安全性越低 如果不打算更换硬盘请时刻关注此数值!!

一般出现[UDMA_CRC_Error_Count]更换/重新插拔SATA线即可,插拔后在观察数值是否有增加

以上教程只能用于机械硬盘


额外:

SSD的S.M.A.R.T.一般由各个厂商定制,所以数据判断可能并不准确

SSD一般可以查看以下值

Hardware ECC Recovered
Media Error

以上值不为0时 数值越大数据安全性越低

留下评论