2009年8月20日木曜日

稼動実績からハードディスクドライブ(HDD)の環境別MTBFを割り出す

ハードディスクドライブ(HDD)を沢山並べて運用していると実際よく壊れる。
在庫を適正に管理しないといけないが、見積りに役立つはずのMTBFがメーカのカタログだとどうも・・・
結論から言うと実際のMTBFは大体6万時間くらいだ、環境がよければ10万とかだろうか。
 
 


メーカのカタログも嘘じゃないけど・・・


先日下の記事を見てちょっと考えた。
 



// 平均故障間隔100万時間のHDDは「114年故障しない」?
http://itpro.nikkeibp.co.jp/article/COLUMN/20050829/220247/
 
HDDのMTBFが100万時間の場合,MTBFのとらえ方は?

例えば100台のHDDを使っているとして,100台のHDDの延べ稼働時間が100万時間になったとき1台のHDDが故障する。





なるほど。
某メーカのHDD、MTBFカタログ値"120万時間" だと...
100台稼動している状況では、12,000時間に1台=500日に1台故障?
 
もっと多い!多いよ実際?
 
 

なんでこんなに実際におきるHDD障害とのずれを感じるのかというと、下記のようにからくりがある為だ。
 





 

つまるところ、HDDのMTBFは自分の環境にて計測しましょうという事に他ならない。
じゃあ割り出しましょう。
 
 


自分の環境で有効な、真のMTBFを計測しておく


一定期間のサンプルが必要だけど、非常に簡単な計算でOKだ。
 

x 台の運用HDDがあるとして、 y 日間稼動させたら z 台壊れて交換しました。
x,y,zが用意できたら、下記表に当てはめて計算しよう。
 




稼働台数稼働日数故障・交換台数MTBF(時間)
(x)(y)(z)式1

 



    式1: x * ( y * 24 ) / z


※ 延べ時間を故障回数で割るだけ。24は単位を日から時間に変換。
※ x に予備HDDの台数は含まない
 
 

一応計算例を、
240台のHDDが稼動しているシステムで、30日間に4台壊れました
240 * (30 * 24) / 4 = 43200
この環境ではHDDのMTBFが 43200 時間になる。
 


というわけで、カタログの実に1/30だがどうだろう。実際このくらい壊れるよね?
あとはこのMTBFを元に故障率やら信頼性を出すなり、環境にあった適正在庫を算出するとよい。