这个计算器能做什么
本工具根据两项可靠性指标——MTBF(平均故障间隔时间,Mean Time Between Failures)和 MTTR(平均修复时间,Mean Time To Repair)——计算系统、服务器或网络组件的可用性(在线率百分比)。这是一条通用的可靠性工程公式,广泛应用于 IT、电信、制造业以及数据中心运维,用来衡量系统处于"在线可服务"状态的时间占比。
使用方法
分别填入两次故障之间的平均运行时间(MTBF)和故障后恢复服务所需的平均时间(MTTR),两者请使用相同的时间单位(用"小时"最为方便)。计算器会输出以百分比表示的可用性、与之对应的停机百分比,以及按每年 8,760 小时估算的年停机小时数。
公式详解
可用性指的是系统正常运行时间在总时间中所占的比例:
$$\text{可用性} = \frac{\text{MTBF}}{\text{MTBF} + \text{MTTR}} \times 100$$MTBF 越高(故障越少)、MTTR 越低(修复越快),可用性就越接近 100%。公式中的分母代表一个完整的"故障—修复"周期,因此该公式本质上就是衡量这个周期里系统正常运行所占的份额。
实例演算
假设某台路由器的 MTBF 为 1,000 小时,MTTR 为 4 小时。可用性 $$\text{可用性} = \frac{1000}{1000 + 4} \times 100 = 99.6016\%$$。停机率为 \(0.3984\%\),换算到一整年(8,760 小时)约相当于 34.9 小时的中断时间。若想达到业界著名的"五个九"(99.999%),就必须大幅缩短修复时间,或显著提升 MTBF。
常见问题
"五个九"很难实现吗? 是的——99.999% 的可用性意味着每年只允许约 5.26 分钟的停机时间,这需要冗余设计和极快的恢复能力才能做到。
MTBF 和 MTTR 可以用不同单位吗? 不行。两者必须使用同一单位(例如都用小时),这样比值才是无量纲的。
这个结果包含计划内维护吗? 基础可用性只统计非计划内的修复时间;如果你想计算运营可用性,则需把计划内停机也算进 MTTR。