MCPで接続 →

計算を入力してください

公式

広告

結果

残りのエラーバジェット
43.2
minutes (100% left)
エラーバジェット総量 43.2 min
消費済みダウンタイム 0 min
期間の長さ 43,200 min
残りバジェット 100%

エラーバジェットとは?

サイト信頼性エンジニアリング(SRE)におけるエラーバジェットとは、サービスがサービスレベル目標(SLO)を満たしながら許容できる「不安定さ」の上限を指します。たとえば可用性99.9%を約束した場合、裏を返せば0.1%のダウンタイムを許容していることになります。この0.1%こそがエラーバジェットです。この汎用計算ツールは、任意のSLO目標値と対象期間を「許容できる最大ダウンタイム(分)」に変換し、すでに消費したダウンタイムを差し引くことで、残りのバジェットを表示します。

全期間を稼働時間と小さなエラーバジェット部分に分けて示す棒グラフ
エラーバジェットとは、全体の時間のうちダウンが許される小さな割合のことです。

使い方

SLO目標値をパーセントで入力し(例:99.9)、集計期間(週・月・四半期・年)を選択して、その期間内ですでに発生したダウンタイムを分単位で入力します。計算ツールは、エラーバジェットの総量、消費済みのダウンタイム、そして残りのバジェットを「分」と「パーセント」の両方で返します。

計算式の解説

まず対象期間を分に換算します:期間(分)=日数 × 24 × 60。エラーバジェットは (1 − SLO)× 期間(分) で求められ、ここでSLOは小数で表します(99.9% → 0.999)。最後に 残りバジェット = エラーバジェット − 消費済みダウンタイム となります。残りがマイナスになった場合は、すでにバジェットを使い切り、SLOに違反している状態を意味します。

$$ B_{\text{rem}} = \left(1 - \frac{\text{SLO (\%)}}{100}\right) \cdot P - \text{Downtime (min)} $$

$$ \text{where}\quad P = \text{Period (days)} \times 24 \times 60 $$

エラーバジェットの計算式を視覚化した図。2つの入力ボックスを掛けて結果を出す
エラーバジェットは、1からSLOを引いた値に期間の分数を掛けたものです。

計算例

SLOが99.9%、対象期間が30日間の月だとします。期間は \(30 \times 24 \times 60 = 43{,}200\) 分。エラーバジェットは \((1 - 0.999) \times 43{,}200 = 43.2\) 分となります。すでに10分のダウンタイムが発生していれば、残りのバジェットは \(43.2 - 10 = 33.2\) 分、つまりバジェット全体の約76.85%が残っている計算になります。

よくある質問(FAQ)

適切なSLOはどのくらい? サービスによって異なります。Webアプリでは99.9%(いわゆる「スリーナイン」)が一般的ですが、重要インフラでは99.99%以上を目標にすることもあります。SLOが高いほど、エラーバジェットは小さくなります。

残りがマイナスになったらどういう意味? 許容ダウンタイムを超過し、SLOに違反した状態です。SREチームでは、バジェットが回復するまでリスクの高いデプロイを凍結することがよくあります。

計画的なメンテナンスも含まれる? メンテナンス時間をダウンタイムとして数える場合のみ含まれます。多くのチームでは、事前告知済みのメンテナンスをSLOの計算から除外しています。

最終更新: