Datadog の仕様

Photo by StockSnap on Pixabay

グラフにプロットされる値(描画数の制限)

基本仕様

  • 描画可能なデータポイントの数は 300個
クエリからグラフまで
https://docs.datadoghq.com/ja/dashboards/querying/
期間内に各グラフで表示できるポイント数は 300です。
https://docs.datadoghq.com/ja/dashboards/guide/query-to-the-graph/
Datadog のバックエンドは、時間間隔の数を最大 300 個に抑えようとします。
(余談)この情報探していても、検索とかからはたどり着きにくかったです。

(参考)ポイント数

それぞれのタイムスケールと取得頻度において、どのくらいのデータポイントがあるのかを示します。

タイムスケール 60秒 5分 15分 備考
1h 60 12 4
4h 240 12 4
1day 1440 288 96
2day 2880 576 192
1week 10080 2016 672
1month 43200 8640 2880 1ヶ月30日換算

青字は300を越えてくる部分です。値が集約されます(デフォルトは平均で集約)。

X軸の表示

タイムスケール(時間枠)を指定すると、下記の通りになる。

4h 1day
折れ線グラフ 1分に1つの値に集計 5分に1つの値に集計
棒グラフ 2分に1つの値に集計 20分に1つの値に集計

グラフの集計方法

avg by 平均 デフォルト
max by 最大
min by 最小
sum by 合計

ロールアップ/ rollup (データの集約)

任意設定のため、設定しないと平均のロールアップが適用される。
集計方法で、 max / min / sum を指定している場合はこちらも変えるほうが直感的なグラフになる。タイムスケールを広く(4h→1day→1month→6month)したときによくわかる。

AGGREGATOR

avg 平均 デフォルト
max 最大
min 最小
sum 合計
count カウント

INTERVAL

データポイント間の間隔(秒)。任意。

  • .rollup(max)
    最大値で集計
  • .rollup(avg,86400)
    86400秒=24時間=1日ごとの平均
  • .rollup(sum,21600)
    21600秒=6時間ごとの合計
  • rollupに何を指定しても冒頭の「データポイントの数は 300個」の制限はうける

アラートの保持

モニタアラートの仕様です。

自動解決(Auto resolve)

アラートトリガーされた状態から解決するタイミング。データが報告されている場合は解決されない。

  • Never(デフォルト)
  • After N hour

グループ保持時間(Remove the non-reporting group)

  • 24 hour (デフォルト)
  • N hour

データが欠落してから N 時間経過すると、そのグループをモニターステータスから削除する。最大で 72 時間です。

・データが報告されなくなったときに結果を保持したくない
・トラブルシューティングにかかる想定時間のみ維持する(その後は維持しない)

(補足)On missing data オプションをサポートするマルチアラートモニターで機能。

アラートのグループ化

クエリを定義する際に group by の手順で選択したグループに応じて自動的にグループ化する。

  • クエリにグループ化がない場合、デフォルトで Simple Alert (シンプルアラート) でグループ化。
  • クエリがディメンションでグループ化されている場合は、Multi Alert (マルチアラート) でグループ化。
タイトルとURLをコピーしました