SmartCollect SC² Dokumentation / Erste Schritte / Histogramme und Heatmaps

Einführung in Histogramme und Heatmaps

Ein Histogramm ist eine grafische Darstellung der Verteilung von numerischen Daten. Es gruppiert Werte in Bereiche (manchmal auch Bins genannt) und zählt dann, wie viele Werte in jeden Bucket fallen.

Anstatt die tatsächlichen Werte grafisch darzustellen, werden in Histogrammen die Bereiche dargestellt. Jeder Balken repräsentiert einen Bereich, und die Balkenhöhe stellt die Häufigkeit (z. B. die Anzahl) der Werte dar, die in das Intervall dieses Bereichs fallen.

Beispiel für ein Histogramm

Dieses Histogramm zeigt die Werteverteilung eines Paares von Zeitreihen. Sie können leicht erkennen, dass die meisten Werte zwischen 240-300 liegen, mit einer Spitze zwischen 260-280.

Histogramme betrachten nur Wertverteilungen über einen bestimmten Zeit-Bereich. Das Problem bei Histogrammen ist, dass Sie keine Trends oder Änderungen in der Verteilung über die Zeit erkennen können. An dieser Stelle werden Heatmaps nützlich.

Heatmaps

Eine Heatmap ist wie ein Histogramm, aber über die Zeit, wobei jede Zeitscheibe ihr eigenes Histogramm darstellt. Anstatt die Balkenhöhe als Darstellung der Häufigkeit zu verwenden, verwendet es Zellen und färbt die Zelle proportional zur Anzahl der Werte im Eimer.

In diesem Beispiel können Sie deutlich sehen, welche Werte häufiger vorkommen und wie sie sich im Laufe der Zeit entwickeln.

Pre-bucketed Data (vorgepuffert)

Im Allgemeinen kann jede Datenquelle verwendet werden, wenn sie die Anforderungen erfüllt: Serien mit Namen, die die Bereichsgrenze darstellen, oder Serien, die nach der Grenze in aufsteigender Reihenfolge sortiert sind, zurückgeben.

Rohdaten vs. aggregierte Daten

Wenn Sie die Heatmap mit regulären Zeitreihendaten (nicht vorgebuckelt) verwenden, dann ist es wichtig zu beachten, dass Ihre Daten oft bereits von Ihrem Zeitreihen-Backend aggregiert sind. Die meisten Zeitreihenabfragen geben keine rohen Stichprobendaten zurück sondern beinhalten eine Gruppierung nach Zeitintervall oder maxDataPoints-Grenze in Verbindung mit einer Aggregationsfunktion (normalerweise Durchschnitt).

Das alles hängt natürlich vom Zeitbereich Ihrer Abfrage ab. Aber der wichtige Punkt ist zu wissen, dass die Histogramm-Bucketing die SmartCollect SC² durchführt, auf bereits aggregierten und gemittelten Daten durchgeführt werden kann.

Wenn Sie die Gruppe nach Zeit in Ihrer Abfrage entfernen oder verringern (oder maxDataPoints erhöhen), um mehr Datenpunkte zurückzugeben, wird Ihre Heatmap aber dies kann auch sehr CPU- und speicherintensiv für Ihren Browser sein und könnte zu Hängern und Abstürzen führen, wenn die Anzahl der Datenpunkte unangemessen groß wird.