SmartCollect SC² Dokumentation / Alarmierung / Übersicht der Alarme

Übersicht der Alarme

Mit Alarmen können Sie Probleme in Ihrem System sofort nach ihrem Auftreten erkennen. Indem Sie unbeabsichtigte Änderungen in Ihrem System schnell erkennen, können Sie Unterbrechungen Ihrer Dienste minimieren.

Alerts bestehen aus zwei Teilen:

  • Alert-Regeln - Wann der Alert ausgelöst wird. Alert-Regeln werden durch eine oder mehrere Bedingungen definiert, die regelmäßig von SmartCollect SC² ausgewertet werden.
  • Benachrichtigungskanal - Wie der Alert zugestellt wird. Wenn die Bedingungen einer Alarmregel erfüllt sind, benachrichtigt SmartCollect SC² die für diesen Alarm konfigurierten Kanäle.

Derzeit unterstützt nur die Grafikpanel-Visualisierung Alarme.

Alert-Aufgaben

Sie können die folgenden Aufgaben für Alerts durchführen:

Clustering

Derzeit unterstützt die Alarmierung eine begrenzte Form der Hochverfügbarkeit. Seit v4.2.0 von SmartCollect SC² werden Alarmbenachrichtigungen dedupiert, wenn mehrere Server betrieben werden. Das bedeutet, dass alle Alarme auf jedem Server ausgeführt werden, aber aufgrund der Dedupierungslogik keine doppelten Alarmbenachrichtigungen gesendet werden. Ein angemessener Lastausgleich von Alarmen wird in Zukunft eingeführt werden.

Notifications

Sie können auch Alarmregel-Benachrichtigungen zusammen mit einer detaillierten Nachricht über die Alarmregel festlegen. Die Nachricht kann alles Mögliche enthalten: Informationen darüber, wie Sie das Problem lösen können, einen Link zum Runbook usw.

Die eigentlichen Benachrichtigungen werden konfiguriert und von mehreren Alerts gemeinsam genutzt.

Ausführung des Alarms

Alert-Regeln werden im SmartCollect SC²-Backend in einem Scheduler und einer Abfrageausführungsmaschine ausgewertet, die Teil des Kerns von SmartCollect SC² ist. Momentan werden nur einige Datenquellen unterstützt. Dazu gehören MySQL, PostgreSQL und MSSQL.

Metriken aus der Alert Engine

Description Type Metric name
Total number of alerts counter alerting.active_alerts
Alert execution result counter alerting.result
Notifications sent counter counter alerting.notifications_sent
Alert execution timer timer alerting.execution_time