Discussion:
[Check_mk (deutsch)] Redundantes Monitoring
Wagner, Torben
2018-10-09 09:24:45 UTC
Permalink
Hallo,
meine Abteilung möchte Check_MK implementieren.
Die Konfiguration des CMK-Hosts, WATO Konfigurationen, automatisiertes
Hinzufügen der Hosts, etc. hat ohne Probleme funktioniert.

Nun sind wir an dem Punkt angekommen, an dem wir eine zweite Site /
Instanz von Check_MK einrichten und eine Art Failover-Cluster bzw.
primär ein redundantes Monitoring aufbauen möchten.
Dabei wollen wir erreichen, dass zwei Instanzen von CMK (eine physisch,
eine virtuell) die Hosts überwachen und den Livestatus (der Master
hierfür wäre die physische Instanz) mit Informationen füttern. Sollte
es zum Ausfall der z.B. physischen Instanz kommen, dann soll das
Versenden von Mails über die virtuelle Instanz abgearbeitet werden. Im
Normalbetrieb mit beiden Instanzen aktiv soll nur der Master bzw. die
physische Instanz die Mailbenachrichtigungen versenden.

Was mir ins Auge fiel war der Artikel über das distributed monitoring. 
So wie ich den Artikel verstanden habe, kann ein Host nur von einem der
beiden Sites und nicht von beiden gleichzeitig überwacht werden.

Da wir nur die raw-Edition verwenden (möchten), steht die Appliance
zunächst außer Frage.
 

Habt Ihr noch irgendwelche Ideen, wie man das realisieren könnte?

Vielen Dank im Voraus und viele Grüße.
Torben Wagner
Grundke, Maximilian
2018-10-09 13:51:20 UTC
Permalink
Hi,

Da bleibt dir eigentlich nur, das Ganze selbst als Cluster zu bauen. Der typische Aufbau hier wäre DRBD + Pacemaker/Corosync. Vor einiger Zeit wurde mal dieses Tutorial hier auf der Mailingliste erwähnt: http://blog.simon-meggle.de/tutorials/nagiosomd-cluster-mit-pacemakerdrbd-teil-1/
Ist halt schon etwas älter, sollte sich aber problemlos auf heute übertragen lassen.
Oder ganz modern: Auf beiden Nodes (oder eher gesagt auch einem Dritten fürs notwendige Quorum) Docker Swarm oder Kubernetes und check_mk in einen Container verpacken und dann hinter einen Loadbalancer/Reverse Proxy stellen. Entweder reicht es dir, dass der eine Container wandern kann oder du startest je eine Instanz pro Node und müsstest dann dem LB beibringen, alle Anfragen an beide Seiten zu schicken oder sonstwie geartete Lösungen basteln. Aber auch dabei musst du dich selbstständig um den Storage-Sync kümmern, ergo vermutlich wieder DRBD wenn man nicht noch weitere Abhängigkeiten zu einem NAS oder SAN oder sonst wie aufbauen will.

So oder so hättest du dann dein Failover-Cluster. Wenn es nur für den einen Dienst sein soll, würde ich Pacemaker/Corosync bevorzugen, wenn du/ihr aber bereits ggf. Docker o.ä. nutzt wäre das eine Option.

Gruß Maximilian


-----Ursprüngliche Nachricht-----
Von: checkmk-de [mailto:checkmk-de-***@lists.mathias-kettner.de] Im Auftrag von Wagner, Torben
Gesendet: Dienstag, 9. Oktober 2018 11:25
An: checkmk-***@lists.mathias-kettner.de
Betreff: [Check_mk (deutsch)] Redundantes Monitoring

Hallo,
meine Abteilung möchte Check_MK implementieren.
Die Konfiguration des CMK-Hosts, WATO Konfigurationen, automatisiertes
Hinzufügen der Hosts, etc. hat ohne Probleme funktioniert.

Nun sind wir an dem Punkt angekommen, an dem wir eine zweite Site /
Instanz von Check_MK einrichten und eine Art Failover-Cluster bzw.
primär ein redundantes Monitoring aufbauen möchten.
Dabei wollen wir erreichen, dass zwei Instanzen von CMK (eine physisch,
eine virtuell) die Hosts überwachen und den Livestatus (der Master
hierfür wäre die physische Instanz) mit Informationen füttern. Sollte
es zum Ausfall der z.B. physischen Instanz kommen, dann soll das
Versenden von Mails über die virtuelle Instanz abgearbeitet werden. Im
Normalbetrieb mit beiden Instanzen aktiv soll nur der Master bzw. die
physische Instanz die Mailbenachrichtigungen versenden.

Was mir ins Auge fiel war der Artikel über das distributed monitoring. 
So wie ich den Artikel verstanden habe, kann ein Host nur von einem der
beiden Sites und nicht von beiden gleichzeitig überwacht werden.

Da wir nur die raw-Edition verwenden (möchten), steht die Appliance
zunächst außer Frage.
 

Habt Ihr noch irgendwelche Ideen, wie man das realisieren könnte?

Vielen Dank im Voraus und viele Grüße.
Torben Wagner

Loading...