numproc – Die Suche nach dem ultimativen Monitoring Tool

Kryptischer Titel, ja.

„numproc“ gibt an, wieviele Tasks (Prozesse, Threads und sonstiger Kleinkram) gleichzeitig ausgeführt werden dürfen. Für mich als Massenhoster im „Kleinen“ war das noch nie ein Parameter der besonderer Aufmerksamkeit bedurfte: eine virtuelle Maschine braucht so viel vom Kuchen bis alle virtuellen Maschinen halt nicht mehr so recht zusammen laufen wollen.

Aber obwohl ich alle meine Kinderchen in einem Rechenzentrum zusammenhalte sind paar Rechner ausserhalb immer von Nöten.

Wie z.B. der von DENIC geforderte 2nd Nameserver, den ich auf einem „Little-VServer“ bei 1&1 hoste. Ein CPU-Core, 512kb RAM (bei Bedarf erweitert sich das zauberhaft auf 4GB), abgemessener Platteplatz und kein Trafficlimit für 9,99 EUR ist schon OK.

Aber die Tage hat es mich nach 2 Jahren Abstinenz wieder angetrieben, mein fossiles Nagios als Netzüberwachungssystem mal durch was besseres zu ersetzen und gleichzeitig Munin als Ressource-Display abzulösen.

Das ultimative Monitoring-Tool hab ich noch nicht gefunden. Es gibt diverse Sprösslinge von Nagios welche (nach dem Motto „warum das Rad neu erfinden“) noch mehr Probleme an den Urvater der Überwachungsprogramme anflanschen und neue Tools, die angeblich alles Automatisieren aber das entweder nur in einer Entersprise-Version wirklich können oder breit darüber schwafeln und es dem Anwender überlassen, die notwendige Funktion dafür zu finden.

Im Grunde genommen ist Monitoring ganz einfach: Man definiert sich selber paar Templates was alles abgeklappert werden soll und lässt das auf ein Netzwerk los. Heraus kommt eine Liste die man in die andere Liste der „Festen Hosts“ übernimmt und dann entweder über das Template oder Sonderfunktionen feinkonfiguriert.

Übrig blieben:

OpenNMS – Eine Java-Programmierung als exemplarisches Beispiel von Bloatware. Mir kam es vor, dass jedes Tool was irgendeinen Zweck auf dieser Welt erfüllt, dort eingebunden wurde. Die Installations- und Startuproutinen sind ständig an irgendwas verhungert und gescheitert. Alleine der Zwang, auf irgendwelchen Umwegen das schon längst obnsolete Java 1.6 „Original Sun“ auf einer aktuellen Linux-Büchse zu installieren, hat bei mir den einen oder anderen Kotzanfall ausgelöst. Die diversen Startscripte geben es schon her irgendeine Java-Version zu nutzen. Dokumentiert ist das aber alles nicht. Nach sorgfältigem Studium der Wegbseiten von OpenNMS scheint es auch keine Schlipskompatiblen Reports mit buntigen Grafiken über die Ressourcen auf einem Server zu geben.

Pandora FMS – Eigentlich ganz wunderbares Tool, einfach zu begreifen bis zu dem Moment wo man mal ein /24 Netz ordentlich „Aufklären“ (in dem Menues als „recon“ bezeichnet) will. Danach wird man mit Fehlermeldungen über Timeouts und Sonstigem in verschiedenen Logfiles unter /var/log bombardiert wärend die Benutzeroberfläche einem eine heile Welt vorgaukelt. Wer wo wie welche Daten liefert ist nicht ersichtlich. Nur der Pandora Agent (was man auf dem Zielserver installiert) ist mir positiv in Erinnerung geblieben weil er sich (nach copy & paste zweier Zeilen in seine Config) brav beim Server anmeldet – aber auf der anderen Seite nur Daten lieferte die mich nicht sonderlich interessieren. Man kann natürlich jeden Agent toll einzeln konfigurieren, aber spätestens nach der 5ten Maschine macht das alles keinen Fun mehr. Abhilfe scheint die Enterprise-Version zu schaffen, wo man die Agents remote konfigurieren kann. Leider habe ich nach 10min nicht herausfinden können wo ich mein Geld für die Enterprise-Version loswerden darf und gebe hiermit offiziell auf

Zabbix – Das grössere Übel von allen weil ich bis heute noch nicht herausgefunden habe, wie man den Kram überhaupt konfiguriert. Bei Pandora FMS hab ich über Umwege noch verstanden wo man welche Statusmeldung findet. Die Gemeinsamkeit von Zabbix mit Pandora: es gibt bei beiden einen „Discovery-Modus“ mit dem man ein Netzwerk scannen kann. Bei Zabbix ist nie was herausgekommen, bei Pandora schon.

So einige Probleme wärend der Tests scheint durch das „numproc“ Hardlimit bei den VMs bei 1&1 zu liegen: ich war bass erstaunt, dass da nur 96 Prozesse insgesamt erlaubt sind. Klar – ich fahre optimierte Java-Anwendungen, die mit 2-20 Prozessen/Threads erstaunliche Leistungen erbringen. Aber bei einer heutigen App, die auf Linux/Apache/PHP/MySql läuft schert sich doch keiner um Ressourcen und daher war ich überrascht, dass 1&1 dort schon so früh den virtuellen Stecker zieht.

Nach Lesart des Webs macht es keinen Sinn, wegen des numproc-Limits beim 1&1 Support zu quengeln. Und gemäss dieser Tabelle von 1&1 machen Updates auf das nächsthöhere Paket nicht wirklich Sinn: 96 Prozesse bei L, 128 bei XL und 256 bei XXL. (Edit 10.04.2013: nach dem diese Limite über Jahre bestanden, wurde klammheimlich bei 1&1 nach oben geschraubt: 128/L, 256/XL und 512 Prozesse bei XXL – aber auch 128 ist für so eine VM noch viel zu wenig).

Ich habe die Preise für die 1&1 Server nicht im Kopf, aber für Virutal-Server XXL bekommt man schon einen Rootserver ohne dass „numproc“ zuschlägt.

Nach bisserl Suchen bin ich auf diesen Artikel gestossen und hab mal einen Auftrag bei Hosteurope angetriggert. Die haben auch Limits, aber ein numproc von 500 scheint mir eher angemessen für ein externes Monitortool zu sein. Kostet auch nur ganz wenig mehr.

Zur Auswahl stand noch Strato, aber zu denen gehe ich wegen ihres nicht vorhandenen Abuse-Managments schonmal aus Prinzip nicht.

Dieser Beitrag wurde unter Hardware, Schwachsinn veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.