Warum ich (schon wieder) dieses Jahr kaum was geschrieben habe…

Der Zirkus begann im November 2014….

Störrische Server, Teil 1

Einer meiner Server im Rechenzentrum machte „blöd“. Obwohl alle Festplatten noch mindestens 5 Jahre vor sich hatten, passierten sehr sehr seltsame Dinge. Ursache war wohl ein Fehler auf der Backplane der Festplatten – nach dem Austausch war Ruhe im Karton.

Kaum war das Problem behoben, rollte das nächste Problem langsam, unbemerkt, aber doch zunehmend meine Nerven strapazierend an: immer mehr Virtuelle Maschinen verbrauchten 100% CPU und das weil sie ständig im „io_wait“ standen weil sie entweder ihre Daten nicht auf die Platte schreiben konnten oder einfach keine Daten von den Platten bekamen.

Ich hab das Problem dadurch gelöst, indem ich noch einen Server ins Rack gestellt habe um die Last besser zu verteilen.

Gartenarbeit unter sengender Sonne

Das ging auch sehr gut, sodass ich mich beruflich bisserl „Freischaufeln“ konnte um im Sommer mit der Hilfe zweier Freunde bei über 30°C im Schatten endlich den Garten weiter zu „optimieren“ – klugerweise in der Urlaubswoche meiner Frau, denn echte Kerle nehmen auf die bestehende Bepflanzung nur begrenzt Rücksicht und Kollateralschäden gefallen der Cäsarin nicht 🙂

Das war eines der Bilder, welches ich meiner Frau dann auf ihre Urlaubsinsel als Geburtstagsüberraschung gesendet habe:

klein_IMG_5016

Die von uns erzeugten (Zer-)Störungen führten nur zum Kommentar „das muss nun eh alles anders gemacht werden“ – uff, nochmal Glück gehabt.

Die Diskussion über den Sonnenschutz des Freisitzes zog sich nochmal über Wochen hin. Ich hab dann einfach bei Amazon etwas Günstiges bestellt. Die Qualität dieser „Pergola“ ist unterirdisch (ich habe noch nie Alumium und Plastik rosten sehen), aber die Nutzerkommentare auf Amazon haben dafür gesorgt dass ich beim Aufbau jede Schraube mit ordentlich überdimensionierten Unterlegscheiben versehen habe und bestimmte Teile gleich mit Hammerit und/oder Öl verzierte. Die Konstruktion konnte sogar Sturmfest gemacht werden und nur einer der Pfosten ist nun etwas schief.

garten

Um das Ganze mal in Relation zu bringen, hier zwei Panoramas vom gleichen Standort (2x klicken für grösseres Bild).

Vorher

garten_alt

Nachher

garten_neu

Sommerliche Reste

Was macht man sonst noch bei hohen Temperaturen neben der Gartenarbeit? Bevorzugt Kunden aufsuchen die eine Klimaanlage haben 🙂

Störrische Server, Teil 2

Den Rest des Sommers habe ich damit verbracht, meinen Servern im Datacenter gut zuzureden. Mehr Aufgaben und die damit verbundene höhere Last sorgten für eine rapide Alterung der Systeme. Ehe ich richtig realisierte was da los ist, mussten von 20 Festplatten 6 Stück wegen Fehlern ausgetauscht werden.

Und ausserdem musste ich nochmal scharf darüber nachdenken, ob RAID-5 mit 3 Platten so richtig tauglich ist für das Jahr 2015. Lange mit erfahrenen Kollegen gesprochen und jetzt wird alles auf RAID-1 mit einer separaten Platte für die Datensicherung umgestellt.

Also noch einen 1HE Barebone besorgt, mit RAM, Platten und CPUs bestücken lassen und da ich sowieso innerhalb des Rechenzentrums umziehen musste wurde der neue Server einfach mal ins neue Rack auf den Gitterboden gelegt.

Das war 7 Tage vor meinem Urlaub, genug Zeit zum Testen der Hardware. Alles war gut – der Datendurchsatz beim Schreiben hat sich von 20MB/s auf 100MB/s erhöht, die Leseperformance auch super als wäre man von einem alten VW Käfer auf ein modernes Auto gewechselt.

An einem ruhigen Mittwoch Abend alle Dienste (darunter auch den zentralen Nameserver) von einem „kritischen“ Server auf den neuen „guten“ Server überspielt, gestartet und abgewartet. 3 Tage Ruhe, also nix wie ab in den Urlaub auf eine sonnige Insel in der Ägäis.

Endlich Urlaub!

Montag Morgen um 1 Uhr ab nach Düsseldorf, 6 Uhr Start des Ferienfliegers, Ankunft auf Samos. Schnell alle Server geprüft, keine Probleme – Urlaubsstimmung.

Am Nachmittag passierten dann mehrere Sachen gleichzeitig: das WLAN unseres Appartments funktioniert nicht so wie es sollte, die DTAG hatte seltsame DSL-Probleme im Rhein-Main-Netz, der Mailserver zickte auf Server 2 herum wärend der Nameserver auf dem neuen Server 4 keine Anfragen mehr beantwortete. Da E-Mail und Nameserver stark verzahnt sind (ohne das Eine geht das Andere nicht) kann man schlecht erkennen welche der beiden Dienste klemmt. Und wenn der Kunde dann anruft und sagt „nichts geht mehr“ darf man raten, wo es nun genau hängt.

Diese Arbeit an der „Kristallkugel“ zog sich über den gesamten Urlaub hin. Meine Frau hat geduldig mein kleines Netbook in ihren Rucksatz gesteckt und es auch mit Gelassenheit ertragen, dass ich mitten in der Einöde mal für 15min mit Laptop und Telefon den Serverbetrieb aufrecht erhalten musste – aber dazu mehr in einem separaten Bericht.

Hier zb….

IMG_1181

Bei genauerer Betrachtung sieht man den Autor verzweifelt in der Einöde einen GSM-Zugang via Reserve-Netbook zu erlangen um festzustellen wo es klemmt und nochmal einen Reboot eines Servers anzufordern.

IMG_1181x

Endlich Zuhause!

Auch vom heimischen Büro aus konnte ich nicht mehr machen, als die Kunden zu vertrösten. Denn meine Kollegen bei Pars-Computer haben zwar Ersatzteile für die Generalüberholung bekommen aber die wichtigsten Teile sind paar Tage auf dem Postweg liegengeblieben (Weihnachten fängt in Deutschland immer früher an) oder die bestellten „neuen“ Festplatten zeigten sich als „fast neue Ware mit 4 Jahren Betriebsstunden“.

Pünktlich bevor alle Beteiligten (Anbieter wie Kunden) entgültig die Nerven verloren haben, kam Server Nummer 1 aus der Werkstatt und dann erstmal Rack aufräumen und alles „ordentlich“ installieren – und schon war von einer zur anderen Stunde absolute Ruhe.

Und zwar so ruhig, dass ich mir anfänglich jede Stunde selber eine E-Mail geschrieben habe um zu testen ob das wirklich alles läuft oder nicht doch ein unbekanntes Problem aufgetreten ist.

Tragischer Verlust eines Familienmitglieds

Als hätte die Welt nur darauf gewartet, dass bei mir wieder Frieden einkehrt, ist sie im zarten Alter von 25 Jahren verschieden: die Miele Waschmaschine meiner Frau. Und das ausgerechnet in dem Moment, wo 2 Koffer Urlaubswäsche anstanden. Da als Ursache nur die elektromechanische Programmautomatik in Frage kam und diese Teile auf eBay zu Preisen eines echten Picassos gehandelt werden gab es einfach eine neue „Miele“. Dienstag bestellt, Samstag Anlieferung inc. Aufbau, Anschluss und Entsorgung des Altgerätes. Beim Abbau zeigte sich die eine oder andere Träne in der Familie – aber da muss man durch.

Und nun?

Letzte Katastrophe war defekter SATA-Stecker an einer SSD – warum auch immer hat Intel an dieser SSD den plattenseitigen Anschluss so gestaltet, dass das Gegenstück nicht „einclipst“. Und so haben Kälte, Hitze und Staub über die Jahre dafür gesorgt dass der Ausfall genau dann passiert wenn ich es garnicht gebrauchen kann. Die „Reparatur“ war einfach: alles steckt in virtuellen Maschinen, die Festplatten-Images werden regelmässig und verteilt gesichert sodass einfach nur eine neue Festplatte für das Betriebsystem rein musste.

Irgendeine der zentralen Abflussmuffen im Keller meiner Hütte ist jetzt auch undicht. Wände und Teppich haben bislang das Wasser aufgesogen, aber irgendwie muss da mal die Ursache gefunden werden.

Die „Satte Liter Schüssel“ auf dem Dach wurde von den Stürmen der letzten Jahre etwas vom Sender im Orbit weggedreht und muss neu justiert werden. Mich störts nicht da nur das „Unterschichtenfernsehen“ nicht mehr reinkommt. Der eine Radio- und Fernsehtechniker will nicht aufs Dach (im Frühling zu nass, im Sommer zu heiss, im Herbst zu stürmisch – nach Winter hab ich gar nicht gefragt), dem anderen sterben ständig die Schwiegermütter und langsam überlege ich auf IP-TV umzustellen und den Rotz abzubauen.

Mal schauen was noch so kommmt….

Na klar: alle nachsommerlichen Folgen von Neo Royale mit Jan Böhmermann anschauen!

Dieser Beitrag wurde unter Dies und das... veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*