[Eisfair] Eisfair64 Kiste abgeschmiert: Jetzt startet virtualbox nicht mehrr

Kay Martinen kay at martinen.de
Mi Feb 5 11:55:45 CET 2020


Am 04.02.20 um 22:00 schrieb B. Sprenger:
> Hi @all,
> 
> im Prinzip habt ihr ja recht.
> Aber ich arbeite hier wenig nach dem KISS-Prinzip (keep it simple)

Das Gegenteil wäre KIC, Keep it Complicated. :-) Findest du das wirklich?

> und bin damit die letzten 25 Jahre gut gefahren.
> Ich hatte im EIS, das müsste der Vorgänger des jetzigen gewesen sein,
> einmal ein Defekt.

In der Hardware, Mainboard oder Software?

> Also den nächsten Büro-PC genommen, die Daten-Platten reingesteckt und
> mit einer zus. leeren Platte eine neuse Systen hochgezogen.
> Nach einer halbe Stunde lief das wieder.

Und beispielsweise bei einem Proliant (oder anderem mit Redundanz) hast
du Null Downtime - wenn nicht grad der RAID Controller oder das
Mainboard defekt ist. Der Controller ist onboard gesteckt, sein Akku
auch, aber beim Mainboard hilft nur Tausch.

Der hat aber eh schon 2 Netzteile, 2 Netzwerkkarten und mit weniger als
2 Platten kann man den eh kaum betreiben = Raid 1.

Heißt: Es kann jeweils ein Netzteil, eine Netzwerkkarte, eine Platte und
auch mehrere Speichermodule kaputt gehen (mit Spare-Memory Setup) das
interessiert nicht, der läuft einfach weiter und zeigt eine Orange
Health-LED an der Front und sendet dir evtl. Alarm Berichte.

Die Netzwerkchips sind onboard, du kannst aber m.W. bei fast jedem
Modell im Laufenden Betrieb eine Steckkarte (Hot Plug) einsetzen. Evtl.
mußt du nicht mal neu booten (OS-Abhängig). Defekte und automatisch
deaktivierte Speichermodule kannst du ebenso im Laufenden Betrieb wechseln.

Wenn du Ersatzteile auf lager oder besorgt hast kannst du ebenso das
defekte Netzteil (an dem die Grüne LED nicht mehr leuchtet) im Betrieb
raus ziehen und den Ersatz einschieben. Fertig. Ebenso bei den Platten.
Einfach die per LED gezeigte ziehen, ersatz rein schieben und der
Controller fängt mit dem Rebuild an. Wenn der Fertig ist hast du wieder
redundanz. Und, die Zwei Netzteile ermöglichen auch z.B. eines/Beide an
eine/zwei USV zu hängen. Fällt der Strom aus zieht er den Saft
automatisch aus der USV die ihn (USB/Seriellkabel) auch zeitig runter
fahren kann wenn ihr der Akku leer läuft - weil der Strom länger weg
bleibt als die Kapazität reicht.

Man kann es auch noch anders machen. Wenn die Anforderungen an
Ausfallsicherung da sind oder das Geld kauft man statt einem gleich zwei
Server der genau gleichen Art & Ausstattung. Geht dann auf Mainboard,
NIC, Controller o.a. was kaputt fährt man ihn runter, zieht die heilen
Platten, Netzteile, Speicher raus, steckt sie in den zweiten und fährt
den einfach wieder hoch. Da das Raid-setup auf den Platten gespeichert
ist liest der Controller das beim Hochfahren und will bestenfalls noch
ein F1 oder F2 haben um das Setup zu übernehmen.

Das dauert auch deutlich unter einer halben Stunde, ich schätze: Keine
10 Minuten.

> Danach auf der defekten Kiste in Ruhe den Fehler gesucht, behoben und
> gut wars.

Und was macht der jetzt?

> Und an die Konsole komme ich mit einem KVM-IP-Switch

Kann man machen, als zusätzliche Externe Lösung. Ich hab nur einen
einfachen 8 Port Compaq KVM mit Okopus-Kabeln im Rack. Für den Zugriff
vor Ort. Der/Die Server steuere ich über ssh oder den Management-Port.
Den sollte man im Firmen-umfeld dann sowieso in einem eigenen Management
(V)LAN einsperren zu dem nur eine Admin-Maschine zugriff hat und aus dem
man nicht ins Internet kommt.

Kay

-- 
Posted via SN


Mehr Informationen über die Mailingliste Eisfair