[Eisfair] Mehrere Probleme auf neu installiertem E1 64bit

Kay Martinen kay at martinen.de
So Mär 24 17:16:09 CET 2019


Am 24.03.2019 um 10:28 schrieb Jürgen Witt:
> 
> Am 23.03.2019 um 14:00 schrieb Fridrich:
>>
>> Die Hardware könnte da mitspielen. Teste die Speicherriegel und die
>> Festplatte.
>>
>> Ramriegel versotten gerne über die Zeit. Korrosion zwischen den billigen
>> Alu oder versilberten Steckplätzen und den Goldkontakten.
> 
> das habe ich gemacht. Das mit dem schwarzem Abrieb kann ich bestätigen.
> Vielleicht hat das ja schon etwas gebracht.
> 
>> Hat der Server genug Arbeitsspeicher?
> 
> 32GB
> 
> Der Server ist "Altmetall". Ein HP ProLiant DL160 G6

Dann hätte ich noch die Frage ob und wie du das Ram Setup gemacht hast.
Die Dinger haben üblicherweise ECC und melden Bitfehler m.W. im Log.
Wenn nicht in dem des Systems dann im IML (integrated Machine Log) das
du auch über die ILO per https erreichst.

Dazu fallen mir zwei Dinge ein von denen ich nicht weiß ob sie helfen.
1. Das RAM kann man bei gleicher Bestückung aufteilen in einen
Arbeitsbereich und einen Hot-spare bereich. Fehlerhafte Riegel würden
dann im Betrieb ersetzt. Sollte im IML vermerkt sein. Man kann AFAIR
aber auch alles RAM nutzen und verliert damit diesen Schutz.

2. Ist länger her das ich von RAM Problemen mit Servern (auch Proliant)
hörte. Da ging es entweder um Fake-ECC oder um Kompatibilität
(Riegel-Server) aber genaueres weiß ich nicht mehr.

Ich würde einen Eisfair nicht direkt auf solcher HW laufen lassen weil
m.E. die Management-tools von HP darunter nicht direkt installiert
werden können. Darunter auch solche mit denen man die Sensordaten vom
BMC direkt lesen kann, oder das IML. Drum laufen meine EIS unter
Proxmox, auf dessen Debian-basis die HP-Tools installiert.

Ich kann mich nicht erinneren ob/wann ich je Segfaults hatte bei meinen
3 Proliants. Und das sind zwei Gen. 4 und ein Gen. 5
Allerdings las ich häufiger die neueren Generationen sollen technisch
nicht mehr besser sein - sondern schlechter.

Ich sehe grad unter (1) das dem Modell nicht nur das Redundante Netzteil
fehlt, sondern die ILO auch optional ist. Da wären mir die HP-Tools noch
wichtiger da der BMC vermutlich eh onboard ist. Und die Addon-card ggf.
nur den KVM-Teil enthielte plus LAN-Port. Vermute ich aber nur...

Immerhin: 18 RAM Sockel die mit RDIMM oder UDIMM bestückt werden können.
Das sind viele - Mögliche Kontaktstellen für Fehler.

Kay

(1) https://h20195.www2.hpe.com/v2/GetPDF.aspx/c04284374.pdf
-- 
Sent via SN (Eisfair-1)


Mehr Informationen über die Mailingliste Eisfair