[Eisfair] [e1] bfb zum Fangen von oom-killer events verwenden

Tom Schulz tom_strike at gmx.de
Sa Mär 21 23:09:32 CET 2020


Hallo Kay,

Kay Martinen schrieb:

> Vielleicht irre ich mich da, aber das oom steht doch für out-of-memory
> und dagegen kann doch eigentlich nur MEHR RAM helfen. Oder du hast
> irgend einen prozess der amok läuft, ein speicherleck, Kaputtes RAM o.a.
> das deinen Speicher aufsaugt.

Genau so ist ist.
Hardwarefehler im RAM kann nahezu ausgeschlossen werden, da schon
dreimal getausch.

> Wäre da nicht die erste Idee noch mehr RAM zu installieren und/oder den
> Verlauf des freien RAMs länger zu beobachten und z.b. bei unterschreiten
> einer gewissen grenze mal eine prozessliste zu sichern damit man dem
> störenfried auf die Schliche kommt.

Ich habe ja schon geschrieben, dass ich den RAM aufgestockt habe. Und
zwar von 2GB auf 8GB, die mit PAE-Kernel auch zur Verfügung stehen.
Weiter gibt es noch 8GB Swap-Partition.

> Ich hab hier noch nie bemerkt das ein oom-killer mir prozesse weg
> schiesst und ich benutzt Eisfair auf einem echten Fileserver und in
> mehreren VMs unter Proxmox.

Ich habe auch 5 Eisfair und darunter ebenfalls mehrere unter Proxmox.
Und bis auf das eine System passiert das bei mir sonst auch nirgendwo,
obwohl alle im 24/7 Betrieb laufen.

> Wenn du die HW schon getauscht hast, hast du neu aufgesetzt oder nur das
> Alte System auf die neue HW umgezogen. Evtl. hat die Alte HW das System
> subtil beschädigt und du schleppst den so entstandenen Fehler auf der
> neuen HW immer noch mit.

Das System wurde komplett neu aufgesetzt. Dies hat das Problem auch
gemildert, sprich den Zeitraum bis zum auftreten verlängert (in
Kombination mit der neuen Hardware nicht eindeutig zuzuordnen)

> Kay

Ich bin mir auch recht sicher, dass das aufrüsten des RAM das Problem
weiter mildert, aber ich denke nicht, dass der eigentliche Fehler damit
behoben ist.

Wie Marcus auch schon geschrieben hat, tritt das Problem bei mehreren
Usern seit längerem auf und so richtig ist noch keiner dahinter
gekommen, soweit ich weiß. Marcus selbst hat sich auch schon
dankenswerterweise mehrfach damit beschäftigt.

Was die betroffenen Systeme gemein haben ist aus meiner Erinnerung
3Ware-Raid, Asterisk und ein paar weitere Pakete.

Es ist allerdings auch nicht Eisfair speziefisch. Man findet auch über
viele andere Distris hinweg ähnliches Verhalten, aber auch da keine
wirklich dauerhafte Lösung.

Gruß,

Tom



Mehr Informationen über die Mailingliste Eisfair