[Eisfair] Ab?==?utf-8?Q?sturz, Log-Datei vor dem A?==?utf-8?Q?bsturz

Christoph Schulz fli4l at kristov.de
So Feb 14 09:16:37 CET 2016


Guten Morgen!

Marcus Roeckrath schrieb am Sa, 13 Februar 2016 23:26
> Kurz vor und nach dem erstmaligen Auftreten der Stall-Meldung kann
> ich kein
> wirklichen Speicherproblem entdecken
> [...]
> Ich finde das erstmal vollkommen in Ordnung, oder übersehe ich
> etwas?


Ich bezog mich bei meiner Aussage lediglich auf den ausgelösten
OOM-Killer. Und der wird nicht allein deshalb ausgelöst, weil ein
ksoftirqd-Prozess ewig in der Bearbeitung einer RCU-Grace-Periode ist.
Es könnte darauf hindeuten, dass durch den RCU-Bug Speicher leckt. Aber
in den Speicherstatistiken habe ich auch keinen Pool gefunden, der so
klein geworden ist, dass sich der Kernel durch das Abschießen von
Prozessen behelfen muss.

Abgesehen von dem Fehler, der zu dieser ganzen Latte von Problemen zu
führen scheint, würde ich generell empfehlen, den OOM-Killer
abzuschalten und statt dessen der Speicher anfordernden Anwendung
einfach mitzuteilen, dass kein Speicher mehr frei ist. Das mache ich auf
meinen Linux-Kisten seit Jahren so, und es gibt IMHO keinen Grund, es
nicht so zu tun. Siehe [1] zu der Motiviation, den OOM-Killer zu
deaktivieren, und auch zu den Details, wie man das machen kann. Im
Prinzip geht es um

  echo 2 > /proc/sys/vm/overcommit_memory
  echo Wert > /proc/sys/vm/overcommit_ratio (z.B. 80)

(Natürlich kann man das besser mit sysctl zur Bootzeit erledigen, es
geht mir hier nur ums Prinzip.)

[1] https://www.win.tue.nl/~aeb/linux/lk/lk-9.html#ss9.6


Viele Grüße,
-- 
Christoph Schulz
[fli4l-Team]



Mehr Informationen über die Mailingliste Eisfair