[Eisfair] Absturz, L?==?utf-8?Q?og-Datei vor dem Absturz

Christoph Schulz fli4l at kristov.de
Sa Feb 13 23:02:58 CET 2016


Hallo!

Peter Schauder schrieb am Sa, 13 Februar 2016 22:41
> Ansteigen der Auslastung kann ich nicht beobachten. Zumindestens
> hat
> mir das Nagios davon nichts berichtet...


Inwieweit die erhöhte Auslastung bei Alex etwas mit den RCU-Timeouts zu
tun hat, kann ich nicht sagen, denn die Auslastung misst die Anzahl
aktiver Prozesse, während der RCU-Lese-Prozess bei synchronize_rcu()
blockiert, d.h. der Prozess legt sich schlafen.

Es gibt aber noch eine ganz andere Möglichkeit, nämlich dass der
Aufruf von try_to_merge_with_ksm_page() zu dem Problem führt --
immerhin ist KSM (eine speicherrelevante Funktion) im Stacktrace zu
finden, und ein Speicherproblem hatte der eisfair von Alex auch. Eine
Deaktivierung von KSM im eisfair-Kernel könnte hier Klarheit bringen.
Allerdings wird es vermutlich nicht exakt diese Funktion sein, weil der
Aufrufpunkt weit vom Anfang der Funktion entfernt ist. Und warum
link_path_walk() (eine VFS-Funktion) im Stacktrace zwischen dem Aufruf
von try_to_merge_with_ksm_page() und dem Timer-Interrupt zu finden ist,
kann ich auch nicht erklären, denn dies ergibt überhaupt keinen Sinn.
Ohne eine Analyse anhand der zugehörigen System.map des eisfair-Kernels
komme zumindest ich hier nicht wirklich weiter.


Viele Grüße,
-- 
Christoph Schulz
[fli4l-Team]



Mehr Informationen über die Mailingliste Eisfair