[Eisfair] Absturz, L?==?utf-8?Q?og-Datei vor dem Absturz

Christoph Schulz fli4l at kristov.de
Sa Feb 13 22:24:13 CET 2016


Hallo!

alex schrieb am Sa, 13 Februar 2016 22:03
> Feb 12 13:27:36 myeis kernel: INFO: rcu_sched detected stall on CPU
> 1 (t=15000 jiffies)
> [...]
> Feb 12 13:27:36 myeis kernel:  [_raw_spin_lock+0x8/0x0b]
> _raw_spin_lock+0x8/0xb
> Feb 12 13:27:36 myeis kernel:  [unix_state_double_lock+0x3d/0x41]
> unix_state_double_lock+0x3d/0x41
> Feb 12 13:27:36 myeis kernel:  [unix_dgram_connect+0x83/0x153]
> unix_dgram_connect+0x83/0x153


Also ist das af_unix-Modul (ein lokales Netzwerk-Protokoll) der
Schuldige. Hier werden gerade heftigst Fehler gefunden und behoben
(projektbedingt überfliege ich gelegentlich die netdev-ML des
Linux-Kernels). Hier würde ich dem eisfair-Kernel-Maintainer Tom
empfehlen, die Patches von Rainer [1] zu sichten, festzustellen, welche
Linux 3.2 betreffen, und ggf. zurückzunehmen bzw. neuere, die noch
nicht in 3.2.76 angekommen sind, testweise hinzuzufügen. Ob das
letztlich hilft, kann ich nicht sagen, es wäre aber einen Versuch
wert.

In 3.2.75 sind einige af_unix-Patches dazugekommen, darunter:

  af_unix: Revert 'lock_interruptible' in stream receive code (commit
1a3b55eee77490693bb4d1338f24b6c9f11e3e1d)
    (siehe https://patchwork.ozlabs.org/patch/557745/ für den
Upstream-Commit)
  unix: avoid use-after-free in ep_remove_wait_queue (commit
a3b0f6e8a21ef02f69a15abac440572d8cde8c2a)
    (siehe https://patchwork.ozlabs.org/patch/547061/ für den
Upstream-Commit)

Ich würde auf den ersten tippen, insbesondere da es z.B. auch einen
fehlerhaften Backport dieses Patches in der 3.10er Versionsreihe gab,
siehe [2].

[1]
https://patchwork.ozlabs.org/project/netdev/list/?submitter=7090&state=*&order=state
[2] https://patchwork.ozlabs.org/patch/572226/

Viele Grüße,
-- 
Christoph Schulz
[fli4l-Team]



Mehr Informationen über die Mailingliste Eisfair