[Fli4l_dev] Aktueller Tarball fli4l-3.9.0-rev27929-testing
Matthias Prager
linux at matthiasprager.de
Sa Jun 29 21:17:17 CEST 2013
Hallo Christoph,
erst einmal ein Dankeschön, für die Hilfe bei der
Ursachensuche.
Am 29.06.2013 10:23, schrieb Christoph Schulz:
> Hallo!
>
> Matthias Prager schrieb:
>
>> Am 23.06.2013 21:22, schrieb Matthias Prager:
>>> Hallo zusammen,
>>>
>>> r27929 läuft hier soweit ok. Ich probiere den Kernel 3.9.6,
>>> vielleicht läuft dieser ja ohne Abstürze mit dem e1000e
>>> (im Gegensatz zu 3.9.4). r27888 lief mit Kernel 3.2.46
>>> soweit stabil.
>> Dem ist leider nicht so. Das e1000e Modul hängt sich im 3.9.6
>> Kernel immer noch auf. Habe wieder auf den 3.2er geswitcht.
>
> Kannst du bitte prüfen, ob es das leidige ASPM-Problem ist? Zu Details siehe
> [1]. Einfach
>
> lspci -vv | grep ASPM
'ASPM L0s L1 Enabled' bei beiden Netzwerkkarten.
>
> ausführen und schauen, ob überall "ASPM Disabled" steht. Wenn nicht,
> könntest du den Workaround in [1] ausprobieren (also nach dem Booten
>
> setpci -s 02:00.0 CAP_EXP+10.b=40
Habe ich ausgeführt für beide Karten, danke für setpci. ASPM jetzt
aus auf beiden Karten. Feedback kann allerdings durchaus wieder
eine Woche dauern (Problembedingt).
>
> ausführen, wobei "02:00.0" durch die PCI-Adresse deines e1000e-Adapters
> ersetzt werden muss, siehe erste Spalte von "lspci | grep 82574L") und
> schauen, ob damit das System stabil läuft. setpci ist momentan leider nicht
> im fli4l-Lieferumfang, du findest es aber auf meinem Server unter [2].
>
> Wenn das alles nicht hilft, hilft evtl. der Patch von [3]. Dann müsste ich
> mal einen Testkernel für dich bauen...
>
> Ach ja: Könntest du auch bitte ein aktuelles Kernel-Fehler-Protokoll zur
> Verfügung stellen?
Ich habe es leider versäumt das letzte zu speichern. Aber ich habe
eines vom 15.06. mit Kernel 3.9.5 zu bieten:
------------[ cut here ]------------
WARNING: at net/sched/sch_generic.c:255 dev_watchdog+0xce/0x122()
Hardware name:
NETDEV WATCHDOG: eth1 (e1000e): transmit queue 0 timed out
Modules linked in: evdev xt_IMQ imq cls_fw sch_sfq sch_htb nf_nat_ftp nf_conntrack_ftp pppoe pppox ppp_generic slhc 8021q mrp garp stp llc e1000e ptp pps_core button rtc_cmos nls_iso8859_1 ums_usbat ums_sddr55 ums_sddr09 ums_realtek ums_onetouch ums_karma ums_jumpshot ums_isd200 ums_freecom ums_eneub6250 ums_datafab ums_cypress ums_alauda usb_storage ahci libahci ata_piix ata_generic sr_mod cdrom sd_mod isofs ext4 jbd2 mbcache crc16 hid_generic usbhid hid ehci_pci uhci_hcd ohci_hcd ehci_hcd xhci_hcd usbcore usb_common libata scsi_mod pcspkr
Pid: 0, comm: swapper/0 Not tainted 3.9.5 #1
Call Trace:
[<c1024c01>] warn_slowpath_common+0x77/0x8e
[<c11c25c7>] ? dev_watchdog+0xce/0x122
[<c11c25c7>] ? dev_watchdog+0xce/0x122
[<c1024c94>] warn_slowpath_fmt+0x2e/0x30
[<c11c25c7>] dev_watchdog+0xce/0x122
[<c11c24f9>] ? netif_tx_unlock+0x3e/0x3e
[<c102dd7e>] call_timer_fn.isra.34+0x19/0x70
[<c1048183>] ? ktime_get+0x3d/0x69
[<c101a00c>] ? apic_write+0xf/0x11
[<c102def2>] run_timer_softirq+0x11d/0x14f
[<c1029efd>] __do_softirq+0x8d/0x141
[<c102a063>] irq_exit+0x36/0x6f
[<c101a5c9>] smp_apic_timer_interrupt+0x64/0x71
[<c104e778>] ? __tick_nohz_idle_enter+0x134/0x36a
[<c128a6ed>] apic_timer_interrupt+0x2d/0x40
[<c100819b>] ? default_idle+0x1e/0x2e
[<c100871d>] cpu_idle+0x50/0x6a
[<c1279d90>] rest_init+0x58/0x5a
[<c13b08e7>] start_kernel+0x2b7/0x2bd
[<c13b046d>] ? repair_env_string+0x51/0x51
[<c13b02af>] i386_start_kernel+0x79/0x7d
---[ end trace 2f824ab818e01993 ]---
e1000e 0000:01:00.0 eth1: Reset adapter unexpectedly
e1000e 0000:01:00.0 eth1: Timesync Tx Control register not set as expected
eth1 ist im übrigen das DSL/Provider-Seitige Interface.
Viele Grüße
Matthias
Mehr Informationen über die Mailingliste Fli4l_dev