[Fli4l_dev] CIRC_x_HUP_TIMEOUT='0' funktioniert nicht
Christoph Schulz
fli4l at kristov.de
Mo Mai 19 09:01:01 CEST 2014
Hallo!
Flemming Beissel schrieb:
> Wenn ich auf den r30653-FFL-506 wechsele ist alles ok. Kein Fehler,
> keine Leitung offline. Wochenlang ohne Probleme.
Fakt ist: Es kann nur an drei Komponenten liegen, wenn eine Meldung wie
May 18 21:11:50 r6001 local2.info pppd[8292]: No response to 3 echo-requests
kommt:
(1) der PPP-Dämon pppd (der die Echo-Anforderungen schickt, aber keine
Antworten empfängt)
(2) der Kern (der das Einkapseln in PPPoE-Pakete übernimmt)
(3) alles außerhalb (Netzwerkkarte, Kabel, DSL-Modem, Verbindung zum DSL-AC
etc.)
Ich habe mal nachgeschaut: Im Quelltext des pppd (1) gab es keine relevanten
Änderungen seit r30653 (eine einzige Änderung bezieht sich nur auf Multilink
PPP, das du nicht einsetzt). Der Kern (2) kann eine mögliche Ursache sein,
deshalb wäre es gut zu wissen, mit welchem Kern es noch funktioniert hat. Zu
(3) kann ich nichts sagen; ich sehe zumindest keine vernünftige Erklärung
dafür, dass (3) bei r30653 keine Probleme macht und bei r30947 nicht.
(2) ist insofern interessant, als wenn der BRAS die PPPoE-Sitzung beendet
(warum auch immer), der Kern dies zwar mit bekommt und entsprechend die
Sitzung auf Client-Seite storniert, dem pppd aber nicht Bescheid gegeben
wird. Das ist ein bekanntes (Design-)Problem unter Linux, siehe [1]. Hier
hilft nur das Einsetzen des PPPoE-Userspace-Dämons (also Typ "daemon"), weil
dann alles offenbar wird (also auch, ob die Gegenstelle die Sitzung außer
der Reihe terminiert).
Natürlich könnte es sein, dass durch einen Bug außerhalb der genannten
Komponenten irgendetwas kaputtgeht (k.A., wie das gehen sollte, aber
theoretisch ist das möglich), aber das ist extrem unwahrscheinlich.
Frage: Der Fehler ist mit dem aktuellen Tarball wirklich reproduzierbar? Und
beim Wechsel zu r30653 tritt der Fehler sagen wir innerhalb der nächsten 48h
definitiv nicht auf? Ich möchte einfach die Möglichkeit mehrerer Zufälle
Wir haben ansonsten nur noch eine Möglichkeit: Wir könnten eine binäre Suche
machen, d.h. wir suchen die Revision, die es kaputt gemacht hat. Dazu wäre
es am praktischsten, wenn du deine fli4l-Installationsverzeichnisse direkt
aus dem SVN-Repository bauen könntest. Wenn du das versuchen magst, sag
Bescheid, dann gibt's von mir eine entsprechende Einführung ;-)
[1] http://lists.roaringpenguin.com/pipermail/rp-pppoe/2009q2/000020.html
Viele Grüße,
--
Christoph Schulz
[fli4l-Team]
Mehr Informationen über die Mailingliste Fli4l_dev