[Fli4l_dev] CIRC_x_HUP_TIMEOUT='0' funktioniert nicht

Flemming Beissel flemming.beissel at gmx.net
Mo Mai 19 09:19:16 CEST 2014


Am 19.05.2014 09:01, schrieb Christoph Schulz:
> Hallo!
> 
> Flemming Beissel schrieb:
> 
>> Wenn ich auf den r30653-FFL-506 wechsele ist alles ok. Kein Fehler,
>> keine Leitung offline. Wochenlang ohne Probleme.
> 
> Fakt ist: Es kann nur an drei Komponenten liegen, wenn eine Meldung wie
> 
> May 18 21:11:50 r6001 local2.info pppd[8292]: No response to 3 echo-requests
> 
> kommt:
> 
> (1) der PPP-Dämon pppd (der die Echo-Anforderungen schickt, aber keine 
> Antworten empfängt)
> (2) der Kern (der das Einkapseln in PPPoE-Pakete übernimmt)
> (3) alles außerhalb (Netzwerkkarte, Kabel, DSL-Modem, Verbindung zum DSL-AC 
> etc.)
> 
> Ich habe mal nachgeschaut: Im Quelltext des pppd (1) gab es keine relevanten 
> Änderungen seit r30653 (eine einzige Änderung bezieht sich nur auf Multilink 
> PPP, das du nicht einsetzt). Der Kern (2) kann eine mögliche Ursache sein, 
> deshalb wäre es gut zu wissen, mit welchem Kern es noch funktioniert hat. Zu 
> (3) kann ich nichts sagen; ich sehe zumindest keine vernünftige Erklärung 
> dafür, dass (3) bei r30653 keine Probleme macht und bei r30947 nicht.
> 
> (2) ist insofern interessant, als wenn der BRAS die PPPoE-Sitzung beendet 
> (warum auch immer), der Kern dies zwar mit bekommt und entsprechend die 
> Sitzung auf Client-Seite storniert, dem pppd aber nicht Bescheid gegeben 
> wird. Das ist ein bekanntes (Design-)Problem unter Linux, siehe [1]. Hier 
> hilft nur das Einsetzen des PPPoE-Userspace-Dämons (also Typ "daemon"), weil 
> dann alles offenbar wird (also auch, ob die Gegenstelle die Sitzung außer 
> der Reihe terminiert).
> 
> Natürlich könnte es sein, dass durch einen Bug außerhalb der genannten 
> Komponenten irgendetwas kaputtgeht (k.A., wie das gehen sollte, aber 
> theoretisch ist das möglich), aber das ist extrem unwahrscheinlich.
> 
> Frage: Der Fehler ist mit dem aktuellen Tarball wirklich reproduzierbar? Und 
> beim Wechsel zu r30653 tritt der Fehler sagen wir innerhalb der nächsten 48h 
> definitiv nicht auf? Ich möchte einfach die Möglichkeit mehrerer Zufälle 
> 
> Wir haben ansonsten nur noch eine Möglichkeit: Wir könnten eine binäre Suche 
> machen, d.h. wir suchen die Revision, die es kaputt gemacht hat. Dazu wäre 
> es am praktischsten, wenn du deine fli4l-Installationsverzeichnisse direkt 
> aus dem SVN-Repository bauen könntest. Wenn du das versuchen magst, sag 
> Bescheid, dann gibt's von mir eine entsprechende Einführung ;-)
> 
> [1] http://lists.roaringpenguin.com/pipermail/rp-pppoe/2009q2/000020.html
> 
> 
> Viele Grüße,
> 
Ich setze jetzt den r30653  wieder ein und werden ihn 2-3 Tage laufen
lassen.
Danach melde ich mich wieder.

Gruß
Flemming


Mehr Informationen über die Mailingliste Fli4l_dev