[Eisfair] antispam stoppt nach einiger Zeit

Rolf Bensch azubi at bensch-net.de
Fr Okt 20 20:14:58 CEST 2023


Hallo Heinz-Peter,

Am 20.10.23 um 09:56 schrieb Heinz-Peter Faasen:
> Hallo Rolf,
>
>> Ich warte jetzt mal ab wie der Server mit reduzierten Speicher, abgeschalteten Antispam und ohne Restart läuft. Treten wieder oom-killer auf, ist antispam nicht die Ursache und wir können mit dem Codeschnipsel weiter suchen.
>
> irgendwie verstehe ich Deine Strategie nicht. Warum nicht gleich schauen, wer da den Müll verursacht und entsprechend handeln?

Einfach um Antispam als Verursacher auszuschließen.

Ich habe noch etwas gestöbert. In /var/log/messages gibt's, wie immer, eine Menge Output zum kill-Prozess. Der beginnt mit:

Oct 18 18:54:02 mail kernel: spamd child invoked oom-killer: gfp_mask=0x1100dca(GFP_HIGHUSER_MOVABLE|__GFP_ZERO), order=0, oom_score_adj=0

Ich interpretiere das so, dass spamd den oom-killer angestoßen hat. Bisher ging ich davon aus, dass oom-killer aufgrund von Speichermangel per select_bad_process() dem spamd eine gewisse Wahrscheinlichkeit unterjubelt und deshalb den Prozess killt. Das scheint hier anders gelagert zu sein.

Ferner aus dem Logfile:
Oct 18 18:54:03 mail kernel: [    775]     0   775    65583    43051   638976        0             0 spamd
Oct 18 18:54:03 mail kernel: [    776]  2022   776   190129   164770  1638400        0             0 spamd child
Oct 18 18:54:03 mail kernel: [    777]  2022   777    67111    44535   643072        0             0 spamd child
Oct 18 18:54:03 mail kernel: [    778]  2022   778    67335    44755   643072        0             0 spamd child
Oct 18 18:54:03 mail kernel: [    779]  2022   779   253633   217283  2060288        0             0 spamd child
Oct 18 18:54:03 mail kernel: [    781]  2022   781    66631    44092   638976        0             0 spamd child

Zum Laufzeit des oom-killer laufen 5 child-Prozesse von spamd. Im exim-mainlog finde ich zu dieser Uhrzeit:

2023-10-18 18:54:02 1qt9nt-0000Jh-2P spam acl condition: cannot parse spamd [127.0.0.1]:783 output

der Dienst scheint also schon tot zu sein. In der vorausgegangenen Stunde wurden 5 eMails verarbeitet, die letzte etwa 60 Sekunden zuvor. Eine Erklärung weshalb hier 5 Prozesse laufen müssen habe ich nicht. Der Prozess 779 wurde letztendlich gekillt.

Grüße

Rolf



Mehr Informationen über die Mailingliste Eisfair