[Eisfair] Fehlermeldung beim Einsatz von rsync

Do Mär 7 20:17:41 CET 2019

Hallo Jürgen,

Jürgen Witt wrote:

> 197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always
>        -       1
> 198 Offline_Uncorrectable   0x0030   200   200   000    Old_age
> Offline      -       1

Habe ich wohl eben übersehen, weil das aus dem Menu kam, aber der Count 1
bei diesen Smartattributen stand da auch und passt zur Fehlermeldung.

> # 1  Short offline       Completed: read failure       90%     13749
>      25117256

Und die ganzen Checks brechen schon nach 10% wegen Fehler ab und es ist
immer Sektor 25117256; ob weitere folgen, ist wegen des abbrechenden Checks
nicht zu sagen.

>> Unlesbarer Sektor ist schon ernst zu nehmen.
>> 
>> Oder die große Last verursacht da ein Problem während des Schreibens. Mal
>> die Plattenanschlüsse neu gesteckt.
> 
> Was schlägst Du vor?

Und dann bin ich es gewesen, wenn du deine Daten verlierst. :-))

Ich hatte auf einer Platte im Raid auch mal in der Penne einen einzelnen
"pending" Sektor. Nach Feststellen des Inhalts habe ich dafür gesorgt, dass
der Sektor neu geschrieben wurde, wads nur mit robusten Mitteln (debugfs)
geht.

Oder man schreibt über eine Schleife ganz ganz viele kleine Dateien, bis die
Platte voll ist.

Wenn der angebliche nicht lesbare dann neu geschrieben werden soll, wird,
wenn der wirklich kaputt ist, eine Reserversektor bemüht oder er wird halt
neu geschrieben.

In der Penne konnte der schlicht problemlos wieder beschrieben werden, ohne
dass ein Reservesektor bemüht wurde, habe das dann aber noch lange
regelmäßig (insbesondere die smart Checkläufe) beobachtet.

Wie ich am Telefon erläutert habe, würde ich zunächst mal die Sektornummer
herannehmen und mittels der vorgeschlagenen Berechnungen und debugfs
prüfen, ob der derzeit in gebrauch ist.

Wahrscheinlich aber eher nicht, wenn bei einem rsync-Lauf auf dem
Ziellaufwerk die Meldung kommt.

Während das RAID aktiv ist, würde ich aber die Manipulationen auf einem
einzelnen Laufwerk des RAIDS geflissentlich sein lassen.

Einfach Unmengen an Dateien erzeugen, um die Platte mal zu füllen, geht
natürlich im Raid; wenn der Sektor aber auf sda3 (/) liegt, könnte das
System dir Grätsche machen, wenn kein Platz mehr vorhanden ist.

Mit

smartctl --test=long /dev/sdb

oder

smartctl --test=short /dev/sdb

kannst du den Check auch anstoßen und schauen, ob der durchläuft - long
dauert wirklich lange, daher lieber erstmal short und wenn der keine Fehler
mehr zeigt dann long.

Man könnte auch schlicht die sdb aus dem Raid rausnehmen und dann komplett
Nullen und dann wieder ins Raid rein und syncen lassen.

Das Nullen mit dd sollte ohne Fehlermeldung bis auf das "No more space on
device" ablaufen und ein smart-Check erfolgreich sein.

Egal was du machst, ein Backup des jetzigen Zustandes ist Pflicht.

Ich würde aber wohl einfach eine neue Platte einbauen und dann in Ruhe mir
die Platte an einem andeen Rechner zu Gemüte führen und dann entscheiden,
ob die noch für einen Anwendungszweck taugt.

Und alles absolut ohne jede Gewähr meinerseits, es sind Schritte enthalten,
die die Platte plätten können.

-- 
Gruss Marcus