Skocz do zawartości

Polecane posty

Witam,

 

Mam sytuacje na jednym z serwerów w OVH:

 

Macierz dyskowa 500 gb , /dev/md1 /dev/md2

 

O ile /dev/md1 jest oki[prawie oki] ( _U ) to cała macierz /dev/md2 znikneła nie potrafie tego przywrócić.

 

Może trzeba dokonfigurować to w pliku mdadm ? Proszę o sugestie.

 

//

Na pewno nie chciałbym utracić danych które są na dysku. ( macierzy ) - tymczasowo podpiałem fizycznie /home z konkretnego dysku omijając macierz.

Edytowano przez Dawid Sobieraj (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Tak, wykrywa dysk fizycznie. On istnieje, tylko nie wykrywa mi macierzy. ( konkretniej /dev/md2 na której podmontowany był /home ).

 

/

 

Plik /etc/mdadm/mdadm.conf

 

ARRAY /dev/md1 level=raid1 num-devices=2 UUID=58ce8002:e4fff179:a4d2adc2:26fd5302

ARRAY /dev/md2 level=raid1 num-devices=2 UUID=80cec190:80e311db:a4d2adc2:26fd5302

 

Jednak po cat /proc/mdadm stat mam tylko /dev/md1

Edytowano przez Dawid Sobieraj (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Prawdopodobnie dysk jakimś cudem odmówił posłuszeństwa, prawdopodobnie coś się posypało. Masz dwie drogi do wyboru - albo wbudowaną aplikację OVH w trybie RESCUE (jeden klik i zrobi to za Ciebie) albo własnoręczne doszukiwanie się chociażby smartem i mdadm'em co jest nie tak. Logi mogą pomóc (/var/log/syslog + /var/log/kern.log).

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Prawdopodobnie dysk jakimś cudem odmówił posłuszeństwa, prawdopodobnie coś się posypało. Masz dwie drogi do wyboru - albo wbudowaną aplikację OVH w trybie RESCUE (jeden klik i zrobi to za Ciebie) albo własnoręczne doszukiwanie się chociażby smartem i mdadm'em co jest nie tak. Logi mogą pomóc (/var/log/syslog + /var/log/kern.log).

 

 

Możesz sprecyzować jednym kliknięciem ?

 

/

 

mdadm --assemble --scan

mdadm: No suitable drives found for /dev/md2

 

 

Pozdrawiam.

Edytowano przez Dawid Sobieraj (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

A smart tych dysków jak wygląda? Może już są w zaawansowanym stadium rozpadu?

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrys

Prawdopodobnie dwa do wymiany, widać te dyski w systemie czy się odpięły ?

 

Na pewno nie chciałbym utracić danych które są na dysku. ( macierzy ) - tymczasowo podpiałem fizycznie /home z konkretnego dysku omijając macierz.

Zrób kopie jeżeli się uda, sprawdź smarty, wymień wadliwy dysk/dyski.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Dziękuje za odpowiedź :)

 

-> Smart jest ok ( o dziwo ), tylko co spowodowało problem ?

 

C odo trybu rescue - wchodziłem i mogłem przeprowadzić tylko testy które zakończyły się powodzeniem - nie mam możliwości reinicjalizacji macierzy.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrys

Jeżeli smart jest ok, to zostaje dostać się do logów kernela i sprawdzić kabelek/kontroler sata.

Danych pewnie nie straciłeś, aczkolwiek ostrożnie teraz z pracami przy macierzy raid.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Nie straciłem jednak martwie sie samą synchronizacją. Czy podczas synchronizowania macierzy nie utracę danych ?

- Jeśli dobrze to rozumiem to jednak jest możliwość ich utraty.

 

Dysk /dev/sda jest oki - jego montuje.

Dysk /dev/sdb jest rozsypany ( dostęp do partycji /dev/sdb1 - do reszty nie ).

 

Może warto :

 

-> Przekopiować /dev/sda na /dev/sdb ( partycje, dane ) a później dokonać synchronizacji ?

 

 

//

 

Z tego co widać, lekko olewają kimsufi - zależało mi na dedyku bo nie mam przyjemnych doswiadczeń z VPS. A tutaj mam dużą kontrole - duży problem. Rozpoczynam kopiowanie całego /home

 

Posiadam tam licencje DA - czy w przypadku ewentualnego utracenia /home , samo wrzucenie zsynchronizuje mi DA ?

 

Wykonanie Backupu nie pomaga - wywala błędy. ( Nie mogę spakować, nie mogę odczytać ... ) - Jednak mogę przez winscp wszystko zaciągnąć.

Edytowano przez Dawid Sobieraj (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrys

Jeżeli tam namieszane i montujesz dyski poza macierzą tu utwórz ją od nowa w rescue:

 

Zrób sobie kopie danych z SDA gdzieś na zewnątrz ( choć to dodatkowe zabezpieczenie ).

Wyczyść SDB i utwórz pustą macierz dyskową.

Zgraj dane z SDA na SDB.

Uruchom system z tej macierzy Raid, pokaże się że jest uszkodzona i przygotuj/dodaj do niej dysk SDA.

 

 

---

 

Czyl jednak są uszkodzone dyski/kontroler, więc zacznij pracę od kopi danych i wymiany komponentu.

Edytowano przez patrys (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrys

pokaż

smartctl -a /dev/sda | egrep 'Mod|Ser|Rea|Pen'
smartctl -a /dev/sdb | egrep 'Mod|Ser|Rea|Pen'

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

pokaż

smartctl -a /dev/sda | egrep 'Mod|Ser|Rea|Pen'
smartctl -a /dev/sdb | egrep 'Mod|Ser|Rea|Pen'

 

 

smartctl -a /dev/sda | egrep 'Mod|Ser|Rea|Pen'

Device Model: ST500DM002-1BD142

Serial Number: Z3T747P3

1 Raw_Read_Error_Rate 0x000f 108 099 006 Pre-fail Always - 65528

5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0

197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0

242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1307983868

 

 

smartctl -a /dev/sdb | egrep 'Mod|Ser|Rea|Pen'

Device Model: ST500DM002-1BD142

Serial Number: Z3T731X7

1 Raw_Read_Error_Rate 0x000f 111 099 006 Pre-fail Always - 32317912

5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0

197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0

242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1758997049

 

// Widzę problem, niestety. Dziękuje.

Edytowano przez Dawid Sobieraj (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrys

A pokaże jeszcze smartctl -a /dev/sda| grep Com i smartctl -a /dev/sdb| grep Com

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

A pokaże jeszcze smartctl -a /dev/sda| grep Com i smartctl -a /dev/sdb| grep Com

 

 

smartctl -a /dev/sda| grep Com

188 Command_Timeout 0x0032 100 098 000 Old_age Always - 4295032838

# 1 Short offline Completed without error 00% 811 -

# 2 Short offline Completed without error 00% 806 -

# 3 Short offline Completed without error 00% 806 -

# 4 Short offline Completed without error 00% 11 -

# 5 Short offline Completed without error 00% 6 -

# 6 Short offline Completed without error 00% 6 -

# 7 Short offline Completed without error 00% 0 -

 

 

smartctl -a /dev/sdb| grep Com

188 Command_Timeout 0x0032 100 099 000 Old_age Always - 150326149157

# 1 Short offline Completed without error 00% 811 -

# 2 Short offline Completed without error 00% 806 -

# 3 Short offline Completed without error 00% 806 -

# 4 Short offline Completed without error 00% 11 -

# 5 Short offline Completed without error 00% 6 -

# 6 Short offline Completed without error 00% 6 -

# 7 Short offline Completed without error 00% 0 -

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrys

To jest spory problem, do sprawdzenia kontroler dyskowy i połączenie do niego.

Są jakieś błędy w dmesg ? Jak tak proszę przeklej je tu.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Bądź aktywny! Zaloguj się lub utwórz konto

Tylko zarejestrowani użytkownicy mogą komentować zawartość tej strony

Utwórz konto

Zarejestruj nowe konto, to proste!

Zarejestruj nowe konto

Zaloguj się

Posiadasz własne konto? Użyj go!

Zaloguj się


×