Skocz do zawartości


 

Zdjęcie

linuxpl.com - pady

linuxpl.com - pady

  • Proszę się zalogować aby odpowiedzieć
91 odpowiedzi na ten temat

linuxpl.com - pady

#81 Gość_pioklo_*

Gość_pioklo_*
  • Goście

Napisany 01 kwiecień 2017 - 19:17

Nie ma zadnej grubszej sprawy :)

5 minutowa awaria czesci podsieci juz jest ok

 

Piotr



#82 rybak157

rybak157

    Nowy użytkownik

  • Użytkownicy
  • 0 postów

Napisany 23 maj 2017 - 12:57

s98 leży od wczoraj 18:48

 

konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

 

Informacje odnośnie awarii serwera s98.vdl.pl

23.05.2017, godzina 00:58

W dniu 22.05 po godzinie 19 doszło do poważnej awarii macierzy RAID10, która utrzymuje dane
stron www i poczty Klientów. W jednym czasie uszkodzone zostały dwa dyski i macierz została
rozsynchronizowana. Obecnie trwają prace nad możliwościa przywrócenia macierzy do działania.
Jest to dosć czasochłonny proces i jeżeli się uda, dane bedą dostępne. Istnieje jednak możliwość
utraty danych, będziemy wtedy przywracali kopie zapasowe z zewnętrznych serwerów.

Nie jest jeszcze znany dokładny czas naprawy serwera, ale napewno potrwa kilka-kilkanaście godzin.
Macierz z bazami danych i ustawieniami jest bezpieczna i nienaruszona.


23.05.2017, godzina 7:00

Niestety nie udało się uruchomić macierzy RAID, ponieważ podczas resynchronizacji danych
doszło do uszkodzenia kolejnego dysku. Sprawdzimy jeszcze jedną możliwość i jeżeli sie
nie uda, zaczniemy przywracać dane z kopii na całkiem nową macierz stworzoną z nowych dysków.


23.05.2017, godzina 8:45

Uruchomiliśmy procedurę przywracania danych z kopii zapasowych. Kopie plików posiadamy z 16-22 maja.
Będziemy mailowo informować każdego Klienta o przywróceniu jego danych.

Po zakończeniu awarii będziemy informować o przyznanych gratyfikacjach do każdego konta na tym serwerze.
Przepraszamy za niedostępność serwera.

 

łączna długość tej awarii to już 19h ... rekordu jeszcze nie ma jeśli chodzi o linuxpl ale są szanse.

 

 



#83 Gość_Łukasz_*

Gość_Łukasz_*
  • Goście

Napisany 23 maj 2017 - 13:02

s98 leży od wczoraj 18:48

 

konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

 

łączna długość tej awarii to już 19h ... rekordu jeszcze nie ma jeśli chodzi o linuxpl ale są szanse.

 

 

 

W przypadku tego typu awarii czynnik ludzki ma mniejsze znaczenie niż na przykład to w jaki sposób sobie sprzęt radzi. Z tego co wkleiłeś wynika, że dane będą przywracane z kopii. Jest to zawsze proces czasochłonny.



#84 nnd_newbie

nnd_newbie

    Stały użytkownik

  • Użytkownicy
  • PipPipPipPipPip
  • 156 postów

Napisany 23 maj 2017 - 13:44

 

konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

 

 

A jakie jeszcze chciałbyś konkrety? Nr seryjne zepsutych dysków? Padły dwa dyski w RAID. Próbowali ją uruchomić. Nie udało się, bo padł kolejny. Spróbowali jeszcze jeden sposób (nie wiem co oni jeszcze próbowali wycisnąć z RAID z trzema padniętymi dyskami), nie udało się. Utworzyli nową macierz i odzyskują dane kont z backupów. Będą emailowo informować każdego klienta o odzyskaniu danych. Na koniec zaproponują gratyfikację dla każdego konta. Przepraszają.

 

Awaria nieprzyjemna sprawa, ale chciałbym żeby każda firma potrafiła po każdym etapie prac wydać komunikat. Następnie bez zbędnej grzebaniny zacząć odzyskiwać dane z backupu (i z tym różnie bywa w innych hostingach), o czym będą informować klienta. 

 

Jedyny minus to że mogli zacząć odzyskiwać dane z backupów na nową macierz zaraz po awarii. Jeśli odbudowa RAID by się powiodła to nie skorzystać, a jeśli by się nie powiodła to mieliby gotową macierz z odzyskanymi danymi. A tak kolejne godziny czekania. 


Edytowany przez nnd_newbie, 23 maj 2017 - 13:48.


#85 rybak157

rybak157

    Nowy użytkownik

  • Użytkownicy
  • 0 postów

Napisany 23 maj 2017 - 14:45

 

A jakie jeszcze chciałbyś konkrety? Nr seryjne zepsutych dysków?

 

Sarkazm nie jest potrzebny, merytorycznie nic nie wnosi a sugeruje brak argumentów.

 

To co podałem otrzymałem 5 minut przed wysłaniem na wht. Oczekiwałbym:

- na początku awarii rzetelne info co się dzieje,

- plan co będzie robione,

- info o postępach i ew. zmianach planu,

 

maile które otrzymałem godzinę po wystąpieniu awarii zawierały się w jednym zdaniu:

Serwer ma awarię nie możemy podać czasu jej usunięcia.

Pierwsze konkretne info udało się wydusić dziś rano.

Dla mnie to słabe.

Żeby była jasność - nie mam do nikogo pretensji że serwer leży od X godzin bo padła macierz - wcale nie zazdroszczę tym chłopakom, ale wątek jest o tym jak zachowują się firmy w trakcie padu i tu to opisałem. Nie oczekuję złotych gór czy pisma na papierze czerpanym przyniesionego na czerwonej poduszce tylko konkretnego info żebym wiedział na czym stoję.



#86 Gość_pioklo_*

Gość_pioklo_*
  • Goście

Napisany 23 maj 2017 - 20:27


Żeby była jasność - nie mam do nikogo pretensji że serwer leży od X godzin bo padła macierz - wcale nie zazdroszczę tym chłopakom, ale wątek jest o tym jak zachowują się firmy w trakcie padu i tu to opisałem. Nie oczekuję złotych gór czy pisma na papierze czerpanym przyniesionego na czerwonej poduszce tylko konkretnego info żebym wiedział na czym stoję.

 

Witam

Na początku awarii nie jest od razu wiadomo co należy robić i jaki jest plan działania.

Trzeba zdiagnozować problem ,ustalić  czy da się w prosty i szybki sposób przywrócić wszystko

.Tak więc ten początkowy czas to są same niewiadome a Klienci oczekują od razu

podania ETA i konkretnych rzeczy .Wtedy admini mogą przekazywać sprzeczne informacje, aż ustali się

jeden tor działania.

 

Obecnie jest już prawie 70% danych przywróconych z aktualnych kopii. Każdy admin pracuję u nas dziś ciężko aby informować Klientów co się dzieje. Możemy tylko przeprosić za tą awarie ale też oczywiście przydzielimy odpowiednie gratyfikacje każdemu Klientowi po ukończeniu przywracania danych.

 

Piotr



#87 rybak157

rybak157

    Nowy użytkownik

  • Użytkownicy
  • 0 postów

Napisany 23 maj 2017 - 21:10

 

Tak więc ten początkowy czas to są same niewiadome a Klienci oczekują od razu

podania ETA i konkretnych rzeczy.

 

Piotrze,
napisałem w poście powyżej że pierwsze zgłoszenie poszło po 1h od komunikatu z mojego monita że website-down, bardzo proszę nie uogólniaj i nie przeinaczaj. Po równej godzinie zgłosiłem na admin@ że jest problem z maszyną. Wiem, że jak pierdyknie to potrzebna jest chwila żeby się ogarnąć, ale po godzinie warto już mieć diagnozę, plan i scenariusz dla klientów.  Napisałem to w dobrej wierze a nie po to żeby się przyczepić, możesz skorzystać z mojej sugestii albo ją zignorować i olać.



#88 rybak157

rybak157

    Nowy użytkownik

  • Użytkownicy
  • 0 postów

Napisany 30 maj 2017 - 08:19

Minął tydzień od awarii:

- brak informacji o podsumowaniu awarii (nie wiem z jakich dni które backupy są podniesione), u mnie maile są z 8-9 maja, część plików z 18 maja, sam muszę dochodzić co jest od czego,

- brak informacji o przyznanej rekompensacie,

- usunięty z serwera link do awarii s98,

 

ogólnie sprawa zamieciona, a w zasadzie to nie było sprawy

 

 



#89 Gość_pioklo_*

Gość_pioklo_*
  • Goście

Napisany 31 maj 2017 - 14:33


 

ogólnie sprawa zamieciona, a w zasadzie to nie było sprawy

 

 

 

 

Jest sprawa. Informacje o rekompensacie wyslemy w tym tygodniu .O niczym nie zapomnielismy ale chcemy najpierw dopracowac do konca poprawe tej awarii.

 

Piotr



#90 rybak157

rybak157

    Nowy użytkownik

  • Użytkownicy
  • 0 postów

Napisany 06 czerwiec 2017 - 19:59

 

Informacje o rekompensacie wyslemy w tym tygodniu .O niczym nie zapomnielismy ale chcemy najpierw dopracowac do konca poprawe tej awarii.

 

minął tydzień który wskazałeś, żaden mail nie dotarł, kibicuję dalej



#91 Gość_pioklo_*

Gość_pioklo_*
  • Goście

Napisany 06 czerwiec 2017 - 21:57

 

minął tydzień który wskazałeś, żaden mail nie dotarł, kibicuję dalej

 

Nie masz się co martwić o rekompensatę ,ona nie ucieknie i będzie przydzielona są już decyzje i mailing będzie wysłany.

 

Piotr



#92 rybak157

rybak157

    Nowy użytkownik

  • Użytkownicy
  • 0 postów

Napisany 22 wrzesień 2017 - 09:42

 

Nie masz się co martwić o rekompensatę ,ona nie ucieknie i będzie przydzielona są już decyzje i mailing będzie wysłany.

 

Piotr

 

widać ile są warte zapewnienia, poczekałem 3 miesiące + kilka dni i:

- żadnego mailingu nie było,

- żadnej rekompensaty nie widzę w panelu serwera,

 

żenua







0 użytkowników czyta ten temat

0 użytkowników, 0 gości, 0 anonimowych użytkowników