Skocz do zawartości

rybak157

Użytkownicy
  • Zawartość

    0
  • Rejestracja

  • Ostatnio

Posty napisane przez rybak157


  1. Minął tydzień od awarii:

    - brak informacji o podsumowaniu awarii (nie wiem z jakich dni które backupy są podniesione), u mnie maile są z 8-9 maja, część plików z 18 maja, sam muszę dochodzić co jest od czego,

    - brak informacji o przyznanej rekompensacie,

    - usunięty z serwera link do awarii s98,

     

    ogólnie sprawa zamieciona, a w zasadzie to nie było sprawy

     

     


  2.  

    Tak więc ten początkowy czas to są same niewiadome a Klienci oczekują od razu

    podania ETA i konkretnych rzeczy.

     

    Piotrze,

    napisałem w poście powyżej że pierwsze zgłoszenie poszło po 1h od komunikatu z mojego monita że website-down, bardzo proszę nie uogólniaj i nie przeinaczaj. Po równej godzinie zgłosiłem na admin@ że jest problem z maszyną. Wiem, że jak pierdyknie to potrzebna jest chwila żeby się ogarnąć, ale po godzinie warto już mieć diagnozę, plan i scenariusz dla klientów. Napisałem to w dobrej wierze a nie po to żeby się przyczepić, możesz skorzystać z mojej sugestii albo ją zignorować i olać.


  3.  

    A jakie jeszcze chciałbyś konkrety? Nr seryjne zepsutych dysków?

     

    Sarkazm nie jest potrzebny, merytorycznie nic nie wnosi a sugeruje brak argumentów.

     

    To co podałem otrzymałem 5 minut przed wysłaniem na wht. Oczekiwałbym:

    - na początku awarii rzetelne info co się dzieje,

    - plan co będzie robione,

    - info o postępach i ew. zmianach planu,

     

    maile które otrzymałem godzinę po wystąpieniu awarii zawierały się w jednym zdaniu:

    Serwer ma awarię nie możemy podać czasu jej usunięcia.

    Pierwsze konkretne info udało się wydusić dziś rano.

    Dla mnie to słabe.

    Żeby była jasność - nie mam do nikogo pretensji że serwer leży od X godzin bo padła macierz - wcale nie zazdroszczę tym chłopakom, ale wątek jest o tym jak zachowują się firmy w trakcie padu i tu to opisałem. Nie oczekuję złotych gór czy pisma na papierze czerpanym przyniesionego na czerwonej poduszce tylko konkretnego info żebym wiedział na czym stoję.


  4. s98 leży od wczoraj 18:48

     

    konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

     

    Informacje odnośnie awarii serwera s98.vdl.pl

    23.05.2017, godzina 00:58

    W dniu 22.05 po godzinie 19 doszło do poważnej awarii macierzy RAID10, która utrzymuje dane
    stron www i poczty Klientów. W jednym czasie uszkodzone zostały dwa dyski i macierz została
    rozsynchronizowana. Obecnie trwają prace nad możliwościa przywrócenia macierzy do działania.
    Jest to dosć czasochłonny proces i jeżeli się uda, dane bedą dostępne. Istnieje jednak możliwość
    utraty danych, będziemy wtedy przywracali kopie zapasowe z zewnętrznych serwerów.

    Nie jest jeszcze znany dokładny czas naprawy serwera, ale napewno potrwa kilka-kilkanaście godzin.
    Macierz z bazami danych i ustawieniami jest bezpieczna i nienaruszona.


    23.05.2017, godzina 7:00

    Niestety nie udało się uruchomić macierzy RAID, ponieważ podczas resynchronizacji danych
    doszło do uszkodzenia kolejnego dysku. Sprawdzimy jeszcze jedną możliwość i jeżeli sie
    nie uda, zaczniemy przywracać dane z kopii na całkiem nową macierz stworzoną z nowych dysków.


    23.05.2017, godzina 8:45

    Uruchomiliśmy procedurę przywracania danych z kopii zapasowych. Kopie plików posiadamy z 16-22 maja.
    Będziemy mailowo informować każdego Klienta o przywróceniu jego danych.

    Po zakończeniu awarii będziemy informować o przyznanych gratyfikacjach do każdego konta na tym serwerze.
    Przepraszamy za niedostępność serwera.

     

    łączna długość tej awarii to już 19h ... rekordu jeszcze nie ma jeśli chodzi o linuxpl ale są szanse.

     

     

×