Skocz do zawartości
vegetagt

Szklana kula potrzebna, sprzęt się wiesza ;)

Polecane posty

Bardzo potrzebny mi jest jakis magik posiadający szklaną kulę ( ew wróżący z fusów ), gdyz komputer się wiesza i trace miliony na każdej sekundzie downtimu...

 

 

A tak serio:

Pecetowy serwer wiesza się w losowych momentach - raz pracuję 15 dni, raz 10, ostatnio pobil rekord i zawiesił się po 24h od poprzedniej zwiechy. W momencie padu na ekranie przeważnie widze ciemność, raz tylko prosił mnie o login lecz i tak nie reagowal na klawiature.

Tak "nieżywy" serwer o dziwo odpowiada na pingi, daje się przeskanowac nmapem. Porty są prawidlowo wykryte, z tą róznicą że 80 ma stan filtered zamiast open.

 

W logach pusto, więc zwalam wine na sprzęt. Na pierwszy ogień poszło sprawdzenie, czy wszystkie kable są prawidlowo podłączone ( bo może niekontaktują czy cos w ten desen ), co nic nie dało. Sprawdzilem napięcie na zasilaczu, 5 i 12V w normie, wahania około 0.1 czyli chyba moze byc :). Kondensatory na płycie nei wylewają się ani nie są napęczniałe, w zasilaczu sprawdze wkrótce.

Myslalem jeszcze, ze dysk szwankuje, ale j/w - w logach pusto. Jeszcze wypadałoby sprawdzic co SMART ciekawego zanotował o pracy dysku.

Ewentualny kurz i inne zanieczyszczenia dzisiaj usunalem, lecz nic to nie dalo.

 

Myślałem o uszkodzonym ramie, lecz niewiem czy ram jest w stanie po pewnym okresie przestac pracowac poprawnie. Zamienilem swego czasu kolejnosc kości i zadnej roznicy nei zauwazylem.

Usterka jest o tyle trudna dla mnie do zdiagnozowania, bo dzieje się w losowych momentach. Gdyby zawieszał cię równo co 5min to bym skakał z radości :) Komputer ma swoje lata i nie jest składakiem - Dell GX110 więc gryzące się z sobą częsci raczej odpadają.

 

 

Jeszcze miłoby mi było, gdyby ktoś polecił jakies sensowne stress testy na poszczególne podzespoly, moze przy którymś uda mi sie wywołać zawieszzenie się sprzętu.

 

 

 

Pozdr.

 

 

edit:

a jeszcze mam nagłówki topa, może się przydadzą.

wczoraj:

top - 23:59:59 up 9 days, 12:48,  1 user,  load average: 0.56, 0.78, 1.11
Tasks:  76 total,   3 running,  73 sleeping,   0 stopped,   0 zombie
Cpu(s): 28.5%us,  2.3%sy,  0.0%ni, 63.2%id,  4.0%wa,  2.0%hi,  0.0%si,  0.0%st
Mem:	509408k total,   497416k used,	11992k free,	 6480k buffers
Swap:   497972k total,	33520k used,   464452k free,   213012k cached

 

 

dzis:

 

top - 23:59:58 up 12:17,  1 user,  load average: 0.86, 0.72, 0.71
Tasks:  72 total,   1 running,  71 sleeping,   0 stopped,   0 zombie
Cpu(s): 47.8%us,  2.3%sy,  0.0%ni, 46.8%id,  1.7%wa,  1.3%hi,  0.0%si,  0.0%st
Mem:	509416k total,   499676k used,	 9740k free,	13900k buffers
Swap:   497972k total,	65200k used,   432772k free,   257540k cached

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

zgaduję - podczas tej "zwiechy" serwis ma jakąś większą odwiedzalność?

 

jaki masz serwer www?

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

nie, nie ma większej odwiedzalnosci. Load 0.5/0.8 podczas ostatnich dwóch padów vs 1.3-2.2 podczas pracy. Jak jutro zresetuje to poszukam logów z lstata z obciążeniem.

 

Korzystam z apache1.3 ( tak, wiem ze przedpotopowe, ale posiadał kilka modułów które były mi potrzebne a nie było ich dla 2.0 )

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

pierwsza myśl jaka mi przyszła do głowy patrząc na dane przez Ciebie udostępnione,

to zwis związany z brakiem pamięci... zobacz, że nawet przy dość niskim LA

serwer włazi Ci na swap dość mocno, przy czym wskaźnik cache i bufora jest wysoki,

a co pozwala sądzić, iż jakiś proces twardo trzyma sobie pamięć...

sprawdź MaxRequestsPerChild w Apache i bufory indeksów/zapytań w MySQLd.

Masz globalnie mało pamięci, toteż -> żaden <- z w.w. procesów

nie powinienen móc per default wykorzystywać jej zbyt dużo na stałe.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Komputer ma swoje lata i nie jest składakiem - Dell GX110 więc gryzące się z sobą częsci raczej odpadają.

Bardzo stary sprzęt, choć w moim osobistym odczuciu jest to bardzo dobra konstrukcja. Sam mam jeszcze takiego DELL'a (Intel Pentium III 933MHz, 384MB SDRAM, kontroler Adaptec'a i dysk 73GB SCSI 10kprm). Trzymam go z sentymentu i pewnie nigdy się nie pozbędę. Swego czasu taki DELL OptiPlex GX110 pracował u mnie w trybie 24h przez rok czasu, z 1 dyskiem SCSI i jedynie 256MB RAM'u na pokładzie obsługując kilka rozwijających się serwisów. Dla wielbicieli nowych technologii, nowych co raz wydajniejszych procesorów, itd. dodam tylko iż mimo Pentium III 933MHz, oraz 256MB SDRAM'u z powodzeniem działały na nim: Apache, MySQL, Exim, oraz panel DirectAdmin. Tyle tylko, że rodzaj serwowanych treśći, oraz konfiguracja działających usług miały tutaj ogromne znaczenie (nie licząc jednego forum phpBB w dodatku w wersji przemo- pozostałe serwisy były autorskimi rozwiązaniami pisanymi typowo "pod klienta").

 

Masz globalnie mało pamięci, toteż -> żaden <- z w.w. procesów

nie powinienen móc per default wykorzystywać jej zbyt dużo na stałe.

Zgadzam się z bell'em- przy tej klasy sprzęcie, dobra konfiguracja i optymalizacja działających na nim usług to podstawa. Niestety- 512MB SDRAM to maks tego co można w tej maszynie obsadzić- musisz więc odpowiednio "dopieścić" configi, przede wszystkim MySQL'a jak i Apache'a. Nie wiem dokładnie jakie usługi tam utrzymujesz, oraz co dokładnie na takim sprzęcie hostujesz.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

@bellerofont

Jak uczylem cię konfigurowac mysqla to swap dochodził do 200mb i pomimo że momentami dysk mocno "mielił" to serwer chodził stabilnie.

mysql zawsze brał max do ~42% pamięci.

MaxRequestPerChild jest ustawione na 10

 

@kaczy

Dość podobne rzeczy trzymam, tylko zamiast DA jest webmin+virtualmin a hostuje kilka for przemowych, gdyż z jedno ma baze grubo ponad 200mb i a drugie masternet wyrzucil po 2-3 dniach a generuje transfer 5gb/miesiac :)

 

 

Zreszta zaraz biegne zresetowac i jezeli pamięc mnie zawiodla przy danych to poprawie :-)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

mhm, jakis krótki ten czas edycji postu jest :)

 

dwa wczesniejsze pady, wykresy:

http://img90.imageshack.us/gal.php?g=3mem1.png

http://img136.imageshack.us/gal.php?g=1load1.png

 

ale z drugiej strony swego czasu bardziej swapowal i wszystko ladnie dzialalo:

http://img30.imageshack.us/img30/6076/3mem1.png

 

 

Wydaje mi się także, że gdyby brak ramu był problemem to w którymś logu miałbym coś a'la out of memory.

Jeszcze dziś zajałem się troche ramem, bo doszly mnie słuchy o magicznym osadzie który potrafi się wytworzyć na stykach, gdy metal użyty do ramowych styków różni się od tego na złączach płyty. Nieweim na ile to prawda, ale zawsze jakas nadzieja :)

 

 

MaxRequestsPerChild jest 10, czyli dobrze pamiętałem.

W mysql query cache 32M, key buffer 95M, tmp table 15M, sort/read buffer 2M, read buffer 6M.

Ogólnie nie jestem w stanie powiedziec czy te wartosci są "głupie", gdyż z nimi celowalem by serwer nei swapowal po 200mb i równocześnie by skrypt Przema dość sprawnie działał.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

[!!] Maximum possible memory usage: 2.7G (548% of installed RAM)

 

 

ups ;) Chociaz pomimo istnienia takiej mozliwosci, nigdy mysql nie żżerał kosmicznie dużo pamięci

 

mysql tuner sugeruje bym jeszcze zwiększyć table_size i max_heap_table_size, reszta okej :P

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

taniec deszczu nic nie dał ^_^

 

top - 00:00:00 up 24 days, 11:55,  1 user,  load average: 0.45, 0.50, 0.60
Tasks:  81 total,   2 running,  79 sleeping,   0 stopped,   0 zombie
Cpu(s):  9.7%us,  0.3%sy,  0.0%ni, 90.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:	509408k total,   496900k used,	12508k free,	 5812k buffers
Swap:   497972k total,	12788k used,   485184k free,   174544k cached

 

i umarło :)

 

pechowa godzina 0-00 i jej okolice, lecz nic ciekawego w cronie się nie dzieje w tym czasie :)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Nie chce krakać, ale chyba działa :)

 

Winowajca: rdate uruchamiane przez crontaba... Nie pytajcie czemu, nie pytajcie jak, nie jestem w stanie się z tego wytłumaczyć. Przerzuciłem zadanie na jeszcze późniejsze godziny i od tego czasu zaczęło chodzic normalnie ;)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Dlaczego uruchamiasz rdate?

 

 

Przy hardresecie czas się potrafi przestawić - rdate w cronie lekarstwem na moje lenistwo. Pozatym, jeżeli bym np w trakcie dnia przestawił z godziny 17(serwer) na 15(prawdziwa), to prawdopodobnie śmieszne rzeczy zaczely by się dziać z datami postów na forach itp ;) A w nocy to by w miare bezboleśnie przeszło.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Przy hardresecie czas się potrafi przestawić - rdate w cronie lekarstwem na moje lenistwo. Pozatym, jeżeli bym np w trakcie dnia przestawił z godziny 17(serwer) na 15(prawdziwa), to prawdopodobnie śmieszne rzeczy zaczely by się dziać z datami postów na forach itp ;) A w nocy to by w miare bezboleśnie przeszło.
Do takich rzeczy używa się NTP (np. OpenNTPD).

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Do takich rzeczy używa się NTP (np. OpenNTPD).

 

 

dobrze ;)

Sprawa 'pilna', czy jak zainteresuję się tym tematem gdy będe miał troche wolnego to też będzie dobrze? :)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
dobrze :)

Sprawa 'pilna', czy jak zainteresuję się tym tematem gdy będe miał troche wolnego to też będzie dobrze? :)

Możesz później ;)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Bądź aktywny! Zaloguj się lub utwórz konto

Tylko zarejestrowani użytkownicy mogą komentować zawartość tej strony

Utwórz konto

Zarejestruj nowe konto, to proste!

Zarejestruj nowe konto

Zaloguj się

Posiadasz własne konto? Użyj go!

Zaloguj się


×