Hozzászólások
-
SzerzőBejegyzés
-
Az ellentmondásosságomnak az lehet az oka, hogy nem igazán tudom, hol fogjam meg a problémát. Amikor az atop-ban látom, hogy a lemez 100%-ig foglalt (néha 101%, ami elég fura), és emellet a CPU wait 95%, valamint csak ír a lemez, azt gondolom, hogy ez a baj forrása. Amikor meg látom a dstat-on, hogy folyamatosan másodpercenként 1-2MB-ot ír, és ezzel kijön a napi 120G, akkor meg azt hiszem, ez a baj.
– Két 70GB-os SCSI winyó van a gépben, egyetlen teljesen hardveres RAID 1 tükörben. Más lemez nincs.
– A teljes fájlrendszer egy partíció.
– Ezen van a swap partíció is, ami 3GB.
– JSP, ASP nincs a gépen. Csak php fut. Elvileg sok lehet egyedi mindenféle, de nem igazán látok 2-3 domainnál több aktívat.
– Rsync csak úgy van a gépen, hogy minden hajnalban lefut egy távoili gépről. Napközben nincs.
Próbáltam find-dal megtalálni egy gyanús fájlt, de csak olyan fájlokat látok módosulni, amiken nem lepődom meg. Logok, mysql adatbázisok, session és tmp fájlok, eaccelerator cache-ek, beérkező levelek. (A levél forgalom szerintem elég alacsony.)
Annyit látok még a collectd alapján, hogy az írás mennyisége – úgy tűnik – arányos az apache kérelmek számával, ami arányos a mysql parancsok számával. De ezek alapján még akármi is lehet. Akár az apache, akár a mysql, akár a php, akár az eaccelerator, vagy akár valami rendszer bug. Mintha például nem használná rendesen a 4GB memóriát, hanem helyette mindig kiírna lemezre. Bár a collectd alapján a 4GB memóriából csak 1-et használ aktívan, a megmaradt kb. 3GB page cache.Az ellentmondásosságomnak az lehet az oka, hogy nem igazán tudom, hol fogjam meg a problémát. Amikor az atop-ban látom, hogy a lemez 100%-ig foglalt (néha 101%, ami elég fura), és emellet a CPU wait 95%, valamint csak ír a lemez, azt gondolom, hogy ez a baj forrása. Amikor meg látom a dstat-on, hogy folyamatosan másodpercenként 1-2MB-ot ír, és ezzel kijön a napi 120G, akkor meg azt hiszem, ez a baj.
– Két 70GB-os SCSI winyó van a gépben, egyetlen teljesen hardveres RAID 1 tükörben. Más lemez nincs.
– A teljes fájlrendszer egy partíció.
– Ezen van a swap partíció is, ami 3GB.
– JSP, ASP nincs a gépen. Csak php fut. Elvileg sok lehet egyedi mindenféle, de nem igazán látok 2-3 domainnál több aktívat.
– Rsync csak úgy van a gépen, hogy minden hajnalban lefut egy távoili gépről. Napközben nincs.
Próbáltam find-dal megtalálni egy gyanús fájlt, de csak olyan fájlokat látok módosulni, amiken nem lepődom meg. Logok, mysql adatbázisok, session és tmp fájlok, eaccelerator cache-ek, beérkező levelek. (A levél forgalom szerintem elég alacsony.)
Annyit látok még a collectd alapján, hogy az írás mennyisége – úgy tűnik – arányos az apache kérelmek számával, ami arányos a mysql parancsok számával. De ezek alapján még akármi is lehet. Akár az apache, akár a mysql, akár a php, akár az eaccelerator, vagy akár valami rendszer bug. Mintha például nem használná rendesen a 4GB memóriát, hanem helyette mindig kiírna lemezre. Bár a collectd alapján a 4GB memóriából csak 1-et használ aktívan, a megmaradt kb. 3GB page cache.Elgondolkoztatott, amit írtál. Egyrészt tényleg 10x-es az írás. Én csak vizuálisan probáltam saccolni, és már a 3x-ost sokalltam. Másrészt azonban nagyobb gondban vagyok ezzel a find-dal. Mert hát mikor adjam ki? Azt igazán nem értem, hogy a 10-15 percenkénti ritmust honnan olvastad le, de ha utánaszámolok, ez óránként kb. 80MB írás.
A dstat 1 kimenete pedig:Code:6 1 87 6 0 0| 147k 1003k| 0 0 | 387B 505B| 520 532
8 3 67 22 0 0| 0 2880k| 14k 304k| 0 0 | 764 1026
9 2 65 23 0 0| 0 2004k| 17k 322k| 0 0 | 559 833
10 3 65 22 0 0| 0 1888k| 30k 190k| 0 0 | 658 856
7 4 82 8 0 0| 560k 1020k| 27k 477k| 0 0 | 517 726
32 5 60 4 0 0| 28k 1400k| 34k 190k| 0 0 | 906 2383
3 1 92 5 0 0| 0 124k| 58k 665k| 0 0 | 920 312
0 0 71 28 0 0| 0 1536k| 34k 771k| 0 0 | 992 240
16 4 70 9 0 0| 32k 2056k| 22k 403k| 0 0 | 853 862Vagyis másodpercenként 1-2MB-ot ír, ami pont kiadja ezt a mennyiséget. Tehát nincs is igazán nagy írás egyszerre. Azért másodpercenként 1-2MB log csak nem készülhet!
Az fuser és lsof parancsokkal már néztem az írása nyitott fájlokat, de nem találtam szembeötlőt.
Mellesleg mi van, ha nem fájlbaírás az az írás, amit keresek? Már csak azért is, mert a teljes felhasznált adatmennyiség 40GB körül van. Ebbe nem jöhet létre naponta 120GB új adat.Elgondolkoztatott, amit írtál. Egyrészt tényleg 10x-es az írás. Én csak vizuálisan probáltam saccolni, és már a 3x-ost sokalltam. Másrészt azonban nagyobb gondban vagyok ezzel a find-dal. Mert hát mikor adjam ki? Azt igazán nem értem, hogy a 10-15 percenkénti ritmust honnan olvastad le, de ha utánaszámolok, ez óránként kb. 80MB írás.
A dstat 1 kimenete pedig:Code:6 1 87 6 0 0| 147k 1003k| 0 0 | 387B 505B| 520 532
8 3 67 22 0 0| 0 2880k| 14k 304k| 0 0 | 764 1026
9 2 65 23 0 0| 0 2004k| 17k 322k| 0 0 | 559 833
10 3 65 22 0 0| 0 1888k| 30k 190k| 0 0 | 658 856
7 4 82 8 0 0| 560k 1020k| 27k 477k| 0 0 | 517 726
32 5 60 4 0 0| 28k 1400k| 34k 190k| 0 0 | 906 2383
3 1 92 5 0 0| 0 124k| 58k 665k| 0 0 | 920 312
0 0 71 28 0 0| 0 1536k| 34k 771k| 0 0 | 992 240
16 4 70 9 0 0| 32k 2056k| 22k 403k| 0 0 | 853 862Vagyis másodpercenként 1-2MB-ot ír, ami pont kiadja ezt a mennyiséget. Tehát nincs is igazán nagy írás egyszerre. Azért másodpercenként 1-2MB log csak nem készülhet!
Az fuser és lsof parancsokkal már néztem az írása nyitott fájlokat, de nem találtam szembeötlőt.
Mellesleg mi van, ha nem fájlbaírás az az írás, amit keresek? Már csak azért is, mert a teljes felhasznált adatmennyiség 40GB körül van. Ebbe nem jöhet létre naponta 120GB új adat.Úgy tűnik a feladatra a pidstat és iotop programok lennének valóak, de ezek 2.6.20-as kernel felett működnek csak. (Szükségük van az „I/O accounting support”-ra.) Az én kernelem 2.6.20-16-os, de ebben még nincs benne ez. Így vélhetőleg csak kernel frissítés után tudnám userekre bontani az io forgalmat … 🙁
Ha bárkinek van további építő ötlete, gondolata, örömmel olvasnám …Úgy tűnik a feladatra a pidstat és iotop programok lennének valóak, de ezek 2.6.20-as kernel felett működnek csak. (Szükségük van az „I/O accounting support”-ra.) Az én kernelem 2.6.20-16-os, de ebben még nincs benne ez. Így vélhetőleg csak kernel frissítés után tudnám userekre bontani az io forgalmat … 🙁
Ha bárkinek van további építő ötlete, gondolata, örömmel olvasnám …Ha a mysql írna ennyit, akkor nem kellene az atop listájában valami nagyobb értékkel megjelennie a mysql-nek vagy CPU vagy DISK használat képében? (A fenti atop az összes aktív processzt tartalmazza.) Nézegettem a mysql terhelést, de egészen minimálisnak tűnik. 1 max 2 lekérés egyszerre, az sem folyamatosan. A collectd semmi extrát nem mutat a mysql elemzésben.
Gyakorlatilag egy igazán látogatott oldal van a szerveren, de az sem portál, bár egy prado nevű keretrendszerben van írva. Egyetlen pradocache táblát használ az adatbázisban, ez is 170 sor csupán. Az oldalhoz tartozó teljes adatbázis mérete is csak 524KB.
Csatolok egy napi lemezhasználatot. Szerintem ez sokkal több írás, mint hogy néha a mysql rendet rak.Ha a mysql írna ennyit, akkor nem kellene az atop listájában valami nagyobb értékkel megjelennie a mysql-nek vagy CPU vagy DISK használat képében? (A fenti atop az összes aktív processzt tartalmazza.) Nézegettem a mysql terhelést, de egészen minimálisnak tűnik. 1 max 2 lekérés egyszerre, az sem folyamatosan. A collectd semmi extrát nem mutat a mysql elemzésben.
Gyakorlatilag egy igazán látogatott oldal van a szerveren, de az sem portál, bár egy prado nevű keretrendszerben van írva. Egyetlen pradocache táblát használ az adatbázisban, ez is 170 sor csupán. Az oldalhoz tartozó teljes adatbázis mérete is csak 524KB.
Csatolok egy napi lemezhasználatot. Szerintem ez sokkal több írás, mint hogy néha a mysql rendet rak.Nem, nem lenne meglepő. Én sem vagyok biztos, pontosan mit is keresek. De az ilyen értékek egészen elbizonytalanítanak. (atop aktív processzek userenként csoportosítva.)
Code:ATOP – csm2 2008/10/28 18:57:39 1 seconds elapsed
PRC | sys 0.08s | user 0.16s | #thr 219 | #zombie 2 | #exit 5 |
CPU | sys 8% | user 18% | irq 0% | idle 282% | wait 92% |
cpu | sys 5% | user 8% | irq 0% | idle 0% | cpu000 w 87% |
cpu | sys 1% | user 6% | irq 0% | idle 88% | cpu002 w 5% |
cpu | sys 1% | user 3% | irq 0% | idle 96% | cpu003 w 0% |
cpu | sys 1% | user 1% | irq 0% | idle 98% | cpu001 w 0% |
MEM | tot 3.9G | free 417.1M | cache 2.4G | buff 233.1M | slab 161.3M |
SWP | tot 2.8G | free 2.6G | | vmcom 1.9G | vmlim 4.8G |
DSK | cciss/c0d0 | busy 101% | read 0 | write 316 | avio 3 ms |
NET | transport | tcpi 208 | tcpo 196 | udpi 0 | udpo 0 |
NET | network | ipi 208 | ipo 198 | ipfrw 0 | deliv 208 |
NET | dev eth0 | pcki 150 | pcko 209 | in 113 Kbps | out 1 Mbps |
NET | dev lo | pcki 8 | pcko 8 | in 5 Kbps | out 5 Kbps |
PAUSED
NPROCS SYSCPU USRCPU VSIZE RSIZE RDDSK WRDSK RNET SNET DSK USER 1/1
3 0.04s 0.13s 160.6M 25776K 0 0 0 0 0% domain1user
11 0.02s 0.01s 1.2G 47284K 0 0 0 0 0% www-data
1 0.00s 0.02s 0K 0K 0 0 0 0 0% domain2user
1 0.01s 0.00s 629.1M 59812K 0 0 0 0 0% mysql
2 0.01s 0.00s 25856K 4032K 0 0 0 0 0% root
2 0.00s 0.00s 5892K 568K 0 0 0 0 0% qmaildA lemez foglaltsága 101%, csak írás van, és egyetlen user sem foglalja lényegesen a lemezt. De akkor miért 101%?
Ráadásul a collectd adatai alapján összességében kb. 3-szor annyi a lemezre írás, mint a lemezről való olvasás, ami engem már magában is meglep, hisz alapvetően csak weboldalak és levelezés van a rendszerben.Nem, nem lenne meglepő. Én sem vagyok biztos, pontosan mit is keresek. De az ilyen értékek egészen elbizonytalanítanak. (atop aktív processzek userenként csoportosítva.)
Code:ATOP – csm2 2008/10/28 18:57:39 1 seconds elapsed
PRC | sys 0.08s | user 0.16s | #thr 219 | #zombie 2 | #exit 5 |
CPU | sys 8% | user 18% | irq 0% | idle 282% | wait 92% |
cpu | sys 5% | user 8% | irq 0% | idle 0% | cpu000 w 87% |
cpu | sys 1% | user 6% | irq 0% | idle 88% | cpu002 w 5% |
cpu | sys 1% | user 3% | irq 0% | idle 96% | cpu003 w 0% |
cpu | sys 1% | user 1% | irq 0% | idle 98% | cpu001 w 0% |
MEM | tot 3.9G | free 417.1M | cache 2.4G | buff 233.1M | slab 161.3M |
SWP | tot 2.8G | free 2.6G | | vmcom 1.9G | vmlim 4.8G |
DSK | cciss/c0d0 | busy 101% | read 0 | write 316 | avio 3 ms |
NET | transport | tcpi 208 | tcpo 196 | udpi 0 | udpo 0 |
NET | network | ipi 208 | ipo 198 | ipfrw 0 | deliv 208 |
NET | dev eth0 | pcki 150 | pcko 209 | in 113 Kbps | out 1 Mbps |
NET | dev lo | pcki 8 | pcko 8 | in 5 Kbps | out 5 Kbps |
PAUSED
NPROCS SYSCPU USRCPU VSIZE RSIZE RDDSK WRDSK RNET SNET DSK USER 1/1
3 0.04s 0.13s 160.6M 25776K 0 0 0 0 0% domain1user
11 0.02s 0.01s 1.2G 47284K 0 0 0 0 0% www-data
1 0.00s 0.02s 0K 0K 0 0 0 0 0% domain2user
1 0.01s 0.00s 629.1M 59812K 0 0 0 0 0% mysql
2 0.01s 0.00s 25856K 4032K 0 0 0 0 0% root
2 0.00s 0.00s 5892K 568K 0 0 0 0 0% qmaildA lemez foglaltsága 101%, csak írás van, és egyetlen user sem foglalja lényegesen a lemezt. De akkor miért 101%?
Ráadásul a collectd adatai alapján összességében kb. 3-szor annyi a lemezre írás, mint a lemezről való olvasás, ami engem már magában is meglep, hisz alapvetően csak weboldalak és levelezés van a rendszerben. -
SzerzőBejegyzés
legutóbbi hsz