• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    AQUARIUS
    AQUARIUS --- ---
    CHILDINTIME: ja bych misto Nagiosu urcite zvolil Icingu (coz je fork Nagiosu s aktivnim vyvojem), na grafy mam pnp4nagios, ale vyhledove se chystam prejit na graphite. Mimochodem, Icinga 2.0 uz ma nativni podporu graphite, nicmene to jsem jeste nezkousel, protoze je to kompletne prepsany (takze se meni syntaxe) a jeste neni venku finalni verze.
    KRISHNA
    KRISHNA --- ---
    CHILDINTIME: na provázání s nagiosem je třeba nagiosgraph, oproti muninu je první nastavování trochu větší pain, ale pak to funguje dobře.
    CHILDINTIME
    CHILDINTIME --- ---
    ahoj, nejak uz je potreba postavit monitorovaci system v mem soucasnem zamestnani, takze ted nejak vybiram co to bude. Uz jsem jednou nastavoval nagios, vyhovuje mi, takze co se dohledu a alertu tyce je to muj favorit. Dal pak potrebuju delat nejak traffic grafy z par zarizeni (2 routery, 3 switche) a resource grafy z linux i windows serveru. Na ty traffic veci asi staci mrtg, ale ty resource grafy nejak nevim..kdysi jsem neco zkousei s muninem, bylo to ok, ale treba je neco lepsiho a bylo by mozna fajn aby na grafy byl jenom jeden system, ktery by navic sel nejak provazat s nagiosem :) nejaka doporuceni, nebo co pouzivate? Sit neni tak velka, stroju co potrebuju sledovat taky neni moc, ale uz to neco chce..
    VITEX
    VITEX --- ---
    Stručný obrázkový návod jak přez můj monitoring sledovat obsah webu v šesti krocích.

    Tutoriál - Monitoring - Redmine Vitex Software
    http://r.v.s.cz/projects/monitoring/wiki/Tutori%C3%A1l

    Napsal jsem vlastně jen generátor konfigurace pro Icingu/Nagios.
    Celá věc je ve fázi alfaverze ale něco to už dělá.
    JENDAVB
    JENDAVB --- ---
    nekdo zkusenosti z HP OVO ?
    HEXXX
    HEXXX --- ---
    SAMGARR: zadnej, upgrade tusim z 2.0.6. doporucuju ale i tak udelat backup vseho.
    po zapnuti noveho serveru jsem se lek, ze tomu nestartuji procesy, ale jen si to ze zacatku chvili dela upgrade databaze, progres vypisuje do logu..
    SAMGARR
    SAMGARR --- ---
    Postrehli jste nejaky problemy pri upgrade na 2.2? At vim do ceho jdu:)
    HEXXX
    HEXXX --- ---
    juchuu v zabbixu 2.2 je ted mozny otevrit url u elementu na mape v novym tabu kliknutim kolecka
    SNIPERCZE
    SNIPERCZE --- ---
    Nevite nekdo o zabbix klientovi pro android, kterej umi zobrazovat slideshows nebo aspon screeny?
    HEXXX
    HEXXX --- ---
    HEXXX: tak jsem si nakonec udelal vedle jeste graf z delta hodnot.
    HEXXX
    HEXXX --- ---
    SNIPERCZE: skoda no. asi to vyresim triggerem co mi bude pri zvyseni posilat to cislo po jabberu..
    SNIPERCZE
    SNIPERCZE --- ---
    HEXXX: bojim se ze to nedas. muzes na to pouzit sekundarni osu y - kdyz pridavas itemy do grafu, tak tam je roletka "y axis" s volbama left a right. Jednomu tomu itemu nastav left, druhymu right a pak ma kazdej item svoji skalu. Ale stejne ti to bude prepocitavat na nasobky, jenom to nebude rovna cara...
    HEXXX
    HEXXX --- ---
    SNIPERCZE: mam graf, kde zobrazuju tx a rx dropy na rozhrani (2 itemy v 1 grafu), pricemz jeden smer ma 0, druhy treba tech 50100, takze nemuzu hnout s y osou. zaroven potrebuju videt prave ty rozdily o jednotky u toho problemovejsiho smeru, coz nemusim mit vyrazny v grafu, ale staci mi jen to cislo v legende..
    SNIPERCZE
    SNIPERCZE --- ---
    HEXXX: zaokrouhleni grafu se dany rozsahem, kterej zobrazuje. Ono je to vlastne logicke - pokud se ti hodnota behem nejakyho obdobi zmeni o 50k, je jedno jestli je to 50001 nebo 50500...podstatnej je rozdil tech 50k. Pokud ti graf bude zobrazovat jenom rozsah rekneme 49900 - 50100 tak to bude vyrazne presnejsi (u rozsahu 200 jednotek je uz podstatne jestli je to 49950 nebo 50050).
    HEXXX
    HEXXX --- ---
    nemuzu prijit v zabbixu na takovou blbost:
    mam item, co pres snmp taha nejaky raw cisla vyssi nez 1000, ciste bez unit.
    v latest data se mi zobrazuje treba 52026, ale v grafech se to uz zaokrouhli na 52k, coz nechci.
    nevite jak to zaoukrouhlovani zrusit ? na wiki jsem to u itemu ani grafu nenasel...
    WENCA
    WENCA --- ---
    DevOps Prague | Community of DevOps enthusiasts in Prague, Czech Republic
    http://devopsprague.cz/
    SAMGARR
    SAMGARR --- ---
    SIRSPOOK: tak to bych asi nezapinal, ten debug je hodne ukecanej:)
    SIRSPOOK
    SIRSPOOK --- ---
    SAMGARR: urcite ne, A/ podle zpravy te action ji dokazu bezpecne identifikovat B/ v tabulce escalations treba v tomto konretnim pripade nebyla jina radka. Debug logovani zapnout muzu, jen mam trechu strach co to udela s tim serverem. Mam k 5000k itemu s kontrolovou 1x za minutu a DB bezi na tom samem stroji na jednom obycejnem SATA disku, ktery uz ted ma problemy i IO. Jak moc velkou zatez predstavuje to debug logovani?
    SAMGARR
    SAMGARR --- ---
    SIRSPOOK: a neposila ti ten alert jina action? Zkus zapnout debug logovani a mrknout se ktera akce ten alert posila, melo by to byt videt v logu.
    SIRSPOOK
    SIRSPOOK --- ---
    Ahoj, resim problem se zabbixem verze 2.0.5, bud spatne chapu logiku fungovani toho monitoringu nebo jsem narazil na bug a nevim jak jej resit. Treba jste se s tim uz nekdo setkal.

    Mam action, ktera ma nasledujici conditions:
    (A) and (B) and (C) and (D)
    (A) Maintenance status not in "maintenance"
    (B) Trigger value = "PROBLEM"
    (C) Trigger severity >= "Average"
    (D) Host group = "Acceptation env"

    v Operations mam step 1-0 s defaultni escalaci 600s
    +Condition:
    (A) Event acknowledged = "Not Ack"

    Problem nastava, kdyz pro prislusny server naplanuji maintenance a v jejim prubehu vyskoci trigger, ktery acknowledgnu. Ve chvili, kdy expiruje prislusna maintenance mi tato akce zacne pravidelne chodit i pres to, ze status toho triggeru je Acknowledge. Zkusil jsme k triggeru pote pridat dalsi acknowledge po vyprseni maintenance, ale nepomohlo.

    Jediny zpusob, jak to zastavit je smazat z DB tabulky escalations prislusny radek s triggerem. Ten radek vypada takto:
    +--------------+------------+------------+-----------+--------------+-----------------+-------------+----------+
    | escalationid | actionid | triggerid | eventid | r_eventid | nextcheck | esc_step | status |
    +--------------+------------+------------+-----------+--------------+-----------------+-------------+----------+
    | 234802 | 4 | 22823 | 741931 | NULL | 1378802942 | 2 | 0 |

    Nesetkal jste se s tim nekdo? Google ani zabbix forum mi zatim moc nepomohl.
    Diky
    Kliknutím sem můžete změnit nastavení reklam