• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    RATTKIN
    RATTKIN --- ---
    ZKOUMAL: dostáváš vůbec data?
    jinak je to item jako každá jiná a triggery fungují stejně.
    ZKOUMAL
    ZKOUMAL --- ---
    Ahoj,

    máte někdo zkušenost se SNMP trap? Potřeboval bych trochu popostrčit jak dostat last data itemu na dashboard. Item chyta cokoliv co skočí do trapu a potreboval bych tu informaci dostat do triggeru.
    RATTKIN
    RATTKIN --- ---
    SAMGARR: a co udělat doporučenou sestavy db cluster, proxy a nad tím web UI? pokud to chcete na víc lokalitách, těší to proxy.
    SAMGARR
    SAMGARR --- ---
    Resite nekdo konfiguraci Zabbixu pomoci nejakeho config managementu jako je treba Puppet nebo Ansible? Resim jak spravovat vice instanci Zabbix serveru. Rucne klikat sablony a importovat/exportovat neni cesta. Puppeti modul pro zabbix umi pracovat se sablonama, ale ma svoje mouchy... Zacinam trochu posilhavat po TICK stacku nebo Prometheovi, tam by to nemel byt problem.
    QUIP
    QUIP --- ---
    SIRSPOOK: aha, tak to si s tim budu muset jeste pohrat. Ted pro testy tam mam par hostu a server se dotazuje agenta.
    SIRSPOOK
    SIRSPOOK --- ---
    QUIP: uz je to strasne davno, co jsme to takle zkouseli, ale rozdil v tom byl docela velkej. Musel jsem mit nastartovany hodne tech polleru a ty docela zatezovali CPU. Jenze tenkrat to bezelo na vyrazne starsim HW a byla to 2.x verze zabbixu. Takze prime srovnani nemam.

    Timto si nejsem 100% jisty:
    Jeden poller dokaze myslim obsluhovat jeden host a jeden item v case, takze v zasade potrebujes tolik polleru, kolik mas values per seconds.
    QUIP
    QUIP --- ---
    SIRSPOOK: Diky za info. S MySQL si pohrat dokazu. Reseni problemu s vykonem MySQL je cast moji prace :) Takze ocenuju hlavne ten prehled o tom, jak se k te DB chova Zabbix, jak moc to narusta atd.

    Jaky je vykonovy rozdil v tom, kdyz se Zabbix dotazuje jednotlivych agentu na data a v tom, kdyz agent ty data cpe na server? Zkousel jste to nekdo porovnavat?
    SIRSPOOK
    SIRSPOOK --- ---
    RATTKIN: jeden stroj, zadna proxy. Je v tom jeden Intel(R) Xeon(R) CPU E3-1240 V2 @ 3.40GHz, 2x samsung evo 850. V tomhle stavu to bezi uz asi 2 roky bez jedineho problemu. tuk tuk.
    Verze zabbixu je stale jeste 3.2. Load 0.50. Snad by to slo jeste vyladit lip, ale nechtelo se mi tim uz ztracet vic casu...
    Kdyz se pusti housekeeper, tak tam nejaky iowait naskoci. Stejne jako kdyz clovek da nejakou hloupou podminku do "latest data".
    RATTKIN
    RATTKIN --- ---
    SIRSPOOK: dobře ty. Je to jen jeden server, bez proxy nebo databázových serverů? jaký cpu?
    SIRSPOOK
    SIRSPOOK --- ---
    QUIP: Ahoj, mam zabbix s 267hosty, vsechny aktivni agenti. Mame asi 32k itemu a 341 novych hodnot za vterinu. Db bezi na mysql a ma aktualne 90gb. Vetsina itemu se sbira po minute a drzi se 7dni a 365dni trendy. Bezi to na 2x ssd v raid1, naprosto bez i/o wait. Spotreba pameti cca 15GB (vetsina z toho dela mysql), procesorove vyuziti minimalni.

    Vyplati se pri volne chvili trochu potunit tu mysql a jak uz tu padlo innodb_file_per_table je nezbytnost.

    Snad pomohlo.
    QUIP
    QUIP --- ---
    SNIPERCZE: innodb_file_per_table mam zapnuty, bez toho by to bylo uplne v haji, protoze pak se musi udelat jedine restore cele databaze, aby se misto uvolnilo. Ale ani takhle to neni idealni, jeste premyslim, ze zkusim table partitions po mesicich, abych pak mohl jen smazat starou partition (starou historii) a nemusel delat OPTIMIZE TABLE, ktery ve skutecnosti dela kopii cele tabulky a trva to silene dlouho.
    SNIPERCZE
    SNIPERCZE --- ---
    QUIP: Autoregistrace funguje krasne, agent se ohlasi serveru a ten si ho ulozi, pripadne prida do skupin a temmplate (nastavujes akce stejne jako u triggeru). U zabbixu je problem (hlavne u mysql na innodb) ze jak uklada data a maze je, vznikaj hodne deravy tabulky - roste velikost. Urcite doporucuju zapnout v mysql innodb_file_per_table.
    QUIP
    QUIP --- ---
    SNIPERCZE: hmm, tak nejak cekam, ze se mi to po plnem nasazeni bude pohybovat nekde kolem 20 - 30GB. Protoze to je sice jen 30 stroju, ale kazdy ma minimalne 100 items, spis to v prumeru bude kolem 200 items.
    Trosku me tohle desi, protoze dlouha leta jsem mel monitoring s rrd databazi, kde to nijak nenarustalo.
    Kazdopadne zatim se mi ten Zabbix libi a bavi me, jak se daji ruzne veci priohnout, automatizovat a navic to ma slusnou dokumentaci. Takze nejvic casu travim nasavanim informaci z manualu a z prikladu na netu. Pak si na to pisu vlastni discovery skripty a sablony a snazim se to automatizovat. Porad si jeste hraju jen se 4 strojema. Az to bude automatizovany, tak bych mel jen udelat jedno velky discovery a o vic se nestarat ... uvidime, jak se zadari. Pak se tu "pochlubim" s vysledkem.
    SNIPERCZE
    SNIPERCZE --- ---
    QUIP: databaze mohla mit kolem 50GB. Drzim vzdycky data za 7 dni a pak rok trendy. Kazdej stroj mohl v prumeru mit 50 itemu, mozna 100. Vzorkovaci frekvence od 30s do 4 hodin (median tak 5min)
    QUIP
    QUIP --- ---
    SNIPERCZE: SNMP uz jsem zavrhnul a testuju to ted pres agenta a vlastni skripty. So far so good.
    U SNMP se mi stala takova vec, ze autodiscovery naslo asi 500x polozku "memory" a pro kazdou sledovalo celkove, vyuzita, volna ... vygenerovalo to okolo 2000 items na jednom hostu a pak me docela prekvapilo, jak rychle roste objem databaze.

    Takze se te zeptam - jak velka byla DB pro tech 300 serveru a kolik sledovanych polozek jsi tam mel? :)
    SNIPERCZE
    SNIPERCZE --- ---
    QUIP: Hlavni vyhoda agenta je, ze vidi do systemu. Muze poustet skripty, tahat si data co nejsou k dispozici pres SNMP apod. Osobne servery hlidam agentem, routery/tiskarny apod. SNMP.

    QUIP: Zabbix proxy se hodi pokud mas vic lokalit. V jedny lokalite nema moc vyznam, nejvetsi moje nasazeni zabbixu bylo asi 300 serveru (fyzicky, virtualy i kontejnery, vsude agent) + nejaky dalsi veci (switche, routery, par tiskaren) a bez problemu. Jenom jsem oddelil zabbix-server, databazi a webksicht na vlastni stroje. Plus doporucuju u velkejch instalaci rovnou nasadit postgresql.
    RATTKIN
    RATTKIN --- ---
    QUIP: my proxy nemáme. kdyby nestačil výkon pro třech našich 300 agentů, tak první by bylo přidat třetí CPU nebo to dát z 7.2k HDD na něco rychlejšího.
    QUIP
    QUIP --- ---
    Delal jste nekdo realne porovnani dopadu na vykon pri sifrovanem spojeni vs nesifrovane (mezi agentem a serverem)?
    Pripadne i rozdily aktivni / pasivni checky?
    QUIP
    QUIP --- ---
    SAMGARR: no tak o ne prijdes, kdyz bude mit vypadek proxy :)
    SAMGARR
    SAMGARR --- ---
    QUIP: Nejde jen o vykon, zabbix-proxy ti umozni treba pseudo HA. Pri maintenance/vypadku zabbix-serveru neprijdes o data protoze je cachuje proxy.
    Kliknutím sem můžete změnit nastavení reklam