• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    TOTAL
    TOTAL --- ---
    Zdravim vsechny pritomne, chtel jsem pokrocit se ZABBIXEM a zastavil jsem se na jedne veci. Mam nekolik serveru s AGENTEM, nejake SNMP a vse funguje vyborne. Ted jsem zacal laborovat s PROXY ZABBIX. Nainstalovane, tvari se, ze komunikuje --- administration ---- proxies ---Last seen 1s ... zije.

    Telnetem overeno, ze zije 10051. Jen jsem pri sve tuposti nepochopil jak dodat hosty pro danou proxy. Mam v te siti nekolik prvku, ktere bych rad hlidal.
    V konfiguraci jsme zadal, aby vse pobirala proxy.


    --------------------
    25378:20180912:160246.777 Starting Zabbix Proxy (passive) [proxy-test]. Zabbix 3.4.13 (revision 84139).
    25378:20180912:160246.778 **** Enabled features ****
    25378:20180912:160246.778 SNMP monitoring: YES
    25378:20180912:160246.778 IPMI monitoring: YES
    25378:20180912:160246.778 Web monitoring: YES
    25378:20180912:160246.778 VMware monitoring: YES
    25378:20180912:160246.778 ODBC: YES
    25378:20180912:160246.778 SSH2 support: YES
    25378:20180912:160246.778 IPv6 support: YES
    25378:20180912:160246.778 TLS support: YES
    25378:20180912:160246.778 **************************
    25378:20180912:160246.778 using configuration file: /etc/zabbix/zabbix_proxy.conf
    25378:20180912:160246.785 current database version (mandatory/optional): 03040000/03040007
    25378:20180912:160246.785 required mandatory version: 03040000
    25378:20180912:160246.795 proxy #0 started [main process]
    25392:20180912:160246.797 proxy #1 started [housekeeper #1]
    25395:20180912:160246.799 proxy #3 started [discoverer #1]
    25398:20180912:160246.801 proxy #5 started [history syncer #2]
    25396:20180912:160246.803 proxy #4 started [history syncer #1]
    25394:20180912:160246.803 proxy #2 started [http poller #1]
    25400:20180912:160246.804 proxy #7 started [history syncer #4]
    25399:20180912:160246.810 proxy #6 started [history syncer #3]


    Vse zda se bezi. Jak dostat hosty dane PROXY do SERVERU ZABBIX ? Monitored by proxy samozrejme mam. Myslel jsem, ze bude fungovat IP PROXY:10051 pro daneho hosta. Muzete me prosim nasmerovat ? Nazvy stroju take sedi. Googlil jsem, hledal jsem ... a jsem na mrtvem bode. Pokud byste me nekdo nasmeroval, budu moc rad. Diky moc.
    RATTKIN
    RATTKIN --- ---
    ZKOUMAL: dostáváš vůbec data?
    jinak je to item jako každá jiná a triggery fungují stejně.
    ZKOUMAL
    ZKOUMAL --- ---
    Ahoj,

    máte někdo zkušenost se SNMP trap? Potřeboval bych trochu popostrčit jak dostat last data itemu na dashboard. Item chyta cokoliv co skočí do trapu a potreboval bych tu informaci dostat do triggeru.
    RATTKIN
    RATTKIN --- ---
    SAMGARR: a co udělat doporučenou sestavy db cluster, proxy a nad tím web UI? pokud to chcete na víc lokalitách, těší to proxy.
    SAMGARR
    SAMGARR --- ---
    Resite nekdo konfiguraci Zabbixu pomoci nejakeho config managementu jako je treba Puppet nebo Ansible? Resim jak spravovat vice instanci Zabbix serveru. Rucne klikat sablony a importovat/exportovat neni cesta. Puppeti modul pro zabbix umi pracovat se sablonama, ale ma svoje mouchy... Zacinam trochu posilhavat po TICK stacku nebo Prometheovi, tam by to nemel byt problem.
    QUIP
    QUIP --- ---
    SIRSPOOK: aha, tak to si s tim budu muset jeste pohrat. Ted pro testy tam mam par hostu a server se dotazuje agenta.
    SIRSPOOK
    SIRSPOOK --- ---
    QUIP: uz je to strasne davno, co jsme to takle zkouseli, ale rozdil v tom byl docela velkej. Musel jsem mit nastartovany hodne tech polleru a ty docela zatezovali CPU. Jenze tenkrat to bezelo na vyrazne starsim HW a byla to 2.x verze zabbixu. Takze prime srovnani nemam.

    Timto si nejsem 100% jisty:
    Jeden poller dokaze myslim obsluhovat jeden host a jeden item v case, takze v zasade potrebujes tolik polleru, kolik mas values per seconds.
    QUIP
    QUIP --- ---
    SIRSPOOK: Diky za info. S MySQL si pohrat dokazu. Reseni problemu s vykonem MySQL je cast moji prace :) Takze ocenuju hlavne ten prehled o tom, jak se k te DB chova Zabbix, jak moc to narusta atd.

    Jaky je vykonovy rozdil v tom, kdyz se Zabbix dotazuje jednotlivych agentu na data a v tom, kdyz agent ty data cpe na server? Zkousel jste to nekdo porovnavat?
    SIRSPOOK
    SIRSPOOK --- ---
    RATTKIN: jeden stroj, zadna proxy. Je v tom jeden Intel(R) Xeon(R) CPU E3-1240 V2 @ 3.40GHz, 2x samsung evo 850. V tomhle stavu to bezi uz asi 2 roky bez jedineho problemu. tuk tuk.
    Verze zabbixu je stale jeste 3.2. Load 0.50. Snad by to slo jeste vyladit lip, ale nechtelo se mi tim uz ztracet vic casu...
    Kdyz se pusti housekeeper, tak tam nejaky iowait naskoci. Stejne jako kdyz clovek da nejakou hloupou podminku do "latest data".
    RATTKIN
    RATTKIN --- ---
    SIRSPOOK: dobře ty. Je to jen jeden server, bez proxy nebo databázových serverů? jaký cpu?
    SIRSPOOK
    SIRSPOOK --- ---
    QUIP: Ahoj, mam zabbix s 267hosty, vsechny aktivni agenti. Mame asi 32k itemu a 341 novych hodnot za vterinu. Db bezi na mysql a ma aktualne 90gb. Vetsina itemu se sbira po minute a drzi se 7dni a 365dni trendy. Bezi to na 2x ssd v raid1, naprosto bez i/o wait. Spotreba pameti cca 15GB (vetsina z toho dela mysql), procesorove vyuziti minimalni.

    Vyplati se pri volne chvili trochu potunit tu mysql a jak uz tu padlo innodb_file_per_table je nezbytnost.

    Snad pomohlo.
    QUIP
    QUIP --- ---
    SNIPERCZE: innodb_file_per_table mam zapnuty, bez toho by to bylo uplne v haji, protoze pak se musi udelat jedine restore cele databaze, aby se misto uvolnilo. Ale ani takhle to neni idealni, jeste premyslim, ze zkusim table partitions po mesicich, abych pak mohl jen smazat starou partition (starou historii) a nemusel delat OPTIMIZE TABLE, ktery ve skutecnosti dela kopii cele tabulky a trva to silene dlouho.
    SNIPERCZE
    SNIPERCZE --- ---
    QUIP: Autoregistrace funguje krasne, agent se ohlasi serveru a ten si ho ulozi, pripadne prida do skupin a temmplate (nastavujes akce stejne jako u triggeru). U zabbixu je problem (hlavne u mysql na innodb) ze jak uklada data a maze je, vznikaj hodne deravy tabulky - roste velikost. Urcite doporucuju zapnout v mysql innodb_file_per_table.
    QUIP
    QUIP --- ---
    SNIPERCZE: hmm, tak nejak cekam, ze se mi to po plnem nasazeni bude pohybovat nekde kolem 20 - 30GB. Protoze to je sice jen 30 stroju, ale kazdy ma minimalne 100 items, spis to v prumeru bude kolem 200 items.
    Trosku me tohle desi, protoze dlouha leta jsem mel monitoring s rrd databazi, kde to nijak nenarustalo.
    Kazdopadne zatim se mi ten Zabbix libi a bavi me, jak se daji ruzne veci priohnout, automatizovat a navic to ma slusnou dokumentaci. Takze nejvic casu travim nasavanim informaci z manualu a z prikladu na netu. Pak si na to pisu vlastni discovery skripty a sablony a snazim se to automatizovat. Porad si jeste hraju jen se 4 strojema. Az to bude automatizovany, tak bych mel jen udelat jedno velky discovery a o vic se nestarat ... uvidime, jak se zadari. Pak se tu "pochlubim" s vysledkem.
    SNIPERCZE
    SNIPERCZE --- ---
    QUIP: databaze mohla mit kolem 50GB. Drzim vzdycky data za 7 dni a pak rok trendy. Kazdej stroj mohl v prumeru mit 50 itemu, mozna 100. Vzorkovaci frekvence od 30s do 4 hodin (median tak 5min)
    QUIP
    QUIP --- ---
    SNIPERCZE: SNMP uz jsem zavrhnul a testuju to ted pres agenta a vlastni skripty. So far so good.
    U SNMP se mi stala takova vec, ze autodiscovery naslo asi 500x polozku "memory" a pro kazdou sledovalo celkove, vyuzita, volna ... vygenerovalo to okolo 2000 items na jednom hostu a pak me docela prekvapilo, jak rychle roste objem databaze.

    Takze se te zeptam - jak velka byla DB pro tech 300 serveru a kolik sledovanych polozek jsi tam mel? :)
    SNIPERCZE
    SNIPERCZE --- ---
    QUIP: Hlavni vyhoda agenta je, ze vidi do systemu. Muze poustet skripty, tahat si data co nejsou k dispozici pres SNMP apod. Osobne servery hlidam agentem, routery/tiskarny apod. SNMP.

    QUIP: Zabbix proxy se hodi pokud mas vic lokalit. V jedny lokalite nema moc vyznam, nejvetsi moje nasazeni zabbixu bylo asi 300 serveru (fyzicky, virtualy i kontejnery, vsude agent) + nejaky dalsi veci (switche, routery, par tiskaren) a bez problemu. Jenom jsem oddelil zabbix-server, databazi a webksicht na vlastni stroje. Plus doporucuju u velkejch instalaci rovnou nasadit postgresql.
    RATTKIN
    RATTKIN --- ---
    QUIP: my proxy nemáme. kdyby nestačil výkon pro třech našich 300 agentů, tak první by bylo přidat třetí CPU nebo to dát z 7.2k HDD na něco rychlejšího.
    QUIP
    QUIP --- ---
    Delal jste nekdo realne porovnani dopadu na vykon pri sifrovanem spojeni vs nesifrovane (mezi agentem a serverem)?
    Pripadne i rozdily aktivni / pasivni checky?
    Kliknutím sem můžete změnit nastavení reklam