Zabbix, nagios a další monitorovací nástroje

QUIP --- --- 10:29:30 18.7.2018

SIRSPOOK: Diky za info. S MySQL si pohrat dokazu. Reseni problemu s vykonem MySQL je cast moji prace :) Takze ocenuju hlavne ten prehled o tom, jak se k te DB chova Zabbix, jak moc to narusta atd.

Jaky je vykonovy rozdil v tom, kdyz se Zabbix dotazuje jednotlivych agentu na data a v tom, kdyz agent ty data cpe na server? Zkousel jste to nekdo porovnavat?

RATTKIN --- --- 9:37:03 18.7.2018

1 odpověď

SIRSPOOK: dobře ty. Je to jen jeden server, bez proxy nebo databázových serverů? jaký cpu?

SIRSPOOK --- --- 9:21:45 18.7.2018

2 odpovědi +2

QUIP: Ahoj, mam zabbix s 267hosty, vsechny aktivni agenti. Mame asi 32k itemu a 341 novych hodnot za vterinu. Db bezi na mysql a ma aktualne 90gb. Vetsina itemu se sbira po minute a drzi se 7dni a 365dni trendy. Bezi to na 2x ssd v raid1, naprosto bez i/o wait. Spotreba pameti cca 15GB (vetsina z toho dela mysql), procesorove vyuziti minimalni.

Vyplati se pri volne chvili trochu potunit tu mysql a jak uz tu padlo innodb_file_per_table je nezbytnost.

Snad pomohlo.

QUIP --- --- 8:40:30 9.7.2018

1 odpověď

SNIPERCZE: innodb_file_per_table mam zapnuty, bez toho by to bylo uplne v haji, protoze pak se musi udelat jedine restore cele databaze, aby se misto uvolnilo. Ale ani takhle to neni idealni, jeste premyslim, ze zkusim table partitions po mesicich, abych pak mohl jen smazat starou partition (starou historii) a nemusel delat OPTIMIZE TABLE, ktery ve skutecnosti dela kopii cele tabulky a trva to silene dlouho.

SNIPERCZE --- --- 18:31:09 7.7.2018

1 odpověď

QUIP: Autoregistrace funguje krasne, agent se ohlasi serveru a ten si ho ulozi, pripadne prida do skupin a temmplate (nastavujes akce stejne jako u triggeru). U zabbixu je problem (hlavne u mysql na innodb) ze jak uklada data a maze je, vznikaj hodne deravy tabulky - roste velikost. Urcite doporucuju zapnout v mysql innodb_file_per_table.

QUIP --- --- 15:42:26 28.6.2018

2 odpovědi +1

SNIPERCZE: hmm, tak nejak cekam, ze se mi to po plnem nasazeni bude pohybovat nekde kolem 20 - 30GB. Protoze to je sice jen 30 stroju, ale kazdy ma minimalne 100 items, spis to v prumeru bude kolem 200 items.
Trosku me tohle desi, protoze dlouha leta jsem mel monitoring s rrd databazi, kde to nijak nenarustalo.
Kazdopadne zatim se mi ten Zabbix libi a bavi me, jak se daji ruzne veci priohnout, automatizovat a navic to ma slusnou dokumentaci. Takze nejvic casu travim nasavanim informaci z manualu a z prikladu na netu. Pak si na to pisu vlastni discovery skripty a sablony a snazim se to automatizovat. Porad si jeste hraju jen se 4 strojema. Az to bude automatizovany, tak bych mel jen udelat jedno velky discovery a o vic se nestarat ... uvidime, jak se zadari. Pak se tu "pochlubim" s vysledkem.

SNIPERCZE --- --- 15:38:00 28.6.2018

1 odpověď

QUIP: databaze mohla mit kolem 50GB. Drzim vzdycky data za 7 dni a pak rok trendy. Kazdej stroj mohl v prumeru mit 50 itemu, mozna 100. Vzorkovaci frekvence od 30s do 4 hodin (median tak 5min)

QUIP --- --- 15:32:43 28.6.2018

1 odpověď

SNIPERCZE: SNMP uz jsem zavrhnul a testuju to ted pres agenta a vlastni skripty. So far so good.
U SNMP se mi stala takova vec, ze autodiscovery naslo asi 500x polozku "memory" a pro kazdou sledovalo celkove, vyuzita, volna ... vygenerovalo to okolo 2000 items na jednom hostu a pak me docela prekvapilo, jak rychle roste objem databaze.

Takze se te zeptam - jak velka byla DB pro tech 300 serveru a kolik sledovanych polozek jsi tam mel? :)

SNIPERCZE --- --- 15:16:51 28.6.2018

1 odpověď

QUIP: Hlavni vyhoda agenta je, ze vidi do systemu. Muze poustet skripty, tahat si data co nejsou k dispozici pres SNMP apod. Osobne servery hlidam agentem, routery/tiskarny apod. SNMP.

QUIP: Zabbix proxy se hodi pokud mas vic lokalit. V jedny lokalite nema moc vyznam, nejvetsi moje nasazeni zabbixu bylo asi 300 serveru (fyzicky, virtualy i kontejnery, vsude agent) + nejaky dalsi veci (switche, routery, par tiskaren) a bez problemu. Jenom jsem oddelil zabbix-server, databazi a webksicht na vlastni stroje. Plus doporucuju u velkejch instalaci rovnou nasadit postgresql.

RATTKIN --- --- 7:09:30 14.6.2018

QUIP: my proxy nemáme. kdyby nestačil výkon pro třech našich 300 agentů, tak první by bylo přidat třetí CPU nebo to dát z 7.2k HDD na něco rychlejšího.

QUIP --- --- 15:17:36 13.6.2018

Delal jste nekdo realne porovnani dopadu na vykon pri sifrovanem spojeni vs nesifrovane (mezi agentem a serverem)?
Pripadne i rozdily aktivni / pasivni checky?

QUIP --- --- 11:54:10 13.6.2018

SAMGARR: no tak o ne prijdes, kdyz bude mit vypadek proxy :)

SAMGARR --- --- 11:10:28 13.6.2018

1 odpověď

QUIP: Nejde jen o vykon, zabbix-proxy ti umozni treba pseudo HA. Pri maintenance/vypadku zabbix-serveru neprijdes o data protoze je cachuje proxy.

QUIP --- --- 11:06:51 13.6.2018

3 odpovědi

SAMGARR: Zrovna to UI mi prijde jako to lepsi z toho, co jsem u podobny produktu videl, takze tady jsem uplne v miru. Jestli to bude na 30 stroju chtit zabbix-proxy, tak to pujde z domu. :) O tech proxy ctu v usecasech pri tisicich stroju a stovkach tisic sledovanych hodnot

SAMGARR --- --- 10:30:43 13.6.2018

1 odpověď

QUIP: pokud ses v miru s desnym UI a horsi moznosti konfigurace config managementem tak Zabbix funguje. Doporucuju nepodcenit skalovani databaze a zabbix agenty nastrkat za zabbix-proxy... A na grafy a dashboardy Grafanu ;)

RATTKIN --- --- 22:02:26 12.6.2018

QUIP: už nás nebavilo řešit chybějící místo na disku a neproběhlé úlohy.

instalace zabbixe je jednoduchá a agent se instaluje taky jednoduše. frkneš tam defaultní template na operační systém, stáhneš z marketu nějakou template na databázi a za pár hodin uvidíš grafy.

RATTKIN --- --- 22:00:39 12.6.2018

QUIP: my v tom máme zatím asi 20 serverů win+linux a asi sto desktopových win stanic.

nejlepší se mi zdá agent a aktivní checky (nemáme všechno v lan, plno je toho v jiných sítích).
agent umí pouštět skripty, ale na windows s powershellem to hodně timeoutuje (O_o)

snmp je taková nouzovka.
máme tam i na pokus dvě vmware esxi přes CIM a taky pár ipmi, jeden freenas (freebsd) nejdřív přes snmp ale taky jsem tam nakonec dal agenta

QUIP --- --- 14:29:17 12.6.2018

4 odpovědi

Zacinam ted zkoumat moznosti Zabbixu (ted mam monitoring v Pandore, velmi zakladni), procitam spoustu dokumentace a how to, ale rad bych nejake info, cemu se vyhnout, nebo naopak, jak to udelat od nekoho, kdo ho v praxi nasazoval, konfiguroval a pouziva ho. Idealne v prostredi, kde se tim nesleduji sitove prvky, ale web servery, DB servery, mail servery. Je to nekolik desitek stroju, vsechno na FreeBSD

Takhle na zacatku stojim hlavne pred otazkou, jestli vsude instalovat Zabbix Agenta, nebo servery sledovat pres SNMP?

FreeBSD ma v zakladu bsnmpd, ktery toho moc neumi, jen nejake zakladni info o systemu, sitovem provozu a da se tam zapnout HOSTRES modul. Coz mi ale porad neresi treba sledovani Disk IOPS, provoz databaze, statistiky z antispamu, nebo monitoring ZFS (obsazenost, fragmentace), SMART status disku atp. Takze bych asi stejne vsude musel instalovat Net-SNMP.

Dokazal by mi teda nekdo nejak shrnout pro a proti pouziti Zabbix Agenta vs SNMP?
A jak do toho pak jeste naroubovat ty veci, co jsem schopen zjistit nejakym prikazem / shellscriptem, ale jak je pak cpat skrz SNMP?

RATTKIN --- --- 19:42:36 2.3.2018

-1

TBC: každej by chtěl aby mu někdo udělal referenční řešení (zadarmo) na jeho ultra speciální usecase ... někdy je ale třeba s něčím začít a pak to holt předělat.

BALOS --- --- 18:06:51 2.3.2018

TBC: Tohle resi zabbix-proxy. Sprava probiha centralne ze Zabbix serveru, ale sber dat zajistujou proxy.

RATTKIN --- --- 7:05:56 21.2.2018

zabbix má Discovery které automaticky vytváří nové zařízení, ale nevím jak to funguje na SNMP. má to i hromadné změny, skupiny.

Na sběr bych se toho nebál. můžeš si pustit SNMP workerů kolik chceš. limit bude ram, cpu nebo network.

TBC --- --- 20:41:28 20.2.2018

2 odpovědi

SAMGARR: ok diky za tip, chapu ze je rozmerem celkem atypicky usecase

RATTKIN: no jde o to, ze spolehat se na dokumentaci je v takovem to pripade malo.. tohle chce referencni reseni

pracuju s icingou ci nagiosem a mam reseni kde dohleduju radove nekolik desitek tisic citacu, vcetne distribuovanyho monitoringu pomoci satelitů, ale to je porad nekde uplne jinde...

CHOROBA: hw zdroje resp. naklady na ne zas nejsou tak limitujici...

limitujici vidim /jak je tu uvadeno/:
- sber a ta parelizace snmp
- db backend, nad kterym idealni potrebuju delat dotazy a nejakou archivni agregaci dat
(samozrejmne pokud by bylo resenim mit treba 10x virtual ktery, kazdy obhospadri 5k device á 200 citacu a pak to sestohuju v centralni db a tam s tim pracuju, tak to vyhovuje)

ale reseni kde to budu mit sber v 10 nodech lokalne v RRD je nadraka. A troufam si rict to by mi to mozna nakonec i utahlo tech 10 satelitů icingy/nagiosu. chce to i nejakej inteligentni provisining novych zarizeni a vyrazeni scriptem atd. Nejakej reporting nad tim atd...

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?