Zabbix, nagios a další monitorovací nástroje

SAMGARR --- --- 10:30:43 13.6.2018

QUIP: pokud ses v miru s desnym UI a horsi moznosti konfigurace config managementem tak Zabbix funguje. Doporucuju nepodcenit skalovani databaze a zabbix agenty nastrkat za zabbix-proxy... A na grafy a dashboardy Grafanu ;)

RATTKIN --- --- 22:02:26 12.6.2018

QUIP: už nás nebavilo řešit chybějící místo na disku a neproběhlé úlohy.

instalace zabbixe je jednoduchá a agent se instaluje taky jednoduše. frkneš tam defaultní template na operační systém, stáhneš z marketu nějakou template na databázi a za pár hodin uvidíš grafy.

RATTKIN --- --- 22:00:39 12.6.2018

QUIP: my v tom máme zatím asi 20 serverů win+linux a asi sto desktopových win stanic.

nejlepší se mi zdá agent a aktivní checky (nemáme všechno v lan, plno je toho v jiných sítích).
agent umí pouštět skripty, ale na windows s powershellem to hodně timeoutuje (O_o)

snmp je taková nouzovka.
máme tam i na pokus dvě vmware esxi přes CIM a taky pár ipmi, jeden freenas (freebsd) nejdřív přes snmp ale taky jsem tam nakonec dal agenta

QUIP --- --- 14:29:17 12.6.2018

4 odpovědi

Zacinam ted zkoumat moznosti Zabbixu (ted mam monitoring v Pandore, velmi zakladni), procitam spoustu dokumentace a how to, ale rad bych nejake info, cemu se vyhnout, nebo naopak, jak to udelat od nekoho, kdo ho v praxi nasazoval, konfiguroval a pouziva ho. Idealne v prostredi, kde se tim nesleduji sitove prvky, ale web servery, DB servery, mail servery. Je to nekolik desitek stroju, vsechno na FreeBSD

Takhle na zacatku stojim hlavne pred otazkou, jestli vsude instalovat Zabbix Agenta, nebo servery sledovat pres SNMP?

FreeBSD ma v zakladu bsnmpd, ktery toho moc neumi, jen nejake zakladni info o systemu, sitovem provozu a da se tam zapnout HOSTRES modul. Coz mi ale porad neresi treba sledovani Disk IOPS, provoz databaze, statistiky z antispamu, nebo monitoring ZFS (obsazenost, fragmentace), SMART status disku atp. Takze bych asi stejne vsude musel instalovat Net-SNMP.

Dokazal by mi teda nekdo nejak shrnout pro a proti pouziti Zabbix Agenta vs SNMP?
A jak do toho pak jeste naroubovat ty veci, co jsem schopen zjistit nejakym prikazem / shellscriptem, ale jak je pak cpat skrz SNMP?

RATTKIN --- --- 19:42:36 2.3.2018

-1

TBC: každej by chtěl aby mu někdo udělal referenční řešení (zadarmo) na jeho ultra speciální usecase ... někdy je ale třeba s něčím začít a pak to holt předělat.

BALOS --- --- 18:06:51 2.3.2018

TBC: Tohle resi zabbix-proxy. Sprava probiha centralne ze Zabbix serveru, ale sber dat zajistujou proxy.

RATTKIN --- --- 7:05:56 21.2.2018

zabbix má Discovery které automaticky vytváří nové zařízení, ale nevím jak to funguje na SNMP. má to i hromadné změny, skupiny.

Na sběr bych se toho nebál. můžeš si pustit SNMP workerů kolik chceš. limit bude ram, cpu nebo network.

TBC --- --- 20:41:28 20.2.2018

2 odpovědi

SAMGARR: ok diky za tip, chapu ze je rozmerem celkem atypicky usecase

RATTKIN: no jde o to, ze spolehat se na dokumentaci je v takovem to pripade malo.. tohle chce referencni reseni

pracuju s icingou ci nagiosem a mam reseni kde dohleduju radove nekolik desitek tisic citacu, vcetne distribuovanyho monitoringu pomoci satelitů, ale to je porad nekde uplne jinde...

CHOROBA: hw zdroje resp. naklady na ne zas nejsou tak limitujici...

limitujici vidim /jak je tu uvadeno/:
- sber a ta parelizace snmp
- db backend, nad kterym idealni potrebuju delat dotazy a nejakou archivni agregaci dat
(samozrejmne pokud by bylo resenim mit treba 10x virtual ktery, kazdy obhospadri 5k device á 200 citacu a pak to sestohuju v centralni db a tam s tim pracuju, tak to vyhovuje)

ale reseni kde to budu mit sber v 10 nodech lokalne v RRD je nadraka. A troufam si rict to by mi to mozna nakonec i utahlo tech 10 satelitů icingy/nagiosu. chce to i nejakej inteligentni provisining novych zarizeni a vyrazeni scriptem atd. Nejakej reporting nad tim atd...

RATTKIN --- --- 21:36:17 19.2.2018

taky u opensource je důležité hledisko jaký je použitá technologie, případně jestli je to technologie, kterou se chceš učit

SAMGARR --- --- 21:11:41 19.2.2018

1 odpověď

TBC: U zabbixu jde prakticky o skalovani databaze pro zapis. A pokud se ti nechce zacit primym testovanim zkus IRC zabbixu, vzdycky tam je nejaky vyvojar ochotny vyvojar.
Prometheus jsem doporucoval protoze je dimenzovany 100k zapisu/s a vic.

RATTKIN --- --- 20:28:23 19.2.2018

1 odpověď

TBC: a podle čeho jiného? u open source projektu je dobrá dokumentace velká výhoda.

zatím se nikdo z nyxáků neozval, kdo by měl milion snmp zařízení.
tak ještě zkusit nějaké zahraniční fóra (stackexchange) a pak placený konzultant, ale ten ti opensource nedoporučí ;-)

CHOROBA --- --- 20:16:50 19.2.2018

1 odpověď

zalezi i co mas na to za masinu/masiny/rozpocet. od toho bych se odpichnul
obecne mi prijde, ze vic drbani bude s cacti, musi se vic nastavovat a ladit, ale zase rozhodne zere min zdroju nez zabbix , tedy jeden server ti utahne vic polleru a zpracuje vic citacu/grafu.

ja honil na 2Xeon s 8G ram asi 5000+ devices s par 10k grafu.
nska mam na distribuovanym reseni 23000+ zarizeni a grafu asi tak 100k

TBC --- --- 19:17:30 19.2.2018

2 odpovědi

RATTKIN: škoda, no rozhodovat se na muj usecase podle dokumentace, to by bylo trochu nezodpovedne :)

RATTKIN --- --- 18:19:59 19.2.2018

1 odpověď

TBC: mám agenty, SNMP i VMware přes ipmi. všechno funguje. když těch zařízení budou miliony, tak by to chtělo nějaký sizing guide.
já nemám škálu co tu hledáš, ale můj zabbix má 1 cpu a 20 giga disk :)

tady je trochu popsaný snmp https://www.zabbix.com/documentation/3.0/manual/config/items/itemtypes/snmp

tohle je o škálování:
Scalable Zabbix – Lessons on hitting 9400 NVPS | Zabbix Weblog
http://blog.zabbix.com/scalable-zabbix-lessons-on-hitting-9400-nvps/2615/

já jiný monitoring neznám, ale rozhodoval bych se podle toho kdo má lepší dokumentaci na tvůj usecase

TBC --- --- 16:40:30 19.2.2018

1 odpověď

RATTKIN: no jde o to ze potrebuji sbirat na desitkach tisich zarizeni SNMP citace (hw boxy), takze potrebuju volat paralene... jinak bych se nedozil nez to vyparsuje... ty to nekde takto nasazeny mas, nebo pouzivat agenty na os?

RATTKIN --- --- 16:03:11 19.2.2018

1 odpověď

TBC: zabbix má trendy, kdy zahodí staré data z databáze hodnot a uchová pouze trendy v samostané databázi pro historii.
plno hodnot zabbix sbírá po 30 sekund nebo po minutě. není to problém.

paraleliazce to je jako co? můžeš mít proxy servery kde se to sbírá a počítají se preprocesy, může být jeden na každé site a pak to jde do centrální databáze.
frontend může taky být samostatný server.

TBC --- --- 15:47:26 19.2.2018

TBC: ale zajima mne i prakticka zkusenost, neco jsou neurcite proklamovany moznosti a neco jinyho je konkretni zkusenost s vlastnim provozem

TBC --- --- 15:45:33 19.2.2018

2 odpovědi

RATTKIN: no predstavuji si idealne po 5ti minutach treba 1 mesic, po 3 mesicich uchovavat jen prumer za hodinu a po roce treba prumer za den, ostatni viz zadani...

gro pro zabbix bude asi schopnsot parelniho pollingu .. to umi CACTI jak psal DANYSEK

RATTKIN --- --- 21:36:46 18.2.2018

1 odpověď

TBC: u zabbixu je hlavní metrika výkonu kolik je hodnot za vteřinu.
miliony čítačů, to je asi zajímavé pro velikost databáze na disku, ale taky záleží na délce retence.

SAMGARR --- --- 21:29:42 16.2.2018

TBC: prometheus?

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?