• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    TBC
    TBC --- ---
    RUDOLF: mas s tim nejakou provozni zkusenost? jinak mi prijde ze to nenabizi onpremise reseni v rozashle velke interni siti nebo ano?
    RUDOLF
    RUDOLF --- ---
    mít peníze tak data dog..
    CHOROBA
    CHOROBA --- ---
    je to uz olddkool ;) v kazdy lokaci mame collector, co sbira metriku, threshholds, logy, authlogy....., atd, prezvejka a vysledek vybleje kazdou minutu do centralniho node, ten neni na nicem postaveny, normalne php/mysql. ELK tu mame jen na delani veselych grafu pro vedeni a navstevy
    TBC
    TBC --- ---
    CHOROBA: vlastni system, ze ho mate napsany, na jake technologii? tech stack jak pise
    SAMGARR: bych bral prave neco jako jako vlasnti reseni, par virtualu na elk uz se na to najde. no hotovy reseni jsou molochy typu IBM Netcool apod.
    CHOROBA
    CHOROBA --- ---
    otazka pak, esli nejni levnejsi hotovy reseni, nez HW pro ELK stack, co bude sbirat par desitek tisic metrik a logu.
    SAMGARR
    SAMGARR --- ---
    TBC: Nevim jestli existuje nejaky hotovy reseni, ale kombinace ELK stack, Elastalert, Grafana a Alerta toho resi docela dost.
    CHOROBA
    CHOROBA --- ---
    na todle mame holt vlastni system (radius logy, syslocy, metriky, monitoring z Cacti..)
    TBC
    TBC --- ---
    AQUARIUS: elastic bych bral spis jako jednu z komponent na log analyze atd, zastrenej pod tu umberellu ... melo by to mit nejakou consolu pro event handling, prihlasovani uzivatelu, acknoweledgovani, enrichment, predavani atd.. rekneme neco s cim bude pracovat treba 10 operatoru.. rekneme ze tam budou dene 10-100tisic eventu, pochopitelne cast zpracovana automaticky atd.
    AQUARIUS
    AQUARIUS --- ---
    TBC: Co to vsechno agregovat v Elastic stacku? Jednu dobu jsem si hral s agregaci Icingabeats a syslogu, nicmene zatim provozuju ELK pouze jako proof of concept, takze jsem vzhledem k hw omezenim musel nakonec Icingu odstrihnout, tech dat bylo nasobne vic, nez ze syslogu.
    TBC
    TBC --- ---
    dotaz, nevim jest/li to nepresahuje scope diskuse, ale pouzivate nejakej umberella fault management, pod kterym mate treba prave nagios, zabix, pak treba tam posilate smnp trapy, eventy ze syslogu, nebo jine protokoly pro nejake vetsi reseni? v radek stovek a tisicu hostů atd?

    a pokud ano jake? muze byt i nemusi byt opensource
    MLEKAR_STEIN
    MLEKAR_STEIN --- ---
    ahoj,
    mam trabl s grafana api.
    potrebuju udelat snapshot jednoho konkretniho dashboardu,
    umim pres api ziskat jeho vlastnosti atd.
    akorat jsem v dokumentaci nenasel, jak vubec udelat smysluplny snapshot, kde nastavim treba konkretni casy, od kdy do kdy se ten snapshot ma udelat, jak nastavim jmeno dashboardu, ze ktereho to chci delat atd.
    a kdyby nekdo nahodou mel odkaz na nejakou stranku, ktera bude obsahlejsi, nez je dokumentace ke grafane, tak bych byl asi stastnejsi.
    diky moc.
    DRON
    DRON --- ---
    TOTAL: super, zrovna sem to rozepisoval :-) pouzivam "Template OS Linux" a disky jsou tam pekne detekovany pomoci autodiscovery pravidel, ktere vytvori prislusne itemy a triggery. Verim, ze to je tento template ;-) https://share.zabbix.com/official-templates/operating-systems/official-os-linux-template
    TOTAL
    TOTAL --- ---
    DRON: Uz jsem to rozchodil, diky ;)

    vfs.fs.size[/home,pused].last()}>85
    DRON
    DRON --- ---
    TOTAL: jen vystrel od boku, nejsem komplu. Tohle pouzivam a funguje mi to i po migraci 4.x -> 5.0. U zabbixu je problem, ze pri update se neaktualizuji defaultne dodavane templates, takze moje domnenka je, ze si mozna tahnes nejaky takovy template z nejake hodne stare verze a pouziva neco, co uz v 5tce nefunguje. Zkusil bych updatnout ten template. Pripadne ti v tydnu mrknu jak to mam ja.
    TOTAL
    TOTAL --- ---
    Takze check pro proxy data mi uz funguje (bohuzel jsem neprisel na zpusob, jak ho pridat do template ZABBIX PROXY APP, tak, aby byl pouzitelny vsude, kde je treba) Tak je na kazdem stroji zvlast. Promenna pro nazev proxy .. Netusim, jak to resit. Funguje to, ale kdyby nekdo vedel, jak toho docilit lip ;)


    Ted resim stale trigger pro upozorneni (80%) misto na disku. Ve verzi 4 bez problemu, verze 5 zatim neuspech ;/ Pouziva te to nekdo ? Diky za nakopnuti.
    TOTAL
    TOTAL --- ---
    Zdravim vespolek, ted resim dalsi zadrhel se ZABBIXEM 5. V jedne lokalite mam proxy, stroje za ni data davaji, vse tak nejak v poradku. Ale pokud vypadne proxy, tak v mape mi stale sviti, ze je vse OK a vypadek se neprojevi. Pokud se podivam do grafu, tak samozrejme data nejsou (proxy nejede). Takze jedine rucne vytvorit nejaky trigger na to, aby provadel check dat z proxy a v pripade vypadku ... zahlasil chybu. Jak tohle resite vy ?

    Ted se mi taky stalo, ze prestal fungovat trigger pro obsazene misto na disku (vse jelo, zadne zmeny jsme nedelal - verze 5.02). Vcera se mi stalo, ze misto bylo obsazene 91%, ale ZABBIX mlcel ... a v navaznosti na to, jsem zjistil, ze trigger vubec nefunguje (tvari se, ze ano ...). Ale vse na zacatku fungovalo ;/

    -------------
    Vychozi sablona
    Name - {#FSNAME}: Disk space is low (used > {$VFS.FS.PUSED.MAX.WARN:"{#FSNAME}"}%)
    ----------------------

    Diky za pripadne nasmerovani. Budu ted vytvaret jednoduchy trigger jako ve verzi 4.x (tam to vse jede)
    TOTAL
    TOTAL --- ---
    CYBI: Presne tak, diky ... ;)
    RUDOLF
    RUDOLF --- ---
    Já mám se zabbix/grafanou trabl, že jsem začal agregovat nějaké metriky (např. traffic z desítek strojů), grafana natáhne data ze zabbixu a pak to začne počítat klient. Na MacOS/Safari mi to několik grafů vedle schroustá, ale kolegové na linux/win/firefox/chrome se nedočkaj načtení grafů. Asi bych tam do toho regex filtru a následné agregace mohl vnést nějakou optimalizaci. Ale ve finále stejně přejdu na prométhea, který mi vrací výsledky a grafana to jen zobrazuje.
    CYBI
    CYBI --- ---
    TOTAL:

    Zabbix server sets the host availability icon to gray (unknown status) for the corresponding agent interface (Zabbix, SNMP, IMP, JMX) if:
    there are no enabled items on the interface (they were removed or disabled);
    there are only active Zabbix agent items;
    host is disabled;
    host is set to be monitored by proxy, a different proxy or by server if it was monitored by proxy;
    host is monitored by a proxy that appears to be offline (no updates received from the proxy during the maximum heartbeat interval - 1 hour).


    3 Hosts [Zabbix Documentation 5.0]
    https://www.zabbix.com/...al/web_interface/frontend_sections/configuration/hosts#unknown_host_status
    TOTAL
    TOTAL --- ---
    SAMGARR: Jen je to dalsi prvek, ktery je treba zabezpecit ... Ale jinak vypada dobre ;) O pluginu vim, dik.
    SAMGARR
    SAMGARR --- ---
    TOTAL: Velmi dobre, existuje plugin, ktery ti prida zabbix jako data source do Grafany.
    Kliknutím sem můžete změnit nastavení reklam