• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    HIDARI_LUPO
    HIDARI_LUPO --- ---
    RATTKIN: PRTG, newrelic.com
    WENCA
    WENCA --- ---
    RATTKIN: imho je pro tebe nejlepsi kdyz pouzijes za nejakej poplatek zabbix od SNIPERCZE
    MCKIDNEY
    MCKIDNEY --- ---
    RATTKIN: Icinga(Nagios) trpí tím, že musíš vytvořit konfiguraci. Základní nastavení a provozní server máš za hotový hned a licenčně je to zdarma.

    Na 3 virtuální servery to jednou nastavíš. Teprve když podporuješ celé sítě a širokou škálu produktů, pak s tím je neustálá práce.

    Opravdu by to chtělo vědět co od něj očekáváš, ne z pohledu ceny a času, ale z pohledu:
    - kde to bude běžet (Chceš službu, nebo třeba podporu svého řešení co poběží v XY)
    - kdo to bude sledovat (Technik na telefonu, Admin na telefonu, Projektový manažer s telefonem co volá správní firmu.)
    - co to přesně má sledovat (A kdo ti dokáže určit co je špatně a co je dobře)
    - jak citlivé to má být (Monitoring ti dnes umožní analyzovat minuty před pádem, ale taky umožní poslat SMS až když už ti volal zákazník.)
    - kdo spravuje ty samotné 3 VM stroje?

    Monitoring je dnes už příliš vágní požadavek a odhaduji že když zjistíme co se přesně děje, tak tě to nebude stát deseti-tisíce.
    AQUARIUS
    AQUARIUS --- ---
    RATTKIN: na Nagios bych se dneska uz vykaslal a nahradil ho jeho forkem - Icingou. Naucit se to da, vyhodou je, ze je to celkem standard (plati pro Icingu 1.x, 2.x ma jinou konfiguraci a spoustu dalsich vychytavek, ale vic k tomu nereknu, protoze jsem to zatim jeste nemel cas podrobne zkoumat)
    TRUHLIK
    TRUHLIK --- ---
    RATTKIN: nebo to sleduj nejakou online sluzbou - napr. https://www.pingdom.com
    SNIPERCZE
    SNIPERCZE --- ---
    RATTKIN: nagios je hnus, ale zabbixe rozjedes rekneme za dve hodiny. Ale strasne zalezi co bys od toho vsechno chtel, co uz existuje a co by se muselo doprogramovat. Kdyztak mi napis do posty, udelam ti nejakou cenovou nabidku na spusteni a provoz.
    RATTKIN
    RATTKIN --- ---
    My monitoring standardně neděláme (programujeme ERP, neděláme správu ani provoz systémů)
    Kolik by stálo takový monitoring udělat? Zkoušel jsem rozjet nagios a zdá se mi, že je to několik dní práce, a že by to stálo desítky tisíc, mám pravdu? Nebo existuje nějaký magický program, který to udělá za 5 minut sám?
    SNIPERCZE
    SNIPERCZE --- ---
    RATTKIN: jsem OSVC a monitoring pouzivam na vsechno od fyzickyho stroje pres VM na nem po aplikace a procesy. Hlavne z duvodu, ze monitoring umi velmi casto sam situaci vyresit a nemusim kvuli tomu vstavat. Pouzivam zabbix.

    Servery monitoruju pres zabbix agenta na nich (tiskarnu pres SNMP :)), weby pres web checky - nastavis scenare a ty vyhodnocujech. Funguje to na principu "jdu na stranku A a over ze obsahuje co ma, pak jdi na stranku B ktery pres post posli tyhle data a zase over jestli obsahuje co ma".
    SAMGARR
    SAMGARR --- ---
    RATTKIN: na urovni aplikaci se bezne pouzivaji selenium/casperjs testy, pak si jen pohlidas vysledek
    TRUHLIK
    TRUHLIK --- ---
    RATTKIN: Uz jsme videl kde jaky monitoring - aplikaci, procesu, site, technologii..

    Sledovat beh sluzby - tj. typicky IP+PORT je docela bezne
    Sledovat aplikaci - tj. typicky nejaky check script aplikace vyvolany HTTP dotazem je rozhodne dobre a uz ne tak casto
    No a zatim nejvic s cim jsem se setkal je sledovat proces - tj. typicky schopnost na eshopu objednat, z DB dostat data apod. - to dela skutecne poradne malokdo, casto se to nahrazuje tim, ze pokud eshop bezi, tak je vsechno ok, coz ale neni totez.

    A imho nejde o velikost firmy, ale o kriticnost dane veci a pozadovane SLA.
    RATTKIN
    RATTKIN --- ---
    řeším dotaz zákazníka na monitorování 3 virtuálních serverů, včetně aplikací co na tom běží + e-shop, databáze, ERP + kdesi cosi, všechno sledovat aby se nic nemohlo stát a hlavně aby to bylo skoro zadarmo.

    Neviděl jsem, že by taková firma měla nějaký komplexní monitoring. Mají 4 zaměstnance (IT je řešeno externí firmou)

    Jak velké firmy používají běžně monitoring, na úrovni aplikací?
    SAMGARR
    SAMGARR --- ---
    SMEJDIL: chystas se? jsem zvedavej na reference:)
    SMEJDIL
    SMEJDIL --- ---
    Zabbix certifikace v Praze
    Homepage of Zabbix :: An Enterprise-Class Open Source Distributed Monitoring Solution
    http://www.zabbix.com/training.php
    MCKIDNEY
    MCKIDNEY --- ---
    Twitter me posledni 2 tydny skakal nahoru a dolu s icinga 2.0

    Ještě jsem to nezkoušel
    ADMIX
    ADMIX --- ---
    Kdo z vas nezaregistroval :)

    Icinga 2.0 has arrived - - Icinga: Open Source Monitoring
    https://www.icinga.org/2014/06/16/icinga-2-0-has-arrived/
    ADMIX
    ADMIX --- ---
    AQUARIUS: Pokud na to dojde, zvu te na pivo :)
    AQUARIUS
    AQUARIUS --- ---
    ADMIX: praktickou zkusenost mam v rozsahu ~1200 nodu, ~25k sluzeb, funguje mi to na virtualech. Spokojen jsem velmi, pripadne detaily muzeme nekdy nekde probrat.
    ADMIX
    ADMIX --- ---
    AQUARIUS: To vypada _velmi_ zajimave - cirou nahodou budu asi letos neco podobnyho resit (zatim o tom ale nic nevim - hlavne rozsah), a puvodne jsem mel namysleny prave neco jako CHILDINTIME, tedy remote icingy a push na master/slave.

    Mas s tim gearmanem nejakou praktickou zkusenost, pripadne jakyho rozsahu?
    ADMIX
    ADMIX --- ---
    AQUARIUS: To vypada zajimave!
    AQUARIUS
    AQUARIUS --- ---
    CHILDINTIME: puvodne jsem to resil taky takhle, ale ma to jiste nevyhody. Doporucuju ti se podivat i na mod_gearman, kterej to resi mnohem elegantneji, nejaka dokumentace je treba zde: https://wiki.icinga.org/display/howtos/Icinga+with+mod_gearman+on+RHEL+and+Debian

    Na konfiguraci je to trochu slozitejsi, nez distributed setup, ale provoz je potom jednodussi a navic to skaluje mnohem lip.
    CHILDINTIME
    CHILDINTIME --- ---
    nakonec jsem se rozhodl pro icingu, zda se mi vse ok. Krome hlavni pracovni site mam jeste jednu vzdalenou mensi, hosty/sluzby chci monitorovat i v ni, ale rad bych vse videl v jednom rozhrani. Pokud to dobre chapu mam pouzit http://docs.icinga.org/latest/en/distributed.html ... v vzdalene siti si pustim druhej nagios, kterej mi bude posilat pomoci NSCA na centralni? mozna bude jednodussi site propojit nejakou vpn a monitorovat primo, zatim jsem to nedelal, nebylo treba.
    MCKIDNEY
    MCKIDNEY --- ---
    Jo a prohlížení jsou dva odlišné nástroje.

    Jsem zvědavý co bude k dispozici až to budu v létě upgradovat.
    MCKIDNEY
    MCKIDNEY --- ---
    Propojené to mám přes plugin (Zapnout active check = zapnout munin)
    Na cilovem stroji zapinam munin pres nrpe, vypina se cronem.

    Na serveru se munin nakonfiguje automaticky podle icinga, ale nemam to tam nijak osetrene. (Kazdy unikátní host dostane konfiguraci v munin)

    Rozhodne by to slo udelat lepe, predevsim kontrolovat stav sluzby v icinga, aby se server nesnazil dotazovat serveru, kde je munin vypnut.

    Ale musim rict, ze to ani nepovazuji za otestovane, protoze munin zapinam jednou za uhersky rok
    AQUARIUS
    AQUARIUS --- ---
    MCKIDNEY: a mas nejak propojeny konfigurace? Nebo to proste jsou 2 nezavisly nastroje vedle sebe?
    MCKIDNEY
    MCKIDNEY --- ---
    Já používám Icinga + Munin

    Na icingu 2 jsem se ještě neodvážil
    AQUARIUS
    AQUARIUS --- ---
    CHILDINTIME: icinga ma pripadne "classic interface" a to je v podstate stejny jako Nagios, akorat je tam dodelanejch par veci, ktery v Nagiosu mely bejt od zacatku (treba moznost oznacit vice sluzeb a v druhem kroku na vsechny oznacene nastavit downtime)
    Kliknutím sem můžete změnit nastavení reklam