• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    SNIPERCZE
    SNIPERCZE --- ---
    tak nakonec na to pujde zneuzit iftop s par parametrama, grep a sed
    DANYSEK
    DANYSEK --- ---
    ip/ebtables a countery tam? jasne, neco za neco, nejakou rezii to prida... ale na 20Mbit to asi bude zanedbatelny..
    RATTKIN
    RATTKIN --- ---
    SNIPERCZE: to co chceš vůbec není triviální. bude se muset počítat každý paket.
    taky můžeš zkusit zachytit provoz tcpdump a udělat si rozbor potom.
    většinou se tohle řeší na switch
    SNIPERCZE
    SNIPERCZE --- ---
    Jinak zatim to vypada ze vezmu zdrojaky iftopu a upravim si ho na toolu co potrebuju.
    SNIPERCZE
    SNIPERCZE --- ---
    DRON: switch nemam pod kontrolou, navic ne vsechno jde pres switch (jsou to virtualy a spousta z nich je na stejnym hostu). Jediny co me napada je tahat to z virtualizace plus netstat plus asi jeste neco dalsiho. Ale nejak to jit musi, preci tohle je docela beznej pozadavek, ne?
    DRON
    DRON --- ---
    SNIPERCZE: otazka je, jestli bys tyhle data nezjistil jinde snadneji. co treba nejaka statistika nad flow zaznamama ze switche?
    DRON
    DRON --- ---
    SNIPERCZE: aha, tak to je opravdu vyzva. takze neco podobneho jako dela iftop, ale zajimaji te jen definovane ipadresy... nenapada me nastroj, ktery by tyhle data vratil tak, aby je slo poslat do zabbixu. urcite by to ale slo s vetsim usilim napsat.
    SNIPERCZE
    SNIPERCZE --- ---
    SNIPERCZE: Prakticky me zajima kolik z tech 20Mbps je rezie technologie (replikace apod.) a kolik realny uzitecny data
    SNIPERCZE
    SNIPERCZE --- ---
    DRON: toky celkove za sitovky zvladam. Me jde o situaci Stroj A ma jenom eth0 a po nem komunikuje se siti. Na eth0 celkove tece odchoziho provozu 20Mbps. Ukaz mi kolik z tech 20Mbps tece na stroj B, kolik na stroj C, kolik na stroj D a kolik na stroj E (a idealne kolik na ostatni stroje, ale to je comuted item v pohode). Abych mohl udelat mapu, kde budu mit jednotlivy svoje stroje a u kazdyho cary jak komunikuje s ostatnima v clusteru.
    DRON
    DRON --- ---
    SNIPERCZE: no pouzivam template s prototypy itemu k sitovkam a autodiscovery vsech sitovek. automaticky to osaha hosta a vytvori itemy podle poctu (a hlavne nazvu) sitovek. itemy k trafficu tam samozrejme mam. pak je potreba naklikat mapu. to v zabbixu imho jeste neni moc sikovne. kdyby jednou udelali treba svg mapy...
    SNIPERCZE
    SNIPERCZE --- ---
    Nenapada vas jak v zabbixu monitorovat sitovy toky mezi jednotlivymi stroji? Mam v zabbixu 50 stroju a potreboval bych mit mapu, kde bych videl propoje jak tecou data (coz si jsem schopnen udelat) a hlavne cislo kolik kbit/Mbit/Gbit mi tam tece. Umim ukazat kolik dat tece na a ze stroje celkove, ale ne rozpadle. Dik
    DRON
    DRON --- ---
    SNIPERCZE: tyyyjo! tak to se mi dost libi
    DRON
    DRON --- ---
    SAMGARR: souhlas. je videt, ze se snazi, zacina to byt trosku uzivatelsky prijemnejsi, ale furt to je obcas klikaci peklo. me docela chybi nejaky udrzovany repozitar sablon. jinak teda panbu zaplat za discovery a prototypy...
    SAMGARR
    SAMGARR --- ---
    SNIPERCZE: Vitana zmena, nicmene by se na ten web interface meli trochu zamerit, je to peklo.
    SNIPERCZE
    SNIPERCZE --- ---
    DRON: v okne latest data u kazdyho itemu je zaskrtavatko a dole pod itemama je tlacitko vygenerovat graf s moznosti vyberu normalniho a stacked.
    DRON
    DRON --- ---
    SNIPERCZE: tyjo, nevsim. dik za tip
    SNIPERCZE
    SNIPERCZE --- ---
    Mozna uz jste si toho vsimli sami, ale v Zabbixu 2.4 lze do jednoho grafu promitnout vic hodnot z tabulky latest data. Moc uzitecne pokud chcete porovnat treba cpu load na vic serverech najednou.
    JENDAVB
    JENDAVB --- ---
    Nasazoval nekdo jako app monitoring Dynatrace ? mame asi 500 licenci tak jak to jako uchopit abych vedel cemu kdyztak vyhnout ?
    MCKIDNEY
    MCKIDNEY --- ---
    Jinak bohužel je to v DMZ korporátu a tak získaní prostoru pro Linux virtual machine bude práce na měsíce.
    Jinak by malý virtuál byl samozřejmé řešení.
    MCKIDNEY
    MCKIDNEY --- ---
    Zkoušel jste někdo rozběhat Icingu/Nagios ve Windows?

    Pluginy už mám napsané v powershellu, ale potřeboval bych nějaký wrapper/frontend a nechce se mě to psát.
    Oboje umožnuje moc pěkně tyto věci sledovat a psát upozornění.
    HIDARI_LUPO
    HIDARI_LUPO --- ---
    RATTKIN: PRTG, newrelic.com
    WENCA
    WENCA --- ---
    RATTKIN: imho je pro tebe nejlepsi kdyz pouzijes za nejakej poplatek zabbix od SNIPERCZE
    MCKIDNEY
    MCKIDNEY --- ---
    RATTKIN: Icinga(Nagios) trpí tím, že musíš vytvořit konfiguraci. Základní nastavení a provozní server máš za hotový hned a licenčně je to zdarma.

    Na 3 virtuální servery to jednou nastavíš. Teprve když podporuješ celé sítě a širokou škálu produktů, pak s tím je neustálá práce.

    Opravdu by to chtělo vědět co od něj očekáváš, ne z pohledu ceny a času, ale z pohledu:
    - kde to bude běžet (Chceš službu, nebo třeba podporu svého řešení co poběží v XY)
    - kdo to bude sledovat (Technik na telefonu, Admin na telefonu, Projektový manažer s telefonem co volá správní firmu.)
    - co to přesně má sledovat (A kdo ti dokáže určit co je špatně a co je dobře)
    - jak citlivé to má být (Monitoring ti dnes umožní analyzovat minuty před pádem, ale taky umožní poslat SMS až když už ti volal zákazník.)
    - kdo spravuje ty samotné 3 VM stroje?

    Monitoring je dnes už příliš vágní požadavek a odhaduji že když zjistíme co se přesně děje, tak tě to nebude stát deseti-tisíce.
    AQUARIUS
    AQUARIUS --- ---
    RATTKIN: na Nagios bych se dneska uz vykaslal a nahradil ho jeho forkem - Icingou. Naucit se to da, vyhodou je, ze je to celkem standard (plati pro Icingu 1.x, 2.x ma jinou konfiguraci a spoustu dalsich vychytavek, ale vic k tomu nereknu, protoze jsem to zatim jeste nemel cas podrobne zkoumat)
    TRUHLIK
    TRUHLIK --- ---
    RATTKIN: Tak takovych sluzeb je vicero, tohle jsem popadl tady u sebe v bookmarku, kdysi jsem to pouzival na sledovani odezvy serveru zvenci site.
    RATTKIN
    RATTKIN --- ---
    TRUHLIK: to se mi zdá že kromě toho co umí google analytics má navíc ping a reporty přes twitter, ale dík za nápad, aspoň to má pěkný logo a grafiku
    TRUHLIK
    TRUHLIK --- ---
    RATTKIN: nebo to sleduj nejakou online sluzbou - napr. https://www.pingdom.com
    SNIPERCZE
    SNIPERCZE --- ---
    RATTKIN: nagios je hnus, ale zabbixe rozjedes rekneme za dve hodiny. Ale strasne zalezi co bys od toho vsechno chtel, co uz existuje a co by se muselo doprogramovat. Kdyztak mi napis do posty, udelam ti nejakou cenovou nabidku na spusteni a provoz.
    RATTKIN
    RATTKIN --- ---
    My monitoring standardně neděláme (programujeme ERP, neděláme správu ani provoz systémů)
    Kolik by stálo takový monitoring udělat? Zkoušel jsem rozjet nagios a zdá se mi, že je to několik dní práce, a že by to stálo desítky tisíc, mám pravdu? Nebo existuje nějaký magický program, který to udělá za 5 minut sám?
    SNIPERCZE
    SNIPERCZE --- ---
    RATTKIN: jsem OSVC a monitoring pouzivam na vsechno od fyzickyho stroje pres VM na nem po aplikace a procesy. Hlavne z duvodu, ze monitoring umi velmi casto sam situaci vyresit a nemusim kvuli tomu vstavat. Pouzivam zabbix.

    Servery monitoruju pres zabbix agenta na nich (tiskarnu pres SNMP :)), weby pres web checky - nastavis scenare a ty vyhodnocujech. Funguje to na principu "jdu na stranku A a over ze obsahuje co ma, pak jdi na stranku B ktery pres post posli tyhle data a zase over jestli obsahuje co ma".
    Kliknutím sem můžete změnit nastavení reklam