• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    HALELUJANagios - dohledový systém počítačových sítí a jeho nadstavby (Centreon, Nagvis, Cacti,..)
    Diskuze, rady, novinky na poli dohledových systémů a jejich rozšíření. Především se zaměřením na Nagios a Centreon. Nagios (dříve Netsaint) - Open source nástroj pro monitorování sítě a techniky v ní se nacházející. Jde monitorovat v podstatě vše. Od dostupnosti síťových zařízení (ping), služeb, přes vyčítání informací přes SNMP, či pomocí NRPE, NSCA a counterů. Případné problémy systém vyhodnotí dle předem nastavených kriterií a provede akci (pošle sms, e-mail, zavolá, něco spustí, vypne,..). Potřebný nástroj pro každou firmu s kritickými aplikacemi, servery atd Centreon (dříve Oreon) - Open source nadstavba Nagiosu. Především nabízí přehledné webové prostředí pro konfiguraci Nagiosu, správu grafů, statistik, logů. Další informace: Oficiální stránky Nagios Oficiální stránky Centreon Nagios na Wikipedii CZ
    rozbalit záhlaví
    MASCA
    MASCA --- ---
    HALELUJA: Sledováním http://mystatus.skype.com/<username>.txt. V nastavení musí být povoleno vidět status přes web. Aspoň naposledy mi to takhle jakž takž fungovalo.
    HALELUJA
    HALELUJA --- ---
    Potřebuju dohledovat status Skype účtu.. máte někdo zkušenost?
    KRISHNA
    KRISHNA --- ---
    AQUARIUS: defaultně "nologin" nebo jak se to jmenuje, ale dal jsem mu /bin/bash na test
    AQUARIUS
    AQUARIUS --- ---
    KRISHNA: jakej shell ma uzivatel nagios?
    KRISHNA
    KRISHNA --- ---
    Ahoj, poradíte? Mám script, kterej vypadá takhle


    #!/bin/bash
    out=$( nmap seznam.cz | grep / | sed '/Starting/d' | cut -f 1 -d '/' | sed ':a;N;$!ba;s/\n/,/g' )
    printf "These ports are opened on seznam.cz $out \n"

    Má scanovat porty na hostu (seznam.cz) tam je schválně a pak vypsat do výstupu, který jsou otevřený. Na Nagios 3.2.3 mi to funguje na poprvé, na Nagios 3.4.1 mi to nejde a už z toho docela šílim. Stejná konfigurace, CentOS 6.3, instalováno z repozitáře, jednou ze starýho (to je ten 3.2.3) a podruhý z EPELu.

    Tady jsou obrázky - (check_test)

    Nagios 3.2.3


    Nagios 3.4.1


    Přitom když to spustim z shellu jako root, tak to funguje, když to spustim jako uživatel nagios, tak to taky funguje. Celkově mi připadá, že jsou nějaký problémy s přenosem obsahu proměnnejch mezi nagiosem a scriptama..

    Případně nemáte script, co by tohle uměl a fungoval?
    Taky bych potřeboval script, co mi ukáže, jestli je port 22 zavřenej, když bude, tak OK, když nebude, tak Critical, taky jsem si to napsal sám a taky mi to nefunguje z asi stejnýho důvodu (nagios 3.4.1 na 3.2.3 to jde)

    #!/bin/bash
    if [ -z $2 ]; then
    if [ -z $1 ]; then
    printf "needs \$1 & \$2 (address & port number)\n"
    exit 2
    else
    printf "needs \$2 (port number)\n"
    exit 2
    fi
    fi

    closed=$(nmap $1 -p $2 | grep ssh | cut -f 2 -d ' ' )

    if [ "$closed" = "open" ]
    then printf "CRITICAL: port $2 is open \n"
    exit 2
    else printf "OK: port $2 is filtered/closed \n"
    exit 0
    fi
    HALELUJA
    HALELUJA --- ---
    Jedete někdo sem? :)

    Nagios - Nagios World Conference North America 2012
    http://www.nagios.com/events/nagiosworldconference/northamerica/2012
    TLOUDEV
    TLOUDEV --- ---
    hele pouzivate nekdo cacti s nagios pluginem? ted se chystam na upgrade monitorovaciho stroje a jen by me zajimalo, jestli ten nagios plugin konfiguruje nagios pres db z hostu v cacti, nebo je to jen rozhrani pro nagios konfigurovany klasicky 'rucne'.. bo pak by se mi to vubec nevyplatilo a asi bych spis presel na centreon, ackoli teda v nem si zase nedovedu predstavit psat grafovani veci, ktery uz mam pres cacti celkem vymakany.. (nekolik grafu z ruznych stroju agregovanych do jednoho atd)
    AQUARIUS
    AQUARIUS --- ---
    ERROR: ja jsem si rikal, ze je nejlepsi nedrzet unikatni nrpe.cfg pro kazdej stroj/skupinu a veskery konfigurovatelny parametry centralizovat do konfigurace na strane nagios serveru... Ono i takhle uz mi deploy novy konfigurace par minut trva :)
    ERROR
    ERROR --- ---
    my teda mame nrpe.cfg uplne vsude stejny a samotny checky jsou v /etc/nrpe.d/ coz je adresar kterej je includnutej
    KRISHNA
    KRISHNA --- ---
    AQUARIUS: jo taak :)
    AQUARIUS
    AQUARIUS --- ---
    KRISHNA: dont_blame_nrpe=1 - nrpe pracuje s promennejma.
    KRISHNA
    KRISHNA --- ---
    AQUARIUS: A ty máš teda nrpe.cfg na všech strojích uplně stejnej? U nás by to nešlo, protože máme třeba na každym stroji s databází její check, a každá má jiný názvy tabulek, co se maji kontrolovat, pak různý checky logů, jestli obsahujou danej string, taky na každym stroji jinak atd.. Máš hodně podobnejch strojů?
    AQUARIUS
    AQUARIUS --- ---
    KRISHNA: hehe, pekny... ja jsem na to sel trochu jinak. Celou konfiguraci mam ulozenou v svn, nrpe.cfg mam pro vsechny servery spolecnej, taky v svn. Kdyz potrebuju rozdistribuovat zmenu nrpe, tak vytvorim novej balik nrpe-client (mam to automatizovany, takze checkout+build+zarazeni do repository je jednim prikazem) a ten pak instaluju na servery normalnim update mechanismem. Vyhoda je, ze verzi konfigurace muzu zjistit podle verze baliku nrpe clienta, nevyhoda pak ta, ze kdyz tohle potrebuju udelat na diskless stroji, kterej bezi z image, tak to neni tak elegantni.
    Pluginy resim analogicky pres balicky, dneska uz tech balicku mam asi 5 kvuli checkum, co pouzivam jenom nekde a maji zavislosti navic. Proti distribuci tarballem zasadni vyhoda spociva prave ve vyreseni zavislosti. Upravu sudoers a dalsich konfiguraku resim v ramci post-install/post-uninstall skriptu.
    KRISHNA
    KRISHNA --- ---
    AQUARIUS: No, máme master server, řikejme mu BigBrother (z historickejch důvodů, dřív tam totiž běžel big brother monitoring software, kterej ale časem nestačil, tak se přemigroval na nagios a hostname zustal) na něm běží nagios+mysql v který je tabulka databáze "nagupdate" v níž jsou uložený configy pro všechny hosty. Na všech linuxovejch strojích máme definovanej check_nagupdate, kterej se spouští jednou denně z bigbrother, nebo jeho satellitu přes nrpe stejně jako třeba check_disk nebo check_cpu nebo cokoliv jinýho. Je to perlovej script, kterej se z toho hosta připojí do mysql bigbrothera a zjistí, jaká je aktuální konfigurace toho danýho hosta, když zjistí rozdíl, tak stáhne nejnovější config (/etc/nagios/nrpe.cfg) nahradí starej, restartuje nagios-nrpe-server a vrátí exit 0 s datumem a časem aktualizace zpět na bigbrother. Tohle všechno by bylo poněkud složitý kdyby šlo jen o configy. Ten perl script krom stažení configu ještě zkontroluje jeho obsah, jestli neobsahuje nějakej neznámej check (máme vlastní pluginy třeba na kontrolu drupalu, Postgresql, dell chasis, IPMI a další věci, co nejsou v nrpe serveru defaultně) a když jo, tak stáhne tarball se všema pluginama a rozbalí je do plugins adresáře nagios nrpe serveru. Abych nekecal, tak windows stroje (kterej je teda minimum) máme taky přes templaty
    AQUARIUS
    AQUARIUS --- ---
    KRISHNA: mohl bys, prosim, malinko rozepsat, jak ta kontrola konfiguraci funguje? Ja na tohle pouzivam sablony, takze zmena konfigurace 100 hostu se dela zmenou sablony, ale ne vzdy to je uplne pouzitelny.
    KRISHNA
    KRISHNA --- ---
    ERROR: jo no, já věřim, že se to dá dostat do použítelnýho stavu, ale já nikdy nějak neměl tu trpělivost a teď jsem skoro rád
    KRISHNA
    KRISHNA --- ---
    ok, s tim nemam zkušenost. Mě v poslední době nutěj na všechno psát scripty i když jsem se ze začátku cukal že to neumim, tak člověk se v tom docela brzo rozkouká. S centreonem mam blbý zkušenosti, že to nikdy nějak nedělalo co jsem si přál. Hlavně náš nagios je spojenej s MySQL databází, kde máme seznam všech hostů a jejich servisů, zároveň máme automatickej check, kterej kontroluje nejnovější configy a pluginy na jednotlivejch hostech. Takže potom můžeš měnit config třeba na 100 hostech najednou, což myslim, že právě v centreonu nešlo a kvuli tomu jsme udělali takhle "manuálně" a je to nakonec určitě lepší.

    Takže teď máme na celou infrastrukturu v podstatě spojení Nagios+mysql+cacti+ntop+ Remedy což je nějakej ulítlej anglickej ticketovací systém, kterej je spojenej s cacti+nagiosem a vytváří/edituje/zavírá tickety
    ERROR
    ERROR --- ---
    filosofie je takova ze na monitoring porad pouzivame nagios, ale kdyz je potreba se kouknout do historie co se delo tak se kouknem do centreonu kterej ma vsechny historicky data v db
    ERROR
    ERROR --- ---
    KRISHNA: problem cacti je ze je spis na monitoring infrastruktury, a my monitorujem nejen infrastrukturu ale i aplikacni metriky jako pocet obednavek atd...takze potrebujeme mit moznost ty data sledovat, treba i v zavislosti na ostatnich datech atd.. a to centreon umi docela dobre (nadefinujes do nejakyho view presne co chces videt)
    KRISHNA
    KRISHNA --- ---
    ERROR: Jaký data potřebujete sbírat? Cacti bych řek, že toho umí víc, než munin a hlavně má snad i nějaký pluginy pro nagios..?
    ERROR
    ERROR --- ---
    cacti nepripada v uvahu protoze by se to muselo vsechno predelat na zeleny louce...
    Kliknutím sem můžete změnit nastavení reklam