Nagios - dohledový systém počítačových sítí a jeho nadstavby (Centreon, Nagvis, Cacti,..)

Diskuze, rady, novinky na poli dohledových systémů a jejich rozšíření. Především se zaměřením na Nagios a Centreon. Nagios (dříve Netsaint) - Open source nástroj pro monitorování sítě a techniky v ní se nacházející. Jde monitorovat v podstatě vše. Od dostupnosti síťových zařízení (ping), služeb, přes vyčítání informací přes SNMP, či pomocí NRPE, NSCA a counterů. Případné problémy systém vyhodnotí dle předem nastavených kriterií a provede akci (pošle sms, e-mail, zavolá, něco spustí, vypne,..). Potřebný nástroj pro každou firmu s kritickými aplikacemi, servery atd Centreon (dříve Oreon) - Open source nadstavba Nagiosu. Především nabízí přehledné webové prostředí pro konfiguraci Nagiosu, správu grafů, statistik, logů. Další informace: Oficiální stránky Nagios Oficiální stránky Centreon Nagios na Wikipedii CZ

rozbalit záhlaví

MASCA --- --- 13:09:42 21.11.2012

HALELUJA: Sledováním http://mystatus.skype.com/<username>.txt. V nastavení musí být povoleno vidět status přes web. Aspoň naposledy mi to takhle jakž takž fungovalo.

HALELUJA --- --- 12:10:52 19.11.2012

1 odpověď

Potřebuju dohledovat status Skype účtu.. máte někdo zkušenost?

KRISHNA --- --- 19:53:08 2.11.2012

AQUARIUS: defaultně "nologin" nebo jak se to jmenuje, ale dal jsem mu /bin/bash na test

AQUARIUS --- --- 13:32:49 2.11.2012

1 odpověď

KRISHNA: jakej shell ma uzivatel nagios?

KRISHNA --- --- 12:43:46 2.11.2012

1 odpověď

Ahoj, poradíte? Mám script, kterej vypadá takhle

#!/bin/bash
out=$( nmap seznam.cz | grep / | sed '/Starting/d' | cut -f 1 -d '/' | sed ':a;N;$!ba;s/\n/,/g' )
printf "These ports are opened on seznam.cz $out \n"

Má scanovat porty na hostu (seznam.cz) tam je schválně a pak vypsat do výstupu, který jsou otevřený. Na Nagios 3.2.3 mi to funguje na poprvé, na Nagios 3.4.1 mi to nejde a už z toho docela šílim. Stejná konfigurace, CentOS 6.3, instalováno z repozitáře, jednou ze starýho (to je ten 3.2.3) a podruhý z EPELu.

Tady jsou obrázky - (check_test)

Nagios 3.2.3

Nagios 3.4.1

Přitom když to spustim z shellu jako root, tak to funguje, když to spustim jako uživatel nagios, tak to taky funguje. Celkově mi připadá, že jsou nějaký problémy s přenosem obsahu proměnnejch mezi nagiosem a scriptama..

Případně nemáte script, co by tohle uměl a fungoval?
Taky bych potřeboval script, co mi ukáže, jestli je port 22 zavřenej, když bude, tak OK, když nebude, tak Critical, taky jsem si to napsal sám a taky mi to nefunguje z asi stejnýho důvodu (nagios 3.4.1 na 3.2.3 to jde)

#!/bin/bash
if [ -z $2 ]; then
if [ -z $1 ]; then
printf "needs \$1 & \$2 (address & port number)\n"
exit 2
else
printf "needs \$2 (port number)\n"
exit 2
fi
fi

closed=$(nmap $1 -p $2 | grep ssh | cut -f 2 -d ' ' )

if [ "$closed" = "open" ]
then printf "CRITICAL: port $2 is open \n"
exit 2
else printf "OK: port $2 is filtered/closed \n"
exit 0
fi

HALELUJA --- --- 9:22:17 9.10.2012

Jedete někdo sem? :)

Nagios - Nagios World Conference North America 2012
http://www.nagios.com/events/nagiosworldconference/northamerica/2012

TLOUDEV --- --- 9:59:17 23.4.2012

hele pouzivate nekdo cacti s nagios pluginem? ted se chystam na upgrade monitorovaciho stroje a jen by me zajimalo, jestli ten nagios plugin konfiguruje nagios pres db z hostu v cacti, nebo je to jen rozhrani pro nagios konfigurovany klasicky 'rucne'.. bo pak by se mi to vubec nevyplatilo a asi bych spis presel na centreon, ackoli teda v nem si zase nedovedu predstavit psat grafovani veci, ktery uz mam pres cacti celkem vymakany.. (nekolik grafu z ruznych stroju agregovanych do jednoho atd)

AQUARIUS --- --- 17:03:23 21.4.2012

ERROR: ja jsem si rikal, ze je nejlepsi nedrzet unikatni nrpe.cfg pro kazdej stroj/skupinu a veskery konfigurovatelny parametry centralizovat do konfigurace na strane nagios serveru... Ono i takhle uz mi deploy novy konfigurace par minut trva :)

ERROR --- --- 15:15:37 21.4.2012

1 odpověď

my teda mame nrpe.cfg uplne vsude stejny a samotny checky jsou v /etc/nrpe.d/ coz je adresar kterej je includnutej

KRISHNA --- --- 14:34:15 21.4.2012

AQUARIUS: jo taak :)

AQUARIUS --- --- 14:25:20 21.4.2012

1 odpověď

KRISHNA: dont_blame_nrpe=1 - nrpe pracuje s promennejma.

KRISHNA --- --- 14:07:30 21.4.2012

1 odpověď

AQUARIUS: A ty máš teda nrpe.cfg na všech strojích uplně stejnej? U nás by to nešlo, protože máme třeba na každym stroji s databází její check, a každá má jiný názvy tabulek, co se maji kontrolovat, pak různý checky logů, jestli obsahujou danej string, taky na každym stroji jinak atd.. Máš hodně podobnejch strojů?

AQUARIUS --- --- 13:56:29 21.4.2012

1 odpověď +1

KRISHNA: hehe, pekny... ja jsem na to sel trochu jinak. Celou konfiguraci mam ulozenou v svn, nrpe.cfg mam pro vsechny servery spolecnej, taky v svn. Kdyz potrebuju rozdistribuovat zmenu nrpe, tak vytvorim novej balik nrpe-client (mam to automatizovany, takze checkout+build+zarazeni do repository je jednim prikazem) a ten pak instaluju na servery normalnim update mechanismem. Vyhoda je, ze verzi konfigurace muzu zjistit podle verze baliku nrpe clienta, nevyhoda pak ta, ze kdyz tohle potrebuju udelat na diskless stroji, kterej bezi z image, tak to neni tak elegantni.
Pluginy resim analogicky pres balicky, dneska uz tech balicku mam asi 5 kvuli checkum, co pouzivam jenom nekde a maji zavislosti navic. Proti distribuci tarballem zasadni vyhoda spociva prave ve vyreseni zavislosti. Upravu sudoers a dalsich konfiguraku resim v ramci post-install/post-uninstall skriptu.

KRISHNA --- --- 13:44:59 21.4.2012

1 odpověď

AQUARIUS: No, máme master server, řikejme mu BigBrother (z historickejch důvodů, dřív tam totiž běžel big brother monitoring software, kterej ale časem nestačil, tak se přemigroval na nagios a hostname zustal) na něm běží nagios+mysql v který je tabulka databáze "nagupdate" v níž jsou uložený configy pro všechny hosty. Na všech linuxovejch strojích máme definovanej check_nagupdate, kterej se spouští jednou denně z bigbrother, nebo jeho satellitu přes nrpe stejně jako třeba check_disk nebo check_cpu nebo cokoliv jinýho. Je to perlovej script, kterej se z toho hosta připojí do mysql bigbrothera a zjistí, jaká je aktuální konfigurace toho danýho hosta, když zjistí rozdíl, tak stáhne nejnovější config (/etc/nagios/nrpe.cfg) nahradí starej, restartuje nagios-nrpe-server a vrátí exit 0 s datumem a časem aktualizace zpět na bigbrother. Tohle všechno by bylo poněkud složitý kdyby šlo jen o configy. Ten perl script krom stažení configu ještě zkontroluje jeho obsah, jestli neobsahuje nějakej neznámej check (máme vlastní pluginy třeba na kontrolu drupalu, Postgresql, dell chasis, IPMI a další věci, co nejsou v nrpe serveru defaultně) a když jo, tak stáhne tarball se všema pluginama a rozbalí je do plugins adresáře nagios nrpe serveru. Abych nekecal, tak windows stroje (kterej je teda minimum) máme taky přes templaty

AQUARIUS --- --- 0:48:56 21.4.2012

1 odpověď

KRISHNA: mohl bys, prosim, malinko rozepsat, jak ta kontrola konfiguraci funguje? Ja na tohle pouzivam sablony, takze zmena konfigurace 100 hostu se dela zmenou sablony, ale ne vzdy to je uplne pouzitelny.

KRISHNA --- --- 17:12:13 20.4.2012

ERROR: jo no, já věřim, že se to dá dostat do použítelnýho stavu, ale já nikdy nějak neměl tu trpělivost a teď jsem skoro rád

KRISHNA --- --- 17:11:17 20.4.2012

1 odpověď

ok, s tim nemam zkušenost. Mě v poslední době nutěj na všechno psát scripty i když jsem se ze začátku cukal že to neumim, tak člověk se v tom docela brzo rozkouká. S centreonem mam blbý zkušenosti, že to nikdy nějak nedělalo co jsem si přál. Hlavně náš nagios je spojenej s MySQL databází, kde máme seznam všech hostů a jejich servisů, zároveň máme automatickej check, kterej kontroluje nejnovější configy a pluginy na jednotlivejch hostech. Takže potom můžeš měnit config třeba na 100 hostech najednou, což myslim, že právě v centreonu nešlo a kvuli tomu jsme udělali takhle "manuálně" a je to nakonec určitě lepší.

Takže teď máme na celou infrastrukturu v podstatě spojení Nagios+mysql+cacti+ntop+ Remedy což je nějakej ulítlej anglickej ticketovací systém, kterej je spojenej s cacti+nagiosem a vytváří/edituje/zavírá tickety

ERROR --- --- 16:46:03 20.4.2012

1 odpověď

filosofie je takova ze na monitoring porad pouzivame nagios, ale kdyz je potreba se kouknout do historie co se delo tak se kouknem do centreonu kterej ma vsechny historicky data v db

ERROR --- --- 16:43:35 20.4.2012

KRISHNA: problem cacti je ze je spis na monitoring infrastruktury, a my monitorujem nejen infrastrukturu ale i aplikacni metriky jako pocet obednavek atd...takze potrebujeme mit moznost ty data sledovat, treba i v zavislosti na ostatnich datech atd.. a to centreon umi docela dobre (nadefinujes do nejakyho view presne co chces videt)

KRISHNA --- --- 16:39:28 20.4.2012

1 odpověď

ERROR: Jaký data potřebujete sbírat? Cacti bych řek, že toho umí víc, než munin a hlavně má snad i nějaký pluginy pro nagios..?

ERROR --- --- 16:38:41 20.4.2012

cacti nepripada v uvahu protoze by se to muselo vsechno predelat na zeleny louce...

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?