Nagios - dohledový systém počítačových sítí a jeho nadstavby (Centreon, Nagvis, Cacti,..)

Diskuze, rady, novinky na poli dohledových systémů a jejich rozšíření. Především se zaměřením na Nagios a Centreon. Nagios (dříve Netsaint) - Open source nástroj pro monitorování sítě a techniky v ní se nacházející. Jde monitorovat v podstatě vše. Od dostupnosti síťových zařízení (ping), služeb, přes vyčítání informací přes SNMP, či pomocí NRPE, NSCA a counterů. Případné problémy systém vyhodnotí dle předem nastavených kriterií a provede akci (pošle sms, e-mail, zavolá, něco spustí, vypne,..). Potřebný nástroj pro každou firmu s kritickými aplikacemi, servery atd Centreon (dříve Oreon) - Open source nadstavba Nagiosu. Především nabízí přehledné webové prostředí pro konfiguraci Nagiosu, správu grafů, statistik, logů. Další informace: Oficiální stránky Nagios Oficiální stránky Centreon Nagios na Wikipedii CZ

rozbalit záhlaví

BUJAGA --- --- 12:31:02 23.12.2016

1 odpověď

AQUARIUS: OK, rozumím. Je to logické, ale přesto mi to neříká, jak to nastavit. Jde o to, že nejen, že nemůže posílat notifikace, ale nemůže jej vidět ani v seznamu hostů, nevidí jeho rozšířené možnosti, nemůže vyžadovat okamžitý check, nevidí jeho jiné stavy, než UP a DOWN, apod.

AQUARIUS --- --- 12:28:18 23.12.2016

1 odpověď

BUJAGA: to mi prijde v poradku - nekdo, kdo nema prava na pohled na vsechny sluzby na hostovi, by nemel mit moznost nastavit downtime na celyho hosta (a tim zamezit posilani notifikaci ostatnim skupinam).

BUJAGA --- --- 12:12:53 23.12.2016

1 odpověď

AQUARIUS: Jasně, to je všude psáno a je to srozumitelné. Nicméně, když dáš kontakt na službu, tak nemůžeš nastavovat downtime na hostovi. A zároveň, když dáš contact na hosta, tak vidíš všechny jeho služby.

AQUARIUS --- --- 23:25:29 22.12.2016

1 odpověď

BUJAGA: nastaveni contact_groups, pripadne contacts v definici sluzby? (bavime-li se teda o Naigiosu nebo Icinze s classic interfacem)

BUJAGA --- --- 21:59:33 21.12.2016

1 odpověď

Ahoj, jak se dívám na datum posledního příspěvku, tak mě napadá, jestli to tu ještě někdo vůbec čte.
Potřeboval bych poradit. Nevím jak dál, ani kam jinam napsat:

Mám dva uživatele: Web, secweb
Jeden monitorovaný host: třeba "Host1"
Dvě monitorované služby: http, https

Suprové by bylo, kdyby každý uživatel viděl stav hosta (UP/DOWN) a stav pouze své služby.
Web by viděl: http-OK; Host1-OK
secweb vidí: https-OK; Host1-OK

Nečuměli by si na servisy navzájem.

Nakopnete mě někdo?

IGRACEK --- --- 21:51:20 3.7.2015

hlasim se s problemem :]

[root@nekde ~]# ll /sbin/runuser
-rwxr-xr-x. 1 root root 32696 Dec 27 2012 /sbin/runuser

# ta "." nakonci znamena selinux involved, ale

[root@nekde ~]# sestatus
SELinux status: disabled

# problem nastane, kdyz user monitor potrebuje neco nastartovat pod monitorem - a potrebuju to bez suda. :]

[monitor@nekde ~]$ runuser - monitor -c 'echo nazdar'
runuser: cannot set groups: Operation not permitted

[root@nekde ~]# chmod u+s /sbin/runuser
[root@nekde ~]# ll /sbin/runuser
-rwsr-xr-x. 1 root root 32696 Dec 27 2012 /sbin/runuser

[monitor@nekde ~]$ runuser - monitor -c 'echo nazdar'
runuser: runuser may not be setuid: Operation not permitted

.. znamena to, ze runuser se setuid proste nejde? :/ Hlaska je ocividna, ale rad bych to nejak obesel..

O co vlastne jde :] OP5 nedavno presel z Nagiosu na Naemon a v /etc/init.d/monitor je tohle:

runuser -s /bin/bash - $user -c "$corelimit >/dev/null 2>&1 ; $exec -vp $config"

.. coz by jeste slo obejit, ale horsi problem je, ze runuser podobnym zpusobem pouziva i /etc/rc.d/init.d/functions pri startovani daemonu:

$cgroup $nice runuser -s /bin/bash $user -c "$corelimit >/dev/null 2>&1 ; $*"

.. mno a tam uz do toho fakt sahat kvuli jedny aplikaci nemuzu.

TLOUDEV --- --- 17:13:40 1.6.2015

MOPIK: nestacilo. na tcp ti kolikrat db zareaguje, ale uz odmitne reagovat na prihlaseni/query/... lepe si napsat jednoduchy select na vytazeni statistik napr. v perlu.

MOPIK --- --- 11:22:49 29.5.2015

Uz sem na to asi kapnul :)

http://ben.goodacre.name/tech/Monitor_SQL_Server_(MSSQL)_using_Nagios

MOPIK --- --- 10:28:09 29.5.2015

1 odpověď

MOPIK: je fakt ze by mozna pro zacate stacilo check_tcp!1433

MOPIK --- --- 10:21:24 29.5.2015

1 odpověď

AQUARIUS: dekuju , zbyva tedy mssql :-( koukal sem, ze se spousta válí tady https://exchange.nagios.org/directory/Plugins/Databases/SQLServer , asi nemate nekdo primou zkusenost s nekterym?

AQUARIUS --- --- 9:48:10 29.5.2015

1 odpověď

MOPIK: vetsinou na to je nejakej plugin... napriklad tohle je k dispozici v epel repository k centosu:

[root@server ~]# yum search nagios-plugins | grep -e "mysql\|oracle\|mssql"
nagios-plugins-mysql.x86_64 : Nagios Plugin - check_mysql
nagios-plugins-oracle.x86_64 : Nagios Plugin - check_oracle

MOPIK --- --- 9:19:43 29.5.2015

1 odpověď

Hello , prosim, jak testujete SQL databaze? ( MS SQL , MYSQL , ORACLE )

TBC --- --- 20:09:33 20.12.2014

SPM: ok, jak funguji oid/mib je mi jasny, slo mi o tu integraci, zkusim teda najit nejaky examlpy jak si to tam dopsat.

CHOROBA --- --- 12:03:35 19.12.2014

spravny oid se nachazi prece snmpwalk -ckomunita -v2c 10.10.10.10 >oid.txt

SPM --- --- 21:30:52 18.12.2014

1 odpověď

TBC: Do Check_MK nejlíp napsat si SNMP plugin (je to v dokumentaci na webu). Správná OID se dozvíš z MIB k danému zařízení, podle nich pak ten plugin napíšeš. Skoro všechny se daj napsat na pár řádků a není potřeba nějaká velká znalost Pythonu.

TBC --- --- 20:29:44 18.12.2014

1 odpověď

A jeste dalsi dotaz ke stejnemu reseni, jak do systemu nahrat MIB/OIDy pro specificke zarizeni abych pak z toho vytahnul vice?

SPM: prima, slape vyborne

TBC --- --- 10:59:18 11.12.2014

SPM: supr dik, testnu...

SPM --- --- 10:48:10 11.12.2014

2 odpovědi

TBC: v nagiosu se obecně rozlišuje soft state a hard state. soft state je vždycky, když ta kontrola neprojde. Pak se nastavuje kolikrát po sobě musí neprojít, aby to byl hard state (navíc se tam specifikuje ještě retry interval, tedy znova kontrola něčeho, co je podle soft statu špatné, může být rychlejší než běžná). Notifikace se posílají až ve chvíli, kdy je služba v hard statu. Standardně u nagiosu v default konfiguraci je IMHO check interval 5 minut, retry 1 a hard state po 2. pokusu. Nicméně pokud si check_mk instaloval z OMD balíčku, tak tam defaultně je 1 minuta a hard state 1, tedy pokaždé, když to neprojde (a dá se to překlikat ve wato).

TBC --- --- 10:23:21 11.12.2014

1 odpověď

Puzivam nagios, resp. check_mk verzi 1.2.4p5, vse slape vyborne, vcetne notifikaci... jen bych rad nejak osetril, aby napriklad kdyz jde host unreacheble a za minutu up, napr. jen diky nejakemu sumu na trase /internet/ aby v takovem pripade emailova notifikace nechodila... rad bych si nastavil notifikovat napr. po 5 minutach... a idelane toto nastavil jen u vybranych hostu, ale neni podminkou, je to mozne? resili jste neco podobneho?

SUK --- --- 23:16:55 2.12.2014

GERLAT: asi bude zaviset na tom, ceho je schopnej onen check_snmp. snmpget (jako protokol i jako net-snmp utilita) umi vzit vic OID najednou... Prinejhorsim si na to napsat vlastni script no...

GERLAT --- --- 17:24:58 2.12.2014

1 odpověď

Ahoj nevíte jak v Nagiosu vepsat více dotazu na nějakou funkcionalitu s OID nebo MIB ?
Ja to zapisuji do checkcommands.cfg as takto :

define command{
command_name check_snmp_artemis
command_line $USER1$/check_snmp -H $HOSTADDRESS$ -C public -o 1.3.6.1.4.1.24681.1.2.11.1.7.1
}
#check_snmp!-C public -o ifOperStatus.1 -r 1 -m RFC1213-MIB
#check_snmp -H $HOSTADDRESS$ -C public -o sysUpTime.0 -r 1

Tady mam dalsi parametry pro sledovani ktere bych tam mne zaroven s aktualnimi :

Free Memory: .1.3.6.1.4.1.24681.1.2.3.0
CPU Temperature: .1.3.6.1.4.1.24681.1.2.5.0
HDD Temperature: 1.3.6.1.4.1.24681.1.2.11.1.3.1 (.3.1 is for drive one .3.1 for drive 2 etc etc)
HDD SMART Status: 1.3.6.1.4.1.24681.1.2.11.1.7.1 (again just change the end digit for a different drive.)
System Temperature: .1.3.6.1.4.1.24681.1.2.6.0
Uptime: .1.3.6.1.2.1.25.1.1.0

dik

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?