• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    HALELUJANagios - dohledový systém počítačových sítí a jeho nadstavby (Centreon, Nagvis, Cacti,..)
    Diskuze, rady, novinky na poli dohledových systémů a jejich rozšíření. Především se zaměřením na Nagios a Centreon. Nagios (dříve Netsaint) - Open source nástroj pro monitorování sítě a techniky v ní se nacházející. Jde monitorovat v podstatě vše. Od dostupnosti síťových zařízení (ping), služeb, přes vyčítání informací přes SNMP, či pomocí NRPE, NSCA a counterů. Případné problémy systém vyhodnotí dle předem nastavených kriterií a provede akci (pošle sms, e-mail, zavolá, něco spustí, vypne,..). Potřebný nástroj pro každou firmu s kritickými aplikacemi, servery atd Centreon (dříve Oreon) - Open source nadstavba Nagiosu. Především nabízí přehledné webové prostředí pro konfiguraci Nagiosu, správu grafů, statistik, logů. Další informace: Oficiální stránky Nagios Oficiální stránky Centreon Nagios na Wikipedii CZ
    rozbalit záhlaví
    BUJAGA
    BUJAGA --- ---
    AQUARIUS: OK, rozumím. Je to logické, ale přesto mi to neříká, jak to nastavit. Jde o to, že nejen, že nemůže posílat notifikace, ale nemůže jej vidět ani v seznamu hostů, nevidí jeho rozšířené možnosti, nemůže vyžadovat okamžitý check, nevidí jeho jiné stavy, než UP a DOWN, apod.
    AQUARIUS
    AQUARIUS --- ---
    BUJAGA: to mi prijde v poradku - nekdo, kdo nema prava na pohled na vsechny sluzby na hostovi, by nemel mit moznost nastavit downtime na celyho hosta (a tim zamezit posilani notifikaci ostatnim skupinam).
    BUJAGA
    BUJAGA --- ---
    AQUARIUS: Jasně, to je všude psáno a je to srozumitelné. Nicméně, když dáš kontakt na službu, tak nemůžeš nastavovat downtime na hostovi. A zároveň, když dáš contact na hosta, tak vidíš všechny jeho služby.
    AQUARIUS
    AQUARIUS --- ---
    BUJAGA: nastaveni contact_groups, pripadne contacts v definici sluzby? (bavime-li se teda o Naigiosu nebo Icinze s classic interfacem)
    BUJAGA
    BUJAGA --- ---
    Ahoj, jak se dívám na datum posledního příspěvku, tak mě napadá, jestli to tu ještě někdo vůbec čte.
    Potřeboval bych poradit. Nevím jak dál, ani kam jinam napsat:

    Mám dva uživatele: Web, secweb
    Jeden monitorovaný host: třeba "Host1"
    Dvě monitorované služby: http, https

    Suprové by bylo, kdyby každý uživatel viděl stav hosta (UP/DOWN) a stav pouze své služby.
    Web by viděl: http-OK; Host1-OK
    secweb vidí: https-OK; Host1-OK

    Nečuměli by si na servisy navzájem.

    Nakopnete mě někdo?
    IGRACEK
    IGRACEK --- ---
    hlasim se s problemem :]


    [root@nekde ~]# ll /sbin/runuser
    -rwxr-xr-x. 1 root root 32696 Dec 27 2012 /sbin/runuser

    # ta "." nakonci znamena selinux involved, ale

    [root@nekde ~]# sestatus
    SELinux status: disabled

    # problem nastane, kdyz user monitor potrebuje neco nastartovat pod monitorem - a potrebuju to bez suda. :]

    [monitor@nekde ~]$ runuser - monitor -c 'echo nazdar'
    runuser: cannot set groups: Operation not permitted

    [root@nekde ~]# chmod u+s /sbin/runuser
    [root@nekde ~]# ll /sbin/runuser
    -rwsr-xr-x. 1 root root 32696 Dec 27 2012 /sbin/runuser

    [monitor@nekde ~]$ runuser - monitor -c 'echo nazdar'
    runuser: runuser may not be setuid: Operation not permitted


    .. znamena to, ze runuser se setuid proste nejde? :/ Hlaska je ocividna, ale rad bych to nejak obesel..

    O co vlastne jde :] OP5 nedavno presel z Nagiosu na Naemon a v /etc/init.d/monitor je tohle:

    runuser -s /bin/bash - $user -c "$corelimit >/dev/null 2>&1 ; $exec -vp $config"

    .. coz by jeste slo obejit, ale horsi problem je, ze runuser podobnym zpusobem pouziva i /etc/rc.d/init.d/functions pri startovani daemonu:

    $cgroup $nice runuser -s /bin/bash $user -c "$corelimit >/dev/null 2>&1 ; $*"

    .. mno a tam uz do toho fakt sahat kvuli jedny aplikaci nemuzu.
    TLOUDEV
    TLOUDEV --- ---
    MOPIK: nestacilo. na tcp ti kolikrat db zareaguje, ale uz odmitne reagovat na prihlaseni/query/... lepe si napsat jednoduchy select na vytazeni statistik napr. v perlu.
    MOPIK
    MOPIK --- ---
    MOPIK: je fakt ze by mozna pro zacate stacilo check_tcp!1433
    MOPIK
    MOPIK --- ---
    AQUARIUS: dekuju , zbyva tedy mssql :-( koukal sem, ze se spousta válí tady https://exchange.nagios.org/directory/Plugins/Databases/SQLServer , asi nemate nekdo primou zkusenost s nekterym?
    AQUARIUS
    AQUARIUS --- ---
    MOPIK: vetsinou na to je nejakej plugin... napriklad tohle je k dispozici v epel repository k centosu:
    [root@server ~]# yum search nagios-plugins | grep -e "mysql\|oracle\|mssql"
    nagios-plugins-mysql.x86_64 : Nagios Plugin - check_mysql
    nagios-plugins-oracle.x86_64 : Nagios Plugin - check_oracle
    MOPIK
    MOPIK --- ---
    Hello , prosim, jak testujete SQL databaze? ( MS SQL , MYSQL , ORACLE )
    TBC
    TBC --- ---
    SPM: ok, jak funguji oid/mib je mi jasny, slo mi o tu integraci, zkusim teda najit nejaky examlpy jak si to tam dopsat.
    CHOROBA
    CHOROBA --- ---
    spravny oid se nachazi prece snmpwalk -ckomunita -v2c 10.10.10.10 >oid.txt
    SPM
    SPM --- ---
    TBC: Do Check_MK nejlíp napsat si SNMP plugin (je to v dokumentaci na webu). Správná OID se dozvíš z MIB k danému zařízení, podle nich pak ten plugin napíšeš. Skoro všechny se daj napsat na pár řádků a není potřeba nějaká velká znalost Pythonu.
    TBC
    TBC --- ---
    A jeste dalsi dotaz ke stejnemu reseni, jak do systemu nahrat MIB/OIDy pro specificke zarizeni abych pak z toho vytahnul vice?

    SPM: prima, slape vyborne
    TBC
    TBC --- ---
    SPM: supr dik, testnu...
    SPM
    SPM --- ---
    TBC: v nagiosu se obecně rozlišuje soft state a hard state. soft state je vždycky, když ta kontrola neprojde. Pak se nastavuje kolikrát po sobě musí neprojít, aby to byl hard state (navíc se tam specifikuje ještě retry interval, tedy znova kontrola něčeho, co je podle soft statu špatné, může být rychlejší než běžná). Notifikace se posílají až ve chvíli, kdy je služba v hard statu. Standardně u nagiosu v default konfiguraci je IMHO check interval 5 minut, retry 1 a hard state po 2. pokusu. Nicméně pokud si check_mk instaloval z OMD balíčku, tak tam defaultně je 1 minuta a hard state 1, tedy pokaždé, když to neprojde (a dá se to překlikat ve wato).
    TBC
    TBC --- ---
    Puzivam nagios, resp. check_mk verzi 1.2.4p5, vse slape vyborne, vcetne notifikaci... jen bych rad nejak osetril, aby napriklad kdyz jde host unreacheble a za minutu up, napr. jen diky nejakemu sumu na trase /internet/ aby v takovem pripade emailova notifikace nechodila... rad bych si nastavil notifikovat napr. po 5 minutach... a idelane toto nastavil jen u vybranych hostu, ale neni podminkou, je to mozne? resili jste neco podobneho?
    SUK
    SUK --- ---
    GERLAT: asi bude zaviset na tom, ceho je schopnej onen check_snmp. snmpget (jako protokol i jako net-snmp utilita) umi vzit vic OID najednou... Prinejhorsim si na to napsat vlastni script no...
    GERLAT
    GERLAT --- ---
    Ahoj nevíte jak v Nagiosu vepsat více dotazu na nějakou funkcionalitu s OID nebo MIB ?
    Ja to zapisuji do checkcommands.cfg as takto :

    define command{
    command_name check_snmp_artemis
    command_line $USER1$/check_snmp -H $HOSTADDRESS$ -C public -o 1.3.6.1.4.1.24681.1.2.11.1.7.1
    }
    #check_snmp!-C public -o ifOperStatus.1 -r 1 -m RFC1213-MIB
    #check_snmp -H $HOSTADDRESS$ -C public -o sysUpTime.0 -r 1


    Tady mam dalsi parametry pro sledovani ktere bych tam mne zaroven s aktualnimi :


    Free Memory: .1.3.6.1.4.1.24681.1.2.3.0
    CPU Temperature: .1.3.6.1.4.1.24681.1.2.5.0
    HDD Temperature: 1.3.6.1.4.1.24681.1.2.11.1.3.1 (.3.1 is for drive one .3.1 for drive 2 etc etc)
    HDD SMART Status: 1.3.6.1.4.1.24681.1.2.11.1.7.1 (again just change the end digit for a different drive.)
    System Temperature: .1.3.6.1.4.1.24681.1.2.6.0
    Uptime: .1.3.6.1.2.1.25.1.1.0



    dik
    Kliknutím sem můžete změnit nastavení reklam