• úvod
  • témata
  • události
  • tržiště
  • Přišli jste skrz odkaz na příspěvek, který již neexistuje.

  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    HALELUJANagios - dohledový systém počítačových sítí a jeho nadstavby (Centreon, Nagvis, Cacti,..)
    VITEX
    VITEX --- ---
    Stručný obrázkový návod jak přez můj monitoring sledovat obsah webu v šesti krocích.

    Tutoriál - Monitoring - Redmine Vitex Software
    http://r.v.s.cz/projects/monitoring/wiki/Tutori%C3%A1l

    Napsal jsem vlastně jen generátor konfigurace pro Icingu/Nagios.
    Celá věc je ve fázi alfaverze ale něco to už dělá.
    TLOUDEV
    TLOUDEV --- ---
    RUDOLF: jo. Ale to asi bude stejny vysledek - spis bych se podival do konfigurace commands/checks jestli tam nemas nejaky problem s predavanim parametru.
    RUDOLF
    RUDOLF --- ---
    TLOUDEV: jako pod nagios userem?
    TLOUDEV
    TLOUDEV --- ---
    RUDOLF: zkousels to pustit pod uzivatelem www-data?
    RUDOLF
    RUDOLF --- ---
    TLOUDEV: jo pardon..

    command[check_disk_hgpfs_kramerius_ndk]=/usr/lib/nagios/plugins/check_disk -w $ARG1$ -c $ARG2$ -W $ARG3$ -K $ARG4$ -p /kramerius_ndk -u GB
    TLOUDEV
    TLOUDEV --- ---
    RUDOLF: ehm... check_disk_hgpfs_kramerius01 vs check_disk_hgpfs_kramerius_ndk - to jsou dva ruzne checky, ne?
    RUDOLF
    RUDOLF --- ---
    čudná věc, zdá se mi že centreon neposílá argumenty pro nrpe_check, páč hlásí jako OK:

    dohled:
    /var/log/nagios/nagios.log
    [1375740000] CURRENT SERVICE STATE: HNAS1;linux_nrpe_disk_hgpfs_kramerius_ndk;OK;HARD;1;DISK OK - free space: /kramerius_ndk 2971 GB (31% inode=46%)

    mašina:
    /etc/nagios/nrpe.cfg
    command[check_disk_hgpfs_kramerius01]=/usr/lib/nagios/plugins/check_disk -w $ARG1$ -c $ARG2$ -W $ARG3$ -K $ARG4$ -p /kramerius/01 -u GB

    argument: !check_disk_hgpfs_kramerius_ndk!5000!100!30%!20%

    screenshot centreonu
    https://docs.google.com/file/d/0B3jVVm68dhZTN2s4ejg0bjdQUmc/edit?usp=drivesdk

    když to pustím napřímo tak cajk:
    /usr/lib/nagios/plugins/check_nrpe -H 10.10.0.41 -c check_disk_hgpfs_kramerius_ndk -a 5000 100 30% 20%

    DISK WARNING - free space: /kramerius_ndk 2940 GB (31% inode=46%);| /kramerius_ndk=6451GB;4392;9292;0;9392
    NIXIMOR
    NIXIMOR --- ---
    HALELUJA: podle toho co pisou v dokumentu jsem zkusil snizit ten Maximum SNMP OID's Per SNMP Get Request na 2 i na 1, ale nic z toho nepomohlo.
    NIXIMOR
    NIXIMOR --- ---
    HALELUJA: snmpwalk z cacti serveru na snmp server funguje, komunitu mam spravnou.
    V logu je jen:
    06/26/2013 12:24:14 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'home.gcm.cz', and OID:'.1.3.6.1.2.1.1.1.0'
    06/26/2013 12:23:46 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'home.gcm.cz', and OID:'.1.3.6.1.2.1.1.1.0'
    06/26/2013 12:21:51 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'localhost', and OID:'.1.3.6.1.2.1.1.1.0'
    06/26/2013 12:21:16 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'localhost', and OID:'.1.3.6.1.2.1.1.1.0'

    Timeout jsem nastavil na 5s a stejne nic (snmpwalk ma timeout nizsi, navic vraci vysledky okamzite)
    chova se to stejne jak pri pripojeni na localhost (kde snmp taky bezi, uplne stejna konfigurace jako v pripade vzdaleneho serveru), tak na vzdaleny stroj.

    # snmpwalk -v1 -cpublic home.gcm.cz .1.3.6.1.2.1.1.1.0
    iso.3.6.1.2.1.1.1.0 = STRING: "Linux gcm.cz 3.2.0-4-686-pae #1 SMP Debian 3.2.41-2 i686"
    # snmpwalk -v1 -cpublic localhost .1.3.6.1.2.1.1.1.0
    iso.3.6.1.2.1.1.1.0 = STRING: "Linux hal 3.2.0-4-amd64 #1 SMP Debian 3.2.41-2+deb7u2 x86_64"
    TLOUDEV
    TLOUDEV --- ---
    hi, resim zapeklity problem s monitoringem ethernetoveho provozu v centreonu.
    k monitoringu pouzivam service check_centreon_traffic, coz je dle definice commands toto:
    $USER1$/check_centreon_snmp_traffic -H $HOSTADDRESS$ --disable-warn-state --64-bits -n -i $ARG1$ -w $ARG2$ -c $ARG3$ -v $_HOSTSNMPVERSION$ -C $_HOSTSNMPCOMMUNITY$

    ARG1 je nazev interface (napr. eth0), ARG2 je warnlevel a ARG3 critical level.

    vypis nekterych klicovych souboru:
    root@monitor4:/var/lib/centreon/centplugins# cat traffic_cache_192.168.3.252
    1372240585
    1;lo
    2;eth0
    3;eth1
    4;eth2
    root@monitor4:/var/lib/centreon/centplugins# cat traffic_if3_192.168.3.252
    1372245685:1976559371712:1272153373496
    root@monitor4:/var/lib/centreon/centplugins# cat traffic_if4_192.168.3.252
    1372245409:57410643440:54048
    root@monitor4:/var/lib/centreon/centplugins# cat traffic_if2_192.168.3.252
    1372245648:303689023992:6845956642080

    tusite nekdo v cem je problem, ze to zobrazuje CRITICAL: Interface speed equal 0! Interface must be down.|traffic_in=0B/s traffic_out=0B/s

    deje se to hlavne na XEN VPS, u fyzickych stroju to normalne zobrazuje vysledky. snmp je na vsech strojich plne funkcni, pouzivam snmp v2

    Dik za kazdou radu.

    HALELUJA
    HALELUJA --- ---
    NIXIMOR: máš tam správnou communitu? co zvýšit timeout? je snmp modul v cacti naloadovanej? z cacti serveru ti teda snmpwalk jede? co ti to hlásí přesně? sem s logem :)
    případně mrkni sem
    http://www.cacti.net/downloads/docs/html/debugging.html
    NIXIMOR
    NIXIMOR --- ---
    Dneska jsem nainstaloval Cacti, ale nedari se mi ho donutit pres snmp monitorovat jiny server. Na obou serverech je debian, nainstalovane (nejspis) net-snmp z balicku snmpd.
    Pres snmpwalk se mi vsechny udaje zobrazi, pres snmpget taky (z cehoz usuzuji, ze by snmp melo byt nakonfigurovane spravne), ale Cacti pri pokusu o ziskani udaju dle logu vytimeoutuje. Bohuzel netusim jak dal debuggovat, mel by nekdo nejaky napad? Diky!
    TLOUDEV
    TLOUDEV --- ---
    neni to oplne nagios, ale celkem zajimavy tool na monitoring - hlavne logu na centralnim logovacim serveru:
    octopussy - http://www.octopussy.pm
    Predem upozornuju, ze to chce trochu naslaplejsi stroj s alespon 2G RAM a takovy praseciny jako apache asp podporu.. nicmene vysledky - pokud to zrovna neni jak zpomaleny film s vybrakovanou RAM - jsou docela cool.
    HALELUJA
    HALELUJA --- ---
    KRISHNA: takhle hezký mě nenapadají, ale jestli máš implementovaný Nagvis, tak ten pár pluginů (koláče, sloupce) má
    Gadgets
    http://exchange.nagvis.org/exchange/Gadgets/
    KRISHNA
    KRISHNA --- ---
    Napadá vás nějakej tool, jak monitorovat velikosti složek, abych z toho dostal graf podobnej tomuhle?



    Potřebuju to na remote systému a grafy vidět na webu. Představuju si něco jako cacti, munin, nagios, nějakej plugin do jednoho z těhle programů..?
    HALELUJA
    HALELUJA --- ---
    Taak a další sranda.. výstup z checku je tak velkej, že se mi nevejde do Status information ani do Performance data v Centreonu. Řešil jste to někdo? celkem vtipný :))
    HALELUJA
    HALELUJA --- ---
    Heh zda se mi to anebo v Nagvisu 1.7.3 nejde dat gadgetum manual input? hergot! a taky nejak brutalne vytezuje apache.. to se zase vyplaci aktualizovat :/
    KRISHNA
    KRISHNA --- ---
    SAMGARR: nějaký logy někde budou, co/kdo dělá grafy z těch rrd souborů? Má práva?
    SAMGARR
    SAMGARR --- ---
    Cus, prave jsem poprvy rozbehal Cacti na debianu za ucelem grafovat zejmena apache2. Nainstaloval jsem tenhle plugin http://forums.cacti.net/viewtopic.php?f=12&t=25227 podle navodu, ale v grafech nemam zadny data. Kdyz ten script pustim samostatne v konzoli vrati mi spravny data. RRD soubory se vytvorily a uzivatel pod kterym bezi Cacti do nich muze zapisovat, ale nedela to...Tusite kde muze bejt problem?
    Kliknutím sem můžete změnit nastavení reklam