Nagios - dohledový systém počítačových sítí a jeho nadstavby (Centreon, Nagvis, Cacti,..)

SPM --- --- 16:00:36 14.2.2014

CHOROBA: dvojsmysl? :)

CHOROBA --- --- 15:39:38 14.2.2014

1 odpověď

jo, neco podobnyho potrebuju taky postavit :)

SUK --- --- 15:21:30 14.2.2014

VYHULENY_UFO: Tyvole :D Oznaceni NSFW by se v sekci "Nagios" urcite siklo :D

VITEX --- --- 16:56:19 6.2.2014

Stručný obrázkový návod jak přez můj monitoring sledovat obsah webu v šesti krocích.

Tutoriál - Monitoring - Redmine Vitex Software
http://r.v.s.cz/projects/monitoring/wiki/Tutori%C3%A1l

Napsal jsem vlastně jen generátor konfigurace pro Icingu/Nagios.
Celá věc je ve fázi alfaverze ale něco to už dělá.

TLOUDEV --- --- 17:36:13 6.8.2013

RUDOLF: jo. Ale to asi bude stejny vysledek - spis bych se podival do konfigurace commands/checks jestli tam nemas nejaky problem s predavanim parametru.

RUDOLF --- --- 17:02:06 6.8.2013

1 odpověď

TLOUDEV: jako pod nagios userem?

TLOUDEV --- --- 15:52:26 6.8.2013

1 odpověď

RUDOLF: zkousels to pustit pod uzivatelem www-data?

RUDOLF --- --- 14:20:40 6.8.2013

1 odpověď

TLOUDEV: jo pardon..

command[check_disk_hgpfs_kramerius_ndk]=/usr/lib/nagios/plugins/check_disk -w $ARG1$ -c $ARG2$ -W $ARG3$ -K $ARG4$ -p /kramerius_ndk -u GB

TLOUDEV --- --- 13:51:12 6.8.2013

1 odpověď

RUDOLF: ehm... check_disk_hgpfs_kramerius01 vs check_disk_hgpfs_kramerius_ndk - to jsou dva ruzne checky, ne?

RUDOLF --- --- 11:25:50 6.8.2013

1 odpověď

čudná věc, zdá se mi že centreon neposílá argumenty pro nrpe_check, páč hlásí jako OK:

dohled:
/var/log/nagios/nagios.log
[1375740000] CURRENT SERVICE STATE: HNAS1;linux_nrpe_disk_hgpfs_kramerius_ndk;OK;HARD;1;DISK OK - free space: /kramerius_ndk 2971 GB (31% inode=46%)

mašina:
/etc/nagios/nrpe.cfg
command[check_disk_hgpfs_kramerius01]=/usr/lib/nagios/plugins/check_disk -w $ARG1$ -c $ARG2$ -W $ARG3$ -K $ARG4$ -p /kramerius/01 -u GB

argument: !check_disk_hgpfs_kramerius_ndk!5000!100!30%!20%

screenshot centreonu
https://docs.google.com/file/d/0B3jVVm68dhZTN2s4ejg0bjdQUmc/edit?usp=drivesdk

když to pustím napřímo tak cajk:
/usr/lib/nagios/plugins/check_nrpe -H 10.10.0.41 -c check_disk_hgpfs_kramerius_ndk -a 5000 100 30% 20%

DISK WARNING - free space: /kramerius_ndk 2940 GB (31% inode=46%);| /kramerius_ndk=6451GB;4392;9292;0;9392

NIXIMOR --- --- 14:30:25 26.6.2013

HALELUJA: podle toho co pisou v dokumentu jsem zkusil snizit ten Maximum SNMP OID's Per SNMP Get Request na 2 i na 1, ale nic z toho nepomohlo.

NIXIMOR --- --- 14:27:13 26.6.2013

HALELUJA: snmpwalk z cacti serveru na snmp server funguje, komunitu mam spravnou.
V logu je jen:
06/26/2013 12:24:14 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'home.gcm.cz', and OID:'.1.3.6.1.2.1.1.1.0'
06/26/2013 12:23:46 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'home.gcm.cz', and OID:'.1.3.6.1.2.1.1.1.0'
06/26/2013 12:21:51 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'localhost', and OID:'.1.3.6.1.2.1.1.1.0'
06/26/2013 12:21:16 PM - CMDPHP: Poller[0] WARNING: SNMP Get Timeout for Host:'localhost', and OID:'.1.3.6.1.2.1.1.1.0'

Timeout jsem nastavil na 5s a stejne nic (snmpwalk ma timeout nizsi, navic vraci vysledky okamzite)
chova se to stejne jak pri pripojeni na localhost (kde snmp taky bezi, uplne stejna konfigurace jako v pripade vzdaleneho serveru), tak na vzdaleny stroj.

# snmpwalk -v1 -cpublic home.gcm.cz .1.3.6.1.2.1.1.1.0
iso.3.6.1.2.1.1.1.0 = STRING: "Linux gcm.cz 3.2.0-4-686-pae #1 SMP Debian 3.2.41-2 i686"
# snmpwalk -v1 -cpublic localhost .1.3.6.1.2.1.1.1.0
iso.3.6.1.2.1.1.1.0 = STRING: "Linux hal 3.2.0-4-amd64 #1 SMP Debian 3.2.41-2+deb7u2 x86_64"

TLOUDEV --- --- 13:25:36 26.6.2013

hi, resim zapeklity problem s monitoringem ethernetoveho provozu v centreonu.
k monitoringu pouzivam service check_centreon_traffic, coz je dle definice commands toto:
$USER1$/check_centreon_snmp_traffic -H $HOSTADDRESS$ --disable-warn-state --64-bits -n -i $ARG1$ -w $ARG2$ -c $ARG3$ -v $_HOSTSNMPVERSION$ -C $_HOSTSNMPCOMMUNITY$

ARG1 je nazev interface (napr. eth0), ARG2 je warnlevel a ARG3 critical level.

vypis nekterych klicovych souboru:
root@monitor4:/var/lib/centreon/centplugins# cat traffic_cache_192.168.3.252
1372240585
1;lo
2;eth0
3;eth1
4;eth2
root@monitor4:/var/lib/centreon/centplugins# cat traffic_if3_192.168.3.252
1372245685:1976559371712:1272153373496
root@monitor4:/var/lib/centreon/centplugins# cat traffic_if4_192.168.3.252
1372245409:57410643440:54048
root@monitor4:/var/lib/centreon/centplugins# cat traffic_if2_192.168.3.252
1372245648:303689023992:6845956642080

tusite nekdo v cem je problem, ze to zobrazuje CRITICAL: Interface speed equal 0! Interface must be down.|traffic_in=0B/s traffic_out=0B/s

deje se to hlavne na XEN VPS, u fyzickych stroju to normalne zobrazuje vysledky. snmp je na vsech strojich plne funkcni, pouzivam snmp v2

Dik za kazdou radu.

HALELUJA --- --- 11:31:38 25.6.2013

2 odpovědi

NIXIMOR: máš tam správnou communitu? co zvýšit timeout? je snmp modul v cacti naloadovanej? z cacti serveru ti teda snmpwalk jede? co ti to hlásí přesně? sem s logem :)
případně mrkni sem
http://www.cacti.net/downloads/docs/html/debugging.html

NIXIMOR --- --- 22:23:33 20.6.2013

1 odpověď

Dneska jsem nainstaloval Cacti, ale nedari se mi ho donutit pres snmp monitorovat jiny server. Na obou serverech je debian, nainstalovane (nejspis) net-snmp z balicku snmpd.
Pres snmpwalk se mi vsechny udaje zobrazi, pres snmpget taky (z cehoz usuzuji, ze by snmp melo byt nakonfigurovane spravne), ale Cacti pri pokusu o ziskani udaju dle logu vytimeoutuje. Bohuzel netusim jak dal debuggovat, mel by nekdo nejaky napad? Diky!

TLOUDEV --- --- 17:58:22 2.5.2013

neni to oplne nagios, ale celkem zajimavy tool na monitoring - hlavne logu na centralnim logovacim serveru:
octopussy - http://www.octopussy.pm
Predem upozornuju, ze to chce trochu naslaplejsi stroj s alespon 2G RAM a takovy praseciny jako apache asp podporu.. nicmene vysledky - pokud to zrovna neni jak zpomaleny film s vybrakovanou RAM - jsou docela cool.

HALELUJA --- --- 11:52:57 23.1.2013

KRISHNA: takhle hezký mě nenapadají, ale jestli máš implementovaný Nagvis, tak ten pár pluginů (koláče, sloupce) má
Gadgets
http://exchange.nagvis.org/exchange/Gadgets/

KRISHNA --- --- 22:21:46 21.1.2013

1 odpověď

Napadá vás nějakej tool, jak monitorovat velikosti složek, abych z toho dostal graf podobnej tomuhle?

Potřebuju to na remote systému a grafy vidět na webu. Představuju si něco jako cacti, munin, nagios, nějakej plugin do jednoho z těhle programů..?

HALELUJA --- --- 17:06:32 7.1.2013

Taak a další sranda.. výstup z checku je tak velkej, že se mi nevejde do Status information ani do Performance data v Centreonu. Řešil jste to někdo? celkem vtipný :))

HALELUJA --- --- 18:01:03 6.12.2012

Heh zda se mi to anebo v Nagvisu 1.7.3 nejde dat gadgetum manual input? hergot! a taky nejak brutalne vytezuje apache.. to se zase vyplaci aktualizovat :/

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?