• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    QWWERTY
    QWWERTY --- ---
    SUCHRE: zarizeni ala ESP8266/32 v zakladu SNMP nemaji o IoT nemluve
    kdybych mel dostupny SNMP, tak muzu nasadit Nagios .. ne ze bych mu rozumel, ale co jsem se koukal tak pasivni rezim, kdy akorat ceka na SNMP umi
    SUCHRE
    SUCHRE --- ---
    QWWERTY: SNMP Trap?
    QWWERTY
    QWWERTY --- ---
    mam mozna hloupy a naivni dotaz, resp. na trosku nizsi urovni nez co poskytuje zabbix, nagios, icinga a podobne
    existuje nejaky monitorovaci nastroj, ktery je plne pasivni a nepotrebuje custom agenty a konkretni protokoly?

    hledam neco pro monitoring domaci site
    staci mi L2/L3, kdy si to nekam ulozi MAC adresu zarizeni, s jakou IP komunikovalo, kdy jsem ho videl poprve a kdy naposledy a bude se tam nekam dat dopsat uzivatelska poznamka ve stylu
    pokud bych si v ramci toho mohl nekde nakreslit topologii mezi zarizenimi co to videlo, je to plus, ale ne nutnost
    prakticky by mi stacila asi i nejaka chytrejsi nadstavba nad iptraf
    QUIP
    QUIP --- ---
    Tak to byla blbost na moji strane. Pri upgrade spatny merge konfiguracniho souboru pro agenta - vypadlo tam
    Include=/usr/local/etc/zabbix4/zabbix_agentd.conf.d/*.conf

    Ted uz manualni check prosel, tak jeste pockam par minut, jestli si to nacte i server.
    QUIP
    QUIP --- ---
    RATTKIN: Neco nepekneho se v tom novem Zabbixu zmenilo... dohledal jsem ted v interni knowledge base, ze tenhle prikaz pred tim fungoval

    # zabbix_get -s AA.BB.CC.DD -k pkg.cache.diskspace
    1516259
    


    A dneska to skonci takhle

    # zabbix_get -s AA.BB.CC.DD -k pkg.cache.diskspace
    ZBX_NOTSUPPORTED: Unsupported item key.
    


    Takze je mozna problem s tim prefixem "pkg" a nebo s necim uplne jinym... jdu to zkusit nekde dohledat.
    RATTKIN
    RATTKIN --- ---
    QUIP: zkus logy na jedný nebo druhý straně abys dostal tu hodnotu raw..

    nebo, v nápovědě je co může vést k not supperted, třeba calc items, tak se měnil ve 4.0 logika výpočtu
    QUIP
    QUIP --- ---
    RATTKIN: Je to vazne trivialni:
    UserParameter=pkg.audit, /usr/local/sbin/pkg audit | awk '/problem\(s\)/ { print $1 }'

    A kdyz to spustim rucne, tak to zafunguje tak jako vzdycky
    # pkg audit | awk '/problem\(s\)/ { print $1 }'
    0
    
    RATTKIN
    RATTKIN --- ---
    QUIP: taky to nemusí souviset se změnou zabbixu, ale třeba se změnit formát co pkg vypisuje. Jak to parsuješ?
    QUIP
    QUIP --- ---
    Mel jsem Zabbix 3.x a pred casem upgradoval na Zabbix 4.0. Od te doby mi u jednohe polozky porad sviti PROBLEM, i kdyz uz ten problem byl davno vyreseny. Tak jsem ted [patral, cim to je a v Triggers jsem nasel u te polozky cerveny vykricnik s textem:

    Cannot evaluate expression: "Cannot evaluate function "sm-reserve.codelab.cz:pkg.audit.last()": item is not supported."

    Tusite nekdo, proc je to najednou unsupported, kdyz to ve starsi verzi fungovalo a je to velmi jednoducha polozka? Proste se pres Agenta na monitorovanem serveru spousti prikaz "pkg audit", ktery vraci pocet deravych balicku.
    KOC256
    KOC256 --- ---
    Tak vyreseno. Maji tam proxy. Takze do address musim mit adresu webu a ne IP. A IP musim mit ve vhost_address.
    KOC256
    KOC256 --- ---
    QUOING:
    Super, to pomohlo alespon zjistit co je spatne...

    Ono to tvori prikaz:
    /usr/lib/nagios/plugins/check_http -I '46.28.105.77' -u 'http://web.cz'

    Coz u WEDOSu nefunguje...

    Rucne mi funguje:
    /usr/lib/nagios/plugins/check_http -H '46.28.105.77' -u 'http://web.cz'

    Ale zatím nevím, jak zrušit parametr -I...

    Na jiných webech mi funguje:
    /usr/lib/nagios/plugins/check_http -I 'http://webX.cz' -u 'http://webX.cz'
    Cehož umím dosáhnout...
    AQUARIUS
    AQUARIUS --- ---
    Hlavne pak tu debug featuru nezapomente vypnout, hrozne to zere misto :)
    QUOING
    QUOING --- ---
    KOC256: co rika debug.log?
    Troubleshooting - Icinga 2
    https://icinga.com/docs/icinga2/latest/doc/15-troubleshooting/#enable-debug-output-on-linuxunix

    Mel by tam byt videt ten check_http prikaz vcetne parametru, z toho by se pak mohlo dat vyvestit co to dela jinak a proc to nedela co chces :)
    KOC256
    KOC256 --- ---
    Ten web je staticky...

    Nepomuze ani "http://web.cz/index.htm", coz je primo existujici soubor...
    KOC256
    KOC256 --- ---
    AQUARIUS:
    no přidal jsem tam generic-host (podle template). A jsem na tom stejnem.

    Ja v tom spise cuju, ze ten web bude nejak jina nastaven. Nebo nejak neodpovida, nebo DNS, nebo nevim co :(.

    Ale at zkousim co kde vidim tak nic...
    AQUARIUS
    AQUARIUS --- ---
    KOC256: rozhodne bych na zacatek definice ty sluzby pridal import "generic-service", jinak by to snad melo byt v poradku. Ta sablona standardne obsahuje
    template Service "generic-service" {
      max_check_attempts = 5
      check_interval = 1m
      retry_interval = 30s
    }

    Hadam, ze bez specifikace check_interval by treba taky nemuselo dojit k naplanovani checku.
    KOC256
    KOC256 --- ---
    Rozchodil jsem si icinga2 monitoring, a u jednoho webu se mi nedaří dostat do "zeleného stavu".
    Všechny weby mám stejně a tento ležící na WEDOSu mi to veací chybu...

    
    object Host "KK__web.cz" {
      address = "46.28.105.77"
      #vars.os = "Linux"
      check_command = "hostalive"
    
      vars.notification["mail"] = {
        groups = [ "icingaadmins" ]
      }
    }
    
    object Service "http" {
      host_name = "KK__web.cz"
      check_command = "http"
      #vars.http_vhost = "http://web.cz"
      vars.http_uri = "http://web.cz"
    }
    


    V icingaweb2 vidím:
    HTTP WARNING: HTTP/1.1 403 Forbidden - 382 bytes in 0.021 second response time

    Ale...
    
    root@D01:~# /usr/lib/nagios/plugins/check_http -H web.cz -I web.cz
    HTTP OK: HTTP/1.1 200 OK - 39995 bytes in 0.113 second response time |time=0.112669s;;;0.000000 size=39995B;;;0
    


    Nějaký nápad?
    nejedná se o žádný redirect.
    ESTEN
    ESTEN --- ---
    Pouziva tu nekdo prometheus s influxdb remote storage?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Nechci te strasit, je to mozna vec spis Promethea nez TimescaleDB, jeste na to musim mrknout;)
    RATTKIN
    RATTKIN --- ---
    SAMGARR: tak počkat, nemělo by to bejt menší?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Ne, ale co jsem to testoval s Prometheem, tak narust datovyho objemu byl cca 70x nasobnej...
    Kliknutím sem můžete změnit nastavení reklam