• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    BNB
    BNB --- ---
    QWWERTY: Hele můžeš zkusit Paessler (PRTG). Myslím, že do 30ks zařízení se dá použít free a asi bude poskytovat, co potřebuješ. Je to bez-agentní monitoring tool... A od nějakých novějších verzí se po prvním spuštění rozjede discovery a zkusí vyšmejdit a zavést co potká, tedy to možná budeš mít jen o instalaci a prvním spuštění...
    QUOING
    QUOING --- ---
    QWWERTY: arpwatch ?
    SUCHRE
    SUCHRE --- ---
    QWWERTY: SNMP Trap?
    QWWERTY
    QWWERTY --- ---
    mam mozna hloupy a naivni dotaz, resp. na trosku nizsi urovni nez co poskytuje zabbix, nagios, icinga a podobne
    existuje nejaky monitorovaci nastroj, ktery je plne pasivni a nepotrebuje custom agenty a konkretni protokoly?

    hledam neco pro monitoring domaci site
    staci mi L2/L3, kdy si to nekam ulozi MAC adresu zarizeni, s jakou IP komunikovalo, kdy jsem ho videl poprve a kdy naposledy a bude se tam nekam dat dopsat uzivatelska poznamka ve stylu
    pokud bych si v ramci toho mohl nekde nakreslit topologii mezi zarizenimi co to videlo, je to plus, ale ne nutnost
    prakticky by mi stacila asi i nejaka chytrejsi nadstavba nad iptraf
    QUIP
    QUIP --- ---
    Tak to byla blbost na moji strane. Pri upgrade spatny merge konfiguracniho souboru pro agenta - vypadlo tam
    Include=/usr/local/etc/zabbix4/zabbix_agentd.conf.d/*.conf

    Ted uz manualni check prosel, tak jeste pockam par minut, jestli si to nacte i server.
    QUIP
    QUIP --- ---
    RATTKIN: Neco nepekneho se v tom novem Zabbixu zmenilo... dohledal jsem ted v interni knowledge base, ze tenhle prikaz pred tim fungoval

    # zabbix_get -s AA.BB.CC.DD -k pkg.cache.diskspace
    1516259
    


    A dneska to skonci takhle

    # zabbix_get -s AA.BB.CC.DD -k pkg.cache.diskspace
    ZBX_NOTSUPPORTED: Unsupported item key.
    


    Takze je mozna problem s tim prefixem "pkg" a nebo s necim uplne jinym... jdu to zkusit nekde dohledat.
    RATTKIN
    RATTKIN --- ---
    QUIP: zkus logy na jedný nebo druhý straně abys dostal tu hodnotu raw..

    nebo, v nápovědě je co může vést k not supperted, třeba calc items, tak se měnil ve 4.0 logika výpočtu
    QUIP
    QUIP --- ---
    RATTKIN: Je to vazne trivialni:
    UserParameter=pkg.audit, /usr/local/sbin/pkg audit | awk '/problem\(s\)/ { print $1 }'

    A kdyz to spustim rucne, tak to zafunguje tak jako vzdycky
    # pkg audit | awk '/problem\(s\)/ { print $1 }'
    0
    
    RATTKIN
    RATTKIN --- ---
    QUIP: taky to nemusí souviset se změnou zabbixu, ale třeba se změnit formát co pkg vypisuje. Jak to parsuješ?
    QUIP
    QUIP --- ---
    Mel jsem Zabbix 3.x a pred casem upgradoval na Zabbix 4.0. Od te doby mi u jednohe polozky porad sviti PROBLEM, i kdyz uz ten problem byl davno vyreseny. Tak jsem ted [patral, cim to je a v Triggers jsem nasel u te polozky cerveny vykricnik s textem:

    Cannot evaluate expression: "Cannot evaluate function "sm-reserve.codelab.cz:pkg.audit.last()": item is not supported."

    Tusite nekdo, proc je to najednou unsupported, kdyz to ve starsi verzi fungovalo a je to velmi jednoducha polozka? Proste se pres Agenta na monitorovanem serveru spousti prikaz "pkg audit", ktery vraci pocet deravych balicku.
    KOC256
    KOC256 --- ---
    Tak vyreseno. Maji tam proxy. Takze do address musim mit adresu webu a ne IP. A IP musim mit ve vhost_address.
    KOC256
    KOC256 --- ---
    QUOING:
    Super, to pomohlo alespon zjistit co je spatne...

    Ono to tvori prikaz:
    /usr/lib/nagios/plugins/check_http -I '46.28.105.77' -u 'http://web.cz'

    Coz u WEDOSu nefunguje...

    Rucne mi funguje:
    /usr/lib/nagios/plugins/check_http -H '46.28.105.77' -u 'http://web.cz'

    Ale zatím nevím, jak zrušit parametr -I...

    Na jiných webech mi funguje:
    /usr/lib/nagios/plugins/check_http -I 'http://webX.cz' -u 'http://webX.cz'
    Cehož umím dosáhnout...
    AQUARIUS
    AQUARIUS --- ---
    Hlavne pak tu debug featuru nezapomente vypnout, hrozne to zere misto :)
    QUOING
    QUOING --- ---
    KOC256: co rika debug.log?
    Troubleshooting - Icinga 2
    https://icinga.com/docs/icinga2/latest/doc/15-troubleshooting/#enable-debug-output-on-linuxunix

    Mel by tam byt videt ten check_http prikaz vcetne parametru, z toho by se pak mohlo dat vyvestit co to dela jinak a proc to nedela co chces :)
    KOC256
    KOC256 --- ---
    Ten web je staticky...

    Nepomuze ani "http://web.cz/index.htm", coz je primo existujici soubor...
    KOC256
    KOC256 --- ---
    AQUARIUS:
    no přidal jsem tam generic-host (podle template). A jsem na tom stejnem.

    Ja v tom spise cuju, ze ten web bude nejak jina nastaven. Nebo nejak neodpovida, nebo DNS, nebo nevim co :(.

    Ale at zkousim co kde vidim tak nic...
    AQUARIUS
    AQUARIUS --- ---
    KOC256: rozhodne bych na zacatek definice ty sluzby pridal import "generic-service", jinak by to snad melo byt v poradku. Ta sablona standardne obsahuje
    template Service "generic-service" {
      max_check_attempts = 5
      check_interval = 1m
      retry_interval = 30s
    }

    Hadam, ze bez specifikace check_interval by treba taky nemuselo dojit k naplanovani checku.
    KOC256
    KOC256 --- ---
    Rozchodil jsem si icinga2 monitoring, a u jednoho webu se mi nedaří dostat do "zeleného stavu".
    Všechny weby mám stejně a tento ležící na WEDOSu mi to veací chybu...

    
    object Host "KK__web.cz" {
      address = "46.28.105.77"
      #vars.os = "Linux"
      check_command = "hostalive"
    
      vars.notification["mail"] = {
        groups = [ "icingaadmins" ]
      }
    }
    
    object Service "http" {
      host_name = "KK__web.cz"
      check_command = "http"
      #vars.http_vhost = "http://web.cz"
      vars.http_uri = "http://web.cz"
    }
    


    V icingaweb2 vidím:
    HTTP WARNING: HTTP/1.1 403 Forbidden - 382 bytes in 0.021 second response time

    Ale...
    
    root@D01:~# /usr/lib/nagios/plugins/check_http -H web.cz -I web.cz
    HTTP OK: HTTP/1.1 200 OK - 39995 bytes in 0.113 second response time |time=0.112669s;;;0.000000 size=39995B;;;0
    


    Nějaký nápad?
    nejedná se o žádný redirect.
    ESTEN
    ESTEN --- ---
    Pouziva tu nekdo prometheus s influxdb remote storage?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Nechci te strasit, je to mozna vec spis Promethea nez TimescaleDB, jeste na to musim mrknout;)
    RATTKIN
    RATTKIN --- ---
    SAMGARR: tak počkat, nemělo by to bejt menší?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Ne, ale co jsem to testoval s Prometheem, tak narust datovyho objemu byl cca 70x nasobnej...
    RATTKIN
    RATTKIN --- ---
    už máte někdo zabbix na timesacaleDB?
    Kliknutím sem můžete změnit nastavení reklam