• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    QUIP
    QUIP --- ---
    RATTKIN: Je to vazne trivialni:
    UserParameter=pkg.audit, /usr/local/sbin/pkg audit | awk '/problem\(s\)/ { print $1 }'

    A kdyz to spustim rucne, tak to zafunguje tak jako vzdycky
    # pkg audit | awk '/problem\(s\)/ { print $1 }'
    0
    
    RATTKIN
    RATTKIN --- ---
    QUIP: taky to nemusí souviset se změnou zabbixu, ale třeba se změnit formát co pkg vypisuje. Jak to parsuješ?
    QUIP
    QUIP --- ---
    Mel jsem Zabbix 3.x a pred casem upgradoval na Zabbix 4.0. Od te doby mi u jednohe polozky porad sviti PROBLEM, i kdyz uz ten problem byl davno vyreseny. Tak jsem ted [patral, cim to je a v Triggers jsem nasel u te polozky cerveny vykricnik s textem:

    Cannot evaluate expression: "Cannot evaluate function "sm-reserve.codelab.cz:pkg.audit.last()": item is not supported."

    Tusite nekdo, proc je to najednou unsupported, kdyz to ve starsi verzi fungovalo a je to velmi jednoducha polozka? Proste se pres Agenta na monitorovanem serveru spousti prikaz "pkg audit", ktery vraci pocet deravych balicku.
    KOC256
    KOC256 --- ---
    Tak vyreseno. Maji tam proxy. Takze do address musim mit adresu webu a ne IP. A IP musim mit ve vhost_address.
    KOC256
    KOC256 --- ---
    QUOING:
    Super, to pomohlo alespon zjistit co je spatne...

    Ono to tvori prikaz:
    /usr/lib/nagios/plugins/check_http -I '46.28.105.77' -u 'http://web.cz'

    Coz u WEDOSu nefunguje...

    Rucne mi funguje:
    /usr/lib/nagios/plugins/check_http -H '46.28.105.77' -u 'http://web.cz'

    Ale zatím nevím, jak zrušit parametr -I...

    Na jiných webech mi funguje:
    /usr/lib/nagios/plugins/check_http -I 'http://webX.cz' -u 'http://webX.cz'
    Cehož umím dosáhnout...
    AQUARIUS
    AQUARIUS --- ---
    Hlavne pak tu debug featuru nezapomente vypnout, hrozne to zere misto :)
    QUOING
    QUOING --- ---
    KOC256: co rika debug.log?
    Troubleshooting - Icinga 2
    https://icinga.com/docs/icinga2/latest/doc/15-troubleshooting/#enable-debug-output-on-linuxunix

    Mel by tam byt videt ten check_http prikaz vcetne parametru, z toho by se pak mohlo dat vyvestit co to dela jinak a proc to nedela co chces :)
    KOC256
    KOC256 --- ---
    Ten web je staticky...

    Nepomuze ani "http://web.cz/index.htm", coz je primo existujici soubor...
    KOC256
    KOC256 --- ---
    AQUARIUS:
    no přidal jsem tam generic-host (podle template). A jsem na tom stejnem.

    Ja v tom spise cuju, ze ten web bude nejak jina nastaven. Nebo nejak neodpovida, nebo DNS, nebo nevim co :(.

    Ale at zkousim co kde vidim tak nic...
    AQUARIUS
    AQUARIUS --- ---
    KOC256: rozhodne bych na zacatek definice ty sluzby pridal import "generic-service", jinak by to snad melo byt v poradku. Ta sablona standardne obsahuje
    template Service "generic-service" {
      max_check_attempts = 5
      check_interval = 1m
      retry_interval = 30s
    }

    Hadam, ze bez specifikace check_interval by treba taky nemuselo dojit k naplanovani checku.
    KOC256
    KOC256 --- ---
    Rozchodil jsem si icinga2 monitoring, a u jednoho webu se mi nedaří dostat do "zeleného stavu".
    Všechny weby mám stejně a tento ležící na WEDOSu mi to veací chybu...

    
    object Host "KK__web.cz" {
      address = "46.28.105.77"
      #vars.os = "Linux"
      check_command = "hostalive"
    
      vars.notification["mail"] = {
        groups = [ "icingaadmins" ]
      }
    }
    
    object Service "http" {
      host_name = "KK__web.cz"
      check_command = "http"
      #vars.http_vhost = "http://web.cz"
      vars.http_uri = "http://web.cz"
    }
    


    V icingaweb2 vidím:
    HTTP WARNING: HTTP/1.1 403 Forbidden - 382 bytes in 0.021 second response time

    Ale...
    
    root@D01:~# /usr/lib/nagios/plugins/check_http -H web.cz -I web.cz
    HTTP OK: HTTP/1.1 200 OK - 39995 bytes in 0.113 second response time |time=0.112669s;;;0.000000 size=39995B;;;0
    


    Nějaký nápad?
    nejedná se o žádný redirect.
    ESTEN
    ESTEN --- ---
    Pouziva tu nekdo prometheus s influxdb remote storage?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Nechci te strasit, je to mozna vec spis Promethea nez TimescaleDB, jeste na to musim mrknout;)
    RATTKIN
    RATTKIN --- ---
    SAMGARR: tak počkat, nemělo by to bejt menší?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Ne, ale co jsem to testoval s Prometheem, tak narust datovyho objemu byl cca 70x nasobnej...
    RATTKIN
    RATTKIN --- ---
    už máte někdo zabbix na timesacaleDB?
    TOTAL
    TOTAL --- ---
    ALL: Nemile prekvapeni po update ZABBIX 4.07 na 4.08 (DEBIAN9) ... nefunkcni ZABBIX a chybejici popisky grafu .... super ;) Kdyby nekdo resil, to same ...

    Po nejakem hledani ....

    --------------------------

    Zkopirovani fontu (lisi se cesta)
    cp /usr/share/zabbix/fonts/graphfont.ttf /usr/share/zabbix/assets/fonts/

    Zmena vlastnika
    chown -R www-data:www-data /usr/share/zabbix/assets/

    Zmena prav
    chmod -R 744 /usr/share/zabbix/assets
    MUXX
    MUXX --- ---
    RATTKIN: nakonec to bylo jednodussi. na serveru jsem nastavil novy item vfs.file.exists[/run/reboot-required], ktery vraci 0/1.
    MUXX
    MUXX --- ---
    RATTKIN: Je to tak. Aspon mam konecne duvod si hrat s ansible.
    RATTKIN
    RATTKIN --- ---
    MUXX: ne. pokud máte serverů víc, stejně musíš mít možnost jak to centrálně spravovat, jak tam dát zabbix agenta a konfigurovat ho, stejně jako další programy, na to jsou řešení. já to dávám do agentů ručně.
    Kliknutím sem můžete změnit nastavení reklam