• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SNIPERCZEZabbix, nagios a další monitorovací nástroje
    Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
    rozbalit záhlaví
    AQUARIUS
    AQUARIUS --- ---
    KOC256: rozhodne bych na zacatek definice ty sluzby pridal import "generic-service", jinak by to snad melo byt v poradku. Ta sablona standardne obsahuje
    template Service "generic-service" {
      max_check_attempts = 5
      check_interval = 1m
      retry_interval = 30s
    }

    Hadam, ze bez specifikace check_interval by treba taky nemuselo dojit k naplanovani checku.
    KOC256
    KOC256 --- ---
    Rozchodil jsem si icinga2 monitoring, a u jednoho webu se mi nedaří dostat do "zeleného stavu".
    Všechny weby mám stejně a tento ležící na WEDOSu mi to veací chybu...

    
    object Host "KK__web.cz" {
      address = "46.28.105.77"
      #vars.os = "Linux"
      check_command = "hostalive"
    
      vars.notification["mail"] = {
        groups = [ "icingaadmins" ]
      }
    }
    
    object Service "http" {
      host_name = "KK__web.cz"
      check_command = "http"
      #vars.http_vhost = "http://web.cz"
      vars.http_uri = "http://web.cz"
    }
    


    V icingaweb2 vidím:
    HTTP WARNING: HTTP/1.1 403 Forbidden - 382 bytes in 0.021 second response time

    Ale...
    
    root@D01:~# /usr/lib/nagios/plugins/check_http -H web.cz -I web.cz
    HTTP OK: HTTP/1.1 200 OK - 39995 bytes in 0.113 second response time |time=0.112669s;;;0.000000 size=39995B;;;0
    


    Nějaký nápad?
    nejedná se o žádný redirect.
    ESTEN
    ESTEN --- ---
    Pouziva tu nekdo prometheus s influxdb remote storage?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Nechci te strasit, je to mozna vec spis Promethea nez TimescaleDB, jeste na to musim mrknout;)
    RATTKIN
    RATTKIN --- ---
    SAMGARR: tak počkat, nemělo by to bejt menší?
    SAMGARR
    SAMGARR --- ---
    RATTKIN: Ne, ale co jsem to testoval s Prometheem, tak narust datovyho objemu byl cca 70x nasobnej...
    RATTKIN
    RATTKIN --- ---
    už máte někdo zabbix na timesacaleDB?
    TOTAL
    TOTAL --- ---
    ALL: Nemile prekvapeni po update ZABBIX 4.07 na 4.08 (DEBIAN9) ... nefunkcni ZABBIX a chybejici popisky grafu .... super ;) Kdyby nekdo resil, to same ...

    Po nejakem hledani ....

    --------------------------

    Zkopirovani fontu (lisi se cesta)
    cp /usr/share/zabbix/fonts/graphfont.ttf /usr/share/zabbix/assets/fonts/

    Zmena vlastnika
    chown -R www-data:www-data /usr/share/zabbix/assets/

    Zmena prav
    chmod -R 744 /usr/share/zabbix/assets
    MUXX
    MUXX --- ---
    RATTKIN: nakonec to bylo jednodussi. na serveru jsem nastavil novy item vfs.file.exists[/run/reboot-required], ktery vraci 0/1.
    MUXX
    MUXX --- ---
    RATTKIN: Je to tak. Aspon mam konecne duvod si hrat s ansible.
    RATTKIN
    RATTKIN --- ---
    MUXX: ne. pokud máte serverů víc, stejně musíš mít možnost jak to centrálně spravovat, jak tam dát zabbix agenta a konfigurovat ho, stejně jako další programy, na to jsou řešení. já to dávám do agentů ručně.
    DRON
    DRON --- ---
    QUIP: jj, samozrejme. Mira pohodlnosti je pres ansible ale mirne vyssi
    QUIP
    QUIP --- ---
    DRON: na tohle nepotrebujes ani ansible/puppet, to proste pustis jednoduchou davku v shellu rovnou pres SSH
    DRON
    DRON --- ---
    MUXX: hmm, ted vazne nevim, o najekem deployingu custom checku se tusim uvazovalo, ale to myslim nedopadlo. Nicmene jednoduchy ukol pro nastroje jako ansible/puppet...
    MUXX
    MUXX --- ---
    RATTKIN: neda se to pridat jenom nejak centralne na serveru misto jednotlive na klientech?
    RATTKIN
    RATTKIN --- ---
    MUXX: tak a do zabbix_agent.conf dej do sekce user parameters novou řádku:
    UserParameter=key,command

    key si vymysli třeba muxx.restartrequired,test -f /run/reboot-required

    hostovi nebo templatě přidej novou item (typ active) muxx.restartrequired a hodnoty to má int nebo text, podle toho co ti vrací skript, restartni agenta a jede to. pak můžeš dít trigger
    MUXX
    MUXX --- ---
    RATTKIN: Jasny. Udelam bash script a strcim do nej “test -f /run/reboot-required”
    Exit code bude 1 nebo 0.
    RATTKIN
    RATTKIN --- ---
    MUXX: dostaneš to do itemu? tzn umíš pustit skript, který vrátí něco jako stav 0/1 nebo true/false?
    MUXX
    MUXX --- ---
    potreboval bych nejak sledovat v zabbixu linuxy, ktere jsou ve stavu " System restart required"
    je na to nejaky udelak/skript/template?
    QUIP
    QUIP --- ---
    MARTYET: Kdyz jsem na Prometheus a Grafanu koukal, nez jsem zacal ladit Zabbix, tak mi to prislo hezky ... takovy az vylozene chytlavy... jenze zaroven mi prislo, ze aby to clovek dostal do nejakeho uceleneho stavu, naimportoval do toho treba 30 masin, tak to bude stat mnohem a opravdu mnohem vic prace, nez to same udelat v Zabbixu.
    Ale mozna je to jen muj zkresleny dojem z toho, ze jsem schopen si celkem rychle napsat discovery shell scripty pro zabbix / pripravit sablony.
    SAMGARR
    SAMGARR --- ---
    MARTYET: jak nejde? Mas zabbix_sender, custom itemy, LLD discovery, ...
    Kliknutím sem můžete změnit nastavení reklam