Schwierigkeit: Mittel · Dauer: 45–90 Min · Ziel: Netdata als Live-Dashboard: Alarme, Eltern-Kind-Streaming, Retention
Kurzproblem und Zielbild
In diesem Guide setzt du Netdata als Live-Dashboard: Alarme, Eltern-Kind-Streaming, Retention mit reproduzierbaren Schritten, klaren Checks und belastbaren Recovery-Pfaden um.
Voraussetzungen
- Linux-/CLI-Grundlagen
- Admin-Zugriff auf die Zielsysteme
- Snapshot/Backup vor Änderungen
Schnellstart (funktionierende Basis)
hostnamectl
ip a
systemctl --failed
journalctl -p 3 -xb --no-pager | tail -n 30
Schritt-für-Schritt Umsetzung
1) Ausgangszustand dokumentieren
date -Iseconds
uname -a
# aktuelle Versionen und relevante Konfig-Pfade notieren
2) Kernkonfiguration sauber setzen
bash <(curl -Ss https://my-netdata.io/kickstart.sh) --dont-wait
systemctl status netdata --no-pager
curl -I http://127.0.0.1:19999
3) Dienst/Funktion gezielt prüfen
# Alarm-Health in UI prüfen
journalctl -u netdata -n 120 --no-pager
4) Betriebsgrenzen testen
sudo apt-get install -y stress-ng
stress-ng --cpu 4 --timeout 60s
curl -fsS "http://127.0.0.1:19999/api/v1/alarms?all=true" | jq '. | length'
Validierung / Checks
# Alarm-Health in UI prüfen
journalctl -u netdata -n 120 --no-pager
curl -fsS http://127.0.0.1:19999/api/v1/info | jq '.version'
curl -fsS "http://127.0.0.1:19999/api/v1/alarms?active=true" | jq '. | length'
Troubleshooting
Konfiguration wird nicht übernommen
Ursache: Syntax-/Reload-Fehler oder falscher Parameterpfad.
systemctl is-active netdata
ss -ltnp | grep 19999
journalctl -u netdata -n 200 --no-pager
Dienst läuft, Funktion aber fehlerhaft
Ursache: Abhängigkeiten, Routing, Rechte oder Versionen inkonsistent.
grep -R "memory mode\|history" /etc/netdata/ -n
curl -I http://127.0.0.1:19999
traceroute NETDATA_PARENT_OR_AGENT
Fazit
Mit einem klaren Ablauf, harten Checks und dokumentierten Grenzwerten bleibt das Setup wartbar statt zufällig stabil. Nächster Schritt: den Ablauf als monatliche Betriebsroutine einplanen.




