MS Reboot wegen watchdog (00000400), eventuell TCPTask Problem

Einklappen
X
 
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • simon_hh
    Lox Guru
    • 18.09.2015
    • 2659

    MS Reboot wegen watchdog (00000400), eventuell TCPTask Problem

    Moin liebe Community,

    ich finde den Fehler nicht.

    Seit geraumer Zeit (so eine Woche) startet mein MS sporadisch neu, seltsamerweise meistens Abends zwischen 18:00 und 23:00 Uhr, zwei/drei Mal am Tage.

    Ich merke das, weil dann meine Lichter flackern, bzw. eben ca 1 Minute nichts automatisch funktioniert.
    In der App kommt keine Nachricht. Ich kenne das sonst, dass rechts oben ein orangenes oder rotes Herz ist... Hier aber nichts.


    2021-05-06 19:57:54.530;Reboot due to watchdog (00000400)
    2021-05-06 18:08:13.562;Read network config: IP: 192.168.1.100, Mask: 255.255.255.0, Gateway: 192.168.1.1, NTP: time.nist.gov
    2021-05-06 20:08:17.915;PRG Reboot 12.0.2.24
    2021-05-06 20:08:45.573;PRG start program
    2021-05-06 20:08:46.109;RestoreRemanenceState /sys/rem/rem89.xml and /sys/rem/rem189.xml OK, /sys/rem/rem1098.xml for Messagecenter OK
    2021-05-06 20:08:46.595;Program started: /prog/sps_0203_20210506105716.zip
    2021-05-06 20:08:46.719;PRG start Extension (Extension OG) serial xxxxxx version 10.3.11.7
    2021-05-06 20:09:00.011;Warning 503, Loxone Miniserver - Neustart des Systems, mail, Miniserver (Uuid 09b78cd8-9af1-11e2-xxxxxxxxxxxx)


    Ich habe den Support kontaktiert. Dieser konnte mir auch nur schreiben, dass man nicht viel in der def.log, als auch nichts wirklich hilfreiches in der "crashlog" lesen kann. (Ich habe gestern dafür die crashlog im MS aktiviert).

    Also Aussage bisher, dass:

    man sich nur an def.log Eintrag "watchdog (00000400)" orientieren könne. Dieser Error Code bedeute genauer gesagt "TCPTask", also vermutlich wird der Neustart durch irgendeinen HTTP Eingang oder UDP Eingang verursacht.

    Ich finde aber den Fehler nicht... Ich habe nichts geändert und an HTTP und UDP habe ich nur MQQT mit dem loxberry und allgemein loxberry mit Weather4Lox, etc, dazu drei Kameras eingebunden.

    Gibt es im Miniserver eine weitere, tiefere Log-Möglichkeit, die mitlaufen kann?
    Hatte jemand schon den Reboot due to watchdog (00000400)

    MS Gen 1. mit 12.0.2.24, nur im internen Netz via VPN erreichbar, keine offenen Ports.

    Danke
    Zuletzt geändert von simon_hh; 07.05.2021, 08:41.
    Haus: Bj 1959, gekauft 2011, totale Entkernung, Dachausbau, Erweiterung & Vergrößerung: Start: 2014, Ende: 2050
    Loxone: 1 x Ms Gen.02, 1 x MS Gen.01, 5 x Ext., 4 x Relay Ext., 1 x Dimmer Ext., 2 x 1-wire Ext., 1 x DMX Ext. 1 x TREE Ext. mehr kommt noch
    Licht: DMX LED Beleuchtung (24V), MW HLG Serie und eldoled Dimmer
    Heizung: Brötje WBS 22F, OG Heizkörper und FuBoHeizung über RTL, EG FuBoHeizung
  • simon_hh
    Lox Guru
    • 18.09.2015
    • 2659

    #2
    habe eben nochmal genauer die "def.log" angeschaut:

    Reboot due to watchdog (00000400) hatte ich bereits schon länger, aber nur nicth so oft:
    23.12.2020
    24.12.2020
    08.01.2021
    15.01.2021
    dann erst wieder
    11.03.2021
    19.04.2021
    23.04.2021
    25.04.2021
    und seit 03.05.2021 täglich zwei bis drei Mal.

    edit:
    SD Test sieht in meinen Augen OK aus. Die Karte hatte ich im Nov.2020 präventiv getauscht:

    <LL control="dev/sys/sdtest" value="SD Performance: Read: 457kB/s, Write: 483kB/s, No error (0 0), ManufacturerId: 159, Date 2017/10, CardType 2, BlockSize 512, Erase 0, MaxTransferRate 25000000, RwFactor 2, ReadSpeed 22222222Hz, WriteSpeed 22222222Hz, MaxReadCurrentVDDmin 6, MaxReadCurrentVDDmax 7, MaxWriteCurrentVDDmin: 0, MaxWriteCurrentVDDmax: 6, Usage: 0.47%" Code="200"/>
    Zuletzt geändert von simon_hh; 07.05.2021, 08:50.
    Haus: Bj 1959, gekauft 2011, totale Entkernung, Dachausbau, Erweiterung & Vergrößerung: Start: 2014, Ende: 2050
    Loxone: 1 x Ms Gen.02, 1 x MS Gen.01, 5 x Ext., 4 x Relay Ext., 1 x Dimmer Ext., 2 x 1-wire Ext., 1 x DMX Ext. 1 x TREE Ext. mehr kommt noch
    Licht: DMX LED Beleuchtung (24V), MW HLG Serie und eldoled Dimmer
    Heizung: Brötje WBS 22F, OG Heizkörper und FuBoHeizung über RTL, EG FuBoHeizung

    Kommentar

    • simon_hh
      Lox Guru
      • 18.09.2015
      • 2659

      #3
      ach und eine Frage, die ein Hinweis sein könnte???

      2021-05-06 20:08:46.719;PRG start Extension (Extension OG) serial xxxxxx version 10.3.11.7

      Was ist das? Ich habe mehrere Extensions, verschiedener Art. Wieso taucht dieser und auch nur dieser eigentlich auf? Das ist die letzte am LoxLink, wo die Terminierung dran hängt.
      Falls das ein Hinweis sein könnte.
      Haus: Bj 1959, gekauft 2011, totale Entkernung, Dachausbau, Erweiterung & Vergrößerung: Start: 2014, Ende: 2050
      Loxone: 1 x Ms Gen.02, 1 x MS Gen.01, 5 x Ext., 4 x Relay Ext., 1 x Dimmer Ext., 2 x 1-wire Ext., 1 x DMX Ext. 1 x TREE Ext. mehr kommt noch
      Licht: DMX LED Beleuchtung (24V), MW HLG Serie und eldoled Dimmer
      Heizung: Brötje WBS 22F, OG Heizkörper und FuBoHeizung über RTL, EG FuBoHeizung

      Kommentar

      • Christian Fenzl
        Lebende Foren Legende
        • 31.08.2015
        • 11225

        #4
        Konnte der Support nicht nennen, worauf dieser Watchdog auslöst? (Speichermangel, Speicherkorruption, ein ungültiger Request...)

        Reboot due to watchdog (00000400)
        Das ist ja schon ein ganz eindeutiger Fehlercode (00000400), der im Quellcode abrufbar ist.
        Hilfe für die Menschen der Ukraine: https://www.loxforum.com/forum/proje...Cr-die-ukraine

        Kommentar


        • simon_hh
          simon_hh kommentierte
          Kommentar bearbeiten
          Die Antwort vom Support ist: Zitat: "Dieser Error Code bedeutet genauer gesagt "TCPTask", also vermutlich wird der Neustart durch irgendeinen HTTP Eingang oder UDP Eingang verursacht."

          wie ich im Eingangsbeitrag schrieb.
      • Mango
        MS Profi
        • 10.10.2015
        • 652

        #5
        Hast du denn mal deine HTTP & UDP Eingänge kontrolliert?
        Take it easy, but take it.

        Kommentar

        • Labmaster
          Lox Guru
          • 20.01.2017
          • 2545

          #6
          Hat der MS eine Portweiterleirung von extern ?
          DOS Angriff ?

          Irgendwelche PicoC s am laufen ?

          Kommentar


          • Gerrit
            Gerrit kommentierte
            Kommentar bearbeiten
            Portweiterleitung hat er nicht wie geschrieben
        • Gerrit
          MS Profi
          • 26.08.2015
          • 939

          #7
          Am Ende bleibt dir nichts anders übrig als alle HTTP / UDP Sachen zu prüfen. Hatte selbst z.B. mal einen Ping, der zu einem Server ging, der abgeschaltet war intern. Hatte ihn ganz vergessen, hat aber auch zu Reboots geführt. D.h. am Ende müsstest bei jeder Verbindung schauen, ob diese schnell antworten bzw. aktuell noch funktionieren. Oder eben nach und nach einzelne Teile abschalten, wenn die Prüfung nicht so einfach möglich.
          Auch ist es sinnvoll alle Timeout Einstellungen zu überprüfen. Die stehen ja tw. glaub bei 8s by default oder aber die Häufigkeit. Also alles was lange brauchen könnte (weil Timeout zu hoch und der Dienst dahinter zu langsam) oder zu häufig aufgerufen wird (zu viel parallel, Pollen durch Push vom anderen Dienst ersetzen)...

          Siehe auch loxwiki: https://www.loxwiki.eu/pages/viewpag...ageId=47120486
          Zuletzt geändert von Gerrit; 08.05.2021, 16:58.

          Kommentar

          • simon_hh
            Lox Guru
            • 18.09.2015
            • 2659

            #8
            Ich habe zwei virtuelle HTTP Eingänge, welche alle 10 Sekunden etwas pollen (ein Token von einer Kamera). Ich habe das Intervall nun auf 60 Sekunden angepasst.
            Das Pollen geschieht direkt auf den Miniserver, also keine externe Ressource. Es ist eine http Datei angelegt, um einen Token einer JSON Antwort auszuwerten.

            Leider ist es ja nicht möglich die Abfrage an- und auszustellen.
            Die Datei wird nur nach Bedarf geschrieben: Wenn ich die Sauna anmache, wird die Kamera angesprochen, Token in Datei geschrieben (1 Stunde gültig).
            Dann mittels HTTP Eingang ausgewertet, um die Kamera, welche auf die Sauna schaut mittels VA Befehl auszuschalten.

            Eleganter ging es mit Bordmitteln nicht, dass ich den Token per Polling auswerte... Nun aber das Intervall angepasst.


            Des Weiteren zwei Ping Bausteine, welche im momentan rausgenommen habe.

            Seitdem hatte ich keine Reboots. Ich werde nacheinander mal wieder die Änderungen zurück setzen und schauen, ob ich den Reboot reproduzieren kann.
            Leider sind die Reboots nicht regelmässig, um es direkt Dingfest zu machen.
            Zuvor hat es ca 1 Jahr problemlos funktioniert.
            Zuletzt geändert von simon_hh; 10.05.2021, 09:51.
            Haus: Bj 1959, gekauft 2011, totale Entkernung, Dachausbau, Erweiterung & Vergrößerung: Start: 2014, Ende: 2050
            Loxone: 1 x Ms Gen.02, 1 x MS Gen.01, 5 x Ext., 4 x Relay Ext., 1 x Dimmer Ext., 2 x 1-wire Ext., 1 x DMX Ext. 1 x TREE Ext. mehr kommt noch
            Licht: DMX LED Beleuchtung (24V), MW HLG Serie und eldoled Dimmer
            Heizung: Brötje WBS 22F, OG Heizkörper und FuBoHeizung über RTL, EG FuBoHeizung

            Kommentar

            Lädt...