Probleme nach Neuinstallation

Einklappen
X
 
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Leigh
    MS Profi
    • 25.08.2015
    • 705

    #1

    Probleme nach Neuinstallation

    Hallo Zusammen,

    ich hab vor etwa 10 Tagen den Loxberry auf nem P4 mit SSD und DietPi neu aufgesetzt.
    Initial lief alles sehr flott und zügig, keine Fehlermeldungen.

    Beim Umzug von Zigbee2MQTT hatte ich dann ein paar kleineren Probleme, aber auch das klappte dann.
    Zu Beginn wurden Beleuchtungen/Gruppen teilweise mit extremem Delay geschaltet. Hab das ganze dann in Ruhe gelassen, dass es sich einpendelt.
    Irgendwann tat es das auch.
    Was nun aber passierte war, dass das MQTT Gateway irgendwann anfing, keine Daten mehr zu empfangen/senden.

    In der Incomming Overview war nur noch bei Zigbee die Bridge gelistet, meine Shellys wurden ihre Infos an den Miniserver nicht mehr los.

    Zuerst dachte ich, das Problem ligt an dem neuen Zigbee-LAN Coordinator, aber ich sehe im Zigbee-Dashboard die Geräte, ob Schalter/Leuchten ect und kann sie auch hier einwandfrei bedienen, bzw sehe die Aktionen bei den Ikea Sound-Controlern.

    Im MQTT Monitor sah ich eingehende Infos, aber eben nicht mehr alle. Wie gesagt, mancher Shelly kam nimmer durch, was Anfangs noch klappte.
    Irgendwann meldete er, dass das RootFS voll wäre. Ich nutze eine 128 Gb SSD, was ja eigentlich nicht sein sollte. Logs waren keine aktiv, die da viel Vollschreiben sollten, war ja das erste mal, dass es mit auffiel.
    Damit hier erst einmal alles wieder läuft, hab ich den alten Loxberry wieder in Betrieb genommen, mit einem Unterschied, nämlich dass ich den ZigBee-Lan Controller weiter verwendet hab.
    Hier läuft alles Problemlos und tut auch alles.

    Wo bitte, setze ich die Fehlersuche an? Logs kann ich gerade keine Anbieten, der neue nun nicht mehr Produktiv ist. Das MQTT Gateway hat exakt NULL zu tun, da ich die übermittlung per UDP deaktivert hab (ich sende alles per UDP). Einzig das SmartMeter Plugin läuft noch auf dem Neuen, da der alte Loxberry nun im Büro steht.

    Hardware P4 B 8GB
    Geekworm SSD Expansion Board
    CodM Zigbee LAN Coordinator
    USB Lesekopf Volkszähler
    Geekworm X728 UPS
    Geekworm Cooling Fan Expansion Board

    OS DietPi 9.6 alles aktuell.
    Loxberry 3.0.1.2
    This is new updated X862 V2.0 version from X862 V1.0. We solve the EMC interference issue between Raspberry Pi 4 and USB3.0 device. The X862 V2.0 M.2 NGFF SATA SSD Shield is designed for Raspberry Pi 4 model B, it provides a complete storage solution for Raspberry Pi 4. New X862 V2.0 ONLY support M.2 NGFF SSD Key-B 2280 length. The X860 V2.0 support UASP.
    Ciao, Leigh

    Nur der eigene Geist setzt uns Grenzen...
  • Prof.Mobilux
    Supermoderator
    • 25.08.2015
    • 4739

    #2
    Wenn er meldet, dass die SSD voll ist, dann ist das zu 99,99999% der Fälle auch so. Es gab mal ein Plugin, was alles mit Logs im Debugmodus vollgeschrieben hat. Keine Ahnung ob das das Zigbee Plugin war.

    Als erstes Selbsttest nochmal ausführen und schauen, ob es noch weitere Probleme gibt: Mein LoxBerry -> Selbsttest

    Dann schauen, ob es sonstige Auffälligkeiten gibt (Speicher voll, CPU ausgelastet, Dateisysteme voll): Mein LoxBerry -> System Information

    Wenn sich bestätigt, dass die SSD voll ist, dann auf die Suche gehen:

    Per Putty einloggen und folgenden Befehl ausführen:

    Code:
    df -h
    Unter "Mounted On" schau nach dem Root-Dateisystem ("/"). Wenn das voll ist, suchst Du den Verursacher. Dazu zu Root werden und folgenden Befehl ausführen:

    Code:
    cd /
    du -hs *
    Da suchst Du nach auffällig großen Verzeichnissen. Vermutlich zeigt er Dir "/opt/loxberry" als ziemlich groß (mehrere Gigabyte) an. Dann gehst Du in das Verzeichnis und machst das ganze Spiel nochmal:

    Code:
    cd /opt/loxberry
    du -hs *
    Nun schaust Du wieder nach auffällig großen Verzeichnissen. Eventuell "log"? Dann weiter:

    Code:
    cd log
    du -hs *
    Und immer so weiter, bis Du das Verzeichnis identifizierst hast. Dann wieder hier melden und wir sehen weiter.​
    Zuletzt geändert von Prof.Mobilux; 21.07.2024, 12:04.
    🇺🇦 Hilfe für die Menschen der Ukraine: https://www.loxforum.com/forum/proje...Cr-die-ukraine


    LoxBerry - Beyond the Limits

    Kommentar

    • svethi
      Lebende Foren Legende
      • 25.08.2015
      • 6318

      #3
      Was denn nun? Du schreibst, dass das MQTT Gateway exakt NULL zu tun das Du UDP deaktiviert hast und dann, dass Du alles per UDP sendest.

      Du schreibst, dass nach der Installation des ZigBee2MQTT ein großes Delay war, Du es aber einfach hast laufen lassen.

      Du schreibst, dass nicht mehr alles durch MQTT ankommt … Probleme mit MQTT bekannt und unbehandelt.

      Du schreibst, dass Du die Meldung bekommen hast, dass das RootFS voll ist … wurde nicht überprüft, kann ja nicht sein …

      Vielleicht solltest Du da anfangen zu suchen, wo die Probleme begannen?
      Miniserver; KNX; Vitogate; EnOcean (EnOceanPi); Loxone Air; Caldav-Kalenderanbindung; RaspberryPi und für keine Frickellösung zu schade :-)

      Kommentar

      • Leigh
        MS Profi
        • 25.08.2015
        • 705

        #4
        Zitat von svethi
        Was denn nun? Du schreibst, dass das MQTT Gateway exakt NULL zu tun das Du UDP deaktiviert hast und dann, dass Du alles per UDP sendest.
        DER NEUE ist nicht mehr Produktiv weil es die Probleme gab und darum auch UDP Deaktiviert damit sich nix überschneidet. Dass nix gesendet wird wenn man ein Protokoll deaktiviert, is mir klar!

        Zitat von svethi
        Du schreibst, dass nach der Installation des ZigBee2MQTT ein großes Delay war, Du es aber einfach hast laufen lassen.
        Weil ich das zuerst eben nicht zuordnen konnte.

        Zitat von svethi
        Du schreibst, dass nicht mehr alles durch MQTT ankommt … Probleme mit MQTT bekannt und unbehandelt.
        Das ist das was ich bemerkt hatte. Und weil es Abends war, hatte ich schlicht kein Bock mehr, da noch ewig zu suchen.

        Zitat von svethi
        Du schreibst, dass Du die Meldung bekommen hast, dass das RootFS voll ist … wurde nicht überprüft, kann ja nicht sein …
        Korrekt, siehe Antwort zuvor.

        Zitat von svethi
        Vielleicht solltest Du da anfangen zu suchen, wo die Probleme begannen?
        Pardon, aber lies doch mal bitte richtig. Ich fragte, wo setze ich mit der Fehlesuche an????
        Dein Angriff gegen mich, zumindest empfinde ich diesen als das, is Kontraproduktiv.
        Wenn Du ein Problem mit mir hast, okay, aber dann lass bitte diese Angriffe und bleib Sachlich.

        Ich bin mir eben gerade nicht im Klaren, ob das MQTT Gateway für alles die Ursache war, oder Zigbee2MTT.

        Debugging, welches mir das RootFS vollschreibt, war zumindest nicht bewußt irgendwo aktiviert.

        Prof.Mobilux
        Ich stell die Kiste nun nochmal step by step um und beobachte alles und gehe dann nach dem Speicherfresser, sollte es erneut passieren.

        Ciao, Leigh

        Nur der eigene Geist setzt uns Grenzen...

        Kommentar


        • Prof.Mobilux
          Prof.Mobilux kommentierte
          Kommentar bearbeiten
          Starte doch "den Neuen" noch einmal und mach Dich auf die Suche. Ich gehe davon aus, dass die Ursache für Probleme mit dem MQTT Gateway die volle Rootpartition ist.

        • Leigh
          Leigh kommentierte
          Kommentar bearbeiten
          Nen Neustart hatte ich schon mehrfach... bin grad am Testen.
          Danke.

        • svethi
          svethi kommentierte
          Kommentar bearbeiten
          Nein, ich habe absolut nichts gegen Dich, ich kenne Dich doch nicht. Ich habe beruflich mit Störungsdiagnose zu tun. Man legt alle Gedanken, Emotionen und Stress ab und geht Punkt für Punkt wie an einer Schnur sämtliche Punkte der Reihe nach ab.
          - Raspi neu aufgesetzt OK
          - Shellies in Betrieb OK
          - kein Delay OK
          - Installation ZigBee2MQTT OK
          - großes Delay NICHT IO
          - Meldung RootFS voll NICHT IO
          - verlorene MQTT Pakete NICHT IO

          Du fragtest, wo Du mit der Suche anfangen sollst … ich sagte, da wo die Probleme begannen … mit der Installation des ZigBee2MQTT.
          Das hat nichts mit irgendwelchen Emotionen zu tun, das ist der einzig logische Schluss. Da begannen die Probleme.

          Wo ist denn die Übersicht über die Filesysteme?
          Ich kenne das SSD Module nicht, aber es ist keine Standard Raspi Installation. Ich könnte mir vorstellen, dass Du zwar ne 128GB SSD hast, das Filesystem aber gar nicht auf 128GB vergrößert wurde.

          Völlig logisch und ohne jegliche Emotionen ist für mich: Meldung RootFS voll -> df -h/du -sh
          Witziger Weise hatte ich heute morgen, als ich in die Firma kam, genau das selbe Problem. Übers WE kaum Mails, ich wollte auf eine antworten -> Mail konnte nicht gesendet werden … auf den Server eingeloggt, df -h 100% auf / -> du ergab dann, dass ein Backup am WE die Platte vollgeschrieben hatte. In diesem Zustand ist es eigentlich nur noch möglich über die Konsole zu arbeiten und auch nur mit einfachen Systembefehlen. -> Platz geschaffen und schon lief das System wieder.
          Auch hier wieder … keine Panik durch den Systemausfall, Ruhe bewahren, Schritt für Schritt ranarbeiten, Problem beseitigen fertig.
      • Leigh
        MS Profi
        • 25.08.2015
        • 705

        #5
        Der Neue läuft aktuell, alles was auf dem alten Produktiv war ist drauf, bis auf Zigbee.
        Ich behaalte das jetzt mal im Auge.
        Was aber etwas seltsam is, is die Anzeige der Threads der CPU.

        Beim Alten stand hier immer "ARMv7"...
        Hier steht einmal nix und 3x unbekannt.


        Klicke auf die Grafik für eine vergrößerte Ansicht

Name: image.png
Ansichten: 151
Größe: 36,1 KB
ID: 437176
        Zuletzt geändert von Leigh; 22.07.2024, 19:18.
        Ciao, Leigh

        Nur der eigene Geist setzt uns Grenzen...

        Kommentar


        • Prof.Mobilux
          Prof.Mobilux kommentierte
          Kommentar bearbeiten
          Das kannst du alles ignorieren. Wichtig ist der Füllgrad des RootFS. Installiere auch Zignee und schaue dann was mit dem RootFS passiert. Siehe meine Beschreibung oben.
      • Leigh
        MS Profi
        • 25.08.2015
        • 705

        #6
        svethi
        Guten Morgen, dann entschuldige. Ich hab das dann falsch Aufgefasst.
        Aber, ich versuch mal zusammen zu fassen, wie die Schritte waren.

        Installation DIetPI auf die SSD ohne SD oder anderes Zuvor, wird problemlos unterstützt.
        Auch die erweiterung des Filesystems auf max 128GB. Es handelt sich dabei um ein Flash-Speicher. M2 NGFF

        Klicke auf die Grafik für eine vergrößerte Ansicht

Name: image.png
Ansichten: 263
Größe: 18,4 KB
ID: 437196

        Im Anschlusshabe ich die nötigen Einstellungen für das UPS Board gemacht.


        Klicke auf die Grafik für eine vergrößerte Ansicht

Name: image.png
Ansichten: 106
Größe: 28,8 KB
ID: 437197

        Dann habe ich erst einmal alle Plugins installiert, ohne sie zu konfigurieren.
        Als das alles durch war, hab ich am alten Loxberry die IP-Adresse geändert und am Neuen, die des alten eingestellt.

        Nun beide ein Reboot und den neuen begonnen einzurichten (Plugins konfigurieren).
        Begonnen bei FHEM -> FritzLox -> Netathmo Weather -> Smart Meter -> UnifiPresence -> Weather4Loxone und am Ende Zigbee

        Den Delay beim bedienen der ZigBee Leuchten, kannte ich bereits. Bis alle Interviews am neuen "Coordinator" durch waren dauert das ein wenig.

        Aktuell aber ist das Zigbee Plugin deinstalliert und läuft noch auf dem alten Loxberry. Derzeit läuft der neue Problemlos und was mich am meißten fuchst ist,
        dass ich noch nicht die Ursache des Problems gefunden habe.

        Klicke auf die Grafik für eine vergrößerte Ansicht

Name: image.png
Ansichten: 102
Größe: 11,5 KB
ID: 437198Auch beim Selbsttest, bzw ​df -h bleibt das Filesystem bei unter 10% Auslastung.
        Die SSD mit dem Problematischen Loxberry liegt hier noch, aktuell läuft eine komplette Neuinstallation auf einer zweiten SSD. Ich hatte 2st. geordert um regelmäßig ein Clone zu erstellen, falls die Aktive ein Defekt hätte. Ich schau mal drauf, wie voll die is, bzw. was die Logs verursacht hat. Ich habe keine Debug-Logs oder ähnliches aktiviert.

        Der nächste Schritt wird dann sein, auch Zigbee2MQTT umzuziehen und zu testen. Vllt. heut Nachmittag. Bislang ist alles unauffällig, auch die Performance ist gut.
        Ciao, Leigh

        Nur der eigene Geist setzt uns Grenzen...

        Kommentar


        • svethi
          svethi kommentierte
          Kommentar bearbeiten
          Interessant wäre andere SSD mal an ein Linux ranzuhängen und die Partitionen anzusehen. Ich glaube noch immer, dass die SSD nicht vergrößert wurde.
          Kannst Du die SSD per USB Verlängerung an die laufenden Raspi mit ranhängen? Also diesen U-Adapter ran und dann mit USB Verlängerung an den USB stecken? Dann könnte man den mal mounten

        • Leigh
          Leigh kommentierte
          Kommentar bearbeiten
          Morgen...
      • Leigh
        MS Profi
        • 25.08.2015
        • 705

        #7
        Bin noch immer ne Antwort zur alten SSD schuldig.
        An den Loxberry kann ich sie nicht ran hängen, dann lässt mich die Kiste nimmer rein…

        Der neu aufgesetzte tut mittlerweile was er soll.
        Die Startschwierigkeiten versteh ich nicht.

        Ich mach die Tage mal ein Raspian fertig und häng sie da rein.
        Ciao, Leigh

        Nur der eigene Geist setzt uns Grenzen...

        Kommentar

        Lädt...