Zawieszajaca sie bramka / problem z pm2?

@Bartek
Cześć. Instaluję od nowa aplikacje z google i z ota, skanuję kod i niestety nie działa.
Czekam z niecierpliwością na @jolka, może coś nam wyjaśni. Nie wiem może to wina adroida…Robię to na dwóch różnych telefonach i nić, brzydko mówiąc DU…

a sprawdzałeś tunel czy masz aktywny ? jak uruchamiasz jolke to potwierdza uruchomienie zdalne ?? podaj może swój adres tunelu to zobaczymy czy się uda wejść po http a nie z poziomu aplikacji

A wyswietla sie jakis komunikat bledu? Sama informadcja “skanuje kod i niestety, nie dziala” raczej nie pomoze zespolowi Jolki na rozwiazanie problemu.

@badzio
Jeśli chodzi o komunikaty to przy tablecie mam tak:

a przy telefonie mam : łączenie z dom- xxxxxxxxxxx i tak w kółko

Laczysz sie bedac tej samej sieci lokalnej co bramka czy tez w innej? Jesli w innej, sprawdz czy przypadkiem wylaczyl sie tunel :slight_smile:

@badzio
i w lokalnej i poza siecią…

  1. Uzywajac konsoli na bramce sprawdz adres IP
  2. Nastepnie z sieci lokalnej
  • sprobuj wejsc na ten adres IP z poziomu przegladarki
  • pusc pinga
  • sprobuj zalogowac sie poprzez klienta ssh (przy okazji odpal pm2 status)
  1. Skoro mozesz zalogowac sie na webpanel bezposrednio z poziomu bramki, to sprawdz czy masz wlaczony tunel

Hej, dziś rano wstaję i Jolka nie działa tj. widzę ją na liście urządzeń zalogowanych na routerze, ale po wejściu na adres IP nie znajduje takiej strony. Oczywiście dostęp zdalny też nie działa (błąd 404). Przyciski zigbee nie działają (nie sterują urządzeniami). Diody na obudowie się świecą. Wygląda na zawiechę. Pozostałe urządzenia na tasmocie działają normalnie (można nimi sterować z adresów IP).

-edit-
Po pierwszych dwóch restartach ostatnim słowem Jolki było “poczekaj” i kilkanaście minut nic więcej nie usłyszałem. Dostępu do bramki nadal brak. Za trzecim razem dodała jeszcze “sterowanie na monitorze” (a jest podłączona do głośnika, nie mam pilota). Niestety dostępu lokalnie oraz zdalnie nadal brak. Podłącze ja później pod monitor, ale co sprawdzić?

-edit2-
Po trzecim restarcie po kilkunastu minutach wszedłem na adres IP bramki i trwało uruchamianie. Po jakimś czasie wszystko wyglądało ok, gdyby nieaktualne stany urządzeń. Sterowanie nimi było ok i po przełączeniu stany pokazuje już prawidłowo.

Jak mogę sprawdzić przyczynę zawiechy?

Wydaje mi sie ze kluczem sa wyniki pm2 logs. Moj problem jest taki, ze w momencie kiedy bramka wariuje, pm2 logs sie wywala (patrz pierwszy post) i nic nie moge zdiagnozowac :frowning:

Moje spostrzezenia

  • po ostatnim update (wypisalem sie z kanalu beta wiec mam tylko stabilne wersje) bramka wstaje znaaczniee dluzej niz wczesniej
  • jesli cierpliwie czekam az monitor podlaczony do bramki wyswietli informacje ze dostep zdalny aktywowany, mozna korzystac, bedzie test glosu etc - wszsytko dziala ok
  • natomiast jesli w trakcie “ladowania” sprobuje odswiezyc status bramki, zostanie wywolana automatyzacja lub zniecierpliwiony odpale pm2 - kaplica, bramka nie wstanie, pm2 sie crashuje

Ale to moze byc zupelny zbieg okolicznosci :slight_smile:

Nowy przypadek - nagle bramka przestala dzialac, tzn

  • nie mozna sie zalogowac poprzez www (ani z zewnatrz ani w ramach sieci lokalnej) -> 504 Gateway Time-out
  • interfejs bezposrednio na bramce tez nie dziala - na dole ekranu pojawil sie komunikat, ktory zazwyczaj sie wyswietla podczas restartowania HA “Utracono połączenie. Łącze ponownie…”

Mosquito oraz Node-RED wciaz dzialaja :slight_smile:

Logi z pm2 (ktory tym razem dziala) ponizej - wyglada jakby problemem bylo zigbee :confused:

[TAILING] Tailing last 1000 lines for [all] processes (change the value with --lines option)
/data/data/pl.sviete.dom/files/home/.pm2/pm2.log last 1000 lines:
PM2        | [2020-10-13 08:13:11] PM2 log: Stopping app:zigbee id:9
PM2        | [2020-10-13 08:13:11] PM2 log: pid=23070 msg=failed to kill - retrying in 100ms
PM2        | [2020-10-13 08:13:11] PM2 log: pid=23070 msg=failed to kill - retrying in 100ms
PM2        | [2020-10-13 08:13:11] PM2 log: pid=23070 msg=failed to kill - retrying in 100ms
PM2        | [2020-10-13 08:13:11] PM2 log: App [zigbee] with id [9] and pid [23070], exited with code [0] via signal [SIGINT]
PM2        | [2020-10-13 08:13:11] PM2 log: pid=23070 msg=process killed
PM2        | [2020-10-13 08:13:59] PM2 log: Stopping app:tunnel id:4
PM2        | [2020-10-13 08:14:00] PM2 log: App [tunnel] with id [4] and pid [4218], exited with code [0] via signal [SIGINT]
PM2        | [2020-10-13 08:14:00] PM2 log: pid=4218 msg=process killed
PM2        | [2020-10-13 08:14:00] PM2 log: Starting execution sequence in -fork mode- for app name:tunnel id:4
PM2        | [2020-10-13 08:14:00] PM2 log: App name:tunnel id:4 online
PM2        | [2020-10-13 08:14:38] PM2 log: Starting execution sequence in -fork mode- for app name:zigbee id:10
PM2        | [2020-10-13 08:14:38] PM2 log: App name:zigbee id:10 online
PM2        | [2020-10-13 21:05:59] PM2 log: Stopping app:zigbee id:10
PM2        | [2020-10-13 21:05:59] PM2 log: pid=22748 msg=failed to kill - retrying in 100ms
PM2        | [2020-10-13 21:05:59] PM2 log: pid=22748 msg=failed to kill - retrying in 100ms
PM2        | [2020-10-13 21:05:59] PM2 log: pid=22748 msg=failed to kill - retrying in 100ms
PM2        | [2020-10-13 21:05:59] PM2 log: App [zigbee] with id [10] and pid [22748], exited with code [0] via signal [SIGINT]
PM2        | [2020-10-13 21:05:59] PM2 log: pid=22748 msg=process killed
PM2        | [2020-10-13 21:06:50] PM2 log: Stopping app:tunnel id:4
PM2        | [2020-10-13 21:06:50] PM2 log: App [tunnel] with id [4] and pid [22252], exited with code [0] via signal [SIGINT]
PM2        | [2020-10-13 21:06:50] PM2 log: pid=22252 msg=process killed
PM2        | [2020-10-13 21:06:50] PM2 log: Starting execution sequence in -fork mode- for app name:tunnel id:4
PM2        | [2020-10-13 21:06:50] PM2 log: App name:tunnel id:4 online
PM2        | [2020-10-13 21:07:24] PM2 log: Starting execution sequence in -fork mode- for app name:zigbee id:11
PM2        | [2020-10-13 21:07:24] PM2 log: App name:zigbee id:11 online
PM2        | [2020-10-15 13:15:52] PM2 log: App [ais] with id [3] and pid [4101], exited with code [0] via signal [SIGKILL]
PM2        | [2020-10-15 13:15:53] PM2 log: App [tunnel] with id [4] and pid [29640], exited with code [1] via signal [SIGINT]
PM2        | [2020-10-15 13:16:23] PM2 log: Starting execution sequence in -fork mode- for app name:ais id:3
PM2        | [2020-10-15 13:16:23] PM2 log: App name:ais id:3 online
PM2        | [2020-10-15 13:16:23] PM2 log: Starting execution sequence in -fork mode- for app name:tunnel id:4
PM2        | [2020-10-15 13:16:23] PM2 log: App name:tunnel id:4 online

/data/data/pl.sviete.dom/files/home/NULL last 1000 lines:
/data/data/pl.sviete.dom/files/home/.pm2/logs/NULL last 1000 lines:
6|node-red | 15 Oct 13:36:40 - [info] [server:AIS-localhost] Connecting to http://127.0.0.1:8180
6|node-red | 15 Oct 13:36:45 - [info] [server:AIS-localhost] Connecting to http://127.0.0.1:8180

@jolka, jakies pomysly?

[Update] wyciagnalem dongle Zigbee z bramki, wlozylem ponownie i znow wyciagnalem

  • HA sie zrestartowal (nowe logi w zalaczniku)
  • nastepnie bramka tez sie zrestartowala, zerwalo mi polaczenie ssh
  • po restarcie znow problem z pm2 status / pm2 logs - jakies krzaki na konsoli

pm2_logs.txt (79,6 KB)

Moje pm2 logs, czy tak powinno być? (w międzyczasie był zanik prądu, logi się wyczyściły?):

Inna sprawa:
Adres IP, pod którym bramka myśli że jest, a tak naprawdę lokalnie działa tylko 192.168.1.94 :roll_eyes: zauważyłem też mocne spadki w użyciu dysku. Było wolne 0.9GiB. Przysiągłbym, że pamięci też było więcej w użyciu. Te akurat zmiany odbieram na plus :wink:

po wpisaniu pm2 logs powinienes widziec cos wiecej - moze nie od razu ale po kilku(nastu) sekundach.

Problemy z moja bramka byly juz na tyle powazne, ze urzadzenie przestalo byc uzyteczne. Pomogl pelny reset aplikacji. Od wczoraj wieczor (odpukac…) nic sie nie dzieje. Przywrocilem juz wiekszosc integracji, w tym HACS. Pozostalo kilka standardowych integracji do dodania. Bede je dodawal sukcesywnie, zobaczymy czy problem sie znow pojawi.

Dziś rano znów odnotowałem zawiechę bramki. Przerwy w dostawie prądu nie było. Nie mogę zalogować się do bramki lokalnie i zdalnie. Nie mam jak podłączyć teraz do niej monitora bez odłączenia jej od zasilania. Na routerze bramka jest zalogowana natomiast urządzenia w konsoli zgłaszają problem z brakiem połączenie z serwerem MQTT:

06:09:39 DNS: Usługa MQTT została znaleziona 192.168.1.94, Adres IP 192.168.1.94, Port 1883
06:09:39 AIS: Rozłączono.
06:09:39 MQT: Próba połączenia...
06:09:45 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:10:15 MQT: Próba połączenia...
06:10:20 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:10:51 MQT: Próba połączenia...
06:10:56 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:11:27 MQT: Próba połączenia...
06:11:32 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:12:03 MQT: Próba połączenia...
06:12:08 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:12:22 RSL: dom-XXX_3EB7C0/tele/STATE = {"Time":"2020-11-06T06:12:22","Uptime":"10T14:33:59","UptimeSec":916439,"Heap":23,"SleepMode":"Dynamic","Sleep":50,"LoadAvg":19,"MqttCount":46,"POWER":"ON","Wifi":{"AP":1,"SSId":"TendaNova","BSSId":"MA:CA:DR:ES","Channel":6,"RSSI":84,"Signal":-58,"LinkCount":9,"Downtime":"0T00:06:46"}}
06:12:39 MQT: Próba połączenia...
06:12:44 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:13:15 AIS: MQTT Host: 192.168.1.94
06:13:15 AIS: Wykrywam MQTT Host dla bramki: dom-XXX_3EB7C0
06:13:15 DNS: Usługa MQTT została znaleziona 192.168.1.94, Adres IP 192.168.1.94, Port 1883
06:13:15 AIS: Rozłączono.
06:13:15 MQT: Próba połączenia...
06:13:20 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:13:39 RSL: dom-XXX_3EB7C0/tele/HASS_STATE = {"Version":"8.1.0(tasmota)","BuildDateTime":"2020-01-31T08:17:16","Core":"2_6_1","SDK":"2.2.2-dev(38a443e)","Module":"Sonoff S2X","RestartReason":"Power on","Uptime":"10T14:35:16","WiFi LinkCount":9,"WiFi Downtime":"0T00:06:46","MqttCount":46,"BootCount":35,"SaveCount":4140,"IPAddress":"192.168.1.11","RSSI":"84","LoadAvg":19}
06:13:51 MQT: Próba połączenia...
06:13:56 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:14:27 MQT: Próba połączenia...
06:14:32 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:15:03 MQT: Próba połączenia...
06:15:08 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:15:39 MQT: Próba połączenia...
06:15:44 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:16:15 MQT: Próba połączenia...
06:16:20 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:16:51 AIS: MQTT Host: 192.168.1.94
06:16:51 AIS: Wykrywam MQTT Host dla bramki: dom-XXX_3EB7C0
06:16:51 DNS: Usługa MQTT została znaleziona 192.168.1.94, Adres IP 192.168.1.94, Port 1883
06:16:51 AIS: Rozłączono.
06:16:51 MQT: Próba połączenia...
06:16:56 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:17:27 MQT: Próba połączenia...
06:17:32 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:18:03 MQT: Próba połączenia...
06:18:08 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec
06:18:12 RSL: dom-XXX_3EB7C0/tele/STATE = {"Time":"2020-11-06T06:18:12","Uptime":"10T14:39:49","UptimeSec":916789,"Heap":23,"SleepMode":"Dynamic","Sleep":50,"LoadAvg":19,"MqttCount":46,"POWER":"ON","Wifi":{"AP":1,"SSId":"TendaNova","BSSId":"MA:CA:DR:ES","Channel":6,"RSSI":84,"Signal":-58,"LinkCount":9,"Downtime":"0T00:06:46"}}
06:18:39 MQT: Próba połączenia...
06:18:44 MQT: Nie udało się nawiązać połączenia 192.168.1.94:1883, rc -2. Spróbuj ponownie 30 sec

Moją uwagę zwrócił też wpis dotyczący połączenia wi-fi, a dokładniej downtime 0T00:06:46. Sprawdziłem logi na routerze ale jedyne co na nim znalazłem to odpytywanie przez urządzenia o adres ip. Na liście są urządzenia z tasmota. Wygląda na to, że problem z bramką zaczął się wczoraj ok. 22.30.

edit:
Pm2 logs po restarcie bramki (swoją drogą inicjalizacja trwała ponad 300 sekund, zwykle 40-kilka)

U mnie to samo. Po update bramka co 2-3 dni się zawiesza. Brak możliwości otwarcia panelu sterowania, SSH działa. Czasem restart nie pomaga. Dopiero czyszczenie bazy przez echo do pliku i ponowny restart. Karta sd klasy 10 SanDisk. Zmniejszyłem ilość logów do 2 dni i jest lepiej, ale zwiechy nadal się zdarzają.

Znowu podobna sprawa, tym razem sam restartowałem bramkę, ponieważ obraz z kamery się zawiesił (a restart kamery nie pomagał). Bramka się już nie uruchomiła. Brak dostępu lokalnego i zdalnego. Obecna na liście urządzeń routera. Pomógł reset po wyjęciu z gniazdka. Nie mam jej jak podłączyć do ekranu i TV bez zmiany lokalizacji, chyba będę musiał ją przenieść bliżej jakiegoś ekranu, żeby podłączyć pod hdmi w razie potrzeby. Trochę to zaczyna być irytujące…

Używasz wersji beta oprogramowania?

Nie, tylko stabilne. Z integracji też uważam, że nic nadzwyczajnego nie mam (spotify, tuya, fibaro i satel). Do tego dongle zigbee ze sklepu AIS.

Są opinie, że jest źródłem wielu problemów.

@Cezary.K słyszałem, ale nie sypie u mnie logami. To jedna z pierwszych integracji na bramce, a problemy zaczęły się niedawno. Mogę ją w sumie wyłączyć i sprawdzić bo mam tam raptem jedno urządzenie (zawór wody). Poszukam może uda się je przerobić na Tasmota :wink: byłoby najlepiej.

@Cezary.K, no i dzięki :slight_smile: nie sądziłem, że ten zawór pójdzie poprzez Tuya Convert, tym bardziej że był używany z apką Tuya od około 2 lat :slight_smile: Tak więc oficjalnie pozbywam się właśnie kolejnej integracji :slight_smile:

image

1 polubienie