Momento pánico con Home Assistant

00:00 /08:44

Os cuento el problema que he tenido con Home Assistant que me ha dejado 35 dispositivos inaccesibles y cuánto tiempo me ha costado volver a tener el sistema online.

Addon de Google Drive Backup para Home Assistant: https://github.com/sabeechen/hassio-google-drive-backup

A mi me podéis seguir en Twitter como csahuqui, escribirme por Telegram o poneros en contacto conmigo a través del blog. Un abrazo y hasta el siguiente capítulo!

Transcripción


Hola a todos, muy buenos días y bienvenidos de nuevo a Domótica Compatible. Hoy quiero compartir con vosotros el momento pánico que he tenido estos días, porque resulta que estaba tan tranquilo en Valencia durante el último fin de semana largo, y vi que los dispositivos que me llegan a casa, a la aplicación casa desde Home Assistant, estaban sin respuesta. Que, bueno, entré en Home Assistant, parecía estar todo bien, pero vi que tenía una alerta de la última copia de seguridad, ya sabéis que utilizo el add on para home assistant de Google Drive Backup, que es una auténtica maravilla. Os pondré el enlace en las notas del programa porque si alguno no lo utiliza, pues debería utilizarlo ya, es un es un más, es un más. Pero bueno, el caso es que en este add on había un error porque la última copia había dado, pues eso, había dado un error, no se había completado correctamente.

Y era un error de conexión con Google, con la cuenta de Google o de que me hubiera quedado sin espacio en Drive o yo qué sé. Era un error de IO, es decir, un error de entrada y salida. Y eso da mucho miedo. Normalmente significa, pues, que hay un error en el disco o en la controladora o algo así. En cualquier caso, como soy idiota, pensé que un reinicio completo podría solucionar el problema, y nada más lejos de la realidad.

O sea, en cuanto lo se reinició, el NOOG dejó de responder y nunca más volvió a la vida. En fin, después de esta pequeña introducción, que parece el falso inicio de esto de nadie sabe nada, os voy a contar cómo lo he arreglado y cuánto me ha costado tener el sistema de nuevo online. Yo soy Carlos Souquillo y comenzamos. Bueno, pues, como sabéis, siempre he dicho que lo que menos me gusta de Home Assistant es su falta de configuración en alta disponibilidad. Al final, todo depende del sistema donde tengas instalado Home Assistant, que puede ser un PC viejo que tengas por casa, un NAS de esos que alguno tenéis en casa, porque es unos piratones.

No conozco a nadie que tenga un NAS que lo utilice solo para hacer backup de sus fotos y sus sus documentos, pero pero bueno. El caso es que Home Assistant también se puede instalar, pues eso, en un NAS, en una Raspberry Pi, a partir del modelo tres ya funciona realmente bien, o en un NOOOK, como lo tengo yo. Pero sí, solo en uno, o sea, no puedes tener una instalación de home assistant en un NOOOK, y además también en el NAS o en un API o en otro dispositivo, para que, en caso de que algo falle, un reinicio o lo que sea, pues todo tu sistema siga funcionando. Hay por ahí algunas aproximaciones de gente que lo que hacen es poner la base de datos de Home Assistant sobre una base de datos estándar SQL, una MaríaDB, por ejemplo, y almacenar en, pues, en algún sistema de archivos compartido en un NFS o algo así, para que sea accesible por dos instalaciones. Y eso es estupendo, o sea, me parece genial, pero al final el pincho Zigbee o el Sky Connect o lo que tengas directamente en el pinchado a Home Assistant, lo vas a tener pinchado solo a uno de los dos.

Que sí, que si uno falla simplemente tendrías que coger el pincho y llevártelo al otro dispositivo y ya está. O sea, al final los dispositivos conectados detectarán que la dirección física del pincho Zigbee, que es como una especie de Mac adress, pues es la misma. Así que que bueno, se conectarán sin saber qué host hay detrás y a dónde está pinchado ni nada, o sea, no no hay ningún problema. Pero claro, incluye un trabajo manual, o sea, en mi caso desde Valencia, pues tampoco lo podría haber hecho. En homekit, sin embargo, esto no es así.

Si tienes dispositivos conectados directamente con homekit por WiFi o por thread y se cae un homepod, pues bueno, si tienes varios homepods, pues no pasa nada, o sea, ni siquiera tienes un corte, ni un aviso, ni nada. Si se te estropea el Apple TV, pero tienes además algún homepod en casa, pues el sistema directamente balancea la central de dispositivos de uno a otro de forma completamente transparente para el usuario. Ya os digo, ni siquiera recibimos una alerta o vemos que algo no funciona. Está claro que, bueno, que si te te casca el router de Internet, pues está faque, ¿no? Pero incluso en ese caso puedes tener varios routers mesh, como es mi caso.

Yo tengo varios euro y hay veces que alguno ha fallado, se ha reiniciado por lo por el motivo que fuera o porque alguien ha quitado el enchufe, que es lo más habitual, y el resto, pues, siguen funcionando y cogen el control de todos los dispositivos WiFi, o sea, es transparente también para el usuario. Obviamente si tienes un bridge comercial, esto no es así, si tienes por ejemplo el bridge de Hugh o de a cara y se estropea, pues las bombillas se quedan sin conexión y no hay más. Y además es que con el de Hugh pasa una cosa, que si tú te compras otro, yo en un momento tuve dos para hacer distintas pruebas, porque además cada uno solo soportaba cincuenta dispositivos y tal. Pues bueno, si tienes dos, no puedes emparejar todas las bombillas con los dos para que si uno se estropea, el otro lleve el control. O sea, cada uno tiene sus bombillas asociadas y no las comparten con el otro dispositivo.

Así que si te casca uno de los bridge, pues bueno, las bombillas que tienes asociadas con ese no van a funcionar, pero el resto sí, ya os digo, todo muy loco, todo muy loco. Pues eso básicamente es lo que me ha pasado a mí este fin de semana, cuando el Nuk dejó de responder todos los dispositivos que llegan a home kit, que me aparecen en la aplicación casa, pero que llegan ahí, pues eso, directamente desde home assistant, dejaron de responder. Treinta y cinco, ni más ni menos. Los dispositivos Matter, claro, no se enteraron, directamente se podían seguir gestionando desde la aplicación casa sin ningún problema, igual que que los que son homekit nativos, pero bueno, pero todos los que son ZIPBI que necesitan un bridge, pues se fueron al carajo. El caso es que cuando volví a casa después de unos días de pánico en niños, lección aprendida, no reiniciéis nunca home assistant si no estáis cerca para darle botonazo o vigilar que todo arranque como toca.

Bueno el caso es que yo conecté el nook a un monitor y vi pues que no arrancaba ¿no? Esto fue ayer y directamente le leí un mensaje que no había encontrado ninguna unidad botable. Lo primero que pensé es bueno que el disco había cascado ¿no? Como pasaba antiguamente, es verdad que es un buen disco, además es un disco ssd, no es una tarjeta de memoria, que ya sabéis que las tarjetas de memoria con home assistant puede darnos problemas porque tanta escritura y lectura de logs y demás, pues al final acaban cascando, pero no, en mi caso es un buen disco SSD. Así que, bueno, he abierto el Nuk, he mirado que estuviera bien conectado, por si acaso, bueno, pues había lo vivido algún problema y se había desconectado, no le llegaba bien la corriente o lo que sea, y después he arrancado el sistema con un USB bootable de estos de Linux que tengo con Kali y Linux para, bueno, para mis cosas.

Y he visto que, bueno, que desde allí sí que se veía perfectamente el disco, reconocía todas las particiones, he hecho los chequeos a todas las particiones y decía que estaba todo correcto, pero el caso es que no arrancaba. Parece que había habido algo algún problema con la partición de arranque y el sistema reconocía todas las particiones, pero no detectaba ninguna como como de arranque. Así que bueno, me he descargado desde ahí mismo, desde Kali, me he descargado la imagen del sistema operativo de home assistant y el instalado desde cero. Después he arrancado con home assistant completamente virgen, recién instalado, he descargado el add on este de Google Drive Backup que os decía y restaurado la copia de seguridad, una vez que se ha conectado con mi cuenta de Google, he restaurado la copia de seguridad, y al reiniciar ya estaba todo funcionando sin problemas, o sea, la verdad que ha sido algo bastante rápido. El proceso en sí me ha costado, yo creo que menos de una hora.

Claro, una vez identificado el problema, o sea, una vez identificado el problema, ha sido todo bastante rápido, pero la incertidumbre de no saber por qué ha pasado, pues es algo que que me jode bastante, ¿no? Que me dice que mañana no va a volver a pasar o la semana que viene, yo que sé, y que además es que puedes hacer nada, o sea, no es algo que puedas ver un aviso y tal. O sea, en mi caso, cuando he visto el error este en el log del de la copia de seguridad, pues ya estaba ahí el problema y al reiniciar, pues no no podía haberlo solucionado de ninguna forma. Es verdad que, bueno, podría tener otro noob preparado para que simplemente, pues como decíamos antes, ¿no? Haya que mover el dispositivo Zigbe, el pincho, el Sky Connect o lo que sea y restaurar backup.

Pero claro, no es una solución automática ni ni muchísimo menos. Así que bueno, esto me ha servido para, bueno, primero para para probar el protocolo de recuperación, todo el procedimiento, a ver si estaba bien definido y funcionaba como toca, y sobre todo para reafirmarme en la idea de seguir abrazado a HomeKit. Voy a ir renovando los dispositivos poco a poco por dispositivos Matter, voy a flashear los Shelley que me quedan con HAA para poder ir eliminando dispositivos de home assistant, o bueno, por lo menos que sea HomeKit, que los publique en Home Assistant, que se puede hacer en esa dirección, por aquello de tenerlos en dos plataformas distintas y poder hacer pruebas y eso, pero no, no al revés, no al revés, o sea, no no los voy a publicar desde home assistant en home kit en cuanto pueda evitarlo. Es verdad que solo me ha costado una hora de reparar, pero bueno, no os imagináis los sudores fríos y el miedo que he tenido en las últimas horas, cada vez que mi mujer se acercaba a un interruptor, que que sabía que no iba a funcionar si lo tocaba, Vamos, vamos, yo yo esos ratos no se los deseo ni a mi peor enemigo.

En fin, chicos, recordad que tenéis los artículos completos en el blog Sauquillo punto org, ya sabéis, con h intercalada entre la a y la u y toda la pesca. Invitaros al grupo de Telegram, hemos estado comentando por allí la petada durante las últimas horas, y además, bueno, veréis cómo cubrir alguna necesidad que en realidad no tenéis, ya sabéis. A mí me podéis seguir en Twitter o en x, como se quiera llamar, como cesauki, escribirme por Telegram o poneros en contacto conmigo a través del blog. Un abrazo y hasta el siguiente capítulo, hasta luego.

Episodios recientes