Recogida automática de eventos de vaciado acústico en casa con Machine Learning at the Edge

Autores: Laura Arjona, Girish Narayanswamy, Sergio Hernandez, Alfonso Bahillo, y Shwetak Patel.

Presentamos Auto-Flow, una prueba de concepto de plataforma acústica basada en Raspberry Pi que ejecuta un novedoso modelo de clasificación de aprendizaje automático para detectar y registrar eventos miccionales de forma automática y sin intervención del usuario.

La uroflujometría es una prueba diagnóstica no invasiva que evalúa el funcionamiento del tracto urinario. En la actualidad, la uroflujometría presenta dos limitaciones principales: (i) la elevada variabilidad de los parámetros de flujo entre sujetos y (ii) la incapacidad de reproducir el proceso natural de micción, ya que el paciente debe orinar a demanda. Para abordar estas dos limitaciones, una posible solución es realizar varias uroflujometrías a cada paciente cuando esté paciente esté fisiológicamente preparado. Para lograr este objetivo, hemos desarrollado una plataforma de bajo coste que detecta y registra que detecta y registra automáticamente los eventos miccionales en una rutina diaria normal que no requiere intervención humana. En primer lugar, creamos un conjunto de datos acústicos con sonidos que probablemente se produzcan en un cuarto de baño doméstico. en un cuarto de baño doméstico. A continuación, utilizamos el conjunto de datos para entrenar y evaluar cuatro modelos de aprendizaje automático y un modelo de clasificación de aprendizaje profundo para la detección automático de vacíos a partir de la energía acústica. Nuestros resultados muestran que el modelo modelo Gradient Boost ejecutado en una Raspberry Pi Zero 2 W presenta los mejores resultados en cuanto a la precisión de clasificación (95,63%) y el tiempo de inferencia (0,15 segundos).

Diagrama simplificado de la operación de la plataforma:

Para desplegar la plataforma presentada, hemos seleccionado el clasificador Gradient Boost utilizando 40 coeficientes MFCC como de entrada. Este modelo es el preferido porque proporciona unos resultados con una tasa de falsos negativos relativamente baja (1,23%), al tiempo que ofrece la mayor precisión de clasificación (95,63%), un tamaño de modelo relativamente bajo (73 KB) y un tiempo de inferencia reducido en comparación con el resto de modelos evaluados. En cuanto a los sistemas embebidos evaluados, nuestro firmware es capaz de ejecutarse en cualquiera de los tres dispositivos analizados. Analizando los resultados del tiempo de inferencia (menos de 0,2 seg con el RPi Zero 2 W), el factor tamaño y el coste, hemos decidido utilizar el RPi Zero 2 W para su despliegue.

Los resultados muestran que, para un dispositivo integrado concreto, el modelo de modelo de aprendizaje profundo es el que más tiempo tarda en ejecutar la inferencia, mientras que el modelo de regresión logística es el que menos tarda. Estos resultados tienen una relación lineal con el tamaño del modelo utilizado: los modelos más ligeros tienen un tiempo de inferencia menor. Analizando los modelos ML tradicionales, el Random Forest es el más lento, seguido del clasificador Gradient Boost. Comparando los tres dispositivos embebidos diferentes, el RPi Zero W (color gris) es considerablemente más lento que los otros dos dispositivos para cualquier modelo dado.