Introducción
El aprendizaje automático es un tema de inteligencia artificial que utiliza datos sobre las poblaciones de indivíduos con enfermedades, animales y muestras de plantas para la investigación, así como equipos/componentes del sistema e incluso datos financieros para realizar clúster, clasificación y predicción basadas en modelos matemáticos, en su mayoría apoyados por algoritmos informáticos.
Considerando la ingeniería de mantenimiento, la aplicación de aprendizaje automático se aplica para la clasificación de criticidad del equipo, predicciones de regresión de fallas y la estrategia de mantenimiento más avanzada, llamada Prognostic Health Management (PHM).
El PHM tiene por objeto definir la vida útil restante del equipo (RUL) y el estado de salud (SoH) sobre la base de datos en línea o de testes no destructivos mediante la medición de factores estresantes como la vibración, la tensión, la temperatura, humedad y otros parámetros físicos que degradan el equipo hasta la falla funcional.
Los conceptos detrás del aprendizaje automático es utilizar las características de los datos para agrupar, clasificar o predecir la futuras respuesta de las variables. Con el fin de clasificar y predecir la respuesta de los datos, el modelo de aprendizaje automático divide el conjunto de datos en los datos de entrenamiento (~70% de los datos) y los datos de prueba (~30% de los datos). El paso siguiente es aplicar un algoritmo a los datos de entrenamiento para el proceso de aprendizaje y luego salir con un modelo. El modelo se aplicará a los datos de prueba y se verificará el resultado. Si el resultado es satisfactorio, el nuevo conjunto de datos puede utilizar el mismo modelo definido sobre la base del conjunto de datos anterior para hacer predicciones y si el resultado es satisfactorio, el modelo se valida. El aprendizaje automático se puede realizar por diferentes métodos que se explicarán más a fondo. Los pasos generales del proceso de aprendizaje automático se describen en la figura 1.
Aprendizaje Automático No Supervisado
El Aprendizaje Automático No Supervisado tiene como objetivo definir un patrón en el conjunto de datos sin conocimiento previo de las características de los datos. Por lo tanto, la primera comprensión de su conjunto de datos puede comenzar aplicando los métodos de Aprendizaje Automático No Supervisado para entender cómo se puede organizar su conjunto de datos y si hay un patrón de tal conjunto de datos basado en sus variables independientes.
Los conceptos detrás del Aprendizaje Automático No Supervisado es agrupar un conjunto de datos sin conocer la clasificación previa o cualquier información sobre los datos. Para agrupar los datos, el Apredizaje Automático No Supervisado modela el conjunto de datos e intenta organizarlo en un clúster. El paso posterior verifica el resultado y, finalmente, Si el resultado es satisfactorio, el nuevo conjunto de datos se puede utilizar el modelo definido sobre la base del conjunto de datos anterior y luego el modelo se valida. Los pasos generales del proceso de Aprendizaje Automático No Supervisado se describen en la figura 2.
Considerando la ingeniería del mantenimiento, el tipo de datos relacionados con el equipo abarca las características físicas, así como el rendimiento, el costo de las operaciones, el costo del mantenimiento preventivo, el mantenimiento correctivo y el costo de las piezas de repuesto. Por lo tanto, al definir algunas de estas variables, es posible agrupar equipos con características similares. De hecho, la organización de datos basada en sus características comunes es el concepto detrás de los datos agrupados que es el resultado de tales métodos de Aprendizaje Automático No Supervisado como muestra la figura 2.
Los modelos de Aprendizaje Automático No Supervisados más comunes utilizados para la agrupación de los datos son:
- Principal Component Analysis;
- Multidimensional Scaling;
- K – Means;
- Gaussian Mixture;
- Hierarchical Clustering;
- Neural Network Self-Organized Map.
The Principal Component Analysis (PCA) es un método tiene como objetivo reducir el número de variables del espacio multidimensional (múltiples variables independientes) a un espacio unidimensional o bidimensional (variables independientes) y definir las variables que tienen más influencia en la variabilidad de los datos.
The Multidimensional Scaling (MDS) tiene como objetivo reducir el número de variables del espacio multidimensional (múltiples variables independientes) a un espacio unidimensional o bidimensional (variables independientes) y definir las variables que tienen más influencia en la variabilidad de los datos. Sin embargo, el MDS permite la reducción de la complejidad de la visualización del espacio multidimensional en uno o espacio bidimensional con respecto a la distancia de pares entre los puntos.
El método K-Means tiene como objetivo organizar un conjunto de puntos de datos en k clústeres diferentes considerando los k centroides diferentes y agrupar los datos más cercanos a cada k centroides.
El método Gaussian Mixture tiene como objetivo organizar los datos en función de la distribución gaussiana de cada clúster en el que cada dato encaja mejor. La suposición principal de este modelo es que todos los clústeres K son los clústeres de conjuntos de datos normales distribuidos.
The Hierarchical Clustering tiene la intención de agrupar el conjunto de datos definiendo la distancia de emparejamiento entre los puntos y basándose en esa distancia agrupar los datos en diferentes niveles de clúster.
The Neural Network Self-Organized Map (SOM) agrupa los datos basados en el peso definido por la Red Neuronal a cada Neurona considerando el punto de la base de dato más cercano a cada neurona. Los principios de SOM son, básicamente, dados datos observados, la neurona más cercana se define, entonces la neurona se mueve más cerca de los datos observados. Así, el proceso se repite de nuevo mediante la selección de datos aleatórios del conjunto de datos.
La figura 3 muestra el concepto principal de organizar un conjunto de datos en clústeres que se pueden aplicar para la planificación de mantenimiento, optimización considerando el resultado de la Vida Útil Restante (RUL) y la Progresión de Degradación (DPS) de un grupo de equipos.
Aprendizaje Automático Supervisado de Clasificación (SMLC)
El Aprendizaje Automático Supervisado tiene como objetivo clasificar los datos de predicción basados en el conocimiento previo de un conjunto de características de datos. Por lo tanto, el SML se puede dividir en dos categorías como Clasificación y Regresión.
El modelo de Aprendizaje Automático Supervisado de Clasificación (SMLC) tiene el objetivo principal de clasificar los datos basados en las características observadas previamente en un conjunto de datos. Por lo tanto, se aplica para clasificar la criticidad del equipo nuevo, el riesgo, el alto rendimiento, los malos actores, y otra clasificación aplicada en el campo del mantenimiento. La principal ventaja de este enfoque es clasificar un gran número de datos basados en los modelos SMLC que permiten ahorrar la enorme cantidad de tiempo dedicado a estas atividades de clasificación, así como definir alarmas de alerta basadas en la clasificación de criticidad de equipos y componentes. Los modelos SMLC más comunes son los siguientes:
- K-Nearest Neighbor (K-NN);
- Decision Tree Classification;
- Naïve Bayes;
- Linear Discriminant Analysis;
- Support Vector Machine;
- Neural Network Classification;
- Logistic Regression Classification.
Los pasos generales de la Clasificación Supervisada de Aprendizaje Automático se describen en la figura 4.
En cuanto a la aplicación de mantenimiento, las características del equipo como la criticidad, el riesgo, el alto rendimiento, los malos actores y otras clasificaciones permiten a los líderes de mantenimiento priorizar los equipos para planear el mantenimiento preventivo. Además, el SMLC también permite definir los niveles límite de alerta para ser parte del programa PHM. La figura 5 muestra un ejemplo de SMLC aplicado a la clasificación de la criticidad del equipo basado en el nivel de vida útil restante (RUL) y vibración (RMS). Este ejemplo muestra la definición de diferentes niveles de criticidad, como crítica (C), moderada (M) y baja (L).
Aprendizaje Automático Supervisado de Regresión (SMLR)
El Aprendizaje Automático Supervisada de Regresión (SMLR) tiene el objetivo principal de predecir y pronosticar valores futuros de datos de variables dependientes basados en las variables independientes que son características de equipo/componente del conjunto de datos pre-observados. Por lo tanto, se aplica para predecir el valor de la variable de proceso, Vida útil restante (RUL), Estado de salud (SoH) y otros parámetros utilizados en el campo de mantenimiento. La principal ventaja de este enfoque es predecir los valores de los parámetros automáticamente sobre la base de los datos históricos actuales. Por lo tanto, los modelos SMLR permiten ahorrar la enorme cantidad de tiempo dedicado a esa actividades, así como para vincular los datos del sensor a los modelos PHM para predecir el equipo y componente RUL y SoH. Los modelos SMLR más comunes son los siguientes:
- Linear Regresión;
- Ridge and Lasso Regresión;
- Stepwise Linear Regresión;
- Gaussian Regresión;
- Decision Tree Regresión;
- Support Vector Machine Regresión,
- Neural Network Regresión (NNR).
Las etapas generales del proceso del SMLR se describen en la figura 6.
En cuanto a la aplicación de mantenimiento, la variable independiente del equipo como temperatura, humedad, rotación, vibración y otras variables medidas por el sensor, así como la medición de la degradación como la corrosión, la erosión por Prueba No destructiva se puede utilizar como entrada para predición del RUL, SoH y otros parámetros de mantenimiento. La figura 7 muestra un ejemplo de predicción RUL basada en la degradación de la temperatura (TDPS).
Antes de terminar la parte teórica de este trabajo, es importante destacar un concepto importante aplicado al aprendizaje automático, que es el sobreajuste. Como hemos mencionado antes, al realizar la clasificación o regresión de Aprendizaje Automático Supervisado, es necesario dividir el conjunto de datos en entrenamiento (70%) y los datos de prueba (30%). Cada vez que el modelo se ajusta demasiado de los datos con muy alta precisión o muy bajo error, decimos que el modelo está sobreajustado. Dado que el objetivo principal es crear un modelo general, que se puede aplicar a nuevos datos, el sobreajusteo no es bueno para crear un modelo general.
El otro concepto importante es el Bias y la Varianza. El bias es la incapacidad de un modelo de aprendizaje automático para capturar la verdadera relación entre las variables (dependientes e independientes). La varianza es la diferencia entre los datos de entrenamiento y los datos de prueba (o nuevos datos) de ajuste. El modelo de sobreajuste presenta un bias bajo pero una alta varianza. El subajuste es el contrario de los conceptos de sobreajuste y en este caso el modelo presenta un alto bias pero baja varianza.
La compensación entre la clasificación simple y compleja y los modelos de regresión es encontrar el modelo que realiza resultados con bajo bias y baja varianza.
De hecho, en la medida de lo posible, tratamos de encontrar el modelo con bajo bias y baja varianza, pero es habitual tener algún error en la clasificación y predicción de regresión.
El Métodos de Aprendizaje Automático No supervisado: Hierarchical Cluster
El método Hierachical Cluster tiene como objetivo agrupar el conjunto de datos definiendo la distancia de pares entre los puntos y en base a dicha distancia el algoritmo agrupa los datos en diferentes clústeres. Inicialmente, cada punto de datos observado está vinculado en base a la distancia del par, que permite que los datos del grupo en diferentes clústeres hasta que el conjunto de datos se divide en tres, dos y un clúster.
La figura 8 muestra la idea detrás del método Hierachical Cluster. El eje horizontal (X) representa las conexiones entre diferentes puntos y el eje vertical (Y) representa la distancia entre cada conexión. Al mirar la distancia más grande entre los grupos de la parte superior a la parte inferior de la figura 8, podemos ver grupos potenciales, como muestra el nivel tres en el centro de la figura donde tres grupos están claramente definidos. El método Hierachical Cluster se puede definir en base a los siguientes pasos:
- Elegir el método para calcular la distancia mínima entre los puntos.
- Fusionar sucesivamente los cúmulos más cercanos.
- Crear el dendrogram para mostrar la definición del clúster.
La distancia entre los puntos son calculadas por:
El “Single Linkage” cuenta la distancia mínima entre los puntos representados por:
El “Complete linkage” cuenta la distancia máxima entre los puntos representados por:
El “Mean distance” cuenta la distancia media entre los puntos representados por:
El “Centroid” cuenta la distancia entre los centroides de clúster representados por:
Es importante notar que tales diferentes métodos desencadenarán diferentes grupos de clústeres dependiendo de la naturaleza de su conjunto de datos. El método de distancia más común utilizado es la «Distancia mínima», pero de hecho, el método utilizado depende del algoritmo aplicado en la solución de software de clúster jerárquico. Para demostrar el método Hierarchical Cluster, se presentará un estudio de caso considerando dieciséis intercambiadores de calor con cuatro ventiladores cada uno. Vamos a considerar que tales refrigeradores de aire tienen cuatro ventiladores cada uno. Basado en el programa PHM, todos los rodamientos de ventiladores están siendo monitoreados en base a la vibración en línea y la Vida Útil Restante (RUL), así como la Degradación (DPS). La tabla 1 muestra los valores resumidos de la situación actual basados en la última medición. Los ventiladores del aire se identifican por dos números; el primer número es el número del refrigerador del aire y el segundo número es el número del ventilador en este refrigerador del aire. El reto para el equipo es planificar la intervención preventiva basada en diferentes niveles de degradación (DPS) y RUL. Por lo tanto, el modelo Hierarchical Cluster tiene como objetivo organizar el conjunto de datos y destacar el grupo de ventiladores que deben ser detenidos primero para la intervención preventiva basada en los valores DPS y RUL.
La figura 9 muestra el resultado dendrogramas de la distancia mínima par de cada punto en el conjunto de datos representado por los refrigeradores de aire considerando el DPS y RUL. Los tres cúmulos principales se pueden visualizar de izquierda a derecha en el segundo nivel del dendrograma. El primer clúster tiene 1.6 valores en el eje y. El segundo clúster tiene valores por debajo de 1.2 en el eje y y el tercer clúster tiene valores un poco por encima de 1.2 en el eje y.
Basado en la figura 10 podemos ver el primer clúster en la parte superior en el lado izquierdo que representan los ventiladores menos críticos con una baja criticidad que tiene menor DPS (20% ≤DPS≤30%) y mayor RUL (9 months≤RUL≤13 months). El segundo grupo en el centro en el lado izquierdo representa los ventiladores con criticidad moderada, con DPS medio (25%≤DPS≤40%) y RUL alto (6 meses ≤ RUL≤ 8 meses). El tercer clúster en la parte inferior a la derecha representa los ventiladores con alta criticidad, con DPS alto (45%≤DPS≤90%) y RUL bajo (1mes ≤ RUL≤ 4 meses).
Algunos de estos ventiladores pertenecen a los mismos refrigeradores de aire y otros no. Sin embargo, la idea no es centrarse en el refriador de aire más crítico, sino en los ventiladores más críticos. Al hacer eso, siempre que un ventilador clasificado en el clúster más crítico, el grupo de ventiladores se apaga para el mantenimiento preventivo, los otros dos ventiladores en la segunda línea del refrigerador de aire seguirá funcionando y evitar la pérdida total de producción.
Una característica importante que necesita ser increíblemente cuidadoso cuando estamos mirando un gráfico de clúster son los puntos ubicados en los límites entre dos clústeres. En realidad, podemos ver que cuando estamos mirando en el centro de la figura 10. Los límites entre el clúster situado en el lado derecho, con bajo RUL y alto y medio DPS y el segundo clúster con medio DPS y medio RUL demuestran una decisión de conflicto. Depende del experto en mantenimiento, pueden considerar los ventiladores con RUL (6 meses) y DPS (0.4) junto con el primer clúster para el mantenimiento preventivo.
Por otra parte, dando una buena mirada a la figura 10, el experto en mantenimiento puede definir el punto en cuatro grupos dividiendo el grupo crítico con RUL Bajo (4 meses) en otros dos grupos. Uno con DPS superior al 70% y el otro con valor DPS entre el 40% y el 60%.
Asi, es necesario investigar si realmente tiene sentido tener un grupo de ventiladores críticos con intervención preventiva en los próximos dos meses y el otro grupo dos meses después o si es mejor realizar la intervención preventiva en todos los ventiladores como un grupo como definido en la figura 10. La mayor ventaja del método Hierarchical Cluster en comparación con otros métodos discutidos hasta ahora es la visualización perfecta de otro posible clúster basado en el diagrama de dendrograma.
Sin embargo, el concepto de clúster sigue siendo el mismo y, al final, una buena imagen de los fans más críticos que necesitan tener la intervención preventiva está muy bien definida.
Como se mencionó anteriormente, es especialmente importante ser consciente de la dinámica de los campos de operación que pueden salir con un RUL diferente datos de entrada y desencadenar el Hierarchical Cluster algoritmo produce una configuración de clúster diferente algunas semanas después de la primera preventiva plan de mantenimiento definido en función del primer resultado del clúster debido a la intensidad de la degradación que puede cambiar entre los ventiladores. En realidad, la actualización de la información (RUL vs DPS) va a ocurrir a lo largo del tiempo. Por lo tanto, los ventiladores definidos en el clúster crítico serán reparados y un nuevo grupo de ventiladores saldrá en diferentes grupos de clúster en el futuro próximo. Asi, los otros dos grupos anteriores se actualizarán y tendrán un nuevo DPS peor y límites RUL menores.
Conclusión
Después de la implementación del Método de Aprendizaje Automático No Supervisado Hierarchical Cluster, llegamos a algunas conclusiones sobre las ventajas e inconvenientes que son los siguientes:
Las ventajas del método Hierarchical Cluster son:
- No es necesario definir el número inicial de grupos.
- Fácil de implementar mediante la aplicación de los métodos de cálculo de distancia.
- Visualización de resultados fácil basada en el gráfico dendrogram.
Los inconvenientes del método Hierarchical Cluster son:
- Los métodos de cálculo de distancia tienen alta incluencia em el resultado depende de cómo se muestran los puntos de datos distribuídos en el espacio.
En general, las ventajas de la aplicación Machine Learning son:
- La clasificación de datos es muy rápida basada en el modelo definido por el conocimiento de la clasificación de conjuntos de datos anteriores. Dicha clasificación ahorrará el enorme esfuerzo de clasificar los datos sobre la base del número de prioridad de riesgo en base diaria, así como otro tipo o criterios de clasificación.
- El predicción de la vida útil restante sobre la base de datos anteriores para anticipar el fallo futuro cuando el equipo está operando por encima de sus límites de diseño de operación condición y degradarse antes del tiempo esperado.
- Agrupar equipos en diferentes clústeres en función de sus características comunes y permitir la optimización del plan de mantenimiento preventivo, optimización del plan de revisión y la prioridad definida para el grupo de equipos críticos.
- Basado en el reconocimiento de imágenes, el equipo dañado da una alerta para el control de las líneas de producción o incluso para los equipos de mantenimiento e inspección cuando se instalan cámaras y se integran con soluciones de aprendizaje automático profundo.
La desventaja del aprendizaje automático radica en la complejidad y la alta demanda de diferentes conocimientos, tales como:
- Requiere un conocimiento matemático profundo para entender los métodos de aprendizaje automático.
- Requiere una habilidad de programación para usar software de aprendizaje automático como MATLAB o incluso una habilidad de programación profunda para crear algoritmos variados como Python, R y otros.
- Requiere un conocimiento de mantenimiento para tener una comprensión clara de la variable a medir por los sensores, instalado el sensor correctamente, entender los datos del sensor y
- Requiere una comprensión clara acerca de las piezas críticas de mantenimiento, modos de fallo, causa para crear una etiqueta de clasificación adecuada.
Referencias
- Amnon Shashua. Introduction to Machine Learning. 67577 – Fall, 2008. School of Computer Science and Engineering. The Hebrew University of Jerusalem. Jerusalem, Israel.
- Calixto. E. Gas and Oil Reliability Engineering: Modelling and Simulation. Second edition, Elsevier ISBN: 9780123919144 – (Release in 26 May2016). http://store.elsevier.com/Gas-and-Oil-Reliability-Engineering/Eduardo-Calixto/isbn-9780128054277/.
- Calixto, Eduardo. Integrated Asset Integrity Management: Risk Management, Human Factor, Reliability and Maintenance integrated methodology applied to subsea case. ESREL 2015.Zürich,Switzerland. 2015 Taylor & Francis Group, London, ISBN 978-1-138-02879-1
- Calixto. E. Artificial Intelligence for Maintenance 4.0. First edition, AMAZON ISBN: ISBN: 9798672601021 (Release in 02 August 2020).
- Daniel Géron. Machine Learning for Beginners: A Step-by-Step Guide to Learning and Mastering Machine Learning for Absolute Beginners with Real Examples.
- EFNMS Asset Management Survey. ESREDA conference. Porto,Portugal, May 2013 http://www.efnms.org/mod/newsarchiv/view/cp-m10/newsmeldung-28
- Guidelines for Vibrations in Reciprocating Compressor Systems, European Forum Reciprocating Compressors (EFRC), 2009.
- Goodman, Douglas. Prognostics and Health Management: A Practical Approach to Improving System Reliability Using Condition-Based Data (Wiley Series in Quality & Reliability Engineering). 2019.
- ISO 55002 standard, 2014. http://www.bsigroup.com/en-GB/search-results/?q=ISO+55002.
- Jos Luis Rojo-lvarez; Manel Martnez-Ramn; Jordi Muoz-Mar; GustauCamps-Valls, ”Support Vector Machine and Kernel Classification Al-gorithms,” in Digital Signal Processing with Kernel Methods, IEEE,2018, pp.433-502.[17]
- PAS 55 standard, 2008. http://www.bsigroup.com/en-GB/search-results/?q=PAS+55
- Paul Wilmott Machine Learning: An Applied Mathematics Introduction (English Edition).Pnada Ohana Publishing, 2019.
- Phil Kim, MATLAB Deep Learning: With Machine Learning, Neural Networks and Artificial Intelligence. APRESS. Juni 2017.
- Stuart Russell und Peter Norvig. Artificial Intelligence: A Modern Approach, Global Edition Pearson. Mai 2016
- https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw
- https://www.youtube.com/channel/UCNU_lfiiWBdtULKOw6X0Dig
- https://www.youtube.com/channel/UCOgKur3rytBtcKkNrBMiRZQ
- https://www.enkelt.co.uk .2017.
- https://www.ridgetopgroup.com/products/advanced-diagnostics-and-prognostics/sentinel-motion/railsafe-integrity-analysis-system/
- https://www.maximocon.com, 2018.
Fuente Libro: Artificial intelligence for Maintenance 4.0
Autor: Dr. Eduardo Calixto
Sitio Web: ecduardocalixto.com