Machine learning

Table of Content

Table of Content

Table of Content

Clasificación

🧩 ¿Qué es?

La clasificación es un tipo de algoritmo de Machine Learning supervisado que permite predecir a qué categoría o grupo pertenece un nuevo dato, basándose en ejemplos previos. Funciona de forma similar a cómo una persona clasifica correos como “spam” o “no spam” después de haber aprendido cómo suelen lucir los correos no deseados.

En términos simples, un modelo de clasificación aprende observando un conjunto de datos que ya están etiquetados (por ejemplo, estados de una máquina como funcionando, en fallo, o en mantenimiento). A partir de ahí, es capaz de asignar automáticamente una categoría a nuevos datos que no ha visto antes, basándose en las características que ya conoce.

🔧 ¿Cómo funciona?

En la fase de entrenamiento, el algoritmo analiza un conjunto de datos históricos que contienen variables de entrada (también llamadas features o atributos) y una variable de salida o etiqueta (label), que representa la categoría conocida. Estas variables de entrada pueden ser numéricas (por ejemplo, temperatura, velocidad, vibración) o categóricas (por ejemplo, tipo de turno, día de la semana).

Durante el entrenamiento, el modelo busca patrones estadísticos o reglas que relacionan combinaciones de características con una categoría específica. Por ejemplo, puede detectar que cuando la temperatura está por encima de cierto umbral y la vibración es alta, la categoría más probable es “fallo”. Esta relación no se establece de forma explícita por el usuario, sino que el algoritmo la infiere automáticamente a partir de los datos.

Existen distintos algoritmos de clasificación, cada uno con su propia forma de aprender, por ejemplo:

  • Árboles de decisión: crean reglas en forma de árbol que segmentan los datos por sus valores.

  • Redes neuronales: aprenden representaciones complejas a través de capas de nodos interconectados.

  • K-Nearest Neighbors (KNN): asigna la categoría más común entre los vecinos más cercanos de un nuevo dato.

  • Naive Bayes: se basa en probabilidades y asume independencia entre características.

Una vez entrenado, el modelo puede recibir nuevos datos —por ejemplo, lecturas en tiempo real de sensores— y predecir la categoría correspondiente sin intervención humana.

🧠 ¿Cuándo se usa?

La clasificación se aplica en casos donde el resultado deseado siempre es una categoría predefinida. Algunos ejemplos pueden ser:

  • Detectar anomalías en sensores clasificando el estado como “normal” o “crítico”.

  • Prever estados operativos de maquinaria (ej. “activo”, “inactivo”, “en revisión”).

  • Clasificar consumos energéticos por tipo de edificio o por nivel de eficiencia (ej. “alto”, “medio”, “bajo”).

  • Asignar una incidencia al tipo correspondiente (“eléctrica”, “climatización”, “estructural”).

📦 Ejemplo práctico: Clasificación del estado de una máquina

Imagina que en una fábrica hay sensores conectados a una máquina que miden temperatura, vibración y nivel de ruido. Con esos datos históricos, se ha etiquetado cada situación como uno de tres posibles estados:

  • 🟢 “Funciona bien”

  • 🟡 “Requiere revisión”

  • 🔴 “En fallo”

Durante el entrenamiento, el modelo aprende que cuando la temperatura es baja, la vibración es estable y el ruido es normal, el estado suele ser “Funciona bien”. Pero si la temperatura y la vibración aumentan, y el ruido se vuelve inestable, probablemente se trata de un estado “En fallo”.

Una vez entrenado, el modelo puede recibir los datos actuales de esos sensores y predecir automáticamente en qué estado está la máquina. Por ejemplo:

  • Si hoy tiene 78°C, vibración 0.35 y ruido 75 dB → el modelo predice 🔴 “En fallo”

  • Si mañana tiene 68°C, vibración 0.20 y ruido 60 dB → predice 🟢 “Funciona bien”