Menú Cerrar
Machine learning

Introducción

Como vimos en el artículo anterior, las computadoras pueden aprender a identificar patrones por medio de algoritmos, dichos algoritmos pueden ser de clasificación o regresión. En esta entrada hablaremos de las diferencias entre estos dos, para que en un futuro podamos elegir el que más se adapte a nuestro proyecto. Si aún no sabes en qué consiste el Machine learning, te sugiero que consultes este artículo Machine Learning: introducción, definición y algoritmos de clasificación. Conozcamos sus diferencias.

Algoritmos de clasificación

Por clasificar entendemos que buscamos etiquetar a cada dato ingresado, sobre la cual buscamos una decisión. Los algoritmos de clasificación son usados cuando la respuesta que queremos obtener es una clase (etiqueta) dentro de varios resultados posibles (varias etiquetas posibles).

Cuando buscamos entre dos clases objetivos se le conoce como clasificación binaria. Algunos ejemplos utilizando dos clases verdadero/falso son los siguientes:

  • ¿El cliente comprará el auto? Sí/no
  • ¿El alumno aprobará su examen? Sí/no
  • ¿Juan clasificará a los juegos olímpicos? Sí/no
Machine learning, clasificación mediante SVM
Clasificación mediante el algoritmo de Support Vector Machine (SVM)

En cambio, sí tenemos que predecir más de dos clases (etiquetas) se le conoce como clasificación multicategoria. Es usado para la categorización (etiquetas) de imágenes, audios y análisis de texto.

Algoritmo de regresión

Cuando se utiliza el algoritmo de regresión el resultado es un número. Entonces decimos que la respuesta a la pregunta será una cantidad que será determinada con base en los atributos de las entradas. Se construye un modelo que permita relacionar dos o más datos. A continuación, te lo explico con dos ejemplos.

  • Si requerimos saber el costo de una vivienda basado en sus características: zona, área, habitaciones, estacionamiento, cuarto de lavado etcétera.
  • Predecir la falla de una maquina industrial basado en el último análisis de aceite, vibración.

Pero entender mejor la diferencia entre ambos algoritmos, te lo explicaré con el siguiente problema. Sigue leyendo.

Analizando problema de ejemplo: ¿algoritmos de clasificación o regresión?

Analizaremos un ejemplo para poder identificar qué tipo de algoritmo es.

Supongamos que has visitado varias casas en venta con distintas características y precios, algunas de ellas te han gustado, con esta información queremos determinar:

  • Si la próxima casa que visitarás te va a gustar o no.
  • En caso de que te guste, ¿en cuánto te la van a vender?

¿Identificaste cuál es el problema de clasificación y regresión?

En el primer caso, si una nueva casa en venta que visitarás con ciertas características te va a gustar o no, la solución sería un algoritmo de clasificación. Puesto que estamos clasificando los datos, sí o no, me gusta o no. En este problema la clasificación es binaria en la que tenemos que predecir si el resultado es sí (1) o no (2).

Para el segundo caso, si te gusta la nueva casa, ¿en cuánto te la venderán? En este caso debemos predecir un valor, por lo tanto, es un problema de regresión. Ya que podría ser $1,000,000.00 pesos, $200,000.00, $500,000.00 todo depende de los datos de entrada.

Resumen

Como pudimos observar, el elegir un algoritmo dependerá únicamente de las necesidades del problema a resolver. Más adelante seguiremos hablando con más profundidad de estos algoritmos.

Acerca del autor

Alethia Imperia Velasco Aguilar

Ingeniera en Sistemas Computacionales. Investigadora en el diseño de proyectos científicos y tecnológicos.

Comparte el artículo en tus redes sociales

Artículos relacionados

24 comentarios

  1. Eduardo Velazco

    Se pueden hacer simulaciones ? Para cruce de ganado por ejemplo?

  2. to

    Hello! otc urinary tract infection treatment
    try these guys out

  3. Antoniotrows

    Por una sencilla razón, son la base de todo el estudio del aprendizaje automático, incluso de la Inteligencia artificial. Esto es lo que vas a aprender Es bien sabido que no me gusta darle vueltas al asunto, por lo que te voy a decir una definición poco convencional, pero muy concisa sobre la diferencia entre regresión y clasificación. La regresión tiene el objetivo de predecir valores continuos Números pues, como el 1, 2.3, 3.1416 etc… , Y la clasificación tiene la tarea de asignar una clase, es decir predecir a que clase pertenece un conjunto de datos, aquí es muy importante entender que en los problemas de clasificación los valores son discretos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

× ¿Cómo puedo ayudarte?