Diferencias entre inferencia y predicción
En este primer artículo del blog, explicaré en líneas generales la diferencia de dos conjuntos de métodos básicos en la estadística y el machine learning que pueden ser bastante confusos de entender en el momento de adentrarse en estos campos: la inferencia y la predicción.
En ambos casos contamos con un conjunto de variables independientes (x1, x2, x3, …) y una variable de respuesta (y) que son utilizados para construir un modelo. La diferencia reside en el uso que hace cada método de este modelo.
La inferencia para entender la relación entre la respuesta y los predictores
En el caso de la inferencia, estamos más interesados en comprender la relación de las variables independientes y la respuesta y no necesariamente en hacer predicciones sobre esta. Es decir, nuestro objetivo consiste en entender como se ve afectada la respuesta cuando los predictores varían.
Para ello es recomendable el uso de modelos explicables y con un comportamiento fácilmente interpretable como la regresión lineal o los árboles de decisión.
Como ejemplo práctico, podríamos pensar en un servicio de portal inmobiliario que quiere conocer como afectan determinadas características de las viviendas en venta (variables independientes) como la superficie en metros cuadrados o el año de construcción en el precio final (variable respuesta).
Mediante la inferencia podríamos responder, por ejemplo, a las siguientes preguntas:
- ¿Qué atributos de una vivienda contribuyen más en el incremento de su precio?
- ¿Cuánto del incremento en el precio está asociado a un incremento en la tasa de criminalidad de la zona donde se encuentra la vivienda?
La predicción para obtener la mayor precisión
Por otro lado, en las tareas de predicción no estamos necesariamente interesados en el porqué, sino simplemente en conseguir la mejor predicción posible de la respuesta.
En este caso es común utilizar modelos de caja negra como las redes neuronales o random forests, que frecuentemente obtienen una mayor precisión a costa de ser menos interpretables. Esto no quiere decir que los modelos más indicados para la inferencia no puedan lograr un buen desempeño a la hora de predecir.
Por ejemplo, las redes neuronales son unos de los modelos más potentes y que alcanzan un gran nivel de precisión. Sin embargo, decimos que se trata de un modelo de caja negra, porque cuando entrenamos una red neuronal no conocemos su implementación ni como ha llegado a la conclusión.
No obstante, normalmente, en el caso de la predicción no nos importa comprender lo que sucede dentro de estos modelos porque lo que queremos es que devuelvan un buen resultado.
En el ejemplo anterior de las viviendas en venta, este tipo de tarea ayudaría a la compañía a predecir el precio de una nueva vivienda en base a sus características.
Espero que os haya resultado útil esta publicación y tengáis más clara la diferencia entre inferencia y predicción. En caso de dudas no dudéis en comentar.