Diferencias entre inferencia y predicción

Ene 3, 2021 | Estadística, Machine Learning | 0 Comentarios

En este primer artículo del blog, explicaré en líneas generales la diferencia de dos conjuntos de métodos básicos en la estadística y el machine learning que pueden ser bastante confusos de entender en el momento de adentrarse en estos campos: la inferencia y la predicción.

En ambos casos contamos con un conjunto de variables independientes (x1, x2, x3, …) y una variable de respuesta (y) que son utilizados para construir un modelo. La diferencia reside en el uso que hace cada método de este modelo.

 

La inferencia para entender la relación entre la respuesta y los predictores

En el caso de la inferencia, estamos más interesados en comprender la relación de las variables independientes y la respuesta y no necesariamente en hacer predicciones sobre esta. Es decir, nuestro objetivo consiste en entender como se ve afectada la respuesta cuando los predictores varían.

Para ello es recomendable el uso de modelos explicables y con un comportamiento fácilmente interpretable como la regresión lineal o los árboles de decisión.

Como ejemplo práctico, podríamos pensar en un servicio de portal inmobiliario que quiere conocer como afectan determinadas características de las viviendas en venta (variables independientes) como la superficie en metros cuadrados o el año de construcción en el precio final (variable respuesta).

Mediante la inferencia podríamos responder, por ejemplo, a las siguientes preguntas:

  • ¿Qué atributos de una vivienda contribuyen más en el incremento de su precio?
  • ¿Cuánto del incremento en el precio está asociado a un incremento en la tasa de criminalidad de la zona donde se encuentra la vivienda?

 

La predicción para obtener la mayor precisión

Por otro lado, en las tareas de predicción no estamos necesariamente interesados en el porqué, sino simplemente en conseguir la mejor predicción posible de la respuesta.

En este caso es común utilizar modelos de caja negra como las redes neuronales o random forests, que frecuentemente obtienen una mayor precisión a costa de ser menos interpretables. Esto no quiere decir que los modelos más indicados para la inferencia no puedan lograr un buen desempeño a la hora de predecir.

Por ejemplo, las redes neuronales son unos de los modelos más potentes y que alcanzan un gran nivel de precisión. Sin embargo, decimos que se trata de un modelo de caja negra, porque cuando entrenamos una red neuronal no conocemos su implementación ni como ha llegado a la conclusión.

No obstante, normalmente, en el caso de la predicción no nos importa comprender lo que sucede dentro de estos modelos porque lo que queremos es que devuelvan un buen resultado.

En el ejemplo anterior de las viviendas en venta, este tipo de tarea ayudaría a la compañía a predecir el precio de una nueva vivienda en base a sus características.

Espero que os haya resultado útil esta publicación y tengáis más clara la diferencia entre inferencia y predicción. En caso de dudas no dudéis en comentar.

También te puede interesar:

Entiende de una vez que son los grados de libertad en estadística

Aprende el concepto grados de libertad en estadística de manera intuitiva y con ayuda de ejemplos prácticos

Libros recomendados para adentrarse en el machine learning

Lista de cinco libros recomendables para principiantes que quieran aprender machine learning y ciencia de datos.

Introducción al topic modeling con Gensim (I): fundamentos y preprocesamiento de textos

En esta publicación entenderéis los fundamentos del topic modeling (modelo LDA) y se mostrará como realizar el preprocesamento necesario a los textos: tokenización, eliminación de stopwords, etc.

Introducción al topic modeling con Gensim (II): asignación de tópicos

En esta publicación aprenderás como entrenar un modelo LDA con noticias periodísticas para la asignación de tópicos, usando para ello la librería Gensim de Python.

Introducción al topic modeling con Gensim (III): similitud de textos

En este post mostramos como utilizar la técnica de topic modeling para obtener la similitud entre textos teniendo en cuenta la semántica

Sentiment analysis en críticas de películas mediante regresión logística

El sentimiento de análisis es una técnica que nos permite identificar la opinión emocional que hay detrás de un textol. En este artículo mostramos como construir un modelo de predicción capaz de distinguir entre críticas positivas y negativas. Estas críticas han sido descargadas previamente de la web de filmaffinity.

AutoML: creación de un modelo de análisis de sentimiento con Google Cloud AutoML

Descubre en que consiste el AutoML, que nos permite automatizar varias partes del proceso de Machine Learning y aprende a utilizar Google Cloud AutoML para realizar una tarea de sentiment analysis y construir un clasificador capaz de identificar si una crítica de película es positiva o negativa.

Introducción al clustering (I): algoritmo k-means

En este artículo explicamos el algoritmo de clustering k-means, el cual busca instancias centradas en un punto determinado, llamado centroide. Después de explicar su funcionamiento, lo aplicaremos en Python a un conjunto de datos y visualizaremos los resultados obtenidos.

Aplicación de la Distribución t de Student en Python: Ejemplos prácticos

Distribución t en Python: Aprende cómo aplicar la Distribución t en Python con ejemplos para pruebas de hipótesis e intervalos de confianza.

Machine Learning vs. Deep Learning: Comprendiendo las diferencias en la inteligencia artificial

Explora las diferencias entre Machine Learning y Deep Learning en este artículo y comprende cuándo utilizar cada enfoque en la inteligencia artificial

Ads Blocker Image Powered by Code Help Pro

Por favor, permite que se muestren anuncios en nuestro sitio web

Querido lector,

Esperamos que estés disfrutando de nuestro contenido. Entendemos la importancia de la experiencia sin interrupciones, pero también queremos asegurarnos de que podamos seguir brindándote contenido de alta calidad de forma gratuita. Desactivar tu bloqueador de anuncios en nuestro sitio nos ayuda enormemente a lograrlo.

¡Gracias por tu comprensión y apoyo!