Blog
Todas las categorías
Ciencia de datos, Machine Learning, Deep Learning, Inteligencia Artificial, Ingeniería de Datos y Procesamiento de lenguajes naturales.

Introducción al clustering (I): algoritmo k-means
En este artículo explicamos el algoritmo de clustering k-means, el cual busca instancias centradas en un punto determinado, llamado centroide. Después de explicar su funcionamiento, lo aplicaremos en Python a un conjunto de datos y visualizaremos los resultados obtenidos.
AutoML: creación de un modelo de análisis de sentimiento con Google Cloud AutoML
Descubre en que consiste el AutoML, que nos permite automatizar varias partes del proceso de Machine Learning y aprende a utilizar Google Cloud AutoML para realizar una tarea de sentiment analysis y construir un clasificador capaz de identificar si una crítica de película es positiva o negativa.
Sentiment analysis en críticas de películas mediante regresión logística
El sentimiento de análisis es una técnica que nos permite identificar la opinión emocional que hay detrás de un textol. En este artículo mostramos como construir un modelo de predicción capaz de distinguir entre críticas positivas y negativas. Estas críticas han sido descargadas previamente de la web de filmaffinity.
Extracción de datos de Twitter con Python (sin consumir la API)
En esta publicación os enseñaremos como poder extraer datos de Twitter en Python mediante la librería Twint. De esta forma, podremos obtener facilmente los últimos tweets que contengan cierta palabra o que pertenezcan a un determinado usuario y aplicar varios filtros.
Identificación e imputación de valores perdidos en Python
Dedicaremos esta nueva publicación a explicar cómo detectar, eliminar e imputar los valores perdidos en nuestros conjuntos de datos en Python mediante un ejemplo práctico.
Recursos para aprender las matemáticas del machine learning
Para este post se han recopilado una serie de cursos y libros para el aprendizaje de las matemáticas necesarias para entender el machine learning.
Introducción al topic modeling con Gensim (III): similitud de textos
En este post mostramos como utilizar la técnica de topic modeling para obtener la similitud entre textos teniendo en cuenta la semántica
Introducción al topic modeling con Gensim (II): asignación de tópicos
En esta publicación aprenderás como entrenar un modelo LDA con noticias periodísticas para la asignación de tópicos, usando para ello la librería Gensim de Python.
Introducción al topic modeling con Gensim (I): fundamentos y preprocesamiento de textos
En esta publicación entenderéis los fundamentos del topic modeling (modelo LDA) y se mostrará como realizar el preprocesamento necesario a los textos: tokenización, eliminación de stopwords, etc.
Gracias por visitar
El Mundo De Los Datos
Si tienes cualquier duda, sugerencia o crítica puedes escribirme.