Blog
NLP

Extracción de datos de Twitter con Python (sin consumir la API)
En esta publicación os enseñaremos como poder extraer datos de Twitter en Python mediante la librería Twint. De esta forma, podremos obtener facilmente los últimos tweets que contengan cierta palabra o que pertenezcan a un determinado usuario y aplicar varios filtros.
Introducción al topic modeling con Gensim (III): similitud de textos
En este post mostramos como utilizar la técnica de topic modeling para obtener la similitud entre textos teniendo en cuenta la semántica
Introducción al topic modeling con Gensim (II): asignación de tópicos
En esta publicación aprenderás como entrenar un modelo LDA con noticias periodísticas para la asignación de tópicos, usando para ello la librería Gensim de Python.
Introducción al topic modeling con Gensim (I): fundamentos y preprocesamiento de textos
En esta publicación entenderéis los fundamentos del topic modeling (modelo LDA) y se mostrará como realizar el preprocesamento necesario a los textos: tokenización, eliminación de stopwords, etc.
Gracias por visitar
El Mundo De Los Datos
Si tienes cualquier duda, sugerencia o crítica puedes escribirme.