Libros recomendados para adentrarse en el machine learning
Empezar a aprender machine learning puede resultar de primeras muy intimidatorio. Esta disciplina involucra varios subcampos y además se requiere tener una base sólida en algebra lineal, cálculo y estadística para llegar a entender e interpretar los modelos.
Mi recomendación es empezar a aprender (en caso de que no sepamos ya) lo básico de estadística, matemáticas y programación hasta tener una cierta base y posteriormente empezar de lleno y con más seguridad con en el machine learning.
En mi opinión, los libros son la mejor y más completa opción a la hora de aprender este campo por tu cuenta, aunque siempre viene bien complementarlo con cursos online, blogs especializados y podcasts.
En esta publicación os traigo una lista de cinco libros recomendables para principiantes que quieran aprender machine learning. Para crear esta lista me he centrado únicamente en libros escritos en inglés (aunque alguno de ellos ha sido traducido al español) y orientados a aquellos lectores que no tengan obligatoriamente una gran base en matemáticas y estadística (en alguno de ellos se requiere estar familiarizado con la programación en Python).
A continuación, tenéis los libros recomendados para adentrarse en esta gran disciplina:
OpenIntro Statistics (4ª edición)
David M. Diez, Christopher D. Barr y Mine Çetinkaya-Rundel
La estadística es fundamental para llegar a entender las técnicas de machine learning y los ingenieros informáticos o programadores no vamos sobrados en ese aspecto.
OpenIntro Statistics es mi libro favorito de introducción a la estadística ya que contiene explicaciones claras y accesibles y muchos ejemplos del mundo real.
El libro abarca la estadística descriptiva, probabilidad, distribuciones, inferencia en datos numéricos y categóricos y principios de regresión lineal y logística.
Como he dicho, se trata de un libro introductorio de estadística, por lo que los temas no son explicados en gran profundidad y los que estén empezando se alegrarán al saber que no esta lleno de formulas matemáticas. Sin embargo, este libro sirve para conseguir una buena base con la que poder seguir profundizando. Podéis descargaros el libro de manera gratuita en su página oficial o comprarlo en formato físico aquí.
Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python (2ª edición)
Peter Bruce, Andrew Bruce y Peter Gedeck
Practical Statistics for Data Scientists es un excelente libro introductorio que complementa al anterior y sirve como guía práctica donde se explica de manera clara, aunque sin adentrarse demasiado, como aplicar diversos métodos estadísticos en la ciencia de datos.
Además, el autor también se ayuda de ejemplos bastante detallados en los lenguajes de programación R y Python.
Una de las partes claves del libro y que más me han gustado es cuando da consejos sobre que partes de la estadística son importantes y cuales no para un científico de datos. Podéis comprar este libro aquí.
Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2ª edición)
Aurelien Geron
A lo largo de sus casi 800 páginas, este estupendo libro abarca los aspectos fundamentales del machine learning y deep learning. En los primeros 8 capítulos, el libro se centra en explicar de manera clara una gran variedad de modelos de machine learning clásico, tanto de aprendizaje supervisado como no supervisado, usando para ello la librería de scikit-learn de Python. En los últimos 8 capítulos, el autor cubre las redes neuronales y el aprendizaje profundo utilizando las librerías Tensorflow y Keras.
Considero este libro como uno de los más útiles y recomendables para aquellos que estén empezando en el campo y lo quieran aprender de una manera muy práctica, ya que el autor combina las explicaciones de cada técnica con diversos ejemplos realizados en Python.
Sin embargo, es importante señalar que en el libro se asume que el lector tenga conocimientos básicos previos de programación así como una pequeña base de estadística.
En resumen, se trata de un libro fácil de leer, con explicaciones claras y muchos ejemplos prácticos en Python donde encontraréis una guía muy completa de las técnicas de machine learning y deep learning. Podéis comprar este libro aquí.
An Introduction to Statistical Learning: With Applications in R
Gareth James, Trevor Hastie, Robert Tibshirani y Daniela Witten
Llegamos posiblemente al material más recomendado para empezar en el machine learning desde el punto de vista estadístico. Se trata de un libro algo más avanzado que los anteriormente mencionados de estadística, aunque sigue siendo bastante accessible y comprensible incluso para aquellos que no tengáis una gran formación en esa disciplina.
An Introduction to Statistical Learning explica los conceptos del aprendizaje estadístico desde el principio y cubre muchas de las técnicas de aprendizaje supervisado y no supervisado como la regresión lineal y logística, árboles de decisión, random forest, boosting, SVM, PCA y k-means clustering. Además, después de cada capítulo incluye varios exhaustivos ejemplos en R.
Al tratarse de un libro introductorio, el nivel de las formulas es relativamente adecuado para todos. En el caso de que ya tengáis cimentada una base sólida en estadística y matemáticas os recomiendo leer también Elements of Statistical Learning.
También podéis acceder al PDF del libro desde aquí o si lo preferís también lo tenéis en formato físico aquí.
Mathematics for Machine Learning
Marc Deisenroth, A. Aldo Faisal y Cheng Soon Ong
Finalmente, si queréis aprender las matemáticas necesarias para entender los modelos de machine learning, entonces sin duda éste es vuestro libro. Mathematics for Machine Learning es un libro muy completo, con muchos ejemplos detallados y divido en dos partes:
- En la primera parte se explican los fundamentos matemáticos que incluyen el algebra lineal, descomposición de matrices, cálculo vectorial, teoría de la probabilidad y optimización continua.
- Por otro lado, la segunda parte del libro se centra en los cuatro pilares del machine learning: regresión, reducción de dimensionalidad, estimación de densidad y clasificación con máquinas de vectores de soporte (SVM).
Eso sí, es muy recomendable tener una base de conocimientos de algebra lineal y cálculo introductorio antes de empezar con este libro.
Podéis descargar este magnifico libro en PDF de manera gratuita desde su página web o comprarlo en formato físico aquí.
Estos son los libros que me han servido a mí para empezar a aprender machine learning, pero hay un sinfín de libros que podéis encontrar sobe el tema. Recuerda que si conoces algún otro buen material para introducirse en esta disciplina puedes dejar un comentario con tu recomendación.
Muchas gracias por las recomendaciones! ¿Hay alguno que esté traducido al castellano?
Me alegro de que te hayan servido de ayuda Mathías. Actualmente, de los libros recomendados, únicamente Hands-on Machine Learning… tiene versión en español. Su nombre es Aprende Machine Learning con Scikit-Learn, Keras y TensorFlow y lo puedes encontrar en Amazon. Saludos!
Alguien tiene el libro «An Introduction to Statistical Learning» en español, estaré muy agradecido