6 RECURSOS para aprender Machine Learning y Data Analytics con Python

Con toda la información que hay sobre el Data Analytics y el Machine Learning muchas veces es complicado saber por dónde empezar o qué recursos utilizar. A continuación, os presento algunos de los recursos que yo utilizo.

Antonio Fernández Troyano
5 min readDec 22, 2020
Photo by Jordan Whitfield on Unsplash

Los recursos que voy a listar a continuación son una parte esencial de los que he utilizado una vez terminé el máster de Big Data y Analytics en DataHack.

Organizaré esta información desde la más esencial y básica hasta la más “compleja” o “intensa” para la que quizás necesites más horas de trabajo.

Por ahora, todos los recursos que os voy a compartir son en inglés.

No recomiendo tratar de leerse de inicio a fin todos los libros ni la documentación, ni agobiarse si no lo entiendes…

Lo más importarte es ponerte manos a la obra con el código y fallar, fallar y fallar. Cuando tu código no funciona es cuando realmente aprendes

Como consejo general: escribe el código, aunque lo entiendas, ¡por muy básico que sea siempre aprenderás algo!

1. Automate The Boring Stuff With Python (EN)

Automate the Boring Stuff with Python by Al Sweigart

Pues uno de los primeros libros que utilicé cuando empecé con Python. Sin duda, uno de los mejores libros para empezar totalmente de cero.

Puedes encontrar la versión antigua en la web del autor, pero merece mucho la pena tener este libro en físico, no te arrepentirás.

Tiene muchos ejemplos prácticos de tareas “cotidianas” que se pueden automatizar y con las que te ahorrarás mucho tiempo. Por ejemplo:

  • Manipulación de strings
  • Web scraping
  • Expresiones regulares
  • Lectura y escritura de ficheros
  • Trabajar con ficheros EXCEL, Google Sheets, PDFs y CSVs

¡Uno de los más recomendables, por eso está el primero!

2. DataCamp (EN)

Ahora creo que han cambiado el logo, ¡pero es el mismo!

DataCamp es otra maravillosa fuente de información con un montón de cursos específicos de varios lenguajes, entre ellos, Python.

En mi caso particular completé el “Career Track” de Data Scientist, con más de 80 horas de formación y 23 cursos en total.

Muy interesante para gente que está empezando de cero o que quiere profundizar en algún ámbito en particular. Algunas de las materias que está incluidas son:

  • Data manipulation with Pandas
  • Merging data frames with pandas
  • Data visualization with Seaborn
  • Cleaning data
  • Exploratory Data Analysis (EDA)
  • Machine Learning

Lo bueno es que gracias a Visual Studio podéis tener acceso gratuito durante unos meses, a través del siguiente enlace.

Además, suelen sacar ofertas puntuales y un año completo ronda los 150€.

https://learn.datacamp.com/

3. Canal YouTube Ken Jee (EN)

Pues otra maravillosa fuente, esta vez en YouTube. Un Youtuber genial con un montón de vídeos sobre data sciences, proyectos, etc.

La verdad que merece mucho la pena seguir a Ken Jee, lo explica todo muy fácil y sencillo. Tiene una serie de vídeos en los que propone un proyecto de data analytics de inicio a fin muy bien explicado.

4. Python for Data Analysis de O’REILLY (EN)

Subimos un poco el nivel. Otro libro de “mesilla” para consultar cuando surgen dudas o ampliar el conocimiento en algún área en particular.

Introducimos el uso de Jupyter Notebooks, Numpy, Matplotlib y funciones de Pandas más complejas como groupby o time series data.

Es un libro algo más denso que el resto, pero muy muy completo.

5. Kaggle(EN)

Fantástica plataforma en la que empresas y data scientists se ponen en contacto para resolver problemas a través de competiciones.

Es un buen sitio para encontrar ideas y proyectos de Machine Learning aplicados a la vida real. Puedes descargarte los data sets publicados y ver cómo se han tratado de resolver los ejercicios en los foros de discusión.

Además, ¿por qué no participar? algunos de los proyectos tienen premios económicos para los mejores proyectos.

6. Towards Data Science (EN)

Al igual que en Medium, en Towards Data Science podemos encontrar muchísimos artículos escritos por profesionales y amateurs del Data Science.

En esta ocasión recomiendo ya haber trabajado bastante los típicos data sets de “juguete” porque muchas veces los artículos escritos no están del todo completos o es necesario adaptarlos a las capacidades de cada uno.

Es un muy buen sitio en el que registrarte en la newsletter (igual que en Medium) para que te envíen todos los días artículos de tu interés.

--

--

Antonio Fernández Troyano
Antonio Fernández Troyano

Written by Antonio Fernández Troyano

Civil Engineer | 📈Management consultant and Master in Data Analytics and Big Data💻 | Website: www.fernandeztroyano.es | Git https://github.com/afernandez119

No responses yet