Machine Learning – Combinando Git con DVC
Automatizando un Pipeline de Machine Learning Al parecer muchos encontraron que es una excelente idea aprender GIT para llevar un proceso ordenado de desarrollo en Ciencia de Datos. Pero también es cierto, que cuando se ideó GIT, la Ciencia de Datos como disciplina no estaba en el radar, y menos el proceso de entrenamiento de un Modelo. Hoy en día el MLOps está más de moda que nunca
Leer más ›
Data Science – Github Basics y un poco más.
Control de Versiones en Ciencia de Datos Si eres Data Scientist es muy probable que nunca hayas usado GIT/Github. No te culpo, no somos completamente desarrolladores y quizás muchos de ustedes (al igual que yo) ni siquiera tenemos un background en Ciencias de la Computación. Entonces la pregunta es, ¿Por qué deberíamos usarlo?
Leer más ›
Machine Learning – Tabular Playground Enero 2022
Prediciendo ventas de Kaggle Como algunos sabrán me cambié de pega. En mi nuevo trabajo hay una fuerte componente temporal involucrada en los problemas que resolvemos y justo este mes en Kaggle el Tabular Playground abordó un problema de series de tiempo. ¿Qué mejor manera de introducirse en el mundo de Kaggle?
Leer más ›
Quick Solves – Creando un Framework de Experimentación
Desafío BCI-Binnario Estamos cerca de Navidad, así que me gustaría hacer un regalo mostrando cómo es que yo enfrento la resolución de un problema de Machine Learning.
Leer más ›
Machine Learning – Fallando hasta el Éxito con Hydra
Cómo entrenar muchos modelos combinando Hydra + Optuna Bueno esta semana me tocó presentar en la Pycon. Fue super buena la experiencia y a pesar de la presión propia de presentar de un tema que sea relevante para una audiencia que quiere aprender de Python me sentí super bien.
Leer más ›
Machine Learning – Aprendizaje No Supervisado más allá de Segmentaciones.
K-Means en Scikit-Learn En un país donde las ofertas de puestos de Data Scientist aparecen por todas partes es muy importante estar preparado. Me llama especialmente la atención que hay muy pocas entrevistas técnicas que evalúan el conocimiento de los Data Scientist a contratar. Esto puede ser útil si eres nuevo, porque puede ser más sencillo entrar el mundillo este. Pero eventualmente, debemos llegar a estándares más altos donde se cuestionarán las habilidades que uno tiene. Siempre se cuentan los casos de éxitos, pero yo quiero contar mi máximo FAIL.
Leer más ›
Deep Learning – Implementando un algoritmo de Anomaly Detection
LSTM AutoEncoder con Pytorch Lightning. Siguiendo con los tutoriales de aplicaciones poco convencionales hoy quiero presentar un tipo de tarea distinta: Anomaly Detection. Este es quizás uno de las aplicaciones con más proyección dentro del Machine Learning por varias cosas…
Leer más ›
Data Science – Nunca publiques código que contenga credenciales secretas.
3 soluciones para evitar meter la pata. El tío Ben decía que un gran poder conlleva grandes responsabilidades. Y eso es súper cierto cuando trabajamos con datos. Normalmente en cualquier área de datos vamos a encontrarnos con datos sensibles o información personal de clientes.
Leer más ›
Deep Learning – Clasificación de Series de Tiempo en Kaggle.
Detectar el tipo de piso mediante data de sensores con Pytorch Lightning. Cuando uno comienza a revisar tutoriales de redes neuronales es común encontrarse con los mismos problemas: Regresión o Clasificación Binaria (o en el mejor de los casos problemas multiclase). Pero existen varios otros tipos de problemas que normalmente no se ven y que son sumamente aplicables. En este caso vamos a resolver un problema de Clasificación de Series de Tiempo. Esto significa que le entregaremos a nuestra red una o varias series de tiempo, y la red la nos dirá a qué clase pertenece.
Leer más ›
Deep Learning – Predecir el comportamiento del BitCoin
Creando LSTM en Pytorch Lightning Las criptomonedas son un tema apasionante. En el último tiempo se han convertido en el dolor de cabezas de los gamers (también de los modeladores de Deep Learning y de Nvidia que no sabe como producir más GPUs), ya que han provocado una escasez en el stock de GPUs, pero también han ayudado a ganar (y también a perder) dinero a mucha gente. Una de las catacterísticas más llamativas de este mercado es lo impredecibles que son y cómo comentarios de gente importante (tío Elon) pueden generar variaciones muy importantes de manera súbita. Hoy intentaremos predecir el comportamiento del precio del Bitcoin utilizando Pytorch Lightning
Leer más ›