La tecnología basada en hechos y no en predicciones. El machine learning y el big data potencializa nuestras decisiones.
La totalidad del curso se desarrollará sobre la plataforma R/Rstudio.
- Primeros pasos: Revisar la instalación del programa, explicación general de la plataforma, como cargar datos. Ejemplos de las posibilidades de este lenguaje de programación.
- Exploratory Data Analysis (EDA). Una serie de procedimientos que se suelen hacer cuando nos encontramos datos nuevos. Carga de los mismos, limpieza, análisis de outliers, tratamientos de datos desconocidos, etc.
- Visualización. Una de las grandes virtudes de R es su gran capacidad para generar gráficos de todo tipo, abordaremos tanto las técnicas básica, como algunas avanzadas.
- Proyecto de datos/Machine learning básico. Sin entrar en modelos muy complejos que se salen del ámbito de este curso, explicaremos por qué hay que dividir y como en train/test los datos, overfitting, evaluación y otras técnicas.
- Reporting. Cómo ir más allá del Excel. Open Data y donde seguir. Rmarkdown, fuentes de datos, reproductibilidad y recursos para seguir avanzando.
El objetivo de este curso es sentar las bases de conocimiento para perfiles técnicos de algunas materias relacionadas con el Big Data y el Machine Learnng.
El alumno conocerá qué es lo que se está haciendo en estos campos para substituir herramientas como el excel, así como nuevas técnicas de reporting orientadas a facilitar la auditoría de datos, que en hojas de cálculo o bases de datos son procesos que requieren mucho tiempo al no tener un comienzo ni un final, ni trazabilidad de los pasos que se han seguido.
Este curso está orientado a perfiles con conocimientos de informática (especialmente excel), que quieren dar un primer paso hacia el análisis de datos con herramientas y técnicas de Big Data / Machine Learning.