Modulo 12: Pandas — Arquitectura y Pipelines de Datos

Ya sabes usar pandas. Tomaste un curso, conoces read_csv, groupby, merge, plot. Tienes un LLM que te genera codigo. Entonces, ¿que queda por aprender?

Como pensar. Cuando usar pandas y cuando no. Como estructurar tu codigo para que no sea desechable. Como disenar un pipeline que otra persona (o tu en 3 meses) pueda entender y mantener. Donde pandas encaja en el ecosistema y donde te conviene usar otra cosa.

Este modulo no repite sintaxis. Se enfoca en las decisiones de diseno que separan a alguien que usa pandas de alguien que sabe trabajar con datos.

Contenido

Seccion Tema Tiempo
Pandas en contexto Historia, cuando usarlo, cuando no, ecosistema, versiones ~12 min
Arquitectura y pipelines Diseno de pipelines, organizacion de codigo, formatos, memoria, errores comunes ~15 min

Notebook

Notebook Tema Tiempo
Pandas en practica Tipos, missings, memoria, pipeline completo, formatos, profiling ~35 min

Open in Colab

Prerequisitos

  • Modulo 9: Fundamentos de Python completado
  • Curso basico de pandas completado (DataCamp o equivalente)
  • python3, pandas, numpy instalados