Modulo 12: Pandas — Arquitectura y Pipelines de Datos
Ya sabes usar pandas. Tomaste un curso, conoces read_csv, groupby, merge, plot. Tienes un LLM que te genera codigo. Entonces, ¿que queda por aprender?
Como pensar. Cuando usar pandas y cuando no. Como estructurar tu codigo para que no sea desechable. Como disenar un pipeline que otra persona (o tu en 3 meses) pueda entender y mantener. Donde pandas encaja en el ecosistema y donde te conviene usar otra cosa.
Este modulo no repite sintaxis. Se enfoca en las decisiones de diseno que separan a alguien que usa pandas de alguien que sabe trabajar con datos.
Contenido
| Seccion | Tema | Tiempo |
|---|---|---|
| Pandas en contexto | Historia, cuando usarlo, cuando no, ecosistema, versiones | ~12 min |
| Arquitectura y pipelines | Diseno de pipelines, organizacion de codigo, formatos, memoria, errores comunes | ~15 min |
Notebook
| Notebook | Tema | Tiempo |
|---|---|---|
| Pandas en practica | Tipos, missings, memoria, pipeline completo, formatos, profiling | ~35 min |
Prerequisitos
- Modulo 9: Fundamentos de Python completado
- Curso basico de pandas completado (DataCamp o equivalente)
python3,pandas,numpyinstalados