Modulo 13: Pandas — I/O y Combinacion de Datos
Antes de limpiar o analizar datos, primero tienes que leerlos. Y antes de analizarlos juntos, tienes que combinarlos. Este modulo cubre exactamente eso.
La mayor parte del trabajo esta en los notebooks — los markdowns son solo el mapa. Abre los notebooks directamente en Colab y sigue las explicaciones ahi.
Contenido
| Seccion | Tema | Tiempo |
|---|---|---|
| I/O y Encodings | Por que los encodings importan, CSV, JSON, Parquet, mojibake | ~5 min |
| Combinando DataFrames | Merges relacionales vs concat posicional | ~8 min |
Notebooks
| Notebook | Tema | Tiempo |
|---|---|---|
| I/O y Encodings | CSV (sep, encoding), JSON nativo y anidado, Parquet, deteccion de encoding, mojibake | ~20 min |
| Merges y Joins | inner/left/right/outer, por columna e indice, keys distintas, validate | ~25 min |
| Concat | axis 0/1, keys, ignore_index, columnas disparejas | ~12 min |
Prerequisitos
- Modulo 12: Pandas completado
pip install -r requirements.txt