Modulo 13: Pandas — I/O y Combinacion de Datos

Antes de limpiar o analizar datos, primero tienes que leerlos. Y antes de analizarlos juntos, tienes que combinarlos. Este modulo cubre exactamente eso.

La mayor parte del trabajo esta en los notebooks — los markdowns son solo el mapa. Abre los notebooks directamente en Colab y sigue las explicaciones ahi.

Contenido

Seccion Tema Tiempo
I/O y Encodings Por que los encodings importan, CSV, JSON, Parquet, mojibake ~5 min
Combinando DataFrames Merges relacionales vs concat posicional ~8 min

Notebooks

Notebook Tema Tiempo
I/O y Encodings CSV (sep, encoding), JSON nativo y anidado, Parquet, deteccion de encoding, mojibake ~20 min
Merges y Joins inner/left/right/outer, por columna e indice, keys distintas, validate ~25 min
Concat axis 0/1, keys, ignore_index, columnas disparejas ~12 min

Open in Colab — I/O Open in Colab — Merges Open in Colab — Concat

Prerequisitos

  • Modulo 12: Pandas completado
  • pip install -r requirements.txt