Módulo 15: Arquitectura de Computadoras
Entrenar un modelo de lenguaje moderno puede costar cien millones de dólares. Un chip H100 ejecuta casi cuatro mil billones de operaciones por segundo. La diferencia entre correr código en CPU o GPU puede ser de cien veces. ¿Por qué? ¿Cuándo importa?
Este módulo explica la arquitectura de la computadora desde la perspectiva de quien trabaja con datos y modelos: qué hay dentro de la máquina, cómo se mueve la información, por qué algunos cómputos son baratos y otros son prohibitivos, y qué significa “cuello de botella” en términos concretos de hardware.
No es un curso de sistemas. No vas a escribir drivers ni compiladores. Pero sí vas a entender por qué tu código de NumPy es cien veces más rápido que un loop de Python, por qué .to("cuda") existe, y cómo se relaciona el número de parámetros de un LLM con millones de dólares en cómputo.
Contenido
| Sección | Tema | Tiempo |
|---|---|---|
| La máquina | Von Neumann, jerarquía de memoria, CPU y GPU en el sistema | ~15 min |
| Los procesadores | CPU vs GPU vs NPU, ARM vs x86, cores y reloj, ensamblador | ~15 min |
| Rendimiento y escala | FLOPs, cuellos de botella de memoria, vectorización, LLMs | ~20 min |
Notebook
| Notebook | Tema | Tiempo |
|---|---|---|
| Hardware y escala | Inspección de hardware, benchmark de vectorización, efectos de caché, escala de LLMs | ~25 min |
Prerequisitos
- Módulo 9: Python completado
pip install -r requirements.txt
Idea central del módulo
El hardware no es magia ni detalle de implementación: es el contrato físico que determina qué operaciones son rápidas, qué operaciones son lentas y por qué ciertos algoritmos escalan y otros no.
Tres principios que guían el módulo:
-
La velocidad y el tamaño siempre se oponen. Los registros son instantáneos pero caben en tu puño; los discos duros guardan terabytes pero son miles de veces más lentos. Todo el diseño de software eficiente vive dentro de esa tensión.
-
CPU y GPU no hacen lo mismo rápido. No es que uno sea mejor que el otro: tienen filosofías de diseño opuestas. Entender cuál usar es tan importante como saber programar.
-
La escala de la IA moderna es literalmente imposible de intuir sin números. Los gráficos de este módulo existen para hacer concreta una magnitud que el lenguaje informal no puede transmitir.