Laboratorio 1: De Dato Crudo a Decisión
Semana 1 · Big Data y Analytics · Universidad San Sebastián
1 Contexto
María González, Gerente de Marketing de TechStyle, tiene un presupuesto de $15.000.000 CLP para la campaña del próximo mes. Necesita decidir en qué categoría de productos invertir para maximizar las ventas.
El equipo de TI te entregó el archivo techstyle_orders.csv con los datos de ventas del año 2023. Tienes 30 minutos para responder la pregunta de María.
2 Instrucciones generales
- Trabajarás individualmente en Excel.
- Sigue los pasos en orden. Cada paso construye sobre el anterior.
- Al finalizar, compararás tus resultados con tus compañeros.
Archivo de datos: labs/data/techstyle_orders.csv
3 Parte 1 — Explorar los datos brutos (5 min)
3.1 Paso 1: Abrir el archivo
- Abre Excel y carga el archivo
techstyle_orders.csv- Menú: Datos → Desde texto/CSV
- Observa la estructura: ¿Cuántas columnas hay? ¿Cuántas filas?
- Identifica las columnas disponibles y comprende qué representa cada una.
3.2 Paso 2: Reflexión inicial
Antes de hacer cualquier cálculo, responde en una hoja aparte:
| Pregunta | Tu respuesta |
|---|---|
| ¿Cuántos registros (filas) tiene el archivo? | |
| ¿Qué período de tiempo cubre? | |
| ¿Qué categorías de productos existen? | |
| ¿Puedes responder la pregunta de María con solo mirar los datos? | Sí / No / Por qué |
Reflexiona: A esto nos referimos cuando decimos que los datos crudos, por sí solos, no son útiles.
4 Parte 2 — Transformar datos en información (15 min)
4.1 Paso 3: Crear una Tabla Dinámica
- Selecciona todos los datos (Ctrl+A)
- Inserta una Tabla Dinámica en una hoja nueva
- Configura la tabla así:
| Área | Campo |
|---|---|
| Filas | categoria |
| Valores | venta_neta (suma) |
| Valores | cantidad (suma) |
| Valores | margen_pct (promedio) |
- Ordena por
venta_netade mayor a menor.
4.2 Paso 4: Analizar tendencias por trimestre
En una segunda Tabla Dinámica:
| Área | Campo |
|---|---|
| Filas | categoria |
| Columnas | trimestre |
| Valores | venta_neta (suma) |
Esto te mostrará cómo evolucionaron las ventas de cada categoría durante el año.
4.3 Paso 5: Analizar por región
En una tercera Tabla Dinámica:
| Área | Campo |
|---|---|
| Filas | region |
| Columnas | categoria |
| Valores | venta_neta (suma) |
5 Parte 3 — De información a decisión (10 min)
5.1 Paso 6: Completar la tabla de análisis
Con los resultados de tus tablas dinámicas, completa esta tabla resumen:
| Categoría | Ventas Totales (CLP) | Margen Promedio (%) | Tendencia T3→T4 | ¿Es buena inversión? |
|---|---|---|---|---|
| Electrónica | ||||
| Ropa | ||||
| Hogar | ||||
| Accesorios |
5.2 Paso 7: Tu recomendación
Escribe en no más de 3 líneas tu recomendación para María:
“Recomiendo invertir los $15.000.000 en la categoría ________ porque…”
6 Parte 4 — Reflexión final (5 min)
Responde estas preguntas:
¿Podrías haber respondido la pregunta de María sin procesar los datos? ¿Por qué no?
¿Qué transformaste? Completa la frase:
- Los datos crudos eran:
_______ - La información que generé fue:
_______ - El conocimiento que apliqué fue:
_______
- Los datos crudos eran:
Límite de Excel: El archivo tiene ~1.250 filas. TechStyle real tiene 8.750.000 registros de ventas.
- Intenta cargar el mismo archivo pero duplicado 3 veces (pégalo en la misma hoja).
- ¿Qué pasa con la velocidad de Excel?
- ¿Qué implicaría trabajar con 10x más datos?
Punto clave del curso: Excel es una herramienta poderosa para datos pequeños, pero las organizaciones reales tienen millones de registros que requieren arquitecturas diferentes. Eso es lo que estudiaremos en este curso.
7 Entrega y discusión
Al finalizar el tiempo, el docente pedirá a grupos al azar que compartan:
- Su recomendación para María
- La categoría más interesante que encontraron y por qué
- Cualquier hallazgo inesperado en los datos
No hay una sola respuesta correcta. Diferentes análisis pueden llevar a diferentes recomendaciones válidas — lo importante es que estén basadas en evidencia.