Solución — Laboratorio 1: De Dato Crudo a Decisión

Semana 1 · Big Data y Analytics · Universidad San Sebastián

Warning

Documento de uso exclusivo del docente. No distribuir a estudiantes antes de que completen el laboratorio.


1 Parte 1 — Explorar los datos brutos

1.1 Paso 2: Reflexión inicial — Respuestas esperadas

Pregunta Respuesta
¿Cuántos registros (filas) tiene el archivo? 1.257 filas (sin contar el encabezado)
¿Qué período de tiempo cubre? Año 2023 completo (enero a diciembre)
¿Qué categorías de productos existen? Electrónica, Ropa, Hogar, Accesorios
¿Puedes responder la pregunta de María con solo mirar los datos? No. Con 1.257 filas desordenadas es imposible identificar tendencias o comparar categorías sin transformar primero los datos.
Note

Para el docente: El punto central de esta reflexión es que los datos crudos requieren transformación antes de ser útiles para tomar decisiones. Reforzar que “ver los datos” no es lo mismo que “extraer información”.


2 Parte 2 — Transformar datos en información

2.1 Paso 3: Tabla Dinámica — Resultados esperados

Resultados de ventas totales por categoría (ordenados de mayor a menor):

Categoría Ventas Totales (CLP) Cantidad (unidades) Margen Promedio (%)
Electrónica $27.668.324 ~850 57,4%
Ropa $12.047.137 ~620 64,7%
Hogar $10.580.186 ~540 63,2%
Accesorios $7.032.922 ~380 68,9%
Note

Los valores exactos pueden variar levemente dependiendo del redondeo en Excel, pero la posición relativa de las categorías debe ser la misma.

2.2 Paso 4: Tendencias por trimestre

Evolución T3 → T4 por categoría:

Categoría T3 T4 Tendencia
Electrónica $6.224.336 $9.639.000 Sube
Ropa $3.813.555 $2.628.985 Baja ↓
Hogar $2.953.216 $2.723.151 Baja ↓
Accesorios $2.306.891 $1.710.083 Baja ↓

Hallazgo clave: Solo Electrónica muestra tendencia alcista hacia el T4, lo que coincide con la temporada de fiestas y el peak de ventas tecnológicas (Navidad, Año Nuevo).


3 Parte 3 — De información a decisión

3.1 Paso 6: Tabla de análisis — Respuestas esperadas

Categoría Ventas Totales (CLP) Margen Promedio (%) Tendencia T3→T4 ¿Es buena inversión?
Electrónica $27.668.324 57,4% Sube — Líder en ventas y en crecimiento
Ropa $12.047.137 64,7% Baja ↓ Posible — Alto margen pero tendencia negativa
Hogar $10.580.186 63,2% Baja ↓ Dudoso — Margen decente pero tendencia negativa
Accesorios $7.032.922 68,9% Baja ↓ Marginal — Mayor margen pero volumen bajo

3.2 Paso 7: Recomendación para María — Respuesta modelo

“Recomiendo invertir los $15.000.000 en la categoría Electrónica porque lidera las ventas con $27.668.324 anuales y es la única con tendencia de crecimiento positiva hacia el T4 (de $6,2M en T3 a $9,6M en T4), lo que sugiere un peak estacional que la campaña puede capitalizar.”

Argumentación alternativa válida (Ropa): > “Si bien Electrónica lidera en volumen, Ropa tiene el segundo mayor volumen ($12M) y el mayor margen de las categorías con alto volumen (64,7%). Podría ser más rentable invertir aquí si el margen es la prioridad estratégica, aunque su tendencia T3→T4 es negativa.”

Tip

Para el docente: Ambas argumentaciones son válidas. El objetivo pedagógico es que la recomendación esté justificada con datos. Penalizar respuestas sin evidencia cuantitativa.


4 Parte 4 — Reflexión final

4.1 Pregunta 1 — ¿Por qué no se podía responder sin procesar?

Con 1.257 filas individuales desordenadas, no es posible identificar cuál categoría vende más, cuál tiene mejor margen, ni cuál está creciendo. La transformación (tablas dinámicas) fue necesaria para agregar y resumir los datos en información accionable.

4.2 Pregunta 2 — ¿Qué transformé?

Nivel Ejemplo
Datos crudos 1.257 filas con transacciones individuales: fecha, producto, precio, región…
Información generada Ventas totales por categoría ordenadas, margen promedio, tendencia trimestral
Conocimiento aplicado Que una categoría con tendencia creciente hacia T4 es mejor candidata para inversión de campaña que una en declive, aunque tenga menor margen

4.3 Pregunta 3 — Límite de Excel

Escenario Observación esperada
1.250 filas (actual) Carga instantánea, operaciones fluidas
5.000 filas (triplicado) Carga lenta, tablas dinámicas demoran más
8.750.000 filas (TechStyle real) Excel no puede manejar más de ~1.048.576 filas (límite técnico). El archivo no abriría.
Important

Punto de entrada al curso: La incapacidad de Excel para manejar datos a escala real es precisamente la motivación para estudiar sistemas de bases de datos, arquitecturas de datos y herramientas analíticas escalables — que es exactamente lo que cubrirá este curso.