Modelo de Recomendación de Productos

Reglas de Asociación — Pastelería Francesa (Bakery France)

1
Resumen Ejecutivo
9,981
Transacciones analizadas
50
Productos del catálogo
185
Reglas de asociación
3.56
Productos promedio / ticket
14.17
Lift máximo encontrado

Se aplicó el algoritmo Apriori sobre el histórico de ventas de la pastelería para descubrir patrones de compra conjunta entre productos. El modelo identificó 185 reglas de asociación estadísticamente significativas que permiten anticipar qué productos adicionales es probable que adquiera un cliente en función de su carrito actual.

Los hallazgos revelan tres clústeres de afinidad claros: (1) productos de manzana (Apple Tart, Apple Croissant, Apple Danish, Cherry Soda), (2) bebidas cítricas y cookies (Lemon Lemonade, Raspberry Lemonade, Lemon Cookie, Raspberry Cookie) y (3) cafés especiales (Coffee Eclair, Hot Coffee, Almond Twist). Estas asociaciones presentan un lift superior a 10×, lo que las convierte en oportunidades concretas de cross-selling.

2
Exploración del Dataset

El dataset Bakery.csv registra las transacciones de una pastelería francesa con 9,981 tickets de compra y 50 productos distintos en formato de matriz binaria (1 = producto comprado, 0 = no comprado). Los tickets contienen entre 1 y 8 artículos, con un promedio de 3.56.

Frecuencia de productos
Figura 1 — Frecuencia de compra por producto. La línea roja indica el umbral mínimo de soporte (2%). Todos los 50 productos superan dicho umbral.
Productos por ticket
Figura 2 — Distribución de la cantidad de productos por ticket. La mayoría de transacciones contienen entre 2 y 5 artículos.
3
Metodología — Algoritmo Apriori

El Algoritmo Apriori es el estándar de la industria para Market Basket Analysis. Identifica conjuntos de productos que aparecen frecuentemente juntos y genera reglas del tipo "Si el cliente compra A, también compra B". Para evaluar si una regla es realmente útil, en este reporte se usan tres métricas principales:

Soporte: indica qué tan frecuente es la combinación dentro de todos los tickets. Ayuda a separar asociaciones relevantes de coincidencias poco comunes.

Confianza: mide la probabilidad de que ocurra la recomendación una vez que ya apareció el antecedente. En otras palabras, responde a: "si el cliente compró A, ¿con qué frecuencia también compra B?"

Lift: compara la regla contra lo que ocurriría por azar. Un lift mayor que 1 indica que la asociación aporta valor; cuanto más alto es, más fuerte es la relación entre los productos.

Además, el modelo calcula métricas complementarias como leverage y convicción para análisis técnico, y construye un score operativo (confianza × lift) para ordenar recomendaciones en el simulador. Ese score no es una métrica estándar de Apriori, sino una forma práctica de priorizar sugerencias de venta cruzada.

Carga de datos

9,981 transacciones en formato one-hot (matriz binaria 9981 × 50)

Itemsets frecuentes

Apriori identifica combinaciones de productos con soporte ≥ 2%

Generación de reglas

Se derivan reglas A → B filtrando por confianza y lift mínimos

Ranking

Las reglas se comparan con soporte, confianza y lift para identificar las más útiles

Motor de recomendación

Score operativo = confianza × lift, usado para priorizar recomendaciones en tiempo real


ParámetroValorInterpretaciónJustificación de elección
min_support0.02 El conjunto de productos aparece en al menos el 2% de los tickets (≥ 199 transacciones). Ticket promedio de 3.56 ítems genera soportes bajos de forma natural. Umbral del 2% captura asociaciones reales sin ruido estadístico.
min_confidence0.25 Dado que el cliente compra A, la probabilidad de que compre B es ≥ 25%. Umbral accionable para recomendaciones operativas; más alto filtraría clústeres de nicho con buen lift.
min_lift1.2 La co-ocurrencia es al menos 20% más frecuente que si fuese aleatoria. Descarta correlaciones espurias. Las mejores reglas del modelo superan lift = 10, lo que indica asociaciones muy fuertes.
max_len3 Reglas de hasta 3 productos (A+B → C). Balance entre potencia del modelo e interpretabilidad operativa. Reglas de 4+ ítems tienen soporte muy bajo en este dataset.
4
Reglas de Asociación — Top 20 por Lift

Se generaron 185 reglas en total. La tabla muestra las 20 más fuertes ordenadas por Lift descendente. El color de fila indica la intensidad de la asociación: verde = lift ≥ 10  amarillo = lift 5–10  blanco = lift < 5

#Si compra…Recomienda…SoporteConfianzaLift
1Apple DanishApple Tart + Cherry Soda0.0200.31014.17
2Apple Tart + Cherry SodaApple Danish0.0200.93614.17
3Apple Tart + Cherry SodaApple Croissant0.0210.94513.69
4Apple CroissantApple Tart + Cherry Soda0.0210.29913.69
5Lemon Lemonade + Raspberry LemonadeRaspberry Cookie0.0260.95613.68
6Raspberry CookieLemon Lemonade + Raspberry Lemonade0.0260.37013.68
7Apple Croissant + Apple TartApple Danish0.0240.89413.54
8Apple DanishApple Croissant + Apple Tart0.0240.37013.54
9Raspberry Cookie + Raspberry LemonadeLemon Lemonade0.0260.92813.48
10Lemon LemonadeRaspberry Cookie + Raspberry Lemonade0.0260.37613.48
11Lemon CookieLemon Lemonade + Raspberry Lemonade0.0260.36213.39
12Lemon Lemonade + Raspberry LemonadeLemon Cookie0.0260.95913.39
13Raspberry LemonadeLemon Cookie + Lemon Lemonade0.0260.38213.38
14Lemon Cookie + Lemon LemonadeRaspberry Lemonade0.0260.90913.38
15Lemon Cookie + Raspberry LemonadeLemon Lemonade0.0260.91513.30
16Lemon LemonadeLemon Cookie + Raspberry Lemonade0.0260.37713.30
17Raspberry LemonadeLemon Cookie + Raspberry Cookie0.0260.38113.28
18Lemon Cookie + Raspberry CookieRaspberry Lemonade0.0260.90213.28
19Lemon Lemonade + Raspberry CookieRaspberry Lemonade0.0260.90213.28
20Raspberry LemonadeLemon Lemonade + Raspberry Cookie0.0260.38113.28
5
Visualizaciones del Modelo
Soporte vs Confianza
Figura 3 — Mapa de reglas: soporte vs. confianza. Tamaño y color del punto reflejan el Lift. Las mejores reglas aparecen en la esquina superior derecha con color verde intenso.
Top 20 reglas por Lift
Figura 4 — Las 20 reglas con mayor Lift. Los clústeres de Apple, Lemon/Raspberry y Coffee dominan el ranking.

Heatmap de confianza
Figura 5 — Heatmap de confianza: filas = antecedente (si compra), columnas = consecuente (recomienda). Los cuadros rojizos oscuros indican asociaciones muy fuertes (confianza > 0.8).
Red de asociaciones
Figura 6 — Grafo de las 30 reglas con mayor Lift. El grosor del arco es proporcional al Lift y el color a la Confianza. Los nodos más grandes son los más conectados.
6
Hallazgos Clave

Clúster Manzana

Apple Tart, Apple Croissant, Apple Danish y Cherry Soda forman el grupo de mayor lift del dataset (hasta 14.17). Los clientes que compran cualquier producto de este grupo tienen alta probabilidad de añadir otro.

Apple Tart + Cherry Soda → Apple Danish · Lift 14.17

Clúster Cítrico

Lemon Lemonade, Raspberry Lemonade, Lemon Cookie y Raspberry Cookie conforman un segundo grupo cohesionado (lift ~13.4). Sugieren un perfil de cliente que prefiere sabores frescos y ácidos.

Lemon Lemonade → Raspberry Cookie · Lift 13.68

Clúster Café

Coffee Eclair + Hot Coffee → Almond Twist con confianza del 88.7% y lift 11.93. Representa la combinación "café + pastelería de almendra" del cliente habitual de mañana.

Coffee Eclair + Hot Coffee → Almond Twist · Lift 11.93

Clúster Chocolate

Chocolate Cake activa recomendaciones de Casino Cake y Chocolate Coffee (lift 11.67). Los amantes del chocolate tienden a complementar con bebidas del mismo perfil.

Chocolate Cake → Chocolate Coffee · Lift 11.67
7
Cómo Utilizar los Resultados del Modelo

1 · Recomendación en TPV / Caja

Integrar el motor de recomendación en el sistema de punto de venta. Al registrar cada producto, el sistema sugiere los 3 ítems con mayor score (confianza × lift) para que el cajero los ofrezca verbalmente o se muestren en pantalla.

2 · Diseño del Mostrador

Colocar físicamente juntos los productos de cada clúster. Los clientes que ven Apple Tart y Apple Croissant contiguos tienen mayor probabilidad de añadir Apple Danish, aumentando el ticket promedio de forma pasiva.

3 · Combos y Promociones

Las reglas con confianza > 85% son candidatas ideales para paquetes promocionales. Ejemplo: combo "Frescura Cítrica" (Lemon Lemonade + Raspberry Lemonade + Raspberry Cookie) con 5–8% de descuento sobre precio individual.

4 · Planificación de Producción

Los pares con alto lift permiten ajustar la producción diaria en conjunto. Si se planifica producir más Apple Tart, se debe incrementar proporcionalmente Apple Croissant y Apple Danish para evitar quiebres de stock.

5 · Menú Digital / Quiosco

En pedidos online o kioscos, mostrar automáticamente el bloque "Los clientes también llevaron…" usando las reglas con mayor confianza para el ítem seleccionado.

6 · Seguimiento y Reentrenamiento

Re-ejecutar el modelo mensualmente para capturar cambios estacionales (ej. más ventas de productos cítricos en verano). Comparar el lift a lo largo del tiempo para detectar tendencias emergentes.