Se aplicó el algoritmo Apriori sobre el histórico de ventas de la pastelería para descubrir patrones de compra conjunta entre productos. El modelo identificó 185 reglas de asociación estadísticamente significativas que permiten anticipar qué productos adicionales es probable que adquiera un cliente en función de su carrito actual.
Los hallazgos revelan tres clústeres de afinidad claros: (1) productos de manzana (Apple Tart, Apple Croissant, Apple Danish, Cherry Soda), (2) bebidas cítricas y cookies (Lemon Lemonade, Raspberry Lemonade, Lemon Cookie, Raspberry Cookie) y (3) cafés especiales (Coffee Eclair, Hot Coffee, Almond Twist). Estas asociaciones presentan un lift superior a 10×, lo que las convierte en oportunidades concretas de cross-selling.
El dataset Bakery.csv registra las transacciones de una pastelería francesa con 9,981 tickets de compra y 50 productos distintos en formato de matriz binaria (1 = producto comprado, 0 = no comprado). Los tickets contienen entre 1 y 8 artículos, con un promedio de 3.56.
El Algoritmo Apriori es el estándar de la industria para Market Basket Analysis. Identifica conjuntos de productos que aparecen frecuentemente juntos y genera reglas del tipo "Si el cliente compra A, también compra B". Para evaluar si una regla es realmente útil, en este reporte se usan tres métricas principales:
Soporte: indica qué tan frecuente es la combinación dentro de todos los tickets. Ayuda a separar asociaciones relevantes de coincidencias poco comunes.
Confianza: mide la probabilidad de que ocurra la recomendación una vez que ya apareció el antecedente. En otras palabras, responde a: "si el cliente compró A, ¿con qué frecuencia también compra B?"
Lift: compara la regla contra lo que ocurriría por azar. Un lift mayor que 1 indica que la asociación aporta valor; cuanto más alto es, más fuerte es la relación entre los productos.
Además, el modelo calcula métricas complementarias como leverage y convicción para análisis técnico, y construye un score operativo (confianza × lift) para ordenar recomendaciones en el simulador. Ese score no es una métrica estándar de Apriori, sino una forma práctica de priorizar sugerencias de venta cruzada.
Carga de datos
9,981 transacciones en formato one-hot (matriz binaria 9981 × 50)
Itemsets frecuentes
Apriori identifica combinaciones de productos con soporte ≥ 2%
Generación de reglas
Se derivan reglas A → B filtrando por confianza y lift mínimos
Ranking
Las reglas se comparan con soporte, confianza y lift para identificar las más útiles
Motor de recomendación
Score operativo = confianza × lift, usado para priorizar recomendaciones en tiempo real
| Parámetro | Valor | Interpretación | Justificación de elección |
|---|---|---|---|
| min_support | 0.02 | El conjunto de productos aparece en al menos el 2% de los tickets (≥ 199 transacciones). | Ticket promedio de 3.56 ítems genera soportes bajos de forma natural. Umbral del 2% captura asociaciones reales sin ruido estadístico. |
| min_confidence | 0.25 | Dado que el cliente compra A, la probabilidad de que compre B es ≥ 25%. | Umbral accionable para recomendaciones operativas; más alto filtraría clústeres de nicho con buen lift. |
| min_lift | 1.2 | La co-ocurrencia es al menos 20% más frecuente que si fuese aleatoria. | Descarta correlaciones espurias. Las mejores reglas del modelo superan lift = 10, lo que indica asociaciones muy fuertes. |
| max_len | 3 | Reglas de hasta 3 productos (A+B → C). | Balance entre potencia del modelo e interpretabilidad operativa. Reglas de 4+ ítems tienen soporte muy bajo en este dataset. |
Se generaron 185 reglas en total. La tabla muestra las 20 más fuertes ordenadas por Lift descendente. El color de fila indica la intensidad de la asociación: verde = lift ≥ 10 amarillo = lift 5–10 blanco = lift < 5
| # | Si compra… | Recomienda… | Soporte | Confianza | Lift |
|---|---|---|---|---|---|
| 1 | Apple Danish | Apple Tart + Cherry Soda | 0.020 | 0.310 | 14.17 |
| 2 | Apple Tart + Cherry Soda | Apple Danish | 0.020 | 0.936 | 14.17 |
| 3 | Apple Tart + Cherry Soda | Apple Croissant | 0.021 | 0.945 | 13.69 |
| 4 | Apple Croissant | Apple Tart + Cherry Soda | 0.021 | 0.299 | 13.69 |
| 5 | Lemon Lemonade + Raspberry Lemonade | Raspberry Cookie | 0.026 | 0.956 | 13.68 |
| 6 | Raspberry Cookie | Lemon Lemonade + Raspberry Lemonade | 0.026 | 0.370 | 13.68 |
| 7 | Apple Croissant + Apple Tart | Apple Danish | 0.024 | 0.894 | 13.54 |
| 8 | Apple Danish | Apple Croissant + Apple Tart | 0.024 | 0.370 | 13.54 |
| 9 | Raspberry Cookie + Raspberry Lemonade | Lemon Lemonade | 0.026 | 0.928 | 13.48 |
| 10 | Lemon Lemonade | Raspberry Cookie + Raspberry Lemonade | 0.026 | 0.376 | 13.48 |
| 11 | Lemon Cookie | Lemon Lemonade + Raspberry Lemonade | 0.026 | 0.362 | 13.39 |
| 12 | Lemon Lemonade + Raspberry Lemonade | Lemon Cookie | 0.026 | 0.959 | 13.39 |
| 13 | Raspberry Lemonade | Lemon Cookie + Lemon Lemonade | 0.026 | 0.382 | 13.38 |
| 14 | Lemon Cookie + Lemon Lemonade | Raspberry Lemonade | 0.026 | 0.909 | 13.38 |
| 15 | Lemon Cookie + Raspberry Lemonade | Lemon Lemonade | 0.026 | 0.915 | 13.30 |
| 16 | Lemon Lemonade | Lemon Cookie + Raspberry Lemonade | 0.026 | 0.377 | 13.30 |
| 17 | Raspberry Lemonade | Lemon Cookie + Raspberry Cookie | 0.026 | 0.381 | 13.28 |
| 18 | Lemon Cookie + Raspberry Cookie | Raspberry Lemonade | 0.026 | 0.902 | 13.28 |
| 19 | Lemon Lemonade + Raspberry Cookie | Raspberry Lemonade | 0.026 | 0.902 | 13.28 |
| 20 | Raspberry Lemonade | Lemon Lemonade + Raspberry Cookie | 0.026 | 0.381 | 13.28 |
Clúster Manzana
Apple Tart, Apple Croissant, Apple Danish y Cherry Soda forman el grupo de mayor lift del dataset (hasta 14.17). Los clientes que compran cualquier producto de este grupo tienen alta probabilidad de añadir otro.
Clúster Cítrico
Lemon Lemonade, Raspberry Lemonade, Lemon Cookie y Raspberry Cookie conforman un segundo grupo cohesionado (lift ~13.4). Sugieren un perfil de cliente que prefiere sabores frescos y ácidos.
Clúster Café
Coffee Eclair + Hot Coffee → Almond Twist con confianza del 88.7% y lift 11.93. Representa la combinación "café + pastelería de almendra" del cliente habitual de mañana.
Clúster Chocolate
Chocolate Cake activa recomendaciones de Casino Cake y Chocolate Coffee (lift 11.67). Los amantes del chocolate tienden a complementar con bebidas del mismo perfil.
1 · Recomendación en TPV / Caja
Integrar el motor de recomendación en el sistema de punto de venta. Al registrar cada producto, el sistema sugiere los 3 ítems con mayor score (confianza × lift) para que el cajero los ofrezca verbalmente o se muestren en pantalla.
2 · Diseño del Mostrador
Colocar físicamente juntos los productos de cada clúster. Los clientes que ven Apple Tart y Apple Croissant contiguos tienen mayor probabilidad de añadir Apple Danish, aumentando el ticket promedio de forma pasiva.
3 · Combos y Promociones
Las reglas con confianza > 85% son candidatas ideales para paquetes promocionales. Ejemplo: combo "Frescura Cítrica" (Lemon Lemonade + Raspberry Lemonade + Raspberry Cookie) con 5–8% de descuento sobre precio individual.
4 · Planificación de Producción
Los pares con alto lift permiten ajustar la producción diaria en conjunto. Si se planifica producir más Apple Tart, se debe incrementar proporcionalmente Apple Croissant y Apple Danish para evitar quiebres de stock.
5 · Menú Digital / Quiosco
En pedidos online o kioscos, mostrar automáticamente el bloque "Los clientes también llevaron…" usando las reglas con mayor confianza para el ítem seleccionado.
6 · Seguimiento y Reentrenamiento
Re-ejecutar el modelo mensualmente para capturar cambios estacionales (ej. más ventas de productos cítricos en verano). Comparar el lift a lo largo del tiempo para detectar tendencias emergentes.