Previsão de Demanda (varejo)

Contexto 2024 (1.065 lojas em todo Brasil):

  • Média diária > 8.000 pedidos

  • Sexta/Sábado: > 12.000 pedidos

  • Domingo: > 4.000 pedidos

  • Forte sazonalidade semanal, picos promocionais e efeitos regionais

Objetivo 2025: gerar previsões diárias (p50/p90) por SKU–loja–canal para suportar S&OP, reposição e logística em escala nacional.

Arquitetura & Dados

  • Grão da previsão: data × loja × categoria × SKU (agregações por região/estado para reconciliação)

  • Fontes principais

    • Pedidos/histórico de vendas 2023–2024

    • Calendário promocional (campanhas, BF, Natal, Volta às Aulas)

    • Preço/descontos, estoque/ruptura, exposição (banner, buy-box), SLA

    • Sazonais externas: feriados nacionais/estaduais/municipais, clima, calendário escolar

  • Qualidade de dados

    • Tratamento de outliers (picos de campanha, rupturas)

    • Sinalização de promo/price change e stock-out para evitar viés de demanda

    • Imputação controlada para séries curtas/novos SKUs

Abordagem de Modelagem (Híbrida e Hierárquica)

  1. Séries Temporais

    • SARIMAX/Prophet (tendência + sazonalidade semanal/fériados BR) por agregações estáveis (loja×categoria)

    • Croston/SBA para SKUs intermitentes (baixa rotação)

  2. Modelos Baseados em Features

    • LightGBM/XGBoost com variáveis: lags/rolling stats, dia da semana, feriados, preço/elasticidade, indicadores de campanha, sinal de ruptura, clima, efeitos regionais

    • Uplift de promoção (dupla abordagem): modelo de promo uplift (árvores causais) + dummies calibradas por categoria

  3. Ensemble & Reconciliação

    • Ensemble (pesos por janela de backtesting) entre série temporal e feature-based

    • Reconciliação hierárquica (MinT/Top-Down) para garantir que a soma SKU→loja→região→Brasil feche com o plano macro

  4. Previsão Probabilística

    • Quantis p50/p90/p95 por SKU–loja para abastecimento e cobertura de serviço

Validação e Métricas

  • Time Series CV (janelas rolantes mensais/semanais)

  • Métricas alvo:

    • WMAPE (prioritária em varejo), MASE, RMSE

    • Bias (tendência de super/under-forecast)

    • Pinball Loss para quantis (qualidade do p90/p95)

  • Cortes operacionais:

    • Macro BR (país), por região/UF, por loja, por categoria e SKU top-N (pareto)

Operação & Entregáveis

  • Batch diário (D-1 para D+14 / D+30), com atualização intradiária em pico promocional

  • Tamanhos de lote: 1.065 lojas × milhares de SKUs (Spark/Polars p/ escala)

  • Saídas

    • Tabelas: forecast_daily_{p50,p90} com metadata (modelo, versão, erro histórico, flags)

    • Dashboard (Power BI): visão nacional→regional→loja→SKU, mapa de calor por semana, alerta de bias/WMAPE

    • API/arquivo para OMS/WMS/abastecimento

  • Monitoramento em produção

    • WAPE diário por nível, Bias, drift de mix/estoque

    • Alarmes por desvio vs. realizado e rupturas impactando acurácia

Roadmap (4 sprints)

  1. Fundação de dados: camadas bronze/prata (limpeza/outliers/ruptura), calendário BR e promo

  2. MVP de previsão: modelos por categoria (SARIMAX/Prophet + LGBM), quantis p50/p90, WMAPE macro

  3. Escala e reconciliação: hierarquia SKU–loja–região, ensemble + MinT, automação do batch

  4. Promo & robustez: uplift de campanhas, cold-start (similaridade por atributos), monitoramento e tunagem de bias