Cadeia de Suprimentos (Logística)

Objetivo: prever a demanda (vendas efetivas) por título × série × região × período, incorporando o comportamento de devoluções para melhorar compra, produção, distribuição e acurácia de faturamento.

Dados

  • Histórico 2022–2025: pedidos, faturamento, devoluções (quantidade/valor/motivo), calendário escolar e promoções.

  • Dimensões: título (ISBN), série/ano, adoção (nova/renovação), canal/região, cliente (escola/rede).

  • Sinais operacionais: ruptura/estoque, lead time, cortes logísticos, metas comerciais.

Abordagem de Modelagem

1) Previsão de Demanda (XGBoost Regressor)

  • Features de série temporal: lags (1,4,8,12), médias móveis (rolling_mean_4/12), dow/mês, sazonalidade de volta às aulas.

  • Features de negócio: preço/desconto, adoção nova vs. renovação, intensidade comercial, exposição, estoque/ruptura, calendário acadêmico por UF.

  • Efeitos espaciais: UF/região e proxy de renda/escolarização (quando disponível).

  • Targets: quantis p50/p90 (via loss de quantil/pinball) para suportar estoque de segurança.

2) Modelagem de Devoluções (Two-Stage)

  • Probabilidade de devolução (classificação) + severidade (regressão) → estima % devolvida.

  • Variáveis-chave: antecipação do pedido, excesso de envio, elasticidade a desconto, histórico de devolução por cliente/título, janela pós-pico (mar/abr), motivo de devolução.

  • Alternativa simplificada: XGBoost direto em % devolução com lags e calendário (janela de retorno típica de 30–90 dias).

  • Lag de devolução: modelado como offset temporal (ex.: pedidos de fev–mar geram devoluções em abr–mai).

3) Demanda Líquida

  • Demanda líquida = Demanda bruta prevista − Devoluções previstas (truncada em ≥ 0).

  • Reconciliação hierárquica (título → coleção → série → região → nacional) para fechar com o plano macro.

Tratamento de Casos Especiais

  • Intermitência (títulos de baixa rotação): agregação temporária + features de ocorrência (zero-inflated handling).

  • Novos títulos (cold start): similaridade por coleção/série e uso de curvas médias por UF.

  • Outliers: isolamento de picos promocionais/adoções extraordinárias com flags para não “contaminar” a sazonalidade.

Validação & Métricas

  • Time Series CV (janelas rolantes por calendário escolar).

  • Foco em WMAPE (por título e por mix), MASE, RMSE e Bias (super/under).

  • Métrica de negócio: Erro de previsão de liquidez (impacto no caixa/produção).

Operação & Entregáveis

  • Batch semanal/diário durante pico (nov–mar); horizonte D+90/D+180.

  • Saídas:

    • Tabelas forecast_bruto_{p50,p90}, forecast_devolucao_%, forecast_liquido_{p50,p90} com versão do modelo e erro histórico.

    • Dashboard (Power BI): calor por período/UF, curva de demanda vs. devolução, alerta de Bias/WMAPE.

  • Monitoramento: drift de mix, aumento atípico de devoluções por título/UF, alerta de ruptura.

Stack Técnica

  • Python: pandas, xgboost, scikit-learn, numpy, optuna (tuning), mlflow (rastros), polars/pyarrow.

  • Versionamento e reprodutibilidade (conda/poetry + MLflow); jobs orquestrados (cron/airflow).