Indústria e Machine Learning

Como a indústria pode usar Machine Learning para prever o que leva um consumidor a comprar?

Maicon Adone

11/13/20253 min read

Prever o comportamento de compra nunca foi tão estratégico para a indústria. Em um mercado competitivo, entender quais fatores influenciam a decisão do consumidor é fundamental para direcionar produtos, campanhas e investimentos de forma precisa.

Neste artigo, apresento uma abordagem analítica poderosa usada pela indústria e por pesquisadores: combinar modelos de segmentação probabilística (LCCM/GMM) com modelos preditivos de classificação (Random Forest). Essa união permite identificar perfis de consumidores e explicar o que realmente impulsiona a intenção de compra.

Parte 1 — Segmentação: LCCM e Gaussian Mixture Models (GMM)

A análise começa pela segmentação — entender quem são os diferentes perfis de consumidores com base em características comportamentais, psicológicas e contextuais.

O papel do LCCM / GMM

Modelos como Latent Class Choice Models (LCCM) e Gaussian Mixture Models (GMM) dividem os consumidores em "classes latentes", ou seja, grupos formados não apenas por dados demográficos, mas por drivers psicológicos, como:

  • Atitude em relação ao produto

  • Percepção de valor

  • Nível de risco percebido

  • Influência social (norma subjetiva)

Por que usar LCCM/GMM em vez de K-Means?

Esses modelos são probabilísticos, o que traz vantagens significativas:

1. Flexibilidade na representação dos dados

Capturam clusters com fronteiras irregulares e não lineares, comuns no comportamento humano.

2. Soft Clustering

Um consumidor pode pertencer parcialmente a mais de um cluster — algo impossível no K-Means.

3. Melhores para dados mistos

Lidam bem com variáveis contínuas e categóricas simultaneamente.

4. Métricas de escolha de clusters

  • AIC e BIC: identificam o número ideal de classes.

  • Silhouette Score: valida a qualidade da separação entre grupos.

Parte 2 — Previsão e Priorização: Random Forest (RF)

Depois de segmentar os consumidores, avançamos para a modelagem preditiva e quantificação da importância dos fatores que influenciam a compra.

O que o RF faz nesse contexto?

A Random Forest prevê a variável-alvo (por exemplo, intenção de compra) e gera um ranking de importância das variáveis explicativas — ajudando a indústria a descobrir o que realmente importa na decisão.

Por que o RF tem alta performance?

Robustez

Funciona muito bem com ruído, outliers e alta dimensionalidade.

Correlação de features

Lida bem com variáveis correlacionadas, reduzindo distorções no ranking.

Importância baseada em MDI

O Mean Decrease Impurity (MDI) mede o quanto cada variável melhora a pureza das decisões na floresta.

Métricas de avaliação recomendadas

  • Acurácia

  • F1-Score

  • Recall

  • AUC

  • R² (em regressão)

Caso Prático — Comportamento de Consumidores sobre Protetor Solar Sustentável

Para demonstrar a abordagem, utilizei GMM + Random Forest para estudar o comportamento de consumidores interessados em protetor solar natural e sustentável.

Resultados de Performance

A Random Forest apresentou excelente capacidade preditiva:

  • Acurácia: 0.9667

  • F1-Score: 0.9666

  • AUC: 0.9949

Na segmentação com GMM, obtive um Silhouette Score de 0.3004, indicando separação clara entre perfis de consumidores — excelente para comportamento psicológico.

Insights Estratégicos: O que realmente influencia a compra?

O modelo identificou o ranking de importância das variáveis na decisão:

  1. Atitude (27.1%) — avaliação geral do produto (“isso faz bem para mim e para o planeta”)

  2. Esforço Percebido (25.5%) — simplicidade da jornada de compra

  3. Norma Subjetiva (24.5%) — influência social direta

  4. Consciência (11.0%) — conhecimento sobre o produto

  5. Risco Percebido (9.9%) — medo de “perder” ao comprar

  6. Valor (2.0%) — percepção de custo-benefício

O que isso significa para estratégias de Marketing?

Com base nos insights:

Foque no que funciona:

  • Construir atitude positiva (benefícios pessoais e ambientais)

  • Reduzir o esforço de compra (UX, checkout, disponibilidade)

  • Aproveitar a influência social (reviews, prova social, creators)

Nem tudo vale esforço:

  • Campanhas voltadas a “valor”, “risco” ou “consciência” têm impacto significativamente menor.

Conclusão

Combinar segmentação probabilística (LCCM/GMM) com modelagem preditiva (Random Forest) é uma abordagem moderna, interpretável e poderosa para:

  • Entender perfis de consumidores

  • Prever comportamentos

  • Priorizar fatores-chave

  • Criar campanhas com ROI elevado

  • Desenvolver produtos orientados por dados

Se a indústria quer prever por que um consumidor compra, essa é a metodologia.