Estatística Multivariada
A estatística multivariada analisa várias variáveis em simultâneo, permitindo compreender estruturas complexas, reduzir dimensão, segmentar perfis e testar modelos com múltiplos preditores.
Quando é útil
- Questionários com muitos itens e dimensões latentes.
- Perfis de clientes/alunos/doentes com várias variáveis.
- Modelos explicativos com múltiplos fatores.
- Dados com correlação entre variáveis.
Objetivos típicos
- Reduzir: condensar informação (PCA/AFE).
- Classificar: separar grupos (discriminante).
- Segmentar: descobrir grupos naturais (cluster).
- Modelar: relações complexas (SEM).
Principais técnicas multivariadas
| Técnica | Para que serve | Quando usar |
|---|---|---|
| PCA (Componentes Principais) | Redução de dimensionalidade | Muitas variáveis quantitativas correlacionadas |
| AFE (Análise Factorial Exploratória) | Identificar fatores latentes | Construção/validação inicial de escalas |
| AFC (Análise Factorial Confirmatória) | Confirmar estrutura factorial | Teste de modelo de medida em SEM |
| Cluster | Segmentação sem variável-alvo | Descobrir perfis/grupos naturais |
| Análise Discriminante | Classificação supervisionada | Grupos definidos + preditores contínuos |
| MANOVA | Comparar grupos em múltiplas dependentes | Várias Y contínuas em simultâneo |
| SEM / PLS-SEM | Modelos com variáveis latentes | Mediação, moderação e modelos teóricos complexos |
Fluxo prático de análise
- Preparação: limpeza, missing values, outliers.
- Diagnóstico: correlações, normalidade, multicolinearidade.
- Escolha do método: conforme objetivo (reduzir, segmentar, modelar).
- Ajuste e validação: métricas de qualidade do modelo.
- Interpretação substantiva: traduzir resultados para o problema real.
PCA / AFE
O que reportar: KMO, teste de Bartlett, método de extração, rotação, variância explicada, cargas factorais.
Regras úteis: cargas ≥ .40 (guia), comunalidades aceitáveis, coerência teórica dos fatores.
Cluster
O que reportar: método (k-means/hierárquico), número de clusters, métricas de separação (silhouette, WSS), interpretação dos perfis.
Atenção: normalizar variáveis antes do clustering quando têm escalas diferentes.
MANOVA
O que reportar: Wilks' Lambda (ou Pillai), F, p-value, efeito multivariado, análises univariadas subsequentes.
Quando preferir: quando existem várias variáveis dependentes correlacionadas e grupos de comparação.
SEM / PLS-SEM
O que reportar: índices de ajustamento (CFI, RMSEA, SRMR), validade convergente/discriminante, coeficientes de caminho.
Pressupostos comuns em multivariada
- Tamanho amostral adequado ao método (ex.: AFE/SEM exigem amostra maior).
- Ausência de multicolinearidade extrema entre preditores.
- Normalidade (quando aplicável ao método).
- Independência das observações.
- Qualidade da medição (fiabilidade das escalas).
Exemplos em R
# PCA pca <- prcomp(dados[, vars], scale. = TRUE) summary(pca) # AFE (pacote psych) library(psych) fa.parallel(dados[, itens]) fa(dados[, itens], nfactors = 3, rotate = "oblimin") # Cluster k-means set.seed(123) km <- kmeans(scale(dados[, vars]), centers = 3, nstart = 25) table(km$cluster) # MANOVA fit <- manova(cbind(y1, y2, y3) ~ grupo, data = dados) summary(fit, test = "Wilks")
Em Jamovi
- AFE/PCA: módulo Factor.
- MANOVA: ANOVA multivariada (dependendo dos módulos ativos).
- SEM: módulo SEMLj.
Exemplo de reporte (APA)
Foi realizada uma AFE (rotação oblimin) sobre 18 itens. O KMO foi .86 e o teste de Bartlett foi significativo, χ²(153) = 1240.5, p < .001. Foram retidos 3 fatores, explicando 62.4% da variância total.