Estatística Multivariada

A estatística multivariada analisa várias variáveis em simultâneo, permitindo compreender estruturas complexas, reduzir dimensão, segmentar perfis e testar modelos com múltiplos preditores.

Quando é útil

Questionários com muitos itens e dimensões latentes.
Perfis de clientes/alunos/doentes com várias variáveis.
Modelos explicativos com múltiplos fatores.
Dados com correlação entre variáveis.

Objetivos típicos

Reduzir: condensar informação (PCA/AFE).
Classificar: separar grupos (discriminante).
Segmentar: descobrir grupos naturais (cluster).
Modelar: relações complexas (SEM).

Principais técnicas multivariadas

Técnica	Para que serve	Quando usar
PCA (Componentes Principais)	Redução de dimensionalidade	Muitas variáveis quantitativas correlacionadas
AFE (Análise Factorial Exploratória)	Identificar fatores latentes	Construção/validação inicial de escalas
AFC (Análise Factorial Confirmatória)	Confirmar estrutura factorial	Teste de modelo de medida em SEM
Cluster	Segmentação sem variável-alvo	Descobrir perfis/grupos naturais
Análise Discriminante	Classificação supervisionada	Grupos definidos + preditores contínuos
MANOVA	Comparar grupos em múltiplas dependentes	Várias Y contínuas em simultâneo
SEM / PLS-SEM	Modelos com variáveis latentes	Mediação, moderação e modelos teóricos complexos

Fluxo prático de análise

Preparação: limpeza, missing values, outliers.
Diagnóstico: correlações, normalidade, multicolinearidade.
Escolha do método: conforme objetivo (reduzir, segmentar, modelar).
Ajuste e validação: métricas de qualidade do modelo.
Interpretação substantiva: traduzir resultados para o problema real.

PCA / AFE

O que reportar: KMO, teste de Bartlett, método de extração, rotação, variância explicada, cargas factorais.

Regras úteis: cargas ≥ .40 (guia), comunalidades aceitáveis, coerência teórica dos fatores.

Ver página de análise factorial →

Cluster

O que reportar: método (k-means/hierárquico), número de clusters, métricas de separação (silhouette, WSS), interpretação dos perfis.

Atenção: normalizar variáveis antes do clustering quando têm escalas diferentes.

Ver página de análise de cluster →

MANOVA

O que reportar: Wilks' Lambda (ou Pillai), F, p-value, efeito multivariado, análises univariadas subsequentes.

Quando preferir: quando existem várias variáveis dependentes correlacionadas e grupos de comparação.

SEM / PLS-SEM

O que reportar: índices de ajustamento (CFI, RMSEA, SRMR), validade convergente/discriminante, coeficientes de caminho.

Ver página de SEM / PLS-SEM →

Pressupostos comuns em multivariada

Tamanho amostral adequado ao método (ex.: AFE/SEM exigem amostra maior).
Ausência de multicolinearidade extrema entre preditores.
Normalidade (quando aplicável ao método).
Independência das observações.
Qualidade da medição (fiabilidade das escalas).

Exemplos em R

# PCA
pca <- prcomp(dados[, vars], scale. = TRUE)
summary(pca)

# AFE (pacote psych)
library(psych)
fa.parallel(dados[, itens])
fa(dados[, itens], nfactors = 3, rotate = "oblimin")

# Cluster k-means
set.seed(123)
km <- kmeans(scale(dados[, vars]), centers = 3, nstart = 25)
table(km$cluster)

# MANOVA
fit <- manova(cbind(y1, y2, y3) ~ grupo, data = dados)
summary(fit, test = "Wilks")

Em Jamovi

AFE/PCA: módulo Factor.
MANOVA: ANOVA multivariada (dependendo dos módulos ativos).
SEM: módulo SEMLj.

Ver secção Jamovi →

Exemplo de reporte (APA)

Foi realizada uma AFE (rotação oblimin) sobre 18 itens.
O KMO foi .86 e o teste de Bartlett foi significativo, χ²(153) = 1240.5, p < .001.
Foram retidos 3 fatores, explicando 62.4% da variância total.

Ver guia de escrita APA →