Explicações de Estatística
Marcar Sessão

Estatística Multivariada

A estatística multivariada analisa várias variáveis em simultâneo, permitindo compreender estruturas complexas, reduzir dimensão, segmentar perfis e testar modelos com múltiplos preditores.

Quando é útil

  • Questionários com muitos itens e dimensões latentes.
  • Perfis de clientes/alunos/doentes com várias variáveis.
  • Modelos explicativos com múltiplos fatores.
  • Dados com correlação entre variáveis.

Objetivos típicos

  • Reduzir: condensar informação (PCA/AFE).
  • Classificar: separar grupos (discriminante).
  • Segmentar: descobrir grupos naturais (cluster).
  • Modelar: relações complexas (SEM).

Principais técnicas multivariadas

TécnicaPara que serveQuando usar
PCA (Componentes Principais)Redução de dimensionalidadeMuitas variáveis quantitativas correlacionadas
AFE (Análise Factorial Exploratória)Identificar fatores latentesConstrução/validação inicial de escalas
AFC (Análise Factorial Confirmatória)Confirmar estrutura factorialTeste de modelo de medida em SEM
ClusterSegmentação sem variável-alvoDescobrir perfis/grupos naturais
Análise DiscriminanteClassificação supervisionadaGrupos definidos + preditores contínuos
MANOVAComparar grupos em múltiplas dependentesVárias Y contínuas em simultâneo
SEM / PLS-SEMModelos com variáveis latentesMediação, moderação e modelos teóricos complexos

Fluxo prático de análise

  1. Preparação: limpeza, missing values, outliers.
  2. Diagnóstico: correlações, normalidade, multicolinearidade.
  3. Escolha do método: conforme objetivo (reduzir, segmentar, modelar).
  4. Ajuste e validação: métricas de qualidade do modelo.
  5. Interpretação substantiva: traduzir resultados para o problema real.

PCA / AFE

O que reportar: KMO, teste de Bartlett, método de extração, rotação, variância explicada, cargas factorais.

Regras úteis: cargas ≥ .40 (guia), comunalidades aceitáveis, coerência teórica dos fatores.

Ver página de análise factorial →

Cluster

O que reportar: método (k-means/hierárquico), número de clusters, métricas de separação (silhouette, WSS), interpretação dos perfis.

Atenção: normalizar variáveis antes do clustering quando têm escalas diferentes.

Ver página de análise de cluster →

MANOVA

O que reportar: Wilks' Lambda (ou Pillai), F, p-value, efeito multivariado, análises univariadas subsequentes.

Quando preferir: quando existem várias variáveis dependentes correlacionadas e grupos de comparação.

SEM / PLS-SEM

O que reportar: índices de ajustamento (CFI, RMSEA, SRMR), validade convergente/discriminante, coeficientes de caminho.

Ver página de SEM / PLS-SEM →

Pressupostos comuns em multivariada

  • Tamanho amostral adequado ao método (ex.: AFE/SEM exigem amostra maior).
  • Ausência de multicolinearidade extrema entre preditores.
  • Normalidade (quando aplicável ao método).
  • Independência das observações.
  • Qualidade da medição (fiabilidade das escalas).

Exemplos em R

# PCA
pca <- prcomp(dados[, vars], scale. = TRUE)
summary(pca)

# AFE (pacote psych)
library(psych)
fa.parallel(dados[, itens])
fa(dados[, itens], nfactors = 3, rotate = "oblimin")

# Cluster k-means
set.seed(123)
km <- kmeans(scale(dados[, vars]), centers = 3, nstart = 25)
table(km$cluster)

# MANOVA
fit <- manova(cbind(y1, y2, y3) ~ grupo, data = dados)
summary(fit, test = "Wilks")

Em Jamovi

  • AFE/PCA: módulo Factor.
  • MANOVA: ANOVA multivariada (dependendo dos módulos ativos).
  • SEM: módulo SEMLj.

Ver secção Jamovi →

Exemplo de reporte (APA)

Foi realizada uma AFE (rotação oblimin) sobre 18 itens.
O KMO foi .86 e o teste de Bartlett foi significativo, χ²(153) = 1240.5, p < .001.
Foram retidos 3 fatores, explicando 62.4% da variância total.

Ver guia de escrita APA →