Correlação
A correlação mede a força e a direção da relação entre duas variáveis. Não implica causalidade, mas ajuda a identificar padrões importantes nos dados.
Quando usar
- Explorar relação entre duas variáveis quantitativas.
- Verificar associação antes de regressão linear.
- Comparar escalas/itens em questionários.
Regra prática
- r > 0: relação positiva.
- r < 0: relação negativa.
- |r| próximo de 1: relação forte.
- |r| próximo de 0: relação fraca.
Correlação de Pearson
Usa-se para variáveis quantitativas com relação aproximadamente linear.
Fórmula:
r = Σ[(xᵢ - x̄)(yᵢ - ȳ)] / √(Σ(xᵢ - x̄)² · Σ(yᵢ - ȳ)²)
Onde x̄ e ȳ são as médias de X e Y.
Teste de significância de Pearson
Para testar H0: ρ = 0:
t = r √((n - 2) / (1 - r²)), gl = n - 2
O p-value é obtido na distribuição t-Student com n-2 graus de liberdade.
Correlação de Spearman
Usa-se quando os dados são ordinais, têm outliers fortes ou a relação é monotónica mas não linear.
Fórmula (sem empates):
ρ = 1 - (6 Σdᵢ²) / (n(n² - 1))
Onde dᵢ é a diferença entre os postos de cada par de observações.
Interpretação de magnitude
| Valor de |r| | Interpretação comum |
|---|---|
| 0.00 – 0.19 | Muito fraca |
| 0.20 – 0.39 | Fraca |
| 0.40 – 0.59 | Moderada |
| 0.60 – 0.79 | Forte |
| 0.80 – 1.00 | Muito forte |
Nota: estes intervalos são guias práticos e dependem da área científica.
Pressupostos principais (Pearson)
- Relação aproximadamente linear entre as variáveis.
- Variáveis quantitativas contínuas.
- Ausência de outliers extremos que distorçam o resultado.
- Independência das observações.
Como reportar em APA
Foi observada uma correlação positiva moderada entre horas de estudo e nota final, r(58) = .46, p < .001.
Exemplos em R
# Pearson cor.test(dados$horas_estudo, dados$nota, method = "pearson") # Spearman cor.test(dados$stress, dados$qualidade_sono, method = "spearman") # Matriz de correlação cor(dados[, c("x1","x2","x3")], use = "pairwise.complete.obs")