Tipos de Regressões
A regressão permite modelar relações entre variáveis e fazer previsão. A escolha do tipo de regressão depende sobretudo da variável dependente e da estrutura dos dados.
Pergunta-chave
Que tipo de variável é a dependente (Y)?
- Contínua → regressão linear
- Binária → regressão logística binária
- Nominal com >2 categorias → logística multinomial
- Ordinal → regressão ordinal
- Contagens → Poisson / binomial negativa
Objetivo
- Explicar: estimar efeito de X em Y.
- Prever: prever novos valores de Y.
- Ajustar: controlar confundidores.
- Comparar modelos: escolher modelo mais robusto.
1) Regressão Linear (simples e múltipla)
Usa-se quando a variável dependente é contínua e a relação é aproximadamente linear.
Y = β₀ + β₁X₁ + β₂X₂ + ... + βₚXₚ + ε
Interpretação: βᵢ representa a variação média em Y por cada unidade adicional de Xᵢ, mantendo as restantes variáveis constantes.
Métricas úteis: R², R² ajustado, erro padrão residual, AIC/BIC.
2) Regressão Logística Binária
Usa-se quando Y tem dois resultados (ex.: sucesso/insucesso, sim/não).
logit(p) = ln(p/(1-p)) = β₀ + β₁X₁ + ... + βₚXₚ
Interpretação: exp(β) = odds ratio. Se OR > 1, aumento de X associa-se a maior odds do evento.
Métricas úteis: AUC, sensibilidade, especificidade, pseudo-R².
3) Regressão Logística Multinomial e Ordinal
- Multinomial: Y nominal com mais de 2 categorias (sem ordem natural).
- Ordinal: Y ordinal (ex.: Likert baixo/médio/alto).
Na ordinal, a suposição de proporcionalidade dos odds deve ser verificada.
4) Regressão para contagens
- Poisson: para contagens (0,1,2,...) com média ≈ variância.
- Binomial Negativa: quando há sobredispersão (variância >> média).
log(μ) = β₀ + β₁X₁ + ... + βₚXₚ
Pressupostos essenciais (linear)
| Pressuposto | Como verificar | Se falhar |
|---|---|---|
| Linearidade | Scatterplots, resíduos vs ajustados | Transformações, termos não lineares |
| Homoscedasticidade | Resíduos com variância constante | Erros robustos, transformação |
| Normalidade dos resíduos | QQ-plot, Shapiro-Wilk | Bootstrap, regressão robusta |
| Independência | Desenho do estudo / Durbin-Watson | Modelos mistos/temporais |
| Multicolinearidade | VIF (< 5, idealmente) | Remover/combinar preditores |
Como escolher rapidamente
| Tipo de Y | Modelo recomendado |
|---|---|
| Contínua | Regressão linear |
| Binária (0/1) | Logística binária |
| Nominal (>2 classes) | Logística multinomial |
| Ordinal | Regressão ordinal |
| Contagem | Poisson / Binomial negativa |
Exemplos em R
# Regressão linear múltipla mod_lin <- lm(nota ~ horas_estudo + faltas + idade, data = dados) summary(mod_lin) # Logística binária mod_log <- glm(aprovado ~ horas_estudo + faltas, data = dados, family = binomial()) summary(mod_log) exp(coef(mod_log)) # odds ratios # Poisson mod_pois <- glm(n_eventos ~ grupo + idade, data = dados, family = poisson()) summary(mod_pois)
No Jamovi
- Linear: Analyses → Regression → Linear Regression
- Logística: Analyses → Regression → Logistic Regression
- Ver sempre: coeficientes, IC 95%, diagnósticos e qualidade de ajuste
Exemplo de reporte (APA)
A regressão linear múltipla foi significativa, F(3, 146) = 18.52, p < .001, R² = .28. Horas de estudo (β = .41, p < .001) e faltas (β = -.29, p = .002) foram preditores significativos da nota final.