Tipos de Regressões

A regressão permite modelar relações entre variáveis e fazer previsão. A escolha do tipo de regressão depende sobretudo da variável dependente e da estrutura dos dados.

Pergunta-chave

Que tipo de variável é a dependente (Y)?

Contínua → regressão linear
Binária → regressão logística binária
Nominal com >2 categorias → logística multinomial
Ordinal → regressão ordinal
Contagens → Poisson / binomial negativa

Objetivo

Explicar: estimar efeito de X em Y.
Prever: prever novos valores de Y.
Ajustar: controlar confundidores.
Comparar modelos: escolher modelo mais robusto.

1) Regressão Linear (simples e múltipla)

Usa-se quando a variável dependente é contínua e a relação é aproximadamente linear.

Y = β₀ + β₁X₁ + β₂X₂ + ... + βₚXₚ + ε

Interpretação: βᵢ representa a variação média em Y por cada unidade adicional de Xᵢ, mantendo as restantes variáveis constantes.

Métricas úteis: R², R² ajustado, erro padrão residual, AIC/BIC.

2) Regressão Logística Binária

Usa-se quando Y tem dois resultados (ex.: sucesso/insucesso, sim/não).

logit(p) = ln(p/(1-p)) = β₀ + β₁X₁ + ... + βₚXₚ

Interpretação: exp(β) = odds ratio. Se OR > 1, aumento de X associa-se a maior odds do evento.

Métricas úteis: AUC, sensibilidade, especificidade, pseudo-R².

3) Regressão Logística Multinomial e Ordinal

Multinomial: Y nominal com mais de 2 categorias (sem ordem natural).
Ordinal: Y ordinal (ex.: Likert baixo/médio/alto).

Na ordinal, a suposição de proporcionalidade dos odds deve ser verificada.

4) Regressão para contagens

Poisson: para contagens (0,1,2,...) com média ≈ variância.
Binomial Negativa: quando há sobredispersão (variância >> média).

log(μ) = β₀ + β₁X₁ + ... + βₚXₚ

Pressupostos essenciais (linear)

Pressuposto	Como verificar	Se falhar
Linearidade	Scatterplots, resíduos vs ajustados	Transformações, termos não lineares
Homoscedasticidade	Resíduos com variância constante	Erros robustos, transformação
Normalidade dos resíduos	QQ-plot, Shapiro-Wilk	Bootstrap, regressão robusta
Independência	Desenho do estudo / Durbin-Watson	Modelos mistos/temporais
Multicolinearidade	VIF (< 5, idealmente)	Remover/combinar preditores

Como escolher rapidamente

Tipo de Y	Modelo recomendado
Contínua	Regressão linear
Binária (0/1)	Logística binária
Nominal (>2 classes)	Logística multinomial
Ordinal	Regressão ordinal
Contagem	Poisson / Binomial negativa

Exemplos em R

# Regressão linear múltipla
mod_lin <- lm(nota ~ horas_estudo + faltas + idade, data = dados)
summary(mod_lin)

# Logística binária
mod_log <- glm(aprovado ~ horas_estudo + faltas, data = dados, family = binomial())
summary(mod_log)
exp(coef(mod_log))  # odds ratios

# Poisson
mod_pois <- glm(n_eventos ~ grupo + idade, data = dados, family = poisson())
summary(mod_pois)

No Jamovi

Linear: Analyses → Regression → Linear Regression
Logística: Analyses → Regression → Logistic Regression
Ver sempre: coeficientes, IC 95%, diagnósticos e qualidade de ajuste

Ver guia de regressão no Jamovi →

Exemplo de reporte (APA)

A regressão linear múltipla foi significativa, F(3, 146) = 18.52, p < .001, R² = .28.
Horas de estudo (β = .41, p < .001) e faltas (β = -.29, p = .002)
foram preditores significativos da nota final.

Ver mais exemplos APA →