Explicações de Estatística
Marcar Sessão

Tipos de Regressões

A regressão permite modelar relações entre variáveis e fazer previsão. A escolha do tipo de regressão depende sobretudo da variável dependente e da estrutura dos dados.

Pergunta-chave

Que tipo de variável é a dependente (Y)?

  • Contínua → regressão linear
  • Binária → regressão logística binária
  • Nominal com >2 categorias → logística multinomial
  • Ordinal → regressão ordinal
  • Contagens → Poisson / binomial negativa

Objetivo

  • Explicar: estimar efeito de X em Y.
  • Prever: prever novos valores de Y.
  • Ajustar: controlar confundidores.
  • Comparar modelos: escolher modelo mais robusto.

1) Regressão Linear (simples e múltipla)

Usa-se quando a variável dependente é contínua e a relação é aproximadamente linear.

Y = β₀ + β₁X₁ + β₂X₂ + ... + βₚXₚ + ε

Interpretação: βᵢ representa a variação média em Y por cada unidade adicional de Xᵢ, mantendo as restantes variáveis constantes.

Métricas úteis: R², R² ajustado, erro padrão residual, AIC/BIC.

2) Regressão Logística Binária

Usa-se quando Y tem dois resultados (ex.: sucesso/insucesso, sim/não).

logit(p) = ln(p/(1-p)) = β₀ + β₁X₁ + ... + βₚXₚ

Interpretação: exp(β) = odds ratio. Se OR > 1, aumento de X associa-se a maior odds do evento.

Métricas úteis: AUC, sensibilidade, especificidade, pseudo-R².

3) Regressão Logística Multinomial e Ordinal

  • Multinomial: Y nominal com mais de 2 categorias (sem ordem natural).
  • Ordinal: Y ordinal (ex.: Likert baixo/médio/alto).

Na ordinal, a suposição de proporcionalidade dos odds deve ser verificada.

4) Regressão para contagens

  • Poisson: para contagens (0,1,2,...) com média ≈ variância.
  • Binomial Negativa: quando há sobredispersão (variância >> média).
log(μ) = β₀ + β₁X₁ + ... + βₚXₚ

Pressupostos essenciais (linear)

PressupostoComo verificarSe falhar
LinearidadeScatterplots, resíduos vs ajustadosTransformações, termos não lineares
HomoscedasticidadeResíduos com variância constanteErros robustos, transformação
Normalidade dos resíduosQQ-plot, Shapiro-WilkBootstrap, regressão robusta
IndependênciaDesenho do estudo / Durbin-WatsonModelos mistos/temporais
MulticolinearidadeVIF (< 5, idealmente)Remover/combinar preditores

Como escolher rapidamente

Tipo de YModelo recomendado
ContínuaRegressão linear
Binária (0/1)Logística binária
Nominal (>2 classes)Logística multinomial
OrdinalRegressão ordinal
ContagemPoisson / Binomial negativa

Exemplos em R

# Regressão linear múltipla
mod_lin <- lm(nota ~ horas_estudo + faltas + idade, data = dados)
summary(mod_lin)

# Logística binária
mod_log <- glm(aprovado ~ horas_estudo + faltas, data = dados, family = binomial())
summary(mod_log)
exp(coef(mod_log))  # odds ratios

# Poisson
mod_pois <- glm(n_eventos ~ grupo + idade, data = dados, family = poisson())
summary(mod_pois)

No Jamovi

  • Linear: Analyses → Regression → Linear Regression
  • Logística: Analyses → Regression → Logistic Regression
  • Ver sempre: coeficientes, IC 95%, diagnósticos e qualidade de ajuste

Ver guia de regressão no Jamovi →

Exemplo de reporte (APA)

A regressão linear múltipla foi significativa, F(3, 146) = 18.52, p < .001, R² = .28.
Horas de estudo (β = .41, p < .001) e faltas (β = -.29, p = .002)
foram preditores significativos da nota final.

Ver mais exemplos APA →