Odds Ratio

O Odds Ratio ou OR indica a relação entre a hipótese de acontecer um acontecimento entre diversas situações.

Um valor de 1 indica que a hipótese é igual e um valor acima de 1 indica que existe maior possibilidade de o acontecimento acontecer. Da mesma forma abaixo de 1 indica uma menor hipótese de o acontecimento acontecer.

Esta estatística utiliza-se com frequência associada a regressões logísticas. Em regressões logísticas tenta-se relacionar várias variáveis a um resultado que se pode assumir 2 valores ou ter hipótese de acontecer ou não acontecer.

A regressão logística resulta do cálculo do logaritmo neperiano da divisão entre a probabilidade de não acontecer um acontecimento e a probabilidade dele acontecer.

Em R o cálculo de uma regressão logística pode ser feita com um comando deste tipo:

model <- glm(Survived ~.,family=binomial(link='logit'),data=train)

O teste de significância relativo ao valor do Odds Ratio é feito habitualmente recorrendo ao Likelihood Ratio Chi-Square.É através deste teste que é possível interpretar o intervalo de confiança do valor calculado para o Odds Ratio e dizer se o mesmo é estatisticamente diferente de 1.

As regressões logísticas habitualmente só são usadas a nível de mestrado ou doutoramento.

Em Português chama-se por vezes razão de possibilidades.

Qual o melhor programa para trabalhos estatísticos ?

O melhor programa depende daquilo que quer fazer com os dados, do seu conhecimento dos programas e da disponibilidade dos mesmos.

Excel

O Excel para algumas estatísticas sumárias costuma ser rápido e estar facilmente disponível na maior parte dos computadores.

A nível de formatação de gráficos e tabelas costuma ser potente ou mesmo para manipular alguns dados facilmente.

SPSS

O SPSS tem habitualmente acordos com a maior parte das faculdades levando a que esteja disponível para os alunos durante o curso. Por vezes, também é usado como ferramenta de demonstração e aprendizagem pelo que as pessoas já sabem os rudimentos do mesmo.
É uma ferramenta paga e tem custos elevados quando considerados vários módulos.
O interface costuma ser relativamente simples de usar mas alguns gráficos são difíceis de conseguir fazer facilmente.

O SPSS em Mac costuma ter algumas diferenças.

R

O R é gratuito e funciona em diversas plataformas incluindo Linux. Tem milhares de módulos adicionais que vão desde genética a séries temporais e afins.

Sem módulos adicionais para interface a aparência do R é complicada para quem está a começar. No entanto para utilizadores avançados existem versões mais orientadas para programação que permitem fazer e repetir extensos trabalhos estatísticos.

Outras aplicações

Existem outras aplicações igualmente boas mas que no entanto estão menos divulgadas.

O Stata por exemplo é bom para séries temporais e costuma ser usado em econometria e na análise da bolsa.

O Statistca tem módulos avançados para análise de BigData sendo extremamente potente.

O EViews também é usado nalgumas faculdades.