Odds Ratio

O Odds Ratio ou OR indica a relação entre a hipótese de acontecer um acontecimento entre diversas situações.

Um valor de 1 indica que a hipótese é igual e um valor acima de 1 indica que existe maior possibilidade de o acontecimento acontecer. Da mesma forma abaixo de 1 indica uma menor hipótese de o acontecimento acontecer.

Esta estatística utiliza-se com frequência associada a regressões logísticas. Em regressões logísticas tenta-se relacionar várias variáveis a um resultado que se pode assumir 2 valores ou ter hipótese de acontecer ou não acontecer.

A regressão logística resulta do cálculo do logaritmo neperiano da divisão entre a probabilidade de não acontecer um acontecimento e a probabilidade dele acontecer.

Em R o cálculo de uma regressão logística pode ser feita com um comando deste tipo:

model <- glm(Survived ~.,family=binomial(link='logit'),data=train)

O teste de significância relativo ao valor do Odds Ratio é feito habitualmente recorrendo ao Likelihood Ratio Chi-Square.É através deste teste que é possível interpretar o intervalo de confiança do valor calculado para o Odds Ratio e dizer se o mesmo é estatisticamente diferente de 1.

As regressões logísticas habitualmente só são usadas a nível de mestrado ou doutoramento.

Em Português chama-se por vezes razão de possibilidades.

Qual o melhor programa para trabalhos estatísticos ?

O melhor programa depende daquilo que quer fazer com os dados, do seu conhecimento dos programas e da disponibilidade dos mesmos.

Excel

O Excel para algumas estatísticas sumárias costuma ser rápido e estar facilmente disponível na maior parte dos computadores.

A nível de formatação de gráficos e tabelas costuma ser potente ou mesmo para manipular alguns dados facilmente.

SPSS

O SPSS tem habitualmente acordos com a maior parte das faculdades levando a que esteja disponível para os alunos durante o curso. Por vezes, também é usado como ferramenta de demonstração e aprendizagem pelo que as pessoas já sabem os rudimentos do mesmo.
É uma ferramenta paga e tem custos elevados quando considerados vários módulos.
O interface costuma ser relativamente simples de usar mas alguns gráficos são difíceis de conseguir fazer facilmente.

O SPSS em Mac costuma ter algumas diferenças.

R

O R é gratuito e funciona em diversas plataformas incluindo Linux. Tem milhares de módulos adicionais que vão desde genética a séries temporais e afins.

Sem módulos adicionais para interface a aparência do R é complicada para quem está a começar. No entanto para utilizadores avançados existem versões mais orientadas para programação que permitem fazer e repetir extensos trabalhos estatísticos.

Outras aplicações

Existem outras aplicações igualmente boas mas que no entanto estão menos divulgadas.

O Stata por exemplo é bom para séries temporais e costuma ser usado em econometria e na análise da bolsa.

O Statistca tem módulos avançados para análise de BigData sendo extremamente potente.

O EViews também é usado nalgumas faculdades.

 

 

 

 

 

Por que usamos tabelas para resolver problemas de Distribuição de Probabilidade Normal?

A função de distribuição normal é demasiado complexa para ser calculada directamente sem aplicar cálculos numéricos complexos e extensos.

Como tal é habitual recorrer a tabelas com os valores já calculados.

imagem de dundas.com

Média vs. Mediana

[note color=”#aff5ef”]Sou aluna do 6º ano de Medicina e pretendia uma informação muito importante.

Sendo o meu trabalho um questionário classificado segundo uma escala de likert (1,2,3,4,5) será que me podem informar se o mais correcto a ser utilizado é a média ou a mediana?

Obrigada desde já.[/note]

Resposta:

Ambas as medidas são medidas de localização e em populações com uma distiribuição normal e sem enviesamento não faz muito diferença usar uma ou outra.

No entanto, quando existe enviesamento, a média pode transmitir uma informação menos correcta.

Imagine que um grupo de 5 médicos ganha em média 4000 euros mas isso é causado por haver um médico que ganha 16 000 euros por mês enquanto os outros ganham todos 1000 euros.

16 000 + 4* 1000 = 20 000

20 000/5 = 4 000

A mediana nesse caso teria na mesma o valor de 1000 euros que corresponderia à média entre o 3º e o 4º médico transmitindo uma informação mais correta sobre o que seria um vencimento normal.