Resultados possíveis do nosso estudo Interpretação de gráficos, decisão baseada nas hipóteses, interpretação. Para termos isso, precisamos fazer uma inferência estatística!
Número de visitas Inferência estatística Com a nossa hipótese biológica, perguntamos: Número de visitas difere? Com nectário Sem nectário
Número de visitas Inferência estatística Com a nossa hipótese biológica, perguntamos: As médias diferem? Com nectário Sem nectário
Geramos uma nova categoria de hipótese: hipótese estatística Hipótese estatística testável: H1: As médias diferem H0: As médias não diferem H0 é a hipótese nula; H1 é a hipótese alternativa
Número de visitas Inferência estatística Como concluir? Precisamos de uma probabilidade de errar! Eu digo que diferem, mas posso estar errado... Com nectário Sem nectário
Número de visitas Inferência estatística Quanto menor a probabilidade de errar, melhor! Com nectário Sem nectário
Número de visitas Inferência estatística Para isso, calculamos uma medida a partir das médias e dos desvios! Com nectário Sem nectário
Por exemplo, nesse caso, há uma medida t de student chamada de estatística t
Número de visitas Inferência estatística Por exemplo, nesse caso, há uma medida t de student chamada de estatística t Desvio X1 Média X1 Desvio X2 Média X2 Com nectário Sem nectário
Calculamos nossa estatística t Existem muitos valores possíveis de t Se usarmos médias e desvios aleatórias, também calculamos um valor de t Esse valor é a estatística esperada ao acaso...
E se calcularmos umas 1000 estatísticas esperadas ao acaso? Teremos valores altos e baixos de t
E vamos ver onde está o nosso t calculado! Fácil Difícil
O que seria difícil? Vamos pegar a área que corresponde a 5% dos valores de t esperados ao acaso!
O que seria difícil? Vamos pegar a área que corresponde a 5% dos valores de t esperados ao acaso! Difícil
Nosso t é muito difícil de ser encontrado ao acaso, certo? Em menos de 5% dos casos encontramos um t aleatório igual ou maior que o nosso, certo? Logo, há igual ou menos do que 5% de chance de eu errar ao dizer que é difícil encontrar nosso t
Número de visitas Inferência estatística Vamos voltar ao que o t significa! Um t difícil de encontrar indica médias bem diferentes! Desvio X1 Média X1 Desvio X2 Média X2 Com nectário Sem nectário
Um t difícil de encontrar indica que há baixa probabilidade de errarmos ao dizer que as médias diferem! Há menos do que 5% de chance de eu errar, se o t estiver naquela área!
A diferença entre as médias é estatisticamente significativa! Claro, com uma chance de errar menor que 5%! Chance de errar = Falsos positivos = α = 5%
Portanto, o teste estatístico é feito para diminuir a probabilidade de errar ( < 0,05; ou < que 5%) Nossa conclusão: Há baixa probabilidade de errar ao dizer que as médias diferem! Lembrem: O método científico nunca PROVA NADA, NUNCA DIZ A VERDADE, SÓ REFUTA!
O erro de inferência estatística é chamado de erro do tipo I Por convenção, se o erro for menor que 5%, concluímos que há significância estatística
Ao testar hipóteses estatísticas, podemos ter 4 situações: DECISÃO H 0 VERDADEIRA H 0 FALSA Aceitar H 0 Decisão correta Probabilidade = 1 - α Erro do tipo II Probabilidade = β Rejeitar H 0 Erro do tipo I Probabilidade = α Decisão correta Probabilidade = 1 β
Temos uma outra fonte de erro! DECISÃO H 0 VERDADEIRA H 0 FALSA Aceitar H 0 Decisão correta Probabilidade = 1 - α Erro do tipo II Probabilidade = β Rejeitar H 0 Erro do tipo I Probabilidade = α Decisão correta Probabilidade = 1 β
Número de visitas Inferência estatística Temos uma outra fonte de erro! Teste t não significativo Com nectário Sem nectário
Número de visitas Inferência estatística Teste t não significativo: t = 0,16; p = 0,235 (23,5% de chance de errar!) Conclusão: as médias não diferem, mas... Com nectário Sem nectário
Número de visitas Inferência estatística Se coletarmos mais? Teste t mostra diferença... t = 3,15; p = 0,001 (0,1% de chance de errar!) Com nectário Sem nectário
O erro que cometemos é o erro do tipo II = falso negativo! DECISÃO H 0 VERDADEIRA H 0 FALSA Aceitar H 0 Decisão correta Probabilidade = 1 - α Erro do tipo II Probabilidade = β Rejeitar H 0 Erro do tipo I Probabilidade = α Decisão correta Probabilidade = 1 β
Cometemos esse erro quando não conseguimos detectar um efeito que existe, mas sempre temos limitações de amostragem! Não dá para controlar no teste estatístico. Quanto mais réplicas, melhor!
Aumento de amostragem é aumento de precisão! Acurácea X Precisão
Portanto, assumimos que podemos errar, mas deduzimos a conclusão a partir dos resultados após inferência estatística!
Probabilidades Falso positivo 48% no papanicolau Falso negativo 4% Faça seu médico tremer...
Número de visitas Inferência estatística Para a análise funcionar, no entanto, precisamos atingir pressupostos matemáticos. No caso do teste t: As variações em torno da média não podem diferir. Com nectário Sem nectário
Quando não atingem os pressupostos, há análises alternativas: Teste t considerando as variâncias diferentes; Teste de Friedmann
Teste t muito utilizado em Biologia comparação de duas médias! Para mais médias Análise de Variância, por exemplo!
Número de dourados Inferência estatística Outra análise bem comum: as cheias afetam os dourados? Quantidade de cheias em um ano
Hipóteses estatísticas: H1: há relação entre a quantidades de cheias no ano e o tamanho populacional de dourados. H0: não há relação entre a quantidades de cheias no ano e o tamanho populacional de dourados.
Número de dourados Inferência estatística Ao invés de comparar as médias, temos que medir a associação das variáveis x e y. Quantidade de cheias em um ano
Número de dourados Inferência estatística Nesse caso, há uma medida (a estatística) chamada r de Pearson. Quantidade de cheias em um ano Karl Pearson (1857-1936)
Nesse caso, há uma medida (a estatística) chamada r de Pearson.
r = 1 é associação total positiva: aumenta uma unidade de x, aumenta uma unidade de y r = -1 é associação total negativa: aumenta uma unidade de x, diminui uma unidade de y r = 0 é não associação: aumenta uma unidade de x, não afeta y.
Significativo? Inferência estatística
Número de dourados Inferência estatística Se sim, r = 0,85 indica que há relação positiva entre cheias e dourados (p = 0,023; 2,3% de chance de errar!) Quantidade de cheias em um ano
Número de dourados Inferência estatística Pressupostos: relação linear Quantidade de cheias em um ano
Número de dourados Inferência estatística Pressupostos: relação linear Quantidade de cheias em um ano
Número de dourados Inferência estatística O fato de colocarmos uma reta já é uma outra análise regressão linear Y = a + bx Quantidade de cheias em um ano
Número de dourados Inferência estatística Nesse caso, o teste estatístico é focado se o a e o b diferem de 0! Y = a + bx Quantidade de cheias em um ano