PÓS-GRADUAÇÃO EM BIOMECÂNICA - UFRJ INTRODUÇÃO À BIOESTATÍSTICA 2011 PARTE 2

Tamanho: px
Começar a partir da página:

Download "PÓS-GRADUAÇÃO EM BIOMECÂNICA - UFRJ INTRODUÇÃO À BIOESTATÍSTICA 2011 PARTE 2"

Transcrição

1 PÓS-GRADUAÇÃO EM BIOMECÂNICA - UFRJ INTRODUÇÃO À BIOESTATÍSTICA 2011 PARTE 2 Probabilidade Toda variável é sujeita a uma distribuição de freqüência. Quando lançamos uma moeda, sabemos que os dois eventos que podem ocorrer são, CARA ou COROA. Neste caso, há 50% de chance de ser cara e 50% de ser coroa. Isso significa dizer que, se lançarmos a moeda 100 vezes, o número de caras e de coroas deve ser em torno de 50 vezes. Sabemos disso porque a PROBABILIDADE de sair cara é a mesma de sair coroa, ou seja, 1 em 2 ou 0,5 ou 50%, se a moeda não for viciada. E agora se dissesse que a chance de sair CARA é de 70%? Neste caso, ao jogarmos a moeda 100 vezes, o número de vezes que sairá CARA será em torno de 70. Entretanto, qual seria a probabilidade de sair CARA, jogando a moeda uma única vez? Ou se jogássemos agora a moeda 15 vezes, qual a probabilidade de sair CARA 10 vezes? Para responder esta e outras questões, toda distribuição de freqüência é caracterizada por uma DISTRIBUIÇÃO DE PROBABILIDADE. Toda distribuição de probabilidade representa a probabilidade de determinada observação ocorrer ou não em qualquer estudo. Há diversas distribuições de probabilidade. Entre as principais na Bioestatística estão a distribuição Binomial, que responde às questões relacionadas à possibilidade de duas respostas somente, como cara ou coroa, sim ou não, positivo ou negativo, etc. A outra distribuição importante é a distribuição de Poisson, responsável pela probabilidade de ocorrência de eventos raros. Entretanto, a distribuição mais importante é a distribuição Normal e todas as derivadas dela. Distribuição Normal (ou Gaussiana) Mais importante distribuição de probabilidade, pois é o alicerce de quase todos os testes estatísticos que serão vistos posteriormente. O termo gaussiano é utilizado para que o nome normal não seja confundido com observações normais, ou seja, o pesquisador pode estar investigando alguma anormalidade que tenha uma distribuição de probabilidade Normal. Ao jogarmos um dado, a probabilidade de cair 1, 2 ou 3 é a mesma de cair 4, 5 ou 6. Se jogássemos esse dado vezes, provavelmente o valor do número de vezes que eu retiraria o número 1 seria aproximadamente igual ao número 2, 3, 4, 5 ou 6. O mesmo ocorreria para cada um destes resultados. Quando as amostras possuem a mesma probabilidade de ocorrência, desde que este dado não seja viciado, a distribuição de probabilidade é uma distribuição retangular, como mostra o histograma abaixo:

2 Entretanto, à medida que começamos a por exemplo medir a estatura dos homens brasileiros, vamos encontrar valores muito pequenos (por exemplo 140 cm) e outros muitos altos (por exemplo 220 cm). Porém, como podemos imaginar, esses valores muito extremos seriam encontrados poucas vezes quando comparados a valores como, por exemplo, 175 cm (média de estatura do homem brasileiro, retirada do último censo antropométrico do Ministério do Desenvolvimento). Ou seja, a probabilidade de, ao retirar um único brasileiro aleatoriamente de toda a população, ter estatura de 175 é maior do que qualquer outra estatura, principalmente as estaturas mais extremas, como 140 e 220 cm. A estatura do brasileiro é um exemplo de uma distribuição de probabilidade Normal. O histograma abaixo foi montado com valores aleatórios (n=28), retirados de um trabalho em que a estatura foi uma das variáveis independentes. Como podemos observar, apesar de apresentar peculiaridades da amostra, pode ser notado que a curva normal (curva em vermelho) representa adequadamente esta amostra. Significa dizer que, se

3 desejássemos saber a probabilidade de um indivíduo da população representada por esta amostra ter 175 cm, bastaria encontrá-la pela Distribuição normal desta variável. Cada variável em cada amostra possui determinada curva de probabilidade, como já foi dito. A curva normal é representada pela equação: f ( x) = 1 e σ 2 π 2 2 ( x µ ) / 2σ A distribuição Normal é contínua, podendo assumir qualquer valor. É uma curva estável, em forma de sino e simétrica em torno da média. Os pontos de inflexão da curva correspondem aos pontos dos desvios-padrão da amostra. Podemos observar que a média e o desvio-padrão da amostra são os dois parâmetros desta distribuição. Como toda distribuição de probabilidade determina a probabilidade de ocorrência de determinado evento, a área sob a curva tem valor 1 (um) ou em termos percentuais, valor de 100%. Embora nosso sistema computacional atualmente calcule rapidamente estes valores, seria dispendioso e desnecessário remetermos a ele sempre que quiséssemos obter as informações sobre a probabilidade para cada observação. Ao invés disso, há regras da Distribuição Normal que nos permitem fazer afirmativas precisas e valiosas quanto às observações, sem a necessidade deste cálculo. Dentre as principais características específicas da distribuição normal estão: o valor central da distribuição é o valor da média. Os pontos de inflexão correspondem ao desvio-padrão. Como pode ser observado no gráfico acima, as áreas de probabilidade são demarcadas pelos valores dos desviospadrão. Por exemplo, a área que corresponde ao intervalo entre -1 desvio-padrão e +1 desvio-padrão é de aproximadamente 68,2%. A área entre -2 e +2 desvios-padrão possui 95,4% de probabilidade. Isso significa dizer que os valores da amostra entre -2 à +2 desvios-padrão correspondem a aproximadamente 95% da amostra. A área entre -3 e +3 desvios corresponde a 99,7% das amostras. Distribuição convencional normal (Z) Se imaginarmos que qualquer variável tem a sua distribuição de probabilidade, seria muito desgastante termos que obter sempre uma distribuição normal de cada uma dessas variáveis.

4 Antigamente, como não havia a utilização do computador, como deveria ser desgastante achar a função de distribuição de probabilidade da curva normal de todas as variáveis! Por isso, foi criada uma curva de padronização da curva normal (Curva Z). A curva Z é uma curva padronizada com seus valores já tabelados e faz com que não haja a necessidade de se criar uma tabela para cada amostra com média e desvio-padrão diferentes. Essa curva padronizada possui média = 0 e desvio-padrão = 1. Para calcular a probabilidade de qualquer variável, basta fazer uma transformação dos seus dados para esta curva padronizada e em seguida olhar a tabela da curva Z. A transformação é simples e obedece a equação abaixo: Em que x é o valor a ser localizado; µ é a média populacional e σ é o desvio- x µ Z = σ padrão. Exemplos: Imaginemos uma população de distribuição normal, com média de idade de 40 anos e desvio-padrão de 10: 1) Qual a probabilidade de encontrar uma pessoa com até 20 anos nessa população? 2) Qual a probabilidade de encontrar uma pessoa com 35 anos ou menos nessa população? 3) Qual a probabilidade de encontrar uma pessoa com 70 anos ou mais nessa população? 1 analisando o gráfico da distribuição, pode ser observado que 20 anos é exatamente dois desviospadrão da média. Até 20 anos seriam todos os sujeitos que estariam até o valor 20. Ou seja, exatamente na marca de dois desvios. Isso significa que a probabilidade de encontrar um sujeito com até 20 anos é de aproximadamente 2,15% 2 No segundo caso, o valor 35 não respeita nenhum desvio-padrão. Precisamos então calcular a localização do valor 35 para esta curva de probabilidade. Portanto, Z = (35-40)/10 = -0,5. Este valor na tabela significa que até a marca de 0,5 há 30,8% de probabilidade de aleatoriamente se retirar um sujeito desta população com 35 anos ou menos. 3 No último caso, novamente o valor a ser visto corresponde exatamente a 3 desvios-padrão. Neste caso, analisando o gráfico, podemos verificar que a probabilidade de se ter 70 anos ou mais significa saber a probabilidade, no gráfico, de ter 3 desvios-padrão ou mais. Entre -3 a +3 desvios, há 99,7% dos sujeitos, portanto, a probabilidade de encontrar um sujeito com mais de 70 anos é de ,7% = 0,3% dividido por dois, pois 0,3% é o valor que pode ser menor do que - 3 desvios ou maior do que +3 desvios. Como só queremos saber dos sujeitos com mais de 3 desvios, ou seja, com mais de 70 anos, a probabilidade é de 0,3/2 = 0,15% de chance de encontrar sujeitos com 70 anos ou mais. Vale ressaltar que a utilização da distribuição normal se iniciou bem antes do advento do computador. Portanto, como era uma distribuição de probabilidade conhecida e tabelada, os pesquisadores tentavam ter um n bastante significativo nas suas amostras para que a utilização da distribuição normal estivesse garantida. A grande maioria dos dados nas populações apresenta

5 distribuição normal, em função do tamanho populacional. Entretanto, como já foi dito anteriormente, utilizar toda a população em um estudo é praticamente impossível e por diversos problemas já discutidos, utilizamos as amostras. As amostras por sua vez, necessitam de técnicas estatísticas para que os dados retirados possam ser extrapolados para as populações. Dentre tais técnicas, as principais são a DISTRIBUIÇÃO DE AMOSTRAGEM e o TEOREMA DO LIMITE CENTRAL. Distribuição de Amostragem Consiste na avaliação da validade das amostras como sendo representativas da população ou se a média de cada amostra ocorreu apenas ao acaso. Está relacionada à distribuição média esperada entre várias amostras retiradas da mesma população. - Retira-se a primeira amostra: x11, x12, x13 x1n 1a amostra, c/ média xm1 - Retira-se a segunda amostra: x21, x22, x23, x2n 2a amostra, c/ média xm2 - ( ) k-ésima amostra, c/média xmk E se calcularmos as médias de cada uma dessas amostras, que distribuição será obtida para essas médias? Sabemos que a distribuição amostral das médias das amostras retiradas de uma mesma população terá uma distribuição Normal. Além disso, a distribuição amostral será sempre normal, qualquer que seja a distribuição da população, desde que se respeite o TEOREMA DO LIMITE CENTRAL, cuja prova matemática vai além do escopo desta revisão. Teorema do Limite Central Informa que, se o n amostral for maior do que 30, a distribuição de probabilidade amostral pode ser aproximada pela distribuição Normal, qualquer que seja a distribuição da variável na população. Outras características importantes: Dada uma população (tamanho N) de distribuição normal com média populacional (µ) e desvio-padrão (σ), a distribuição de amostragem de uma amostra desta população, com tamanho (n), terá a média amostral igual à média populacional (média amostral = média populacional = µ) e desviopadrão das médias, denominado de erro-padrão da média igual à divisão do desvio-padrão populacional pela raiz quadrada de n. Ou seja, EP = σ/ n. Importante salientar através deste teorema que não há a necessidade de se obter várias amostras. Basta apenas uma amostra para representar adequadamente a população, desde que esta amostra respeite as características do Teorema do Limite Central. Portanto, ao utilizarmos este teorema, só precisamos de uma única amostra com n > 30 sujeitos. Observação: Desvio-padrão informa a variabilidade encontrada entre os indivíduos da amostra com relação à média. O Erro-padrão informa a variabilidade encontrada entre as médias das amostras que seriam retiradas da mesma população.

6 Como vimos anteriormente, a Distribuição de Amostragem das médias é uma ferramenta importante, principalmente aliada ao Teorema do Limite Central. Entretanto, analisando-a criteriosamente, podemos observar que o Erro-padrão amostral somente é conhecido se soubermos o desvio-padrão populacional. Como vimos, a obtenção deste parâmetro é praticamente impossível, tornando a distribuição de amostragem das médias e o teorema do limite central muito mais utilizado em questões teóricas, como veremos a seguir. Esta distribuição e este teorema têm aplicabilidade prática somente quando o n amostral é bastante elevado, permitindo extrapolar o desvio-padrão amostral como sendo igual ao populacional. Entretanto, sabemos que amostras menores são mais fáceis de serem encontradas nos estudos, e portanto o desvio-padrão populacional é na maior parte das vezes estimado a partir do desvio padrão amostral através da equação do erro padrão amostral (EP = σ/ n). Para preencher esta lacuna, William Gosset, auto denominado student, verificou que as observações que vinham de uma distribuição normal tinham as médias amostrais seguindo a distribuição normal somente se o desvio-padrão populacional fosse conhecido. Quando o verdadeiro desvio-padrão não era conhecido, as médias amostrais não mais seguiam a distribuição Normal, mas sim a Distribuição t-student. Como quase sempre utilizamos amostras ao invés da população, a maior acurácia dos estudos se dá utilizando a Distribuição t e não mais a Normal. Vale ressaltar, porém que a Distribuição Normal e a Distribuição t são praticamente idênticas a partir do n amostral > 30 (Teorema do Limite Central). Distribuição t Student Como vimos, a Distribuição t é bastante semelhante à distribuição padronizada Z (referente à Distribuição Normal). Utilizamos a Distribuição t para respondermos às questões de pesquisa sobre médias. O cálculo da distribuição t é similar à distribuição Z, como veremos a seguir: X µ X µ t = = EP s n Sendo: X (com a barra em cima) = média amostral que deseja testar µ = média populacional EP = Erro-padrão = desvio-padrão amostral (s) / raiz quadrada do número de sujeitos da amostra (n). Esta equação nos dá a localização da nossa amostra no gráfico de probabilidade t-student. A partir deste valor, verificamos se a variação ocorrida realmente aconteceu ou foi somente devido ao acaso. Há duas formas, semelhantes, de verificarmos estas variações: Teste de Hipóteses ou Intervalos de Confiança. Vale ressaltar que atualmente não há a necessidade de realizarmos estes testes na mão, uma vez que temos o computador. Entretanto, é imprescindível entendermos seu mecanismo de atuação para compreendermos melhor os resultados que o computador nos fornece.

7 Teste de Hipóteses e Intervalos de Confiança Ambos respondem à simples questão: Há diferença significativa entre a média amostral e a populacional ou a diferença ocorreu ao acaso? Passos para testar a diferença entre as médias a partir do Teste de Hipóteses: Passo 1) Decisão de qual teste estatístico será utilizado. Dependerá de diversos fatores, como n amostral, classificação das variáveis, medidas de tendência central e de dispersão conhecidas, etc. Passo 2) Formular as questões em termos de hipóteses estatísticas: - Toda hipótese estatística apresenta uma hipótese nula (denominada H0) e uma hipótese alternativa (denominada H1). A H0 é sempre de que a média amostral é igual à média populacional. Ou de forma mais geral, em qualquer teste estatístico, a H0 é sempre de igualdade entre as médias. Portanto, a H1 é de diferença entre as médias. Passo 3) Seleção do nível de significância do teste estatístico - Este valor corresponde ao valor α do teste. Em Bioestatística, como nos demais segmentos que utilizam a estatística, os valores mais utilizados são: 0,05 (ou 5%); 0,01 (ou 1%); 0,1 (ou 10%). Estes valores são os valores limites na distribuição de probabilidade que determinam se a diferença entre as médias é ao acaso ou se é estatisticamente significativa. Passo 4) Cálculo da localização da média da sua amostra na distribuição de probabilidade da variável que está sendo testada. Este valor (denominado de valor p), medido em função do teste estatístico que está sendo utilizado, é comparado ao valor α. Passo 5) Conclusão do teste - A partir da comparação entre os valores p e α, tiram-se as conclusões referentes a este teste. A única diferença existente entre o teste de hipóteses e o intervalo de confiança ocorre no passo 4. Esta diferença será vista nos exemplos. Exemplos: 1) População tem em média 1,80 (±0,2) m. Desta população, retirou-se uma amostra com 40 indivíduos com estatura média de 1,84 (±0,14) m. Com relação à estatura, pode-se dizer que esta amostra é representativa da população? Passo 1) Como temos um n>30 (n=40) e conhecemos o desvio-padrão populacional, podemos utilizar o teste t ou o teste Z, pois como já sabemos, após n de 30, os testes são praticamente idênticos. Como costume, utilizaremos sempre o teste t Passo 2) Hipóteses estatísticas: H0: µ = X ou 1,80 = 1,84 H1: µ X ou 1,80 1,84 Passo 3) Escolha do nível de significância: Normalmente, o nível de significância mais utilizado é α = 0,05. Isto significa dizer que, se o valor 1,84 tiver probabilidade menor do que 5% de ocorrer, há diferença estatística

8 significativa (significa que a H0 deve ser rejeitada ou a H1 deve ser aceita). Se a probabilidade de ocorrência de 1,84 for maior do que 5%, nada pode ser dito, ou seja, esta diferença pode ter ocorrido ao acaso, então, estatisticamente, dizemos que estas médias são iguais (aceita H0 ou rejeita H1). Passo 4) Cálculo (não há a necessidade de fazer estes cálculos, pois atualmente temos os programas computacionais o utilizado será o Statistica 6.0). Aqui é somente para visualização e entendimento do teste. t = (X - µ)/ep = (X-µ)/(s/ n) = (1,84 1,8)/(0,14/ 40) = 0,04/(0,14/6,32) = 0,04/0,02 = 2 t calculado = 2 t 0,05; 39 = 2,02 este valor de t é o valor da localização da probabilidade nesta distribuição. 0,05 é o nível de significância escolhido e 39 é chamado grau de liberdade deste teste. O grau de liberdade é utilizado no teste t e corresponde a n-1. Neste caso seria 40 1 = 39. Passo 5) Conclusão - Como o valor t calculado foi menor do que o valor da localização na distribuição de probabilidade desta variável, significa que a chance de ocorrência da média de 1,84 é MAIOR do que os 5%(α=0,05), porque o valor do t calculado indica que a localização da média amostral encontra-se dentro do limite de significância de 5%. Logo, NÃO podemos afirmar que há diferença estatística entre as médias. Estatisticamente, as médias são consideradas iguais. Apesar de não ser um conceito muito simples de identificar, vale lembrar que o valor encontrado pelo teste t (ou qualquer outro teste) é, na verdade, a localização deste valor (neste exemplo 1,84) na distribuição de probabilidade da média (neste exemplo 1,80). A partir da posição 2,02 (5%), qualquer média será considerada uma média estatisticamente diferente da média de 1,80. É desta forma que pensamos os Intervalos de Confiança. O intervalo de confiança é dado pela expressão: s x t µ x + t n α, gl α, gl s n Ou seja, a média populacional deve estar incluída no intervalo para que falemos que a média amostral é estatisticamente igual à média populacional. No exemplo 1, x = média da amostra (1,84); t α, gl = valor do teste t (vide tabela) com α = 0,05 e gl = 40-1=39. t 0,05;39 = 2,02; s = desvioamostral = 0,14 e µ = média da população = 1,80. Montando a equação: 1,84 2,02 (0,14/ 40) 1,80 1,84 + 2,02 (0,14/ 40) = 1,79 1,80 1,88 ou melhor: [1,79;1,88] Neste intervalo encontram-se os valores das médias as quais estatisticamente são iguais à média 1,80. Como 1,80 está dentro do intervalo, dizemos, com 95% de certeza, que a média amostral entre 1,79 e 1,88 contém a verdadeira média populacional.

9 2) Após utilização de um medicamento contra resfriado, os pesquisadores gostariam de saber se o mesmo interfere no peso dos indivíduos. As medidas anteriores ao início do medicamento mostram uma média de massa da amostra de 70 (± 12) Kg. Após a ingestão do medicamento, a amostra de 36 indivíduos obteve média do peso de 73,6 (±11) Kg. Pode-se pensar em variação do peso em função do remédio nesta amostra? Antes de iniciarmos os passos, devemos ter em mente que agora estamos tratando da mesma amostra, antes e depois de uma intervenção (neste caso a intervenção é aplicação de remédio). O objetivo é saber se este medicamento aumenta a massa corporal. Passo 1) Teste estatístico. Mesma amostra antes e depois teste estatístico t de student para amostras pareadas (será visto posteriormente). Passo 2) H0: 70 = 73,6 H1: 70 73,6 Passo 3) Nível de significância α = 0,05 Passo 4) cálculos t calc X = s e n S = 2 2 X ( X ) n n 1 Após cálculos: t calc = 3,22 (valor inventado, pois para o cálculo real, deveríamos saber o valor de todos os sujeitos da amostra e realizar as diferenças do antes e depois da intervenção). Passo 5) Conclusão: como t calc > t 0,05;35 = significa que o valor 73,6 está mais distante do que o valor com a probabilidade de 5%. Logo, 73,6 é estatisticamente diferente da média 70. Ou seja, conclui-se que o medicamento aumentou a massa corporal. Testes Bicaudais e Unicaudais Os testes estatísticos NORMALMENTE são bicaudais, ou seja, quando se realiza o teste, testase a hipótese das médias serem diferentes. Significa que o teste é feito para verificar se a média da sua amostra é menor ou maior do que a média utilizada como padrão. Neste caso, analisando o gráfico abaixo, estamos dizendo que a amostra será estatisticamente diferente se estiver abaixo de 2,5% no início da curva ou 2,5% acima no fim da curva de probabilidade, levando em consideração um valor α = 0,05 ou 5%. Aproximadamente, seriam os valores fora das partes azul e vermelho, uma vez que a probabilidade somada destas duas partes corresponde a 95,4%, sobrando assim 2,5% antes do primeiro intervalo vermelho e 2,5% após o segundo intervalo vermelho.

10 Entretanto, há casos ESPECÍFICOS em que já sabemos se a intervenção feita ocasionará diminuição ou aumento da média. Nestes casos, utilizamos o teste unicaudal. Normalmente este teste é utilizado quando há a garantia anterior (trabalhos anteriores, metanálises ou resultados prévios) de que a média realmente tenderá a aumentar ou diminuir. A vantagem de utilizar o teste unicaudal é que há uma maior chance de apresentar diferença significativa. Porém, a desvantagem é que como estipulamos este parâmetro antes dos testes, caso ocorra uma diferença no outro sentido (por exemplo, tínhamos certeza de que aumentaria a média e ela diminuiu, não há a possibilidade de se tirar nenhuma conclusão, porque o teste foi estipulado somente para um dos lados da distribuição) Erros nos testes estatísticos Todo teste estatístico tem uma probabilidade de erro, calculada. Há dois erros principais na estatística. O erro tipo I e o erro tipo II. Erro tipo I Afirmar que existe diferença quando não existe, ou seja, rejeitar H0 quando ela é correta. A probabilidade de ocorrência é igual ao valor α (valor de significância do teste). Erro tipo II Afirmar que não existe diferença quando existe, ou seja, não rejeitar H0 quando ela está incorreta. A probabilidade de ocorrência é igual a β (erro de difícil cálculo). Poder do teste Significa a probabilidade de afirmar que existe uma diferença quando ela realmente existir. Utilizado para cálculo do tamanho da amostra. O poder do teste é dado pela seguinte diferença: PODER DO TESTE = 1 β Ex: β = 10% = 0,1; logo o poder do teste é 1 0,1 = 0,9 ou 90%.

11 DISTRIBUIÇÃO T OU TESTE T Como vimos, o teste t é o teste mais empregado nas pesquisas médicas. Através dele, há a possibilidade de fazermos estimativas da população de interesse apenas utilizando um n amostral relativamente pequeno e respeitando duas propriedades, a distribuição de amostragem e o teorema do limite central. Estas propriedades são responsáveis em garantir a principal suposição que esta distribuição deve adotar: as OBSERVAÇÕES devem seguir uma distribuição normal. Em termos mais técnicos, a distribuição t somente poderá ser aplicada se os valores da variável que está sendo testada tiverem distribuição próxima da normal. Tal suposição pode ser analisada pelo conhecimento anterior destas medidas, pela análise empírica através dos histogramas ajustados à Distribuição normal ou pelos testes de normalidade que serão vistos posteriormente. Por isso afirmamos que a distribuição t somente será corretamente aplicada quando a distribuição das observações da variável de interesse for razoavelmente próxima da distribuição normal. Atualmente, com o vasto emprego do computador, a verificação de proximidade dos valores da variável na distribuição normal é feita por alguns testes estatísticos. Dentre os principais testes de normalidade para variáveis contínuas estão o Kolmogorov-Smirnov test (auxiliado pela estatística do Lilliefors test), o Shapiro-Wilk test e o D`Agostino-Pearson Omnibus test. Estes testes indicam se a sua variável possui distribuição próxima da normal ou não (verificam se a distribuição dos dados da amostra pode ser atribuída à Curva Gaussiana). Ou seja, se o valor-p for menor do que o estipulado (valor α), então os dados não são distribuídos normalmente. E, mesmo que o valor-p seja maior, mostrando pelos testes que a distribuição Gaussiana pode ser usada, esta não é a única garantia, pois estes testes apresentam um baixo poder, principalmente com um n amostral pequeno. Portanto, estes testes devem ser analisados em conjunto com os demais assuntos já abordados, principalmente a análise gráfica e os teoremas do limite central e da distribuição de amostragem. Quando não há a garantia da suposição de normalidade, o teste t não resolve satisfatoriamente o problema, necessitando de outras soluções. As mais encontradas são a transformação dos dados e os testes não-paramétricos. Transformações dos dados e os Testes não-paramétricos para um ÚNICO grupo Caso os testes de normalidade dêem significativamente diferentes, ou seja, caso as observações não possam ser caracterizadas como uma curva de distribuição próxima da normal, transformamos os dados ou usamos os testes não-paramétricos. A transformação dos dados possibilita expressá-los em outra escala. Serve para adequação da variável na curva de probabilidade normal. Embora haja algumas maneiras de usar este artifício, é pouco empregado nas análises bioestatísticas e, portanto, não será discutido. Os testes não-paramétricos têm esse nome em virtude de não necessitarem de nenhum parâmetro populacional e de não seguirem nenhuma distribuição de probabilidade em especial. Com

12 isso, as hipóteses por eles baseadas são mais fracas. Um dos testes não-paramétricos para um único grupo é o Teste do Sinal. Outro teste é o Wilcoxon signed rank test. Como sabemos, uma variável que não pode ser representada razoavelmente pela distribuição normal, provavelmente, possui uma assimetria dos seus dados. Isto sugere a utilização da mediana como medida de tendência central ao invés da média. Estes testes são utilizados quando comparamos a mediana da população e a mediana da amostra. Comparações em dois grupos amostrais O teste t tem sua vasta aplicabilidade em função do possível emprego sem a necessidade de conhecer a média e o desvio-padrão populacional. Por esta razão os pesquisadores sempre buscarão tratar seus dados contínuos através desta distribuição, principalmente quando o objetivo dos seus estudos for a comparação entre médias de duas amostras. Há dois tipos básicos de comparação entre duas médias amostrais: as comparações independentes ou de amostras independentes e as comparações pareadas ou de amostras dependentes. Teste t para amostras independentes Amostras independentes são aquelas em que as observações nos dois grupos que estão sendo mensuradas são independentes, ou seja, a medida de um grupo não tem nenhuma interferência na medida de qualquer sujeito do outro grupo. Na Bioestatística, normalmente utilizamos os termos grupo controle e grupo experimental, ou grupo de tratamento I ou A e grupo de tratamento II ou B. Os nomes dependem do tipo de estudo que está sendo organizado. A principal comparação a ser feita através deste teste é se as médias amostrais são estatisticamente iguais ou se uma é maior do que a outra. Vale ressaltar que a ÚNICA diferença a ser apresentada entre os grupos é com relação à variável a ser tratada. Por exemplo, se desejamos comprovar uma maior eficácia de uma droga A em relação à droga B, devemos fazer com que os grupos sejam os mais homogêneos possíveis, para que, se houver realmente uma maior eficácia de uma droga, que isto seja devido somente à diferença da droga e não a qualquer outra variável (variável de confundimento). Há, como no teste t para uma única amostra, a necessidade de se atender a algumas pressuposições para que possa ser empregado. A primeira delas é que as observações, separadamente, tenham distribuição aproximadamente normal. Para este caso específico, o teste t é considerado bastante robusto, ou seja, ele é considerado aproximadamente normal mesmo com desvios considerados, desde que: as amostras sejam iguais em tamanho, tenham o n amostral de pelo menos 30 observações e o teste seja bilateral. A segunda suposição se refere à igualdade das variâncias. Para a aplicação do teste t é fundamental que a variação no grupo A seja igual a do grupo B. Esta segunda pressuposição é avaliada através do teste de homogeneidade das variâncias ou mais comumente conhecido como Teste F para variâncias iguais. Deve ser realizado antes do teste t, uma vez que o teste t somente poderá ser empregado se ambas as pressuposições forem aceitas.

13 Embora seja muito usado, o Teste F para variâncias iguais possui uma limitação importante. Quando as observações das amostras a serem comparadas não são tão bem caracterizadas pela distribuição normal, o Teste F se torna muito sensível. Neste caso, o teste pode parecer significativo, ou seja, pode mostrar que as variâncias são diferentes quando na verdade não são. Uma alternativa para este teste é o Teste de Levene. Da mesma forma que o teste F, ele avalia a igualdade das variâncias, ou seja, se resultado do teste der estatisticamente significante, as variâncias não são iguais. A vantagem é que este teste não sofre influência da não-normalidade dos dados. Concluindo as questões metodológicas iniciais na análise da utilização ou não do teste t, pensemos na seguinte ordem cronológica : primeiro verifica-se a proximidade com a distribuição normal ou não dos dados através dos testes de normalidade vistos acima e da análise do pesquisador. Caso seja verificada significativa simetria dos dados, utilizamos o Teste F para variâncias iguais. Em contrapartida, se não houver a certeza de uma simetria bem característica, empregamos o teste de Levene. Teste t para amostras dependentes ou pareadas Amostras dependentes são aquelas em que as observações são realizadas em um mesmo grupo, antes e depois da intervenção. É importante salientar que se entende por intervenção qualquer ação realizada pelos pesquisadores, desde um treinamento específico, trabalho de reabilitação ou simplesmente repouso absoluto. Faz-se a medição da variável de interesse no grupo e, após a intervenção, mede-se novamente a mesma variável. A principal pergunta a ser respondida neste tipo de análise é se a intervenção fez diferença. O nome dependente se dá pela relação de dependência entre os dados antes e depois. Como sabemos os valores dos sujeitos no estudo, temos alguma idéia de como serão os valores dos mesmos após a intervenção. E, o nome pareado se dá pelo pareamento (emparelhamento) que é realizado entre os valores do mesmo sujeito, antes e depois. O cálculo deste teste é baseado neste pareamento. Em função de se tratar dos mesmos indivíduos e ser organizado através do emparelhamento das observações, é mais eficiente e mais sensível às pequenas variações. Como estamos lidando com um mesmo grupo, antes e depois, as pressuposições que devem ser aceitas são as mesmas que no teste t para amostras independentes. Quando pelo menos um dos grupos na comparação das médias não pode ser aproximado pela curva normal, o teste t, seja ele para amostras independentes ou dependentes, não pode ser utilizado. Nestes casos, há alguns testes não-paramétricos que os substituem. Testes não-paramétricos para comparação entre duas amostras independentes Em se tratando de duas amostras independentes, o teste empregado é chamado de várias maneiras: Teste da soma de postos de Wilcoxon ou Teste U Mann-Whitney ou Teste da soma de

14 postos Mann-Whitney-Wilcoxon. Na prática, este teste é denominado apenas de teste de Wilcoxon para amostras independentes. Ele nos diz se as medianas são diferentes (ao invés das médias), através da ordenação dos valores das amostras. Pode ser empregado se respeitar as seguintes pressuposições: as duas amostras são aleatórias e independentes, tanto entre as amostras como dentro das próprias amostras e a variável de interesse deve ser contínua. Como o teste apura a hipótese de igualdade entre as medianas (assim como a grande maioria dos testes), um valor (valor p) menor do que o estipulado no estudo (valor α) significa que as amostras são estatisticamente diferentes. Outros testes que comparam duas amostras de características contínuas, mas não-paramétricas são o TESTE DE WELCH e o RUN TEST. Embora sejam utilizados, seus valores são similares aos testes de Wilcoxon, mas menos poderosos e, portanto, não serão abordados neste curso. Testes não-paramétricos para comparação entre duas amostras dependentes Para comparação entre duas amostras não-paramétricas e dependentes, utilizamos o Teste de Wilcoxon para amostras dependentes, ou também denominado de Teste de ordenação de Wilcoxon. As pressuposições para realização deste teste incluem: dependência dentro dos pares, mas independência entre os pares e as diferenças intrapares constituindo uma variável contínua, de distribuição simétrica ao redor da mediana. Outro teste empregado na comparação de duas amostras pareadas é o teste do sinal. Embora seja utilizado, este teste é menos poderoso que o teste de Wilcoxon e também não será abordado neste curso. Ambos os testes de Wilcoxon para amostras independentes ou dependentes são extremamente eficazes. Quando há a possibilidade de utilização do teste t e a hipótese nula não é verdadeira, ou seja, há a verificação estatística de diferença entre os grupos, os testes de Wilcoxon provavelmente darão o mesmo resultado. E, principalmente, quando as pressuposições para utilização do teste t não são garantidas, os testes de Wilcoxon são mais eficazes. Observação: O programa utilizado no laboratório (Statistica 7.0) chama o teste estatístico para comparação entre amostras independentes de Mann-Whitney U test e para amostras dependentes de Wilcoxon matched pairs test. O programa Prism denomina o teste de Wilcoxon para amostras independentes de Mann-Whitney test e para amostras dependentes de Wilcoxon matched pairs test. Vale lembrar que os testes estatísticos empregados em função da distribuição de probabilidade normal, ou curva t e todos os outros até aqui observados são usados somente em variáveis contínuas. Portanto, para os demais tipos de variáveis, descrevemos alguns testes empregados.

15 Testes estatísticos para variáveis não contínuas Variáveis não contínuas em uma única amostra Quando há a verificação de uma única amostra medida em termos proporcionais, o teste utilizado é semelhante à verificação de hipóteses ou ao intervalo de confiança, mas ajustado para as medidas de proporção. Comparação de variáveis não contínuas para duas amostras Nas AMOSTRAS INDEPENDENTES, utilizamos os seguintes testes: intervalo de confiança para a diferença entre as proporções utilizando a distribuição Z, teste de hipóteses das proporções iguais por meio do teste Z e o teste Qui-quadrado Os primeiros são extensões dos métodos do teste Z e não são tão utilizados como o terceiro teste, descrito abaixo. Teste Qui-Quadrado (χ 2 ) Esta técnica foi desenvolvida para responder às perguntas de igualdade entre dois OU MAIS grupos de variáveis qualitativas. A distribuição Qui-quadrado é uma das diversas distribuições existentes em estatística. Sua versatilidade a capacita para diversas aplicações. Entre elas, podemos destacar: - Verificar se a distribuição observada dos dados ajusta-se à distribuição esperada (teórica), denominado teste Qui-quadrado de aderência ou ajustamento. - Comparar uma variável categórica em duas ou mais amostras, denominado de Teste Quiquadrado de comparação de proporções ou teste Qui-quadrado de heterogeneidade. - Verificar associação entre duas variáveis qualitativas, denominado teste Qui-quadrado de associação. O teste do Qui-quadrado é baseado em tabelas de contingência com freqüências absolutas. Uma das principais vantagens é que a tabela de contingência não precisa ser 2x2. Porém, há a necessidade de supor o valor da freqüência esperada para cada valor da tabela de contingência. Abaixo um exemplo do teste Qui-quadrado de comparação de proporções para facilitar o entendimento. Ex: Imaginemos uma situação hipotética em que se descobriu um novo tipo de par de genes. Os alelos seriam R e S, ou seja, em uma fecundação haveria a possibilidade de encontrar RR, SS e RS, sendo que a pessoa somente seria considerada R ou S se tivesse os dois alelos (genes recessivos). Uma forma escolhida pelos pesquisadores para tentar provar esta afirmativa foi avaliar o sangue de 24 sujeitos filhos de pais com os genes RS. Cruzando-se os genes (RSxRS), ESPERAMOS que a probabilidade seja de 25% para RR, 25% para SS e 50% para RS. Após análise de DNA, foram observados 4 (quatro) sujeitos RR, 13 RS e 7 SS. Os valores esperados seriam de 25% de 24 indivíduos para RR e SS (0,25 x 24 = 6 RR e 6 SS) e 50% de 24 indivíduos para RS (0,5 x 24 = 12 RS). Abaixo, a tabela mostra os valores esperados e os observados.

16 Podemos ver que os valores observados são um pouco diferentes dos valores esperados para esta amostra. O teste do Qui-quadrado testa se esta variação é estatisticamente diferente ou pode ter ocorrido ao acaso. Analisando a tabela abaixo com os resultados do teste: Observamos que o valor p é de aproximadamente 0,63. Como este valor é maior do que o valor estipulado para este teste (α = 0,05), não rejeitamos a hipótese nula de que o observado e o esperado são iguais. Estatisticamente, o número de valores observados é igual ao de valores esperados. Neste tipo de estudo, a quantidade de observações nas amostras é estipulada pelo pesquisador, não controlando a freqüência nas categorias (variáveis aleatórias). A hipótese a ser testada é se as proporções nas diferentes categorias é a mesma nas amostras estudadas. Ex2: Em 3 (três) centros de reabilitação de fisioterapia da cidade do Rio de Janeiro foi avaliada a capacidade de independência (nula, parcial ou total) de idosos com mais de 70 anos, após cirurgia de quadril e tratamento fisioterápico. O objetivo era verificar se a proporção destas categorias era semelhante nos 3 hospitais ou se em algum deles as melhoras foram mais significativas. O quadro de contingência abaixo mostra os dados deste estudo. Como sabemos os testes estatísticos quase sempre testam a igualdade entre as amostras. Neste estudo, supomos então que a proporção de sujeitos de independência nula é igual nos três centros, assim como as demais proporções. Portanto, devemos saber o valor esperado em todas as amostras. Calculando para independência nula (IND NULA): 58/253 = 22,9%, ou seja, esperamos que em cada um dos centros, 22,9% do total avaliado seja de idosos com IND NULA. Agora, calculamos quantas observações deveríamos esperar em cada centro. CENTRO 1: 76 casos no total e esperamos 22,9% de

17 casos como IND NULA, assim, 76 x 22,9% = 17,4 casos são esperados de IND NULA no CENTRO 1; CENTRO 2 (22,9% x 108 = 24,7); CENTRO 3 (22,9% x 69 = 15,8). Após todos os cálculos, a tabela com os valores observados e os esperados (valores esperados entre os parênteses) está abaixo: Agora, reescrevendo as colunas e linhas no programa e rodando o teste Qui-quadrado, obtemos o seguinte resultado: Esta tabela de valores nos mostra o valor de p < 0,33. Este valor é maior que o valor estipulado de α = 0,05. Com isso, não podemos afirmar que há diferença entre os valores observados e os valores esperados. Entretanto, se analisarmos os nossos dados com mais atenção, devemos notar que o valor observado para independência total no centro 3 é muito maior do que o esperado. Analisando separadamente cada tipo de observação (IND NULA, IND PARCIAL e IND TOTAL), verificamos as seguintes tabelas de valores:

18 Como podemos observar nos valores p de cada comparação, somente no terceiro quadro encontramos um valor p < 0,028 que é menor do que o valor α = 0,05. Neste caso, a chance de esta diferença ter sido ao acaso é muito pequena, ou seja, os valores observados não devem ser iguais aos valores esperados. Entretanto, a interpretação mais acurada se dará em função da análise de resíduos. Como este tratamento do teste é extremamente específico e de elevada complexidade, não será assunto desta apostila. Como qualquer teste estatístico, o Qui-quadrado deve atender a algumas condições. Entre as principais encontram-se: - Deve ser realizado para freqüências observadas absolutas. - Quando o grau de liberdade for igual a 1 (gl = 1), a distribuição empírica do Qui-quadrado não se aproxima corretamente da distribuição teórica. Neste caso, há a necessidade de se fazer a correção de Yates. Para o grau de liberdade ser igual a 1, a tabela de contingência deve ser 2x2. Por isso, nas tabelas de contingência 2x2, haverá a correção de Yates. - A última condição, e talvez a mais importante, está relacionada à quantidade de freqüências no estudo. Esta distribuição pressupõe que os valores esperados não sejam pequenos, exigindo-se: total da amostra superior a 25 sujeitos. Além disso, 20% das amostras não devem ter o valor esperado inferior a 5. Com relação a esta última condição, caso haja mais de 20% inferior ao valor 5 (cinco), devemos utilizar o Teste Exato de Fisher. É importante termos em mente que o Teste Exato de Fisher é a alternativa para o teste do Qui-quadrado para examinar a associação nas tabelas, quando as mesmas são do tipo 2x2 e os valores esperados são pequenos. Nas AMOSTRAS DEPENDENTES, quando estamos tratando de variáveis nominais dicotômicas, utilizamos o teste de McNemar. Teste bastante simples, porém é imprescindível a correta formulação da tabela de contingência, como veremos no exemplo a seguir:

19 Ex: Imaginemos que estamos interessados em saber qual dos tipos de massagem é o mais eficaz para os braços de homens que trabalham como motoristas de ônibus. Para tal, em cada membro dos sujeitos era aplicado um dos dois tipos de massagem. Os indivíduos respondiam a pergunta simples se houve melhora na dor por estresse ou não (variável dicotômica). Logicamente, todos os conceitos básicos foram seguidos, como escolha aleatória dos sujeitos e aleatoriedade das massagens nos membros. Abaixo a tabela de valores: Massagem I Massagem I SIM NÃO TOTAL Massagem II SIM Massagem II NÂO TOTAL Como os demais testes, a hipótese nula é de que ambas as massagens têm o mesmo efeito. Neste caso, esperamos que o número de pessoas que classifique a massagem I como boa e a massagem II como ruim seja o mesmo que classifique a massagem I como ruim e a II como boa. Os indivíduos que deram a mesma resposta para as duas massagens (as duas boas ou as duas ruins) são descartados. Portanto, nesta tabela, os valores importantes são 11 (sujeitos que acharam a massagem I ruim e a II boa) e 14 (sujeitos que acharam a massagem I boa e a II ruim). O teste agora irá testar se estes valores são iguais estatisticamente ou se realmente uma delas é melhor do que a outra. Após ajuste das observações, a tabela ficou da seguinte maneira: Como podemos observar, houve a necessidade de trocar a localização dos valores para que o teste pudesse ser aplicado corretamente. Outra característica do próprio programa é que ele nos dá os valores dos diversos testes que são utilizados com as tabelas 2x2. Analisando o teste de McNemar, observamos um valor de p = 0,6892. Como este valor é maior do que o valor estipulado α = 0,05, não

20 rejeitamos a hipótese nula, ou seja, estatisticamente os valores são iguais. Clinicamente, devemos entender que os dois tipos de massagem produziram efeitos semelhantes nestes indivíduos. Não podemos esquecer que os testes pareados normalmente tratam de observações ocorridas antes e depois de uma intervenção. Por exemplo, queremos saber após 10 anos, qual o número de indivíduos de determinado grupo que se casou ou se separou. A pergunta a ser respondida é se a proporção de casados e solteiros é a mesma após 10 anos. Vale ressaltar que o fator intervenção neste caso é tão somente o tempo. Abaixo apresentamos a tabela do estudo: CASADOS CASADOS ANTES SIM ANTES NÃO TOTAL CASADOS DEPOIS SIM CASADOS DEPOIS NÃO TOTAL De qualquer maneira, estaríamos interessados nos sujeitos que mudaram de estado civil após 10 anos. Significa dizer que faríamos a comparação dos valores da direita superior e da esquerda inferior, ou seja, compararíamos as observações dos que eram solteiros e se tornaram casados com os que eram casados e se tornaram solteiros (35 e 57, respectivamente) Neste caso, notamos que o valor p = 0,0286 é menor do que o valor α = 0,05. Portanto, há diferença estatística, ou seja, neste grupo a proporção de separações foi maior do que a proporção de casamentos.

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA População (N) representa o conjunto de todas as unidades experimentais que apresentam características em comum Amostra (n) representa uma parte do todo.

Leia mais

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA Determinada a pergunta/ hipótese Recolhidos os dados Análise descritiva = Estatística descritiva QUAIS TESTES ESTATÍSTICOS DEVEM SER REALIZADOS?? PROFESSORA:

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

Estimação e Testes de Hipóteses

Estimação e Testes de Hipóteses Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas

Leia mais

7 Teste de Hipóteses

7 Teste de Hipóteses 7 Teste de Hipóteses 7-1 Aspectos Gerais 7-2 Fundamentos do Teste de Hipóteses 7-3 Teste de uma Afirmação sobre a Média: Grandes Amostras 7-4 Teste de uma Afirmação sobre a Média : Pequenas Amostras 7-5

Leia mais

Intervalos de Confiança

Intervalos de Confiança Intervalos de Confiança INTERVALOS DE CONFIANÇA.1 Conceitos básicos.1.1 Parâmetro e estatística Parâmetro é a descrição numérica de uma característica da população. Estatística é a descrição numérica de

Leia mais

Medidas de Dispersão ou variabilidade

Medidas de Dispersão ou variabilidade Medidas de Dispersão ou variabilidade A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou

Leia mais

Especialização em Engenharia de Processos e de Sistemas de Produção

Especialização em Engenharia de Processos e de Sistemas de Produção Especialização em Engenharia de Processos e de Sistemas de Produção Projetos de Experimento e Confiabilidade de Sistemas da Produção Prof. Claudio Luis C. Frankenberg 3ª parte Conforme foi apresentado

Leia mais

AULA 05 Teste de Hipótese

AULA 05 Teste de Hipótese 1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução

Leia mais

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO Ana Paula Araujo Correa Eder Queiroz Newton Trevisan DEFINIÇÃO É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Distribuição de frequências. Prof. Dr. Alberto Franke

Distribuição de frequências. Prof. Dr. Alberto Franke Distribuição de frequências Prof. Dr. Alberto Franke E-mail: alberto.franke@ufsc.br 1 Distribuição de frequências Há necessidade de distinguir entre: Distribuição observada Distribuição verdadeira Distribuição

Leia mais

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA) 1. Sabe-se que o nível de significância é a probabilidade de cometermos um determinado tipo de erro quando da realização de um teste de hipóteses. Então: a) A escolha ideal seria um nível de significância

Leia mais

Por que testes não-paramétricos?

Por que testes não-paramétricos? Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Métodos Estatísticos Avançados em Epidemiologia Aula 3 Testes Não-Paramétricos: Wilcoxon Mann-Whitney Kruskal-Wallis

Leia mais

AULA 07 Inferência a Partir de Duas Amostras

AULA 07 Inferência a Partir de Duas Amostras 1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,

Leia mais

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média TESTES DE HIPÓTESES Conceitos, Testes de 1 proporção, Testes de 1 média 1 Testes de Hipóteses População Conjectura (hipótese) sobre o comportamento de variáveis Amostra Decisão sobre a admissibilidade

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia 1 / 44 Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Referência: Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 44

Leia mais

Testes de Hipótese para uma única Amostra - parte I

Testes de Hipótese para uma única Amostra - parte I Testes de Hipótese para uma única Amostra - parte I 26 de Junho de 2014 Objetivos Ao final deste capítulo você deve ser capaz de: Estruturar problemas de engenharia como testes de hipótese. Entender os

Leia mais

Bioestatística Básica

Bioestatística Básica Bioestatística Básica Curso de Pós-Graduação RCA 5804 PROF. DR. ALFREDO J RODRIGUES DEPARTAMENTO DE CIRURGIA E ANATOMIA FACULDADE DE MEDICINA DE RIBEIRÃO PRETO UNIVERSIDADE DE SÃO PAULO alfredo@fmrp.usp.br

Leia mais

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja: Pessoal, trago a vocês a resolução da prova de Estatística do concurso para Auditor Fiscal aplicada pela FCC. Foram 10 questões de estatística! Não identifiquei possibilidade para recursos. Considero a

Leia mais

Princípios de Bioestatística

Princípios de Bioestatística Princípios de Bioestatística Análise de Variância Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/~enricoc 2011 1 / 25 Introdução Existem muitas

Leia mais

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa

Leia mais

Razão para rejeitar H 0

Razão para rejeitar H 0 Processo do teste de hipótese Hipótese de pesquisa: a idade média da população é 5 H : μ = 5 H 1 : μ 5 É X = improvável se μ =5? População Selecionar amostra aleatória Sim: Rejeite Ho Para definir pouco

Leia mais

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48) Estimação parâmetros e teste de hipóteses Prof. Dr. Alberto Franke (48) 91471041 Intervalo de confiança para média É um intervalo em que haja probabilidade do verdadeiro valor desconhecido do parâmetro

Leia mais

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística Disciplina: Estatística Aplicada Professores: Héliton Tavares e Regina Tavares Aluna:

Leia mais

Unidade III ESTATÍSTICA. Prof. Fernando Rodrigues

Unidade III ESTATÍSTICA. Prof. Fernando Rodrigues Unidade III ESTATÍSTICA Prof. Fernando Rodrigues Medidas de dispersão Estudamos na unidade anterior as medidas de tendência central, que fornecem importantes informações sobre uma sequência numérica. Entretanto,

Leia mais

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Glossário Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Análise de co-variância: Procedimento estatístico utilizado para análise de dados que

Leia mais

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA VARIABILIDADE NA MEDIDA DE DADOS CIENTÍFICOS Se numa pesquisa, desenvolvimento de um processo ou produto, o valor

Leia mais

BIOESTATISTICA. Unidade IV - Probabilidades

BIOESTATISTICA. Unidade IV - Probabilidades BIOESTATISTICA Unidade IV - Probabilidades 0 PROBABILIDADE E DISTRIBUIÇÃO DE FREQUÊNCIAS COMO ESTIMATIVA DA PROBABILIDADE Noções de Probabilidade Após realizar a descrição dos eventos utilizando gráficos,

Leia mais

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC Exercício 1 Contexto: amostras independentes de populações normais (a) Teste e IC para Duas Variâncias Método Hipótese nula Variância(Primeiro) / Variância(Segundo) = 1 Hipótese alternativa Variância(Primeiro)

Leia mais

Inferência para duas populações

Inferência para duas populações Inferência para duas populações Capítulo 13, Estatística Básica (Bussab&Morettin, 8a Edição) 7a AULA 27/04/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 7a aula (27/04/2015) MAE229 1 / 27 1.

Leia mais

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5 MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão

Leia mais

Mais Informações sobre Itens do Relatório

Mais Informações sobre Itens do Relatório Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo

Leia mais

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES Prof. Dr. Alfredo J Rodrigues Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo alfredo@fmrp.usp.br

Leia mais

CORRELAÇÃO. Flávia F. Feitosa

CORRELAÇÃO. Flávia F. Feitosa CORRELAÇÃO Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015 Revisão Inferência Estatística: Método científico para tirar conclusões sobre os parâmetros

Leia mais

TESTE t-student TESTE IGUALDADE DE VARIÂNCIAS

TESTE t-student TESTE IGUALDADE DE VARIÂNCIAS UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE ESTATÍSTICA TESTE t-student TESTE IGUALDADE DE VARIÂNCIAS BELÉM 2014 TAIS MEDEIROS SILVA 201107840019 TESTE t-student TESTE

Leia mais

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016. de Matemática Financeira e Estatística do ISS Teresina, aplicada em 8/08/016. 11 - (ISS Teresina 016 / FCC) Joana aplicou todo seu capital, durante 6 meses, em bancos ( e Y). No Banco, ela aplicou 37,5%

Leia mais

Inferência Estatística: Conceitos Básicos II

Inferência Estatística: Conceitos Básicos II Inferência Estatística: Conceitos Básicos II Distribuição Amostral e Teorema do Limite Central Análise Exploratória de dados no SPSS Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação

Leia mais

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza Estatística 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão Renata Souza Medidas Depois que você conheceu os conceitos de coleta de dados, variação, causas comuns e causas especiais,

Leia mais

( x) = a. f X. = para x I. Algumas Distribuições de Probabilidade Contínuas

( x) = a. f X. = para x I. Algumas Distribuições de Probabilidade Contínuas Probabilidade e Estatística I Antonio Roque Aula Algumas Distribuições de Probabilidade Contínuas Vamos agora estudar algumas importantes distribuições de probabilidades para variáveis contínuas. Distribuição

Leia mais

Estatística

Estatística Estatística 1 2016.2 Sumário Capítulo 1 Conceitos Básicos... 3 MEDIDAS DE POSIÇÃO... 3 MEDIDAS DE DISPERSÃO... 5 EXERCÍCIOS CAPÍTULO 1... 8 Capítulo 2 Outliers e Padronização... 12 VALOR PADRONIZADO (Z)...

Leia mais

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo Bioestatística Básica RCA 5804 1. Experimentos no qual o sujeito recebe + de 1 tratamento 2. Alternativas para teste T e Análise de Variância 3. Correlação Prof. Dr. Alfredo J Rodrigues Departamento de

Leia mais

Modelos de Regressão Linear Simples - parte I

Modelos de Regressão Linear Simples - parte I Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir

Leia mais

Distribuição t de Student

Distribuição t de Student Distribuição t de Student Introdução Quando o desvio padrão da população não é conhecido (o que é o caso, geralmente), usase o desvio padrão da amostra como estimativa, substituindo-se σ x por S x nas

Leia mais

Distribuições Amostrais

Distribuições Amostrais Estatística II Antonio Roque Aula Distribuições Amostrais O problema central da inferência estatística é como fazer afirmações sobre os parâmetros de uma população a partir de estatísticas obtidas de amostras

Leia mais

Testes t para comparação de médias de dois grupos independentes

Testes t para comparação de médias de dois grupos independentes Testes t para comparação de médias de dois grupos independentes Acadêmicas do curso de Zootecnia - Aline Cristina Berbet Lopes Amanda da Cruz Leinioski Larissa Ceccon Universidade Federal do Paraná UFPR/2015

Leia mais

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso MEDIDAS DE POSIÇÃO E DE DISPERSÃO Profª Andréa H Dâmaso Bioestatística e Delineamento Experimental - 2012 Tópicos da aula Medidas de tendência central e dispersão Variáveis contínuas: distribuição normal

Leia mais

Licenciatura em Ciências Biológicas Universidade Federal de Goiás. Bioestatística. Prof. Thiago Rangel - Dep. Ecologia ICB

Licenciatura em Ciências Biológicas Universidade Federal de Goiás. Bioestatística. Prof. Thiago Rangel - Dep. Ecologia ICB Licenciatura em Ciências Biológicas Universidade Federal de Goiás Bioestatística Prof. Thiago Rangel - Dep. Ecologia ICB rangel.ufg@gmail.com Página do curso: http://www.ecologia.ufrgs.br/~adrimelo/bioestat

Leia mais

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida Teste de hipóteses para uma média populacional com variância conhecida e desconhecida Teste de hipóteses para uma média populacional com variância conhecida Tomando-se como exemplo os dados de recém-nascidos

Leia mais

Os testes. O teste de McNemar O teste de Wilcoxon O teste do sinais

Os testes. O teste de McNemar O teste de Wilcoxon O teste do sinais Prof. Lorí Viali, Dr. http://www.mat.ufrgs.br/viali/ viali@mat.ufrgs.br Os testes O teste de McNemar O teste de Wilcoxon O teste do sinais O teste de McNemar para a significância de mudanças é aplicável

Leia mais

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011 Distribuição Normal Prof a Dr a Alcione Miranda dos Santos Universidade Federal do Maranhão Programa de Pós-Graduação em Saúde Coletiva email:alcione.miranda@gmail.com Abril, 2011 1 / 18 Sumário Introdução

Leia mais

Análise da Variância. Prof. Dr. Alberto Franke (48)

Análise da Variância. Prof. Dr. Alberto Franke (48) Análise da Variância Prof. Dr. Alberto Franke (48) 91471041 Análise da variância Até aqui, a metodologia do teste de hipóteses foi utilizada para tirar conclusões sobre possíveis diferenças entre os parâmetros

Leia mais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari amanda@fcav.unesp.br INTRODUÇÃO Um dos principais objetivos da estatística é a tomada de decisões a respeito da população,

Leia mais

Métodos Quantitativos em Medicina

Métodos Quantitativos em Medicina Métodos Quantitativos em Medicina Comparação de Duas Médias Terceira Aula 009 Teste de Hipóteses - Estatística do teste A estatística do teste de hipótese depende da distribuição da variável na população

Leia mais

Probabilidade e Estatística. stica. Prof. Dr. Narciso Gonçalves da Silva pessoal.utfpr.edu.

Probabilidade e Estatística. stica. Prof. Dr. Narciso Gonçalves da Silva  pessoal.utfpr.edu. Probabilidade e Estatística stica Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva pessoal.utfpr.edu.br/ngsilva Distribuição Uniforme Uma variável aleatória contínua X está

Leia mais

Estatística Indutiva

Estatística Indutiva Estatística Indutiva MÓDULO 7: INTERVALOS DE CONFIANÇA 7.1 Conceitos básicos 7.1.1 Parâmetro e estatística Parâmetro é a descrição numérica de uma característica da população. Estatística é a descrição

Leia mais

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa

Leia mais

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas). Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas). Na comparação de duas populações, dispomos de duas amostras, em

Leia mais

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 214 Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica

Leia mais

Distribuição T - Student. Prof. Herondino S. F.

Distribuição T - Student. Prof. Herondino S. F. Distribuição T - Student Prof. Herondino S. F. Distribuição T-Student A distribuição T de Student é uma distribuição de probabilidade estatística, publicada por um autor que se chamou de Student, pseudônimo

Leia mais

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa

Leia mais

Modelos Lineares Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite. Professora Ariane Ferreira

Modelos Lineares Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite. Professora Ariane Ferreira Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite Professora Ariane Ferreira Modelos Probabilísticos de v.a. continuas Distribuição de Probabilidades 2 IPRJ UERJ Ariane Ferreira

Leia mais

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM ANÁLISE DE VARIÂNCIA - ANOVA Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM UM EXEMPLO DE APLICAÇÃO Digamos que temos 6 métodos de ensino aplicados a 30 crianças

Leia mais

Probabilidade e Estatística

Probabilidade e Estatística Probabilidade e Estatística Teste Qui-quadrado Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva Teste Qui-quadrado É um teste não paramétrico, pois independe dos parâmetros

Leia mais

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP Bioestatística UNESP Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP Perguntas iniciais para reflexão I - O que é Estatística? II - Com que tipo de informação (dados)

Leia mais

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas. Estudo e Aplicação dos Testes de Hipóteses Paramétricos e Não Paramétricos em Amostras da Estação Fluviométrica Três Maria (MG) da bacia Hidrográfica do Rio São Francisco José Aparecido da Silva Gama¹

Leia mais

Análise de Aderência e de Associação

Análise de Aderência e de Associação Análise de Aderência e de Associação Capítulo 14, Estatística Básica (Bussab & Morettin, 8a Edição) Capítulo 8, Introdução Computacional à Probabilidade e Estatística (Pedrosa & Gama, Porto Editora) 8a

Leia mais

Inferência a partir de duas amostras

Inferência a partir de duas amostras Inferência a partir de duas amostras Inferência a partir de duas amostras. Inferência sobre duas médias: amostras dependentes. Inferência sobre duas médias: amostras grandes e independêntes 3. Comparação

Leia mais

Intervalo de confiança4

Intervalo de confiança4 Intervalo de confiança4 4.1 Introdução 4.2 Intervalo de confiança (IC) 4.3 Erro-padrão da média e da proporção 4.4 Precisão da estimativa dos parâmetros 4.5 Conclusão Referências Dirce Maria Trevisan Zanetta

Leia mais

Fernando de Pol Mayer

Fernando de Pol Mayer Fernando de Pol Mayer Laboratório de Estatística e Geoinformação (LEG) Departamento de Estatística (DEST) Universidade Federal do Paraná (UFPR) Este conteúdo está disponível por meio da Licença Creative

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 6 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise de dados bivariada: os casos dos testes de proporções para duas amostras independentes e emparelhadas

Leia mais

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS Nível de significância No processo de tomada de decisão sobre uma das hipóteses levantadas num estudo, deve-se antes de tudo definir

Leia mais

HEP Bioestatística

HEP Bioestatística HEP 57800 Bioestatística DATA Aula CONTEÚDO PROGRAMÁTICO 05/03 Terça 1 Níveis de mensuração, variáveis, organização de dados, apresentação tabular 07/03 Quinta 2 Apresentação tabular e gráfica 12/03 Terça

Leia mais

Hipóteses. Hipótese. É uma pressuposição de um determinado problema.

Hipóteses. Hipótese. É uma pressuposição de um determinado problema. Bioestatística Aula 7 Teoria dos Teste de Hitóteses Prof. Tiago A. E. Ferreira 1 Hipóteses Hipótese É uma pressuposição de um determinado problema. Uma vez formulada, a hipótese estará sujeita a uma comprovação

Leia mais

Medidas de Dispersão 1

Medidas de Dispersão 1 Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti Medidas de Dispersão 1 Introdução Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não

Leia mais

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior ESTATÍSTICA INFERENCIAL Prof. Dr. Guanis de Barros Vilela Junior As Hipóteses A Hipótese Nula (H 0 ) é, em geral, uma afirmação conservadora sobre uma situação da pesquisa. Por exemplo, se você quer testar

Leia mais

Probabilidade, distribuição normal e uso de tabelas padronizadas

Probabilidade, distribuição normal e uso de tabelas padronizadas Probabilidade, distribuição normal e uso de tabelas padronizadas Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é probabilidade? Número de 0 até 1 que expressa a tendência de

Leia mais

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total. INSTRUÇÕES Para a realização desta prova, você recebeu este Caderno de Questões. 1. Caderno de Questões Verifique se este Caderno de Questões contém a prova de Conhecimentos Específicos referente ao cargo

Leia mais

Universidade Federal do Paraná Seminário de Bioestatistica. Teste de Wilcoxon. Danielle Pierin Olivia Cleto

Universidade Federal do Paraná Seminário de Bioestatistica. Teste de Wilcoxon. Danielle Pierin Olivia Cleto Universidade Federal do Paraná Seminário de Bioestatistica Teste de Wilcoxon Danielle Pierin Olivia Cleto Teste de Postos com Sinais de Wilcoxon para Pares Combinados Esse teste é usado com dados amostrais

Leia mais

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p Inferência Estatística Básica Teste de Hipóteses para uma média populacional Cálculo do Valor p Exemplo 1 Um restaurante compra frangos abatidos inteiros com peso médio de 3 Kg há vários anos de um mesmo

Leia mais

TESTES NÃO PARAMÉTRICOS (para mediana/média)

TESTES NÃO PARAMÉTRICOS (para mediana/média) MAE212: Introdução à Probabilidade e à Estatística II - Profas. Beti e Chang (2012) 1 TESTES NÃO PARAMÉTRICOS (para mediana/média) Os métodos de estimação e testes de hipóteses estudados até agora nessa

Leia mais

Intervalos de Confiança - Amostras Pequenas

Intervalos de Confiança - Amostras Pequenas Intervalos de Confiança - Amostras Pequenas Teste de Hipóteses para uma Média Jorge M. V. Capela, Marisa V. Capela, Instituto de Química - UNESP Araraquara, SP capela@iq.unesp.br Araraquara, SP - 2016

Leia mais

Distribuições Amostrais

Distribuições Amostrais Distribuições Amostrais 1 Da população, com parâmetro, retira-se k amostras de tamanho n e calcula-se a estatística. Estas estatísticas são as estimativas de. As estatísticas, sendo variáveis aleatórias,

Leia mais

Planejamento e Otimização de Experimentos

Planejamento e Otimização de Experimentos Planejamento e Otimização de Experimentos Um Pouco de Estatística Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br anselmo.disciplinas@gmail.com Populações, Amostras e Distribuições População Amostra

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

BIBLIOGRAFIA INTRODUÇÃO À BIOESTATÍSTICA OBJETIVOS DO CURSO ESTATÍSTICA ESTATÍSTICA ESTATÍSTICA

BIBLIOGRAFIA INTRODUÇÃO À BIOESTATÍSTICA OBJETIVOS DO CURSO ESTATÍSTICA ESTATÍSTICA ESTATÍSTICA BIBLIOGRAFIA INTRODUÇÃO À BIOESTATÍSTICA BIOESTATÍSTICA BÁSICA E CLÍNICA Beth Dawson; Robert G. Trapp Ed.Mc Graw Hill 3ª edição PROFESSORA: Carolina Peixinho carolina@peb.ufrj.br BIOESTATÍSTICA: PRINCÍPIOS

Leia mais

aula DISTRIBUIÇÃO NORMAL - PARTE I META OBJETIVOS PRÉ-REQUISITOS Apresentar o conteúdo de distribuição normal

aula DISTRIBUIÇÃO NORMAL - PARTE I META OBJETIVOS PRÉ-REQUISITOS Apresentar o conteúdo de distribuição normal DISTRIBUIÇÃO NORMAL - PARTE I 4 aula META Apresentar o conteúdo de distribuição normal OBJETIVOS Ao final desta aula, o aluno deverá: determinar a média e a variância para uma função contínua; padronizar

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões

Leia mais

Teste de Cochran (Homogeneidade de Variância)

Teste de Cochran (Homogeneidade de Variância) ara o modelo heterocedástico, vamos inicialmente testar as hipóteses Os métodos mais utilizados são os testes de Cochran, Bartlett e de Levene. Teste de Cochran (Homogeneidade de Variância) O teste de

Leia mais

b) 5 6 d) 1 6 e) 7 6

b) 5 6 d) 1 6 e) 7 6 CONHECIMENTOS ESPECÍFICOS 21. Em estatística, duas medidas são de grande importância na análise de dados, medidas de tendência central e de dispersão. Dentre as medidas indicadas abaixo, são, respectivamente,

Leia mais

16/6/2014. Teste Qui-quadrado de independência

16/6/2014. Teste Qui-quadrado de independência UNIVERSIDADE FEDERAL DA PARAÍBA TESTES NÃO- PARAMÉTRICOS Parte I Prof. Luiz Medeiros Departamento de Estatística Teste Qui-quadrado de independência Um dos principais objetivos de se construir uma tabela

Leia mais

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência Introdução 1 Muito frequentemente fazemos perguntas do tipo se alguma coisa tem relação com outra. Estatisticamente

Leia mais

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II Prof.ª Sheila Regina Oro Projeto Recursos Educacionais Digitais Autores: Bruno Baierle e Maurício Furigo TESTE PARA UMA PROPORÇÃO H0: p = p 0

Leia mais

TESTES NÃO-PARAMÉTRICOS

TESTES NÃO-PARAMÉTRICOS Les-0773: ESTATÍSTICA APLICADA III TESTES NÃO-PARAMÉTRICOS AULA 3 26/05/17 Prof a Lilian M. Lima Cunha Maio de 2017 Revisão... Teste dos Sinais A Comparar valores de medianas de uma amostra com um valor

Leia mais

Parte 8 Testes de hipóteses Comparação de dois grupos

Parte 8 Testes de hipóteses Comparação de dois grupos Parte 8 Testes de hipóteses Comparação de dois grupos Um objetivo frequente em estudos de diferentes áreas é a comparação de dois ou mais grupos (ou populações). Alguns exemplos: o Comparação dos salários

Leia mais

Intervalos Estatísticos para uma única Amostra - parte I

Intervalos Estatísticos para uma única Amostra - parte I Intervalos Estatísticos para uma única Amostra - parte I Intervalo de confiança para média 14 de Janeiro Objetivos Ao final deste capítulo você deve ser capaz de: Construir intervalos de confiança para

Leia mais

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra Análise da Regressão múltipla: MQO Assintótico Capítulo 5 do Wooldridge Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades

Leia mais

AULA 11 Teste de Hipótese

AULA 11 Teste de Hipótese 1 AULA 11 Teste de Hipótese Ernesto F. L. Amaral 20 de setembro de 2012 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo

Leia mais