Testes Não Paramétricos

Tamanho: px
Começar a partir da página:

Download "Testes Não Paramétricos"

Transcrição

1 Testes Não Paramétricos Nos testes abordados até agora, ditos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar ou de rácios, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação,...), etc. 1

2 Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a distribuição populacional em estudo pode ser considerada Normal). Estes são chamados testes não paramétricos. Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver certas suposições básicas associadas à maioria das provas não paramétricas, essas suposições são em menor número e mais fracas do que as associadas às provas paramétricas. A maior parte das provas não paramétricas servem para pequenas amostras e, além disso, aplicam-se a dados medidos em escala ordinal, e alguns mesmo a dados em escala nominal. 2

3 Testes de Ajustamento Testes de Ajustamento (testes da bondade do ajustamento) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição especificada. Hipóteses a testar: H 0 : a amostra provém de uma população com distribuição especificada H 1 : a população de onde provém a amostra não segue a distrib. especificada 3

4 Testes de Ajustamento Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa. Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0.1 e desvio padrão 7.2. Uma amostra de 30 navios revelou os resultados que se apresentam na tabela seguinte Diferença entre a data de chegada e a data planeada para 30 navios. Será mesmo de admitir que tais dados foram extraídos de uma pop. N(0.1, 7.2)? 4

5 Testes de Ajustamento Neste exemplo, estamos perante um problema de ajustamento de dados a uma determinada distribuição. Existem vários testes de ajustamento que nos permitem fazer uma análise de problemas deste tipo, entre os quais: o Teste de Ajustamento do Qui-quadrado sugerido por Karl Pearson, o teste de Kolmogorov ou Kolmogorov-Smirnov e o teste de normalidade de Lilliefors, que apresentamos a seguir. 5

6 Testes de Ajustamento Teste do Qui-quadrado Considere-se uma amostra aleatória de n elementos, extraída de uma população com distribuição desconhecida, sobre os quais se observa uma característica (qualitativa ou quantitativa). Os valores possíveis da característica em estudo são, num primeiro passo, repartidas por m classes mutuamente exclusivas, A 1, A 2,..., A m (serão intervalos da recta real se a característica é quantitativa e contínua). 6

7 Testes de Ajustamento Denote-se por: - O i o nº de observações ou frequência absoluta observada da classe A i ; - p i a probabilidade desconhecida de obter uma observação na classe A i ; - p 0i a probabilidade de obter uma observação na classe A i, assumindo que a observação foi extraída de uma população com a distribuição especificada em H 0. Hipóteses a testar: H 0 : p i =p 0i, i=1,...,m H 1 : p i p 0i para algum i 7

8 Testes de Ajustamento Assim, a frequência esperada da classe A i, quando H 0 é verdadeira, é dada por e i = n p 0i. A estatística de teste, do teste de ajustamento do Qui-quadrado, é dada por Q ( Oi ei ) = m i= 1 e i 2 que, sendo verdadeira a hipótese nula, tem distribuição assimptótica do Quiquadrado com m-k-1 graus de liberdade (χ 2 m-k-1), onde k é o número de parâmetros desconhecidos da distribuição proposta em H 0, estimados a partir da amostra. 8

9 Testes de Ajustamento Se a hipótese nula for verdadeira, a diferença entre cada valor observado e o respectivo valor esperado, O i e i, não deve ser muito grande e, consequentemente, a estatística de teste terá um valor observado, Q obs, também não muito grande. De modo intuitivo, quanto maior for o valor observado de Q, menos plausível é a hipótese nula, isto é, mais nos encaminhamos de concluir que as frequências observadas não foram provenientes da população em que se baseou a hipótese nula, levando à rejeição desta. Trata-se portanto de um teste unilateral à direita. 9

10 Testes de Ajustamento Na aplicação deste teste deve-se ter particular atenção às frequências esperadas, e i s, pois se estas forem muito pequenas a aproximação ao Qui-quadrado não é a mais apropriada. São referidas na literatura várias regras práticas de aplicação do teste, das quais avançamos a seguinte. Se tivermos: ou, - mais de 20% das classes com e i inferior a 5 - alguma classe com e i inferior a 1 devemos proceder à agregação de algumas classes contíguas, e iniciar novamente o teste, agora com menos classes. 10

11 Testes de Ajustamento Retomemos o exemplo exposto atrás. Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a data planeada, as hipóteses a testar são H 0 : X ~ N(0.1, ) H 1 : X ~/ N(0.1, ) Neste caso a distribuição proposta em H 0 é contínua e, deste modo, as classes A i, i=1,...m, são intervalos da forma A 1 =]-, a 1 [, A 2 =[ a 1, a 2 [ A 3 =[ a 2, a 3 [... A m =[ a m-1, + [. 11

12 Testes de Ajustamento Para a determinação das classes é sugerida a regra de Mann e Wald: Número de classes = m, com m tal que n/m>5. Os limites dos intervalos são tais que as probabilidades decorrentes da hipótese nula sejam iguais a 1/m para todas as classes. Assim, as frequências esperadas são todas iguais a n/m>5. Para o exemplo escolheu-se m=4 classes (e i =30/4=7.5>5), donde p 0i = P(A i \H 0 ) = 1/4, para i=1,2,3,4. 12

13 Testes de Ajustamento Cálculo dos limites dos intervalos de classe: a 3 : p 03 = 0.25 a 3 =4.96 (EXCEL: INV.NORM(0.75;0.1;7.2)); 1/4 1/4 1/4 1/4 Da simetria da distribuição normal: a 1 a 2 =0.1 a 3 a 2 =0.1 e a 1 =0.1-( )= (EXCEL: INV.NORM(0.25;0.1;7.2)) 13

14 Testes de Ajustamento Classes Frequências observadas p 0i Frequências esperadas A 1 =]-, -4.76[ A 2 =[-4.76,0.1[ A 3 =[0.1, 4.96[ A 4 =[4.96, + [ O valor observado da estatística de teste é Q obs = (8 7.5) (8 7.5) ( ) ( ) =

15 Testes de Ajustamento A estatística teste, sob o pressuposto de H 0 ser verdadeira, tem aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade. Para α=0.05: R.C.=[7.81, + [. (EXCEL: 7.81=INV.CHI(0,05;3)) Como Q obs R.C., somos levados a não rejeitar a hipótese de que a diferença entre os tempos de chegada e os tempos planeados tem distribuição N(0.1, ). 15

16 Testes de Ajustamento Teste de Kolmogorov-Smirnov (K-S) O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado, não se aplica a dados qualitativos nem a variáveis discretas, pois a tabela disponível para este teste só é exacta caso a distribuição em teste seja contínua. No entanto, tem a vantagem de não estar dependente de classificações dos dados, que além de serem sempre algo arbitrárias envolvem perdas de informação. De facto, no ajustamento de uma distribuição contínua a uma amostra usando o teste do Qui-quadrado, temos de proceder à agregação dos dados em classes, sendo por isso mais adequado utilizar o teste K-S. 16

17 Testes de Ajustamento Por outro lado, o teste K-S só pode ser aplicado quando a distribuição indicada na hipótese nula está completamente especificada (o que não sucede com o teste do Qui-quadrado). No caso de pretendermos, por exemplo, efectuar um ajustamento de uma distribuição normal, sem especificar µ e σ, podemos recorrer a outro teste, neste caso o teste desenvolvido por Lilliefors (teste de normalidade de Lilliefors) que será abordado mais tarde. Além disso, o teste do Qui-Quadrado está orientado essencialmente para grandes amostras, enquanto que o teste K-S é aplicável a pequenas amostras. 17

18 Testes de Ajustamento Seja F a função de distribuição da população em estudo e F 0 a função de distribuição proposta, contínua e completamente especificada. Hipóteses a testar: H 0 : F(x)=F 0 (x), para qualquer x H 1 : F(x) F 0 (x), para algum x No teste de Kolmogorov-Smirnov comparam-se as frequências relativas acumuladas registadas na amostra com as que se esperariam se a distribuição populacional fosse a especificada na hipótese nula. 18

19 Testes de Ajustamento A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar um valor inferior ou igual a x se a distribuição populacional for a especificada em H 0, F 0 (x): D n = sup S ( x ) F 0( x ) < x<+ F 0 (x) S (x) 19

20 Testes de Ajustamento Uma vez que F 0 é uma função (contínua) não decrescente e S é uma função em escada, o supremo ocorre num ponto onde se verifica um salto de S : { F ( x ) S( x ), F ( x ) S( x ) } D. n, obs = i i= 1,..., n max 0 i i 0 i 1 Assim, se H 0 for verdadeira, a distância vertical máxima entre as imagens das duas distribuições não deve de ser muito grande, e logo espera-se que D n,obs tome um valor pequeno. Então, para um nível de significância α, rejeita-se H 0, se o valor observado for superior ou igual ao ponto crítico D n,α (os valores críticos D n,α podem ser consultados numa tabela). 20

21 Testes de Ajustamento Exemplo: Acredita-se que o tempo despendido na execução de uma determinada tarefa é uma variável aleatória com distribuição normal de média 290 minutos e desvio padrão 56 minutos. Foram registados os tempos despendidos em 10 tarefas seleccionadas ao acaso, tendo-se registado o seguinte: Ao nível de significância de 5%, há evidência para rejeitar a hipótese de normalidade da referida variável? 21

22 Testes de Ajustamento Denote-se por X o tempo despendido na execução de uma tarefa. As hipóteses a testar são, neste caso, H 0 : X N(290, 56 2 ) H 1 : X ~/ N(290, 56 2 ). O ponto crítico da estatística de teste D 10 é, para α=0.05, D 10,0.05 = (consulte a tabela). Para calcular o valor observado da estatística de teste, começa-se por ordenar os valores da amostra por ordem crescente. Os cálculos estão efectuados na tabela seguinte. 22

23 Testes de Ajustamento EXCEL: DIST.NORM(198;290;56;VERDADEIRO) x i S(x i ) S(x i-1 ) F 0 (x i ) F 0 (x i )- S(x i ) F 0 (x i )- S(x i-1 ) 198 0,1 0 0,0502 0,05 0, ,2 0,1 0,2602 0,06 0, ,3 0,2 0,3085 0,009 0, ,4 0,3 0,3739 0,026 0, ,5 0,4 0,3944 0,106 0, ,6 0,5 0,4152 0,185 0, ,7 0,6 0,4644 0,236 0, ,9 0,7 0,4786 0,421 0, ,9 0,5142 0,486 0,3858 Como D 10,obs =0.486>0.409, ao nível de significância de 5%, rejeitamos a hipótese de o tempo despendido na execução de uma tarefa seguir distribuição N(290, 56 2 ). 23

24 Testes de Ajustamento Teste de Normalidade Lilliefors Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ, σ 2 ) sem especificar µ e σ, isto é, para algum µ e algum σ. Hipóteses a testar H 0 : X ~ N(µ, σ 2 ) H 1 : X ~/ N(µ, σ 2 ) Este teste processa-se como o teste de K-S, usando estimativas de µ e σ, respectivamente, x e s. Os pontos críticos são consultados na tabela elaborada por Lilliefors. 24

25 Testes de Ajustamento Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos seus produtos a um cliente bastante importante. Foi recolhida uma amostra aleatória de cinco tempos: 29, 33, 35, 36 e 36. O senhor quer estimar o tempo médio pretendido através de um intervalo de confiança, mas nada sabe acerca da distribuição do tempo de entrega X, e além disso, a dimensão da amostra é muito pequena (n=5). Poderá fazê-lo? Sabemos que caso a distribuição subjacente aos dados seja normal, o intervalo pode ser calculado usando a fórmula: S X m t, onde t: P(-t<T<t) =λ, T ~ t n-1 n 25

26 Testes de Ajustamento Assim, interessa testar, em primeiro lugar, as hipóteses H 0 : X ~ N(µ, σ 2 ) H 1 : X ~/ N(µ, σ 2 ) Uma vez que nada sabemos acerca de µ e σ, podemos utilizar o teste de Lilliefors, recorrendo às estimativas x =33.8 s=2.95. D O valor crítico da estatística teste, ao nível de significância de 0.05 é * 5,0.05 =0.337 (consulte a tabela). 26

27 Testes de Ajustamento EXCEL: DIST.NORM(29;33.8;2.95;VERDADEIRO) Cálculo do valor observado da estatística de Teste: x i S(x i ) S(x i-1 ) F 0 (x i ) F 0 (x i )- S(x i ) F 0 (x i )- S(x i-1 ) 29 0,2 0 0,0519 0,1481 0, ,4 0,2 0,3931 0,0069 0, ,6 0,4 0,6579 0,0579 0, ,6 0,772 0,2279 0,1721 Como D * 5, obs =0.2579<0.337, então, ao nível se significância de 5%, não rejeitamos a hipótese de a população em estudo ter distribuição normal. 27

28 Tabelas de Contingência Tabelas de Contingência Teste do Qui-quadrado de Independência Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma com r e outra com s modalidades ou categorias, respectivamente A 1, A 2,..., A r e B 1, B 2,..., B s. 28

29 Tabelas de Contingência Cada indivíduo da amostra é classificado numa e numa só categoria (ou classe) de A e numa e numa só categoria (ou classe) de B. A classificação dos elementos da amostra dá origem a uma tabela de dupla entrada, designada por tabela de contingência r s, com o seguinte aspecto: B 1 B 2... B s A 1 O 11 O O 1s A 2 O 21 O O 2s M M M O M A r O r1 O r2... O rs O ij (i=1,...,r e j=1,...,s) número de elementos classificados simultaneamente nas categorias A i de A e B j de B, numa amostra de tamanho n. 29

30 Tabelas de Contingência Sejam: O i = s j= 1 O (i=1,...,r) nº de elementos na amostra com modalidade A i ; ij O j = r i= 1 O (j=1,...,s) nº de elementos na amostra com modalidade B j. ij Tem-se, n = r s i= 1j= 1 O ij = r i= 1 O = s i j= 1 O j onde n é a dimensão da amostra. 30

31 Tabelas de Contingência O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não de qualquer relação ou associação entre os atributos (variáveis) A e B, mais concretamente, inferir se A e B são ou não independentes. Hipóteses a testar: H 0 : A e B são independentes H 1 : A e B não são independentes 31

32 Tabelas de Contingência Denote-se por: p ij =P(A i B j ) (i=1,..,r e j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado simultaneamente nas categorias A i de A e B j de B; p i =P(A i) (i=1,...,r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria A i de A; p j =P(B j ) (j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria B j de B. r s i= 1j= 1 i= 1 1 = p = p = p. ij r s i j= 1 j 32

33 Tabelas de Contingência Ora, se os atributos são independentes, verifica-se a conhecida relação, isto é, P(A i B j ) = P(A i ) P(B j ), p ij = p i p j Assim, as hipóteses anteriores podem ser formuladas do seguinte modo: H 0 : p ij = p i p j (para todo i e j) H 1 : p ij p i p j (para algum i j). 33

34 Tabelas de Contingência Os verdadeiros valores das probabilidades p i e p j são estimadas, a partir dos dados amostrais, por O pˆ i i = e n O j pˆ j =, n Notação: e ij =n p ij número esperado de indivíduos na classe A i de A e B j de B. Quando H 0 é verdadeira, i.e, p ij = p i p j, temos e ij =n p ij =n p i p j estimado por ê ij = n pˆ pˆ = i j O O i n j 34

35 Tabelas de Contingência A estatística do teste de independência é então: χ 2 = r s i= 1j= 1 (O ij ê ê ij ij ) 2, que, sob o pressuposto de H 0 ser verdadeira, tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1) graus de liberdade. Vimos que quando H 0 é verdadeira e ij pode ser estimado por ê ij = n pˆ pˆ. i j Logo, a diferença entre O ij (frequência observada) e ê ij (estimativa da frequência esperada supondo a independência) não deve ser grande. Assim, a estatística teste, mede o afastamento dos dados em relação à hipótese de independência. Trata-se então de um teste unilateral à direita. 35

36 Tabelas de Contingência Exemplo: Um supermercado quer testar ao nível de significância de 5% a hipótese de que o modo de pagamento dos clientes nesse estabelecimento é independente do período do dia em que fazem as compras. Existem três modos de efectuar os pagamentos: por cheque, dinheiro e cartão de débito/crédito. A seguinte tabela de contingência 3 3 apresenta os resultados obtidos numa amostra de 4000 clientes: PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Cheque Dinheiro Cartão de débito/crédito

37 Tabelas de Contingência Denotando por A o atributo Modo de pagamento e por B o atributo Período do dia em que faz as compras, as hipóteses as testar são H 0 : A e B são independentes H 1 : A e B não são independentes Uma vez que A e B assumem cada uma 3 modalidades, sob H 0, a estatística teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4 graus de liberdade. Ao nível de significância de 0.05, a região crítica é então [9.49, + [ (consulte tabela ou faça no EXCEL: INV.CHI(0,05;4)). 37

38 Tabelas de Contingência PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais Cheque Dinheiro Cartão de Crédito Totais Cálculo das frequências esperadas: ê ij O = n pˆ i pˆ j=n i n ê 11 =( )/4000=750 ê 12=( )/4000=1500 ê 13 =( )/4000=750. M O j Oi = n no j 38

39 Tabelas de Contingência Frequências esperadas PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais Cheque Dinheiro Cartão de Crédito Totais Valor observado da estatística teste: χ 2 obs = ( ) ( ) ( ) ( ) =60. Uma vez que 60 excede o valor crítico 9.49, ao nível de significância de 0.05, rejeitamos a hipótese de que o modo de pagamento é independente do período do dia em que as compras são feitas. 39

40 Tabelas de Contingência Medidas de Associação No teste do Qui-Quadrado apresentado, se for rejeitada a hipótese de independência entre os atributos, pode interessar medir a intensidade da associação entre os mesmos, através de uma medida adequada. Uma vez que a estatística do teste mede o afastamento em relação à hipótese de independência, o seu valor observado poderá ser usado para avaliar o grau de associação entre os atributos. 40

41 Tabelas de Contingência Coeficiente de Contingência de Pearson: C = χ χ n Este coeficiente varia entre 0 e ( q 1) q onde q=min{r,s} e portanto nunca assume o valor 1. Valores pequenos de C indicam fraca associação entre os atributos, enquanto que valores grandes de C indicam forte associação. O facto deste coeficiente não assumir o valor 1 no caso de associação completa é uma sua limitação. Para obviar este problema, Tshuprow propôs o seguinte coeficiente. 41

42 Tabelas de Contingência Coeficiente de Tshuprow: T = n (r χ 2 1) (s 1) Este coeficiente varia entre 0 e 1, tomando o valor 0 no caso de existir independência e o valor 1 quando r=s e houver associação completa. Por último, referimos o coeficiente proposto por Cramer que atinge o valor 1 quando há associação completa. Coeficiente V de Cramer: V 2 χ =, com q=min{r,s} 0 V 1. n(q 1) 42

43 Tabelas de Contingência Para o exemplo anterior, rejeitámos a hipótese de independência entre o modo de pagamento e o período do dia em que as compras eram efectuadas. Para ter uma ideia da intensidade de associação entre estes dois atributos, calculam-se os coeficientes que acabámos de descrever. χ 60 Coeficiente de Contingência de Pearson: C = = = χ + n C ( q 1) q, onde q=min{r,s}=3, i.e, 0 C

44 Tabelas de Contingência Coeficiente de Tshuprow: T χ 2 60 = = n (r 1) (s 1) =0.087 Coeficiente V de Cramer: 2 V χ 60 = = n(q 1) =0.087 Verificamos, então, que apesar de haver associação entre os atributos, esta pode considerar-se fraca. 44

45 Tabelas de Contingência Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações (sub-populações ou estratos) B 1, B 2,..., B s, nas quais se observa um atributo A com r categorias A 1, A 2,..., A r. Neste contexto, surge também uma tabela de contingência r s: B 1 B 2... B s A 1 O 11 O O 1s A 2 O 21 O O 2s M M M O M A r O r1 O r2... O rs O ij (i=1,...,r e j=1,...,s) número de elementos da amostra da população B j classificados na categoria A i de A. 45

46 Tabelas de Contingência Sejam: O i = s j= 1 amostras; O (i=1,...,r) nº de elementos na categoria A i de A em todas as ij O j = r i= 1 O (j=1,...,s) tamanho da amostra recolhida na população B j. ij Neste caso, cada B j rotula uma sub-população cujos elementos se distribuem pelas r modalidades do atributo A, e o que se pretende saber é se existe homogeneidade, isto é, se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A. 46

47 Tabelas de Contingência À semelhança do teste de independência, a estatística do teste é χ 2 = r s i= 1j= 1 (O ij ê ê ij ij ) 2, que, sob o pressuposto de H 0 ser verdadeira, tem distribuição assimptótica do Qui-Quadrado com (r-1)(s-1) graus de liberdade. Valores muito grandes da estatística de teste traduzem um grande afastamento dos dados em relação à hipótese nula, conduzindo à rejeição desta. Assim, a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade. 47

48 Tabelas de Contingência Para aplicar os testes de independência e de homogeneidade devem ser seguidas as mesmas regras que vimos para o teste de ajustamento do Quiquadrado, isto é, se tivermos: ou, - mais de 20% das frequências esperadas, e i s, inferiores a 5 - alguma frequência esperada inferior a 1 devemos proceder à agregação de algumas classes contíguas. 48

49 Tabelas de Contingência Teste exacto de Fisher O teste do Qui-quadrado é, como já se disse, baseado numa distribuição assimptótica, o que portanto limita a sua aplicação ao caso de grandes amostras (recorde as limitações sobre as frequências esperadas). Em tabelas de contingência 2x2, existe uma alternativa ao teste do Qui-quadrado, o teste de Fisher, que é um teste exacto, i.e., a distribuição da estatística é exacta (os pontos críticos e valores-p são calculados de forma exacta). 49

50 Ajuste entre duas Amostras Independentes AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas populações, pretende-se testar a hipótese H 0 de que as duas distribuições populacionais são idênticas, isto é, as duas amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Hipóteses a testar: H 0 : As duas amostras são retiradas de populações com a mesma distribuição H 1 : As duas amostras são retiradas de populações com distribuições diferentes 1

51 Ajuste entre duas Amostras Independentes Teste do Qui-quadrado Os valores possíveis da característica em estudo são repartidos por m classes mutuamente exclusivas A 1, A 2,...,A m. A hipótese H 0 que se pretende testar é a de que as duas populações em estudo têm a mesma distribuição, isto é, não há diferença entre as duas populações no modo como os seus elementos se distribuem pelas diversas classes. Por outras palavras, as duas populações são homogéneas. Trata-se então do teste do Qui-quadrado de homogeneidade para duas populações (s=2). 2

52 Ajuste entre duas Amostras Independentes Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas. Comparam-se as frequências relativas acumuladas registadas nas duas amostras (digamos A e B). Se não se registarem diferenças significativas, não é rejeitada a hipótese nula de que as duas amostras provêm de populações com a mesma distribuição. A estatística de teste considera a maior das diferenças, em valor absoluto, entre as proporções de valores inferiores ou iguais a x observadas em cada amostra, S A (x) S B (x). Estatística de teste: D' = sup < x<+ S A ( x) S Para um nível de significância α, a hipótese H 0 é rejeitada se o valor observado da estatística de teste for superior ao ponto crítico B ( x) D ' α (a ser consultado numa tabela). 3

53 Ajuste entre duas Amostras Independentes Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante A de uma dada doença, obtendo-se os seguintes resultados VALORES N.º indivíduos Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença. Os valores da análise para estes 70 indivíduos estão registados seguidamente. VALORES N.º indivíduos Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B desta doença? (Use α=0.01) 4

54 Ajuste entre duas Amostras Independentes Variante A: Variante B: VALORES N.º indivíduos Freq. acumuladas S A (x) 2/80 5/80 14/80 26/80 53/80 69/80 76/80 78/80 1 VALORES N.º indivíduos Freq. acumuladas S B (x) 1/70 3/70 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1 5

55 Ajuste entre duas Amostras Independentes Cálculo do valor observado da estatística de teste: Valores S A (x) 2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/ S B (x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1 S A (x)- S B (x) 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014 0 O valor observado da estatística de teste é então D obs = Para α=0.01, o ponto crítico é (consulte tabela): 1.63 =

56 Ajuste entre duas Amostras Independentes Dado que o valor observado da estatística de teste é 0.491>0.267, então rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao nível de significância de 0.01, de que os valores da análise de distribuem de forma diferente na variante A e B da doença. 7

57 Teste de Kruskal_Wallis TESTE DE KRUSKAL-WALLIS Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde foram extraídas k amostras aleatórias e independentes, pretende-se testar a hipótese H 0 de que as distribuições populacionais são idênticas, isto é, as k amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um factor, a ser abordada mais tarde, quando os pressupostos desta não podem ser verificados. 1

58 Teste de Kruskal_Wallis Hipóteses a testar: H 0 : As k amostras são retiradas de populações com a mesma distribuição H 1 : As k amostras não são retiradas de populações com a mesma distribuição, isto é, há pelo menos duas populações com distribuições diferentes O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas de localização. Por esta razão as hipóteses são geralmente formuladas em termos das médias ou das medianas populacionais. 2

59 Teste de Kruskal_Wallis Notação: µ i média da i-ésima população M i mediana da i-ésima população H 0 : µ 1 =µ 2 = =µ k H 1 : µ i µ j, i j (as médias populacionais são iguais para as k populações) (há pelo menos duas populações com médias diferentes) H 0 : M 1 =M 2 = =M k (as k medianas populacionais são iguais) H 1 : M i =M j, i j (há pelo menos duas populações com medianas diferentes) 3

60 Teste de Kruskal_Wallis Notação: n i - o tamanho da amostra retirada da população i (i=1,...k); N = k n i i= 1 - nº total de observações; X ij - a j-ésima observação da amostra da população i. Procedimento: ordenam-se todas as observações por ordem crescente dos seus valores; atribui-se um nº de ordem, ou posto, R ij, a cada observação X ij (a observação mais pequena fica com o nº de ordem, ou posto, 1 e a observação maior com o posto N); para cada população i determina-se o valor R i da soma dos postos das observações correspondentes a esse grupo populacional: R n = i i R ij j= 1 4

61 Teste de Kruskal_Wallis Quando há empates nos valores observados, o número de ordem, ou posto, que deve ser atribuído a cada valor empatado deve ser a média dos números de ordem que seriam atribuídos a estes valores se não estivessem empatados. Por exemplo, suponhamos que ordenando os valores observados obtínhamos 100, 102, 102, 102, 102.5, 103, 103, 104. Neste caso, os números de ordem seriam respectivamente, 1, 3, 3, 3, 5, 6.5, 6.5, 8. 5

62 Teste de Kruskal_Wallis Quando não há empates nos valores observados das amostras, ou o nº de empates é muito pequeno, a estatística de teste é: 12 k R H= i 3(N + 1) N(N + 1) = n i 1 A hipótese nula deve ser rejeitada se o valor observado da estatística H for muito grande, i.e., superior ao ponto crítico (teste unilateral à direita). Pontos críticos: o Se k=3 e n i 5 para todo i=1,...,k, consultar tabela da distribuição exacta da estatística H, sob H 0. o Se n i 5 para todo i=1,...,k, sob H 0, H tem aproximadamente 2 distribuição ; consultar tabela desta distribuição. χ k 1 2 i 6

63 Teste de Kruskal_Wallis Quando há muitos empates nos valores observados das amostras a estatística de teste a usar deve ser: onde, 1 H'= S 2 k 2 Ri N(N + 1) i= 1 ni 4 2 Pontos críticos: S 2 1 k ni 2 N(N + 1) Rij N 1 i= 1 j= 1 4 = 2 o Se n i 5 para todo i=1,...,k, sob H 0, H tem aproximadamente 2 distribuição ; consultar tabela desta distribuição. χ k 1 7

64 Teste de Kruskal_Wallis Exemplo: Para avaliar o mérito de três métodos de ensino diferentes, cada um de 14 estudantes foi aleatoriamente matriculado em uma de três turmas. Em cada turma utilizou-se um método de ensino diferente. Após algumas aulas, pediu-se a cada estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos) constam do quadro seguinte. Método 1 Método 2 Método Será possível afirmar que os métodos de ensino produzem resultados diferentes no que diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05) 8

65 Teste de Kruskal_Wallis Ordenam-se as observações, registando o grupo (mét. ensino) a que pertencem, e determina-se o posto de cada uma: Observação Posto - R ij Grupo (mét.) R 1 = =32 R 2 = =25 R 3 = =48 9

66 Teste de Kruskal_Wallis 12 k R Não havendo empates, a estatística de teste é H= i 3(N + 1) N(N + 1) = n i 1 2 i cujo valor observado é: H obs = (14 + 1) = (14 + 1) Consultando a tabela da distribuição exacta de H, sob H 0, retira-se o ponto crítico para α=0.05: Dado que H obs =1.963<5.6429, não se rejeita a hipótese nula dos três métodos de ensino produzirem efeitos idênticos. Por outras palavras, não há evidência estatística de que o tipo de método de ensino influencie o desempenho dos estudantes na resolução de problemas. 10

67 Teste de Kruskal_Wallis Testes de Comparações múltiplas Quando rejeitamos a hipótese H 0, surge a questão de identificar onde se encontram as diferenças, i.e., quais são as amostras onde se encontram diferenças significativas. Para isso temos de comparar cada par de amostras da seguinte maneira: para cada amostra, calcula-se o posto médio postos R i pelo tamanho da amostra n i ; R i, dividindo a soma dos Determinam-se as diferenças absolutas entre cada par de postos médios R i R j, i,j=1,,k 11

68 Teste de Kruskal_Wallis Cada diferença absoluta R R é comparada com o valor crítico i j c ij 2 = χα,k 1 N(N + 1) 12 1 n i + 1 n j onde, 2 α, k 1 χ é o ponto crítico usado para o teste de Kruskal-Wallis. Se R R > i j c ij, então, considera-se significativa a diferença entre as amostras i e j, havendo, portanto, evidência de existirem diferenças entre as populações de onde se extraíram estas amostras. 12

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma

Leia mais

Capítulo 4 Inferência Estatística

Capítulo 4 Inferência Estatística Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a variância de

Leia mais

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição

Leia mais

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição

Leia mais

Testes Qui-Quadrado - Teste de Aderência

Testes Qui-Quadrado - Teste de Aderência Testes Qui-Quadrado - Teste de Aderência Consideremos uma tabela de frequências com k frequências, k 2 k: total de categorias frequências observadas: O 1,, O k seja p 1 = p 01,, p k = p 0k as probabilidades

Leia mais

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

AULA 11 Experimentos Multinomiais e Tabelas de Contingência 1 AULA 11 Experimentos Multinomiais e Tabelas de Contingência Ernesto F. L. Amaral 24 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG)

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 5 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise de dados bivariada: cruzamentos e medidas de associação variáveis nominais e ordinais e variáveis

Leia mais

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar: Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar: o tempo médio de efeito de dois analgésicos não é o mesmo; a popularidade de determinado partido político aumentou; uma

Leia mais

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira Análise estatística Aula de Bioestatística 17/9/2008 (2.ª Parte) Paulo Nogueira Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs.

Leia mais

Aula 8. Teste Binomial a uma proporção p

Aula 8. Teste Binomial a uma proporção p Aula 8. Teste Binomial a uma proporção p Métodos Estadísticos 2008 Universidade de Averio Profª Gladys Castillo Jordán Teste Binomial a uma Proporção p Seja p ˆ = X n a proporção de indivíduos com uma

Leia mais

MAE116 - Noções de Estatística

MAE116 - Noções de Estatística MAE116 - Noções de Estatística Grupo A - 1 semestre de 2015 Gabarito da Lista de exercícios 10 - Introdução à Estatística Descritiva - CASA Exercício 1. (2 pontos) Sabe-se que, historicamente, 18% dos

Leia mais

Aula 12 Teste de hipótese sobre proporções amostras grandes

Aula 12 Teste de hipótese sobre proporções amostras grandes Aula 12 Teste de hipótese sobre proporções amostras grandes Objetivos Na aula anterior, você aprendeu a construir testes de hipóteses sobre a média de uma população normal com variância σ 2 conhecida.

Leia mais

Teste de Hipótese e Intervalo de Confiança. Parte 2

Teste de Hipótese e Intervalo de Confiança. Parte 2 Teste de Hipótese e Intervalo de Confiança Parte 2 Questões para discutirmos em sala: O que é uma hipótese estatística? O que é um teste de hipótese? Quem são as hipóteses nula e alternativa? Quando devemos

Leia mais

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição

Leia mais

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança Estimação Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança Motivação A partir da média de uma a amostra em uma colheita recente, o conselho de qualidade

Leia mais

AULA 12 Inferência a Partir de Duas Amostras

AULA 12 Inferência a Partir de Duas Amostras 1 AULA 12 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 15 de setembro de 2011 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro:

Leia mais

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Introdução. Ou seja, de certo modo esperamos que haja uma certa UNIVERSIDADE FEDERAL DA PARAÍBA Teste de Independência Luiz Medeiros de Araujo Lima Filho Departamento de Estatística Introdução Um dos principais objetivos de se construir uma tabela de contingência,

Leia mais

Modelos de Probabilidade e Inferência Estatística

Modelos de Probabilidade e Inferência Estatística Modelos de Probabilidade e Inferência Estatística Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Distribuições Qui-quadrado, t-student e F de Snedecor 04/14

Leia mais

Distribuições Conjuntas (Tabelas de Contingência)

Distribuições Conjuntas (Tabelas de Contingência) Cruzamento de Dados Distribuições Conjuntas (Tabelas de Contingência) Lorí Viali, Dr. DESTAT/FAMAT/PUCRS viali@pucrs.br http://www.pucrs.br/famat/viali Distribuição Conjunta Exemplo (tabela um) Suponha

Leia mais

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade. Metodologia de Diagnóstico e Elaboração de Relatório FASHT Correlação e Plano da Apresentação Correlação linear Diagrama de dispersão Covariância Coeficiente de correlação de Pearson Teste de correlação

Leia mais

Correlação e Regressão linear simples

Correlação e Regressão linear simples Metodologia de Diagnóstico e Elaboração de Relatório FASHT Correlação e Regressão linear simples Prof. Cesaltina Pires cpires@uevora.pt Plano da Apresentação Correlação linear Diagrama de dispersão Covariância

Leia mais

Teorema do Limite Central e Intervalo de Confiança

Teorema do Limite Central e Intervalo de Confiança Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),

Leia mais

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados BIOESTATÍSTICA Parte 1 - Estatística descritiva e análise exploratória dos dados Aulas Teóricas de 17/02/2011 a 03/03/2011 1.1. População, amostra e dados estatísticos. Dados qualitativos e quantitativos

Leia mais

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior ANOVA (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior Para que serve a ANOVA? Para comparar três ou mais variáveis ou amostras. Por exemplo, queremos testar os efeitos cardiorrespiratórios

Leia mais

AULA 04 Estimativas e Tamanhos Amostrais

AULA 04 Estimativas e Tamanhos Amostrais 1 AULA 04 Estimativas e Tamanhos Amostrais Ernesto F. L. Amaral 27 de agosto de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario

Leia mais

Estatística. Slide 0. Ana M. Abreu - 2006/07

Estatística. Slide 0. Ana M. Abreu - 2006/07 Estatística Slide 0 Capítulo 1 Estatística Descritiva Slide 1 I-1 Introdução à organização e ao processamento de dados. I-2 Amostra e população; cuidados a ter na recolha da amostra. I-3 Ordenação dos

Leia mais

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA META Dimensionar o tamanho ideal de amostra para cada população.

Leia mais

ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA

ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA Apresentar a Estatística no contexto do dia-a-dia e fazendo uso da planilha Excel. Espera-se que o estudante ao término do curso esteja apto a usar a planilha

Leia mais

IND 1115 Inferência Estatística Aula 8

IND 1115 Inferência Estatística Aula 8 Conteúdo IND 5 Inferência Estatística Aula 8 Setembro 4 Mônica Barros O - aproximação da Binomial pela Este teorema é apenas um caso particular do teorema central do limite, pois uma variável aleatória

Leia mais

Estatística - exestatmedposic.doc 25/02/09

Estatística - exestatmedposic.doc 25/02/09 Medidas de Posição Introdução Vimos anteriormente que, através de uma distribuição de freqüências se estabelece um sistema de classificação que descreve o padrão de variação de um determinado fenômeno

Leia mais

cuja distribuição é t de Student com n 1 graus de liberdade.

cuja distribuição é t de Student com n 1 graus de liberdade. Aula 13 Teste de hipótese sobre a média de uma população normal σ 2 desconhecida Objetivos: Nesta aula você completará seu estudo básico sobre testes de hipóteses, analisando a situação relativa a uma

Leia mais

Aula 8 Intervalos de confiança para proporções amostras grandes

Aula 8 Intervalos de confiança para proporções amostras grandes Aula 8 Intervalos de confiança para proporções amostras grandes Objetivos Na aula anterior, foram apresentadas as idéias básicas da estimação por intervalos de confiança. Para ilustrar o princípio utilizado

Leia mais

Regressão linear múltipla. Prof. Tatiele Lacerda

Regressão linear múltipla. Prof. Tatiele Lacerda Regressão linear múltipla Prof Tatiele Lacerda Yi = B + Bx + B3X3 + u Plano de resposta E(Y i ) = 0,00 Y i i 0 (,33;,67) Y i 0 X i Xi X p i, p i 3 Modelo de regressão linear múltipla em termos matriciais,

Leia mais

Análise de Regressão Linear Simples III

Análise de Regressão Linear Simples III Análise de Regressão Linear Simples III Aula 03 Gujarati e Porter Capítulos 4 e 5 Wooldridge Seção.5 Suposições, Propriedades e Teste t Suposições e Propriedades RLS.1 O modelo de regressão é linear nos

Leia mais

Inferência sobre duas proporções

Inferência sobre duas proporções Teste para duas populações duas populações Amostra :,,,, alor comum para delta 0 Amostra 2:,,,, Tamanho Tamanho Média amostral x Média amostral x Desvio-padrão Desvio-padrão Teste para duas populações

Leia mais

Análise de Regressão. Notas de Aula

Análise de Regressão. Notas de Aula Análise de Regressão Notas de Aula 2 Modelos de Regressão Modelos de regressão são modelos matemáticos que relacionam o comportamento de uma variável Y com outra X. Quando a função f que relaciona duas

Leia mais

ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010. Curso: 12/06/2010.

ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010. Curso: 12/06/2010. ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010 Curso: 12/06/2010 Nome: N o Instruções: Estaprovatemaduraçãode120 minutos e é constituída

Leia mais

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência Tipos de Variáveis Problema Motivador: Um pesquisador está interessado em fazer um levantamento sobre aspectos sócio-econômicos dos empregados da seção de orçamentos de uma companhia (vide tabela). Algumas

Leia mais

Regressão Linear Múltipla

Regressão Linear Múltipla UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EATAS E NATURAIS FACULDADE DE ESTATÍSTICA DISCIPLINA: Estatística Aplicada PROFESSORES: Heliton Tavares e Regina Madruga ALUNO: Wemenson avier Trabalho

Leia mais

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança Hipótese estatística Unidade 5. Teste de Hipóteses (uma população) Hipótese estatística-qualquer afirmação feita sobre um parâmetro populacional desconhecido. Hipótese: Duração média da bateria (µ) > 300

Leia mais

Matemática Aplicada às Ciências Sociais

Matemática Aplicada às Ciências Sociais ESCOLA SECUNDÁRIA DE AMORA PLANIFICAÇÃO ANUAL Matemática Aplicada às Ciências Sociais Ensino Regular Curso Geral de Ciências Sociais e Humanas 11º ANO Ano Letivo 2014 / 2015 PLANIFICAÇÃO A LONGO PRAZO

Leia mais

Desvio Padrão ou Erro Padrão

Desvio Padrão ou Erro Padrão NOTAS METODOLÓGICAS ISSN 0871-3413 ArquiMed, 2006 Desvio Padrão ou Erro Padrão Nuno Lunet, Milton Severo, Henrique Barros Serviço de Higiene e Epidemiologia da Faculdade de Medicina da Universidade do

Leia mais

Teste de hipóteses para médias e proporções amostrais

Teste de hipóteses para médias e proporções amostrais Teste de hipóteses para médias e proporções amostrais Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais Intervalo de confiança: outro entendimento É o intervalo que contém o parâmetro que queremos

Leia mais

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão Capítulo 5 Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão Hipóteses do Modelo de Regressão Linear Simples RS1. y x e t 1 t t RS. RS3. RS4. RS5. RS6. Ee

Leia mais

1 Introdução. 1.1 Importância da Utilização da Amostragem

1 Introdução. 1.1 Importância da Utilização da Amostragem 1 Introdução Um dos principais objetivos da maioria dos estudos, análises ou pesquisas estatísticas é fazer generalizações seguras com base em amostras, sobre as populações das quais as amostras foram

Leia mais

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem. 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem. Determine a média aritmética da distribuição: A mediana não é tão sensível, como a média, às observações que são muito

Leia mais

AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA. MATEMÁTICA B Curso de Artes Visuais

AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA. MATEMÁTICA B Curso de Artes Visuais Direção-Geral dos Estabelecimentos Escolares Direção de Serviços da Região Centro AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA MATEMÁTICA B Curso de Artes Visuais ANO LECTIVO: 2015/2016 11º ANO 1º PERÍODO PLANIFICAÇÃO

Leia mais

População e Amostra POPULAÇÃO AMOSTRA AMOSTRAGEM TIPOS DE AMOSTRAGEM I. Amostra probabilística: II. Amostra não-probabilística

População e Amostra POPULAÇÃO AMOSTRA AMOSTRAGEM TIPOS DE AMOSTRAGEM I. Amostra probabilística: II. Amostra não-probabilística População e Amostra POPULAÇÃO A palavra população, na sua acepção mais comum, representa o conjunto de habitantes de uma dada região em determinado período. Em estatística, população (ou universo) é o

Leia mais

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS) DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS) O QUE É ESTATÍSTICA Estatística é a ciência de obter conclusões a partir de dados. Envolve métodos para

Leia mais

Probabilidade e Estatística, 2009/2

Probabilidade e Estatística, 2009/2 Probabilidade e Estatística, 2009/2 CCT - UDESC Prof. Fernando Deeke Sasse Problemas Resolvidos - Testes de Hipóteses 1. Uma empresa de manufatura têxtil está testando rolos de fio que o fornecedor afirma

Leia mais

EXAME DE MACS 2º FASE 2014/2015 = 193

EXAME DE MACS 2º FASE 2014/2015 = 193 EXAME DE MACS 2º FASE 2014/2015 1. Divisor Padrão: 00+560+80+240 200 = 190 = 19 200 20 Filiais A B C D Quota Padrão 1,088 58,01 86,010 24,870 L 1 58 86 24 L(L + 1) 1,496 58,498 86,499 24,495 Quota Padrão

Leia mais

Testes de variância e Análise de Variância (ANOVA)

Testes de variância e Análise de Variância (ANOVA) Testes de variância e Análise de Variância (ANOVA) Introdução à Inferência Estatística Introdução à Inferência Estatística TESTE DE VARIÂNCIAS E DISTRIBUIÇÃO F Testes sobre variâncias Problema: queremos

Leia mais

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média. Desvio Padrão From Wikipedia, the free encyclopedia probabilidade e estatística, o desvio padrão de uma distribuição de probabilidade, de uma variável aleatória, ou população é uma medida do espalhamento

Leia mais

Stela Adami Vayego DEST/UFPR

Stela Adami Vayego DEST/UFPR Resumo 5 - Análise Bivariada (Bidimensional) 5.1. Introdução O principal objetivo das análises nessa situação é explorar relações (similaridades) entre duas variáveis. A distribuição conjunta das freqüências

Leia mais

Lição 5 Medidas Descritivas Medidas de Dispersão

Lição 5 Medidas Descritivas Medidas de Dispersão 99 Lição 5 Medidas Descritivas Medidas de Dispersão Após concluir o estudo desta lição, esperamos que você possa: identifi car o objetivo das medidas de dispersão; identifi car o conceito de variância;

Leia mais

ANÁLISE EXPLORATÓRIA DE DADOS

ANÁLISE EXPLORATÓRIA DE DADOS ANÁLISE EXPLORATÓRIA DE DADOS 1.0 Conceitos A estatística descritiva tem o objetivo de organizar, resumir e apresentar de forma adequada os dados, para que estes se tornem informativos. A análise exploratória

Leia mais

Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida

Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida Objetivo: Nesta aula, iremos aplicar os conceitos básicos sobre a teoria de teste de hipótese a uma situação específica.

Leia mais

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana Medidas de Tendência Central Introdução Média Aritmética Moda Mediana Introdução A maioria dos dados apresenta uma tendência de se concentrar em torno de um ponto central Portanto, é possível selecionar

Leia mais

Medidas de dispersão e assimetria

Medidas de dispersão e assimetria Metodologia de Diagnóstico e Elaboração de Relatório FASHT Medidas de dispersão e assimetria Profª Cesaltina Pires cpires@uevora.pt Plano da Apresentação Medidas de dispersão Variância Desvio padrão Erro

Leia mais

Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos

Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos Contexto Já vimos como analisar um experimento em blocos na presença de um único fator de interesse. Podemos ter experimentos

Leia mais

Aula 1 Variáveis aleatórias contínuas

Aula 1 Variáveis aleatórias contínuas Aula 1 Variáveis aleatórias contínuas Objetivos: Nesta aula iremos estudar as variáveis aleatórias contínuas e você aprenderá os seguintes conceitos: função de densidade de probabilidade; função de distribuição

Leia mais

UNIDADE 6 TESTES DE HIPÓTESES OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

UNIDADE 6 TESTES DE HIPÓTESES OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Unidade 6 Testes de Hipóteses UNIDADE 6 TESTES DE HIPÓTESES OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Ao finalizar esta Unidade, você deverá ser capaz de: Escolher o teste de hipótese adequado; Formular um

Leia mais

Modelo Uniforme. como eu e meu colega temos 5 bilhetes, temos a mesma probabilidade de ganhar a rifa:

Modelo Uniforme. como eu e meu colega temos 5 bilhetes, temos a mesma probabilidade de ganhar a rifa: Modelo Uniforme Exemplo: Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de 21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93. Quem

Leia mais

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos Coeficiente de Assimetria e Curtose Rinaldo Artes 2014 Padronização Seja X uma variável aleatória com E(X)=µ e Var(X)=σ 2. Então a variável aleatória Z, definida como =, tem as seguintes propriedades:

Leia mais

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período 2014.1

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período 2014.1 Probabilidade III Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2014.1 Ulisses Umbelino (DE-UFPB) Probabilidade III Período 2014.1 1 / 42 Sumário 1 Apresentação

Leia mais

1. Estatística Descritiva

1. Estatística Descritiva Introdução à Estatística Estatística Descritiva 1 1. Estatística Descritiva Suponhamos que dispomos de um conjunto de dados (sem nos preocuparmos como foram obtidos) e pretendemos desenvolver processos

Leia mais

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná 1º Sorteio Eletrônico da Nota Fiscal Paraná Relatório parcial contendo resultados 1 da análise estatística dos bilhetes premiados Conteúdo 1 Introdução Este relatório apresenta uma análise estatística

Leia mais

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná Quinto Sorteio Eletrônico da Nota Fiscal Paraná Relatório parcial contendo resultados 1 da análise estatística dos bilhetes premiados Conteúdo 1 Introdução Este documento apresenta a análise dos resultados

Leia mais

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média. UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Tarciana Liberal As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar

Leia mais

Avaliação e Desempenho Aula 1 - Simulação

Avaliação e Desempenho Aula 1 - Simulação Avaliação e Desempenho Aula 1 - Simulação Introdução à simulação Geração de números aleatórios Lei dos grandes números Geração de variáveis aleatórias O Ciclo de Modelagem Sistema real Criação do Modelo

Leia mais

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação Parte XIV Técnicas estatísticas para análise de dados e de resultados de modelos de simulação A saída de um modelo de simulação geralmente constitui-se de VA s, muitas das quais podem ter variância grande.

Leia mais

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292 Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292 Título PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA Código da disciplina SIA CCE0292 16 Número de semanas de aula 4 Número

Leia mais

Os dados quantitativos também podem ser de natureza discreta ou contínua.

Os dados quantitativos também podem ser de natureza discreta ou contínua. Natureza dos Dados Às informações obtidas acerca das características de um conjunto dá-se o nome de dado estatístico. Os dados estatísticos podem ser de dois tipos: qualitativos ou quantitativos. Dado

Leia mais

Química Analítica IV ERRO E TRATAMENTO DE DADOS ANALÍTICOS

Química Analítica IV ERRO E TRATAMENTO DE DADOS ANALÍTICOS Química Analítica IV 1 semestre 2012 Profa. Maria Auxiliadora Costa Matos ERRO E TRATAMENTO DE DADOS ANALÍTICOS Todas as medidas físicas possuem um certo grau de incerteza. Quando se faz uma medida, procura-se

Leia mais

IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla

IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla Significância Estatística Existe uma estatítica, o t-estatístico,associado a cada estimativa O t-estatístico mede

Leia mais

Modelos de Probabilidade e Inferência Estatística

Modelos de Probabilidade e Inferência Estatística Modelos de Probabilidade e Inferência Estatística Ronei Marcos de Moraes Análise de Variância e Estatística Nãoparamétrica UFPB Maio/2011 ANOVA - Análise de Variância O caso da comparação de várias médias

Leia mais

2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.

2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média. 1) Inicializar um vetor de inteiros com números de 0 a 99 2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média 3)

Leia mais

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.) I. INTRODUÇÃO Quando se faz um experimento, deseja-se comparar o resultado obtido

Leia mais

(1, 6) é também uma solução da equação, pois 3 1 + 2 6 = 15, isto é, 15 = 15. ( 23,

(1, 6) é também uma solução da equação, pois 3 1 + 2 6 = 15, isto é, 15 = 15. ( 23, Sistemas de equações lineares generalidades e notação matricial Definição Designa-se por equação linear sobre R a uma expressão do tipo com a 1, a 2,... a n, b R. a 1 x 1 + a 2 x 2 +... + a n x n = b (1)

Leia mais

Amostragem: Desenho e Procedimentos

Amostragem: Desenho e Procedimentos Amostragem: Desenho e Procedimentos 1-1 Sumário do Capítulo 1) Amostragem ou censos 2) Desenho de um processo de amostragem i. Definir população alvo ii. Determinar o quadro de amostragem iii. Escolha

Leia mais

Estatística Não Paramétrica

Estatística Não Paramétrica Estatística Não Paramétrica com uso de softwares Angelo Cabral UFPR 16 de novembro de 2015 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 1 / 53 Sumário 1 Softwares Utilizados

Leia mais

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise CAPÍTULO 8 Análise de Variância - UFRGS Os testes de hipótese apresentados até aqui limitaram-se à comparação de duas médias ou duas variâncias. Contudo, há situações onde se deseja comparar várias médias,

Leia mais

Medidas de Localização

Medidas de Localização MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS RESUMO Estatística 2 Medidas de Localização e Dispersão 10º ano Cláudia Henriques Medidas de Localização Estatísticas Medidas que se calculam a partir dos dados

Leia mais

3 Modelos de Simulação

3 Modelos de Simulação 43 3 Modelos de Simulação 3.1 Simulação de Monte Carlo O método de Monte Carlo foi concebido com este nome nos anos 40 por John Von Neumann, Stanislaw Ulam e Nicholas Metropolis durante o projeto de pesquisa

Leia mais

Probabilidade e Estatística, 2011/2

Probabilidade e Estatística, 2011/2 média verdadeira de 104F? Estabeleçamos a média 100F como um limite não tolerado:, Probabilidade e Estatística, 2011/2 CCT - UDESC Prof. Fernando Deeke Sasse Testes de Hipóteses Problemas Resolvidos em

Leia mais

Processos Estocásticos

Processos Estocásticos Processos Estocásticos Hélio Lopes INF2035 - Introdução à Simulação Estocástica 1 Introdução Um processo estocástico é uma família de variáveis aleatórias {X(t), t T } definidas em um espaço de probabilidade,

Leia mais

Contabilometria. Análise Discriminante

Contabilometria. Análise Discriminante Contabilometria Análise Discriminante Fonte: Corrar, L. J.; Theóphilo, C. R. Pesquisa Operacional para Decisão em Contabilidade e Administração, Editora Atlas, São Paulo, 010 Cap. 3 Análise Discriminante

Leia mais

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Testes dos sinais e de Wilcoxon Teste de Mann-Whitney Teste

Leia mais

Testes de Ajustamento (testes da bondade do ajustamento)

Testes de Ajustamento (testes da bondade do ajustamento) Testes de Ajustamento (testes da bondade do ajustamento) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição

Leia mais

25 a 30 de novembro de 2013

25 a 30 de novembro de 2013 LSD Introdução à Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 25 a 30 de novembro de 2013 LSD 1 2 3 LSD 4 Parte 2 - Conteúdo LSD Quando o F da ANOVA está sendo utilizado

Leia mais

Aula 6 Medidas de Tendência Central

Aula 6 Medidas de Tendência Central 1 Estatística e Probabilidade Aula 6 Medidas de Tendência Central Professor Luciano Nóbrega Somatório Quando queremos representar uma soma de valores que obedecem à uma sequência, podemos codificá-la através

Leia mais

Unidade 5 5.1 Medidas de Posição ou de Tendência Central

Unidade 5 5.1 Medidas de Posição ou de Tendência Central Unidade 5 5.1 Medidas de Posição ou de Tendência Central 1- Introdução Se estivermos numa parada de ônibus urbano e nos pedirem alguma informação sobre a demora em passar um determinado ônibus, que diremos?

Leia mais

Diplomados com o Ensino Superior

Diplomados com o Ensino Superior Ensino dos 30 aos 34 anos - dados e projeções Julho de 2016 Direção-Geral de Estatísticas da Educação e Ciência Ensino Julho de 2016 Ensino dos 30 aos 34 anos - dados e projeções Esta nota técnica visa

Leia mais

Medidas e Escalas: Escalas não Comparativas

Medidas e Escalas: Escalas não Comparativas Medidas e Escalas: Escalas não Comparativas 1-1 Sumário do Capítulo 1) Escalas não comparativas 2) Escalas de rácios contínuos 3) Escalas de Itens i. Escala de Likert ii. iii. Escala de Diferencial semântico

Leia mais

Aula 6 Propagação de erros

Aula 6 Propagação de erros Aula 6 Propagação de erros Conteúdo da aula: Como estimar incertezas de uma medida indireta Como realizar propagação de erros? Exemplo: medimos A e B e suas incertezas. Com calcular a incerteza de C, se

Leia mais

Probabilidade. Distribuição Binomial

Probabilidade. Distribuição Binomial Probabilidade Distribuição Binomial Distribuição Binomial (Eperimentos de Bernoulli) Considere as seguintes eperimentos/situações práticas: Conformidade de itens saindo da linha de produção Tiros na mosca

Leia mais

índice Introdução Estatística Descritiva Capítulo 1 Capítulo 2 O que é a Estatística Escalas de medida Escalas Nominais Escalas Ordinais

índice Introdução Estatística Descritiva Capítulo 1 Capítulo 2 O que é a Estatística Escalas de medida Escalas Nominais Escalas Ordinais índice MENSAGEM DO AUTOR 11 AGRADECIMENTOS 13 Capítulo 1 Introdução Importância da estatística 17 O que é a Estatística? Escalas de medida Escala de medida qualitativa Escalas Nominais Escalas Ordinais

Leia mais

Para mais de duas variáveis independentes, em função de uma variável dependente.

Para mais de duas variáveis independentes, em função de uma variável dependente. MÉTODOS QUANTlTATlVOS APLlCADOS À CONTABlLlDADE Prof. Héber Lavor Moreira Plano de Aula TEMA: REGRESSÃO MÚLTlPLA - Caso Multiplan S/A lntrodução Em muitos casos uma variável pode estar relacionada com

Leia mais

Teste 1. (a) 0.33 (b) 0.50 (c) 0.30 (d) 0.20

Teste 1. (a) 0.33 (b) 0.50 (c) 0.30 (d) 0.20 Teste 1 1. Das 4 afirmações seguintes qual a que é falsa? a) O primeiro quartil é o valor da observação tal que existem 25% de observações menores o iguais a ela; b) A mediana é sempre igual ao percentil

Leia mais