Testes Não Paramétricos
|
|
- Bárbara Silva de Andrade
- 7 Há anos
- Visualizações:
Transcrição
1 Testes Não Paramétricos Nos testes abordados até agora, ditos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar ou de rácios, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação,...), etc. 1
2 Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a distribuição populacional em estudo pode ser considerada Normal). Estes são chamados testes não paramétricos. Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver certas suposições básicas associadas à maioria das provas não paramétricas, essas suposições são em menor número e mais fracas do que as associadas às provas paramétricas. A maior parte das provas não paramétricas servem para pequenas amostras e, além disso, aplicam-se a dados medidos em escala ordinal, e alguns mesmo a dados em escala nominal. 2
3 Testes de Ajustamento Testes de Ajustamento (testes da bondade do ajustamento) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição especificada. Hipóteses a testar: H 0 : a amostra provém de uma população com distribuição especificada H 1 : a população de onde provém a amostra não segue a distrib. especificada 3
4 Testes de Ajustamento Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa. Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0.1 e desvio padrão 7.2. Uma amostra de 30 navios revelou os resultados que se apresentam na tabela seguinte Diferença entre a data de chegada e a data planeada para 30 navios. Será mesmo de admitir que tais dados foram extraídos de uma pop. N(0.1, 7.2)? 4
5 Testes de Ajustamento Neste exemplo, estamos perante um problema de ajustamento de dados a uma determinada distribuição. Existem vários testes de ajustamento que nos permitem fazer uma análise de problemas deste tipo, entre os quais: o Teste de Ajustamento do Qui-quadrado sugerido por Karl Pearson, o teste de Kolmogorov ou Kolmogorov-Smirnov e o teste de normalidade de Lilliefors, que apresentamos a seguir. 5
6 Testes de Ajustamento Teste do Qui-quadrado Considere-se uma amostra aleatória de n elementos, extraída de uma população com distribuição desconhecida, sobre os quais se observa uma característica (qualitativa ou quantitativa). Os valores possíveis da característica em estudo são, num primeiro passo, repartidas por m classes mutuamente exclusivas, A 1, A 2,..., A m (serão intervalos da recta real se a característica é quantitativa e contínua). 6
7 Testes de Ajustamento Denote-se por: - O i o nº de observações ou frequência absoluta observada da classe A i ; - p i a probabilidade desconhecida de obter uma observação na classe A i ; - p 0i a probabilidade de obter uma observação na classe A i, assumindo que a observação foi extraída de uma população com a distribuição especificada em H 0. Hipóteses a testar: H 0 : p i =p 0i, i=1,...,m H 1 : p i p 0i para algum i 7
8 Testes de Ajustamento Assim, a frequência esperada da classe A i, quando H 0 é verdadeira, é dada por e i = n p 0i. A estatística de teste, do teste de ajustamento do Qui-quadrado, é dada por Q ( Oi ei ) = m i= 1 e i 2 que, sendo verdadeira a hipótese nula, tem distribuição assimptótica do Quiquadrado com m-k-1 graus de liberdade (χ 2 m-k-1), onde k é o número de parâmetros desconhecidos da distribuição proposta em H 0, estimados a partir da amostra. 8
9 Testes de Ajustamento Se a hipótese nula for verdadeira, a diferença entre cada valor observado e o respectivo valor esperado, O i e i, não deve ser muito grande e, consequentemente, a estatística de teste terá um valor observado, Q obs, também não muito grande. De modo intuitivo, quanto maior for o valor observado de Q, menos plausível é a hipótese nula, isto é, mais nos encaminhamos de concluir que as frequências observadas não foram provenientes da população em que se baseou a hipótese nula, levando à rejeição desta. Trata-se portanto de um teste unilateral à direita. 9
10 Testes de Ajustamento Na aplicação deste teste deve-se ter particular atenção às frequências esperadas, e i s, pois se estas forem muito pequenas a aproximação ao Qui-quadrado não é a mais apropriada. São referidas na literatura várias regras práticas de aplicação do teste, das quais avançamos a seguinte. Se tivermos: ou, - mais de 20% das classes com e i inferior a 5 - alguma classe com e i inferior a 1 devemos proceder à agregação de algumas classes contíguas, e iniciar novamente o teste, agora com menos classes. 10
11 Testes de Ajustamento Retomemos o exemplo exposto atrás. Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a data planeada, as hipóteses a testar são H 0 : X ~ N(0.1, ) H 1 : X ~/ N(0.1, ) Neste caso a distribuição proposta em H 0 é contínua e, deste modo, as classes A i, i=1,...m, são intervalos da forma A 1 =]-, a 1 [, A 2 =[ a 1, a 2 [ A 3 =[ a 2, a 3 [... A m =[ a m-1, + [. 11
12 Testes de Ajustamento Para a determinação das classes é sugerida a regra de Mann e Wald: Número de classes = m, com m tal que n/m>5. Os limites dos intervalos são tais que as probabilidades decorrentes da hipótese nula sejam iguais a 1/m para todas as classes. Assim, as frequências esperadas são todas iguais a n/m>5. Para o exemplo escolheu-se m=4 classes (e i =30/4=7.5>5), donde p 0i = P(A i \H 0 ) = 1/4, para i=1,2,3,4. 12
13 Testes de Ajustamento Cálculo dos limites dos intervalos de classe: a 3 : p 03 = 0.25 a 3 =4.96 (EXCEL: INV.NORM(0.75;0.1;7.2)); 1/4 1/4 1/4 1/4 Da simetria da distribuição normal: a 1 a 2 =0.1 a 3 a 2 =0.1 e a 1 =0.1-( )= (EXCEL: INV.NORM(0.25;0.1;7.2)) 13
14 Testes de Ajustamento Classes Frequências observadas p 0i Frequências esperadas A 1 =]-, -4.76[ A 2 =[-4.76,0.1[ A 3 =[0.1, 4.96[ A 4 =[4.96, + [ O valor observado da estatística de teste é Q obs = (8 7.5) (8 7.5) ( ) ( ) =
15 Testes de Ajustamento A estatística teste, sob o pressuposto de H 0 ser verdadeira, tem aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade. Para α=0.05: R.C.=[7.81, + [. (EXCEL: 7.81=INV.CHI(0,05;3)) Como Q obs R.C., somos levados a não rejeitar a hipótese de que a diferença entre os tempos de chegada e os tempos planeados tem distribuição N(0.1, ). 15
16 Testes de Ajustamento Teste de Kolmogorov-Smirnov (K-S) O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado, não se aplica a dados qualitativos nem a variáveis discretas, pois a tabela disponível para este teste só é exacta caso a distribuição em teste seja contínua. No entanto, tem a vantagem de não estar dependente de classificações dos dados, que além de serem sempre algo arbitrárias envolvem perdas de informação. De facto, no ajustamento de uma distribuição contínua a uma amostra usando o teste do Qui-quadrado, temos de proceder à agregação dos dados em classes, sendo por isso mais adequado utilizar o teste K-S. 16
17 Testes de Ajustamento Por outro lado, o teste K-S só pode ser aplicado quando a distribuição indicada na hipótese nula está completamente especificada (o que não sucede com o teste do Qui-quadrado). No caso de pretendermos, por exemplo, efectuar um ajustamento de uma distribuição normal, sem especificar µ e σ, podemos recorrer a outro teste, neste caso o teste desenvolvido por Lilliefors (teste de normalidade de Lilliefors) que será abordado mais tarde. Além disso, o teste do Qui-Quadrado está orientado essencialmente para grandes amostras, enquanto que o teste K-S é aplicável a pequenas amostras. 17
18 Testes de Ajustamento Seja F a função de distribuição da população em estudo e F 0 a função de distribuição proposta, contínua e completamente especificada. Hipóteses a testar: H 0 : F(x)=F 0 (x), para qualquer x H 1 : F(x) F 0 (x), para algum x No teste de Kolmogorov-Smirnov comparam-se as frequências relativas acumuladas registadas na amostra com as que se esperariam se a distribuição populacional fosse a especificada na hipótese nula. 18
19 Testes de Ajustamento A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar um valor inferior ou igual a x se a distribuição populacional for a especificada em H 0, F 0 (x): D n = sup S ( x ) F 0( x ) < x<+ F 0 (x) S (x) 19
20 Testes de Ajustamento Uma vez que F 0 é uma função (contínua) não decrescente e S é uma função em escada, o supremo ocorre num ponto onde se verifica um salto de S : { F ( x ) S( x ), F ( x ) S( x ) } D. n, obs = i i= 1,..., n max 0 i i 0 i 1 Assim, se H 0 for verdadeira, a distância vertical máxima entre as imagens das duas distribuições não deve de ser muito grande, e logo espera-se que D n,obs tome um valor pequeno. Então, para um nível de significância α, rejeita-se H 0, se o valor observado for superior ou igual ao ponto crítico D n,α (os valores críticos D n,α podem ser consultados numa tabela). 20
21 Testes de Ajustamento Exemplo: Acredita-se que o tempo despendido na execução de uma determinada tarefa é uma variável aleatória com distribuição normal de média 290 minutos e desvio padrão 56 minutos. Foram registados os tempos despendidos em 10 tarefas seleccionadas ao acaso, tendo-se registado o seguinte: Ao nível de significância de 5%, há evidência para rejeitar a hipótese de normalidade da referida variável? 21
22 Testes de Ajustamento Denote-se por X o tempo despendido na execução de uma tarefa. As hipóteses a testar são, neste caso, H 0 : X N(290, 56 2 ) H 1 : X ~/ N(290, 56 2 ). O ponto crítico da estatística de teste D 10 é, para α=0.05, D 10,0.05 = (consulte a tabela). Para calcular o valor observado da estatística de teste, começa-se por ordenar os valores da amostra por ordem crescente. Os cálculos estão efectuados na tabela seguinte. 22
23 Testes de Ajustamento EXCEL: DIST.NORM(198;290;56;VERDADEIRO) x i S(x i ) S(x i-1 ) F 0 (x i ) F 0 (x i )- S(x i ) F 0 (x i )- S(x i-1 ) 198 0,1 0 0,0502 0,05 0, ,2 0,1 0,2602 0,06 0, ,3 0,2 0,3085 0,009 0, ,4 0,3 0,3739 0,026 0, ,5 0,4 0,3944 0,106 0, ,6 0,5 0,4152 0,185 0, ,7 0,6 0,4644 0,236 0, ,9 0,7 0,4786 0,421 0, ,9 0,5142 0,486 0,3858 Como D 10,obs =0.486>0.409, ao nível de significância de 5%, rejeitamos a hipótese de o tempo despendido na execução de uma tarefa seguir distribuição N(290, 56 2 ). 23
24 Testes de Ajustamento Teste de Normalidade Lilliefors Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ, σ 2 ) sem especificar µ e σ, isto é, para algum µ e algum σ. Hipóteses a testar H 0 : X ~ N(µ, σ 2 ) H 1 : X ~/ N(µ, σ 2 ) Este teste processa-se como o teste de K-S, usando estimativas de µ e σ, respectivamente, x e s. Os pontos críticos são consultados na tabela elaborada por Lilliefors. 24
25 Testes de Ajustamento Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos seus produtos a um cliente bastante importante. Foi recolhida uma amostra aleatória de cinco tempos: 29, 33, 35, 36 e 36. O senhor quer estimar o tempo médio pretendido através de um intervalo de confiança, mas nada sabe acerca da distribuição do tempo de entrega X, e além disso, a dimensão da amostra é muito pequena (n=5). Poderá fazê-lo? Sabemos que caso a distribuição subjacente aos dados seja normal, o intervalo pode ser calculado usando a fórmula: S X m t, onde t: P(-t<T<t) =λ, T ~ t n-1 n 25
26 Testes de Ajustamento Assim, interessa testar, em primeiro lugar, as hipóteses H 0 : X ~ N(µ, σ 2 ) H 1 : X ~/ N(µ, σ 2 ) Uma vez que nada sabemos acerca de µ e σ, podemos utilizar o teste de Lilliefors, recorrendo às estimativas x =33.8 s=2.95. D O valor crítico da estatística teste, ao nível de significância de 0.05 é * 5,0.05 =0.337 (consulte a tabela). 26
27 Testes de Ajustamento EXCEL: DIST.NORM(29;33.8;2.95;VERDADEIRO) Cálculo do valor observado da estatística de Teste: x i S(x i ) S(x i-1 ) F 0 (x i ) F 0 (x i )- S(x i ) F 0 (x i )- S(x i-1 ) 29 0,2 0 0,0519 0,1481 0, ,4 0,2 0,3931 0,0069 0, ,6 0,4 0,6579 0,0579 0, ,6 0,772 0,2279 0,1721 Como D * 5, obs =0.2579<0.337, então, ao nível se significância de 5%, não rejeitamos a hipótese de a população em estudo ter distribuição normal. 27
28 Tabelas de Contingência Tabelas de Contingência Teste do Qui-quadrado de Independência Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma com r e outra com s modalidades ou categorias, respectivamente A 1, A 2,..., A r e B 1, B 2,..., B s. 28
29 Tabelas de Contingência Cada indivíduo da amostra é classificado numa e numa só categoria (ou classe) de A e numa e numa só categoria (ou classe) de B. A classificação dos elementos da amostra dá origem a uma tabela de dupla entrada, designada por tabela de contingência r s, com o seguinte aspecto: B 1 B 2... B s A 1 O 11 O O 1s A 2 O 21 O O 2s M M M O M A r O r1 O r2... O rs O ij (i=1,...,r e j=1,...,s) número de elementos classificados simultaneamente nas categorias A i de A e B j de B, numa amostra de tamanho n. 29
30 Tabelas de Contingência Sejam: O i = s j= 1 O (i=1,...,r) nº de elementos na amostra com modalidade A i ; ij O j = r i= 1 O (j=1,...,s) nº de elementos na amostra com modalidade B j. ij Tem-se, n = r s i= 1j= 1 O ij = r i= 1 O = s i j= 1 O j onde n é a dimensão da amostra. 30
31 Tabelas de Contingência O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não de qualquer relação ou associação entre os atributos (variáveis) A e B, mais concretamente, inferir se A e B são ou não independentes. Hipóteses a testar: H 0 : A e B são independentes H 1 : A e B não são independentes 31
32 Tabelas de Contingência Denote-se por: p ij =P(A i B j ) (i=1,..,r e j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado simultaneamente nas categorias A i de A e B j de B; p i =P(A i) (i=1,...,r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria A i de A; p j =P(B j ) (j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria B j de B. r s i= 1j= 1 i= 1 1 = p = p = p. ij r s i j= 1 j 32
33 Tabelas de Contingência Ora, se os atributos são independentes, verifica-se a conhecida relação, isto é, P(A i B j ) = P(A i ) P(B j ), p ij = p i p j Assim, as hipóteses anteriores podem ser formuladas do seguinte modo: H 0 : p ij = p i p j (para todo i e j) H 1 : p ij p i p j (para algum i j). 33
34 Tabelas de Contingência Os verdadeiros valores das probabilidades p i e p j são estimadas, a partir dos dados amostrais, por O pˆ i i = e n O j pˆ j =, n Notação: e ij =n p ij número esperado de indivíduos na classe A i de A e B j de B. Quando H 0 é verdadeira, i.e, p ij = p i p j, temos e ij =n p ij =n p i p j estimado por ê ij = n pˆ pˆ = i j O O i n j 34
35 Tabelas de Contingência A estatística do teste de independência é então: χ 2 = r s i= 1j= 1 (O ij ê ê ij ij ) 2, que, sob o pressuposto de H 0 ser verdadeira, tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1) graus de liberdade. Vimos que quando H 0 é verdadeira e ij pode ser estimado por ê ij = n pˆ pˆ. i j Logo, a diferença entre O ij (frequência observada) e ê ij (estimativa da frequência esperada supondo a independência) não deve ser grande. Assim, a estatística teste, mede o afastamento dos dados em relação à hipótese de independência. Trata-se então de um teste unilateral à direita. 35
36 Tabelas de Contingência Exemplo: Um supermercado quer testar ao nível de significância de 5% a hipótese de que o modo de pagamento dos clientes nesse estabelecimento é independente do período do dia em que fazem as compras. Existem três modos de efectuar os pagamentos: por cheque, dinheiro e cartão de débito/crédito. A seguinte tabela de contingência 3 3 apresenta os resultados obtidos numa amostra de 4000 clientes: PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Cheque Dinheiro Cartão de débito/crédito
37 Tabelas de Contingência Denotando por A o atributo Modo de pagamento e por B o atributo Período do dia em que faz as compras, as hipóteses as testar são H 0 : A e B são independentes H 1 : A e B não são independentes Uma vez que A e B assumem cada uma 3 modalidades, sob H 0, a estatística teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4 graus de liberdade. Ao nível de significância de 0.05, a região crítica é então [9.49, + [ (consulte tabela ou faça no EXCEL: INV.CHI(0,05;4)). 37
38 Tabelas de Contingência PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais Cheque Dinheiro Cartão de Crédito Totais Cálculo das frequências esperadas: ê ij O = n pˆ i pˆ j=n i n ê 11 =( )/4000=750 ê 12=( )/4000=1500 ê 13 =( )/4000=750. M O j Oi = n no j 38
39 Tabelas de Contingência Frequências esperadas PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais Cheque Dinheiro Cartão de Crédito Totais Valor observado da estatística teste: χ 2 obs = ( ) ( ) ( ) ( ) =60. Uma vez que 60 excede o valor crítico 9.49, ao nível de significância de 0.05, rejeitamos a hipótese de que o modo de pagamento é independente do período do dia em que as compras são feitas. 39
40 Tabelas de Contingência Medidas de Associação No teste do Qui-Quadrado apresentado, se for rejeitada a hipótese de independência entre os atributos, pode interessar medir a intensidade da associação entre os mesmos, através de uma medida adequada. Uma vez que a estatística do teste mede o afastamento em relação à hipótese de independência, o seu valor observado poderá ser usado para avaliar o grau de associação entre os atributos. 40
41 Tabelas de Contingência Coeficiente de Contingência de Pearson: C = χ χ n Este coeficiente varia entre 0 e ( q 1) q onde q=min{r,s} e portanto nunca assume o valor 1. Valores pequenos de C indicam fraca associação entre os atributos, enquanto que valores grandes de C indicam forte associação. O facto deste coeficiente não assumir o valor 1 no caso de associação completa é uma sua limitação. Para obviar este problema, Tshuprow propôs o seguinte coeficiente. 41
42 Tabelas de Contingência Coeficiente de Tshuprow: T = n (r χ 2 1) (s 1) Este coeficiente varia entre 0 e 1, tomando o valor 0 no caso de existir independência e o valor 1 quando r=s e houver associação completa. Por último, referimos o coeficiente proposto por Cramer que atinge o valor 1 quando há associação completa. Coeficiente V de Cramer: V 2 χ =, com q=min{r,s} 0 V 1. n(q 1) 42
43 Tabelas de Contingência Para o exemplo anterior, rejeitámos a hipótese de independência entre o modo de pagamento e o período do dia em que as compras eram efectuadas. Para ter uma ideia da intensidade de associação entre estes dois atributos, calculam-se os coeficientes que acabámos de descrever. χ 60 Coeficiente de Contingência de Pearson: C = = = χ + n C ( q 1) q, onde q=min{r,s}=3, i.e, 0 C
44 Tabelas de Contingência Coeficiente de Tshuprow: T χ 2 60 = = n (r 1) (s 1) =0.087 Coeficiente V de Cramer: 2 V χ 60 = = n(q 1) =0.087 Verificamos, então, que apesar de haver associação entre os atributos, esta pode considerar-se fraca. 44
45 Tabelas de Contingência Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações (sub-populações ou estratos) B 1, B 2,..., B s, nas quais se observa um atributo A com r categorias A 1, A 2,..., A r. Neste contexto, surge também uma tabela de contingência r s: B 1 B 2... B s A 1 O 11 O O 1s A 2 O 21 O O 2s M M M O M A r O r1 O r2... O rs O ij (i=1,...,r e j=1,...,s) número de elementos da amostra da população B j classificados na categoria A i de A. 45
46 Tabelas de Contingência Sejam: O i = s j= 1 amostras; O (i=1,...,r) nº de elementos na categoria A i de A em todas as ij O j = r i= 1 O (j=1,...,s) tamanho da amostra recolhida na população B j. ij Neste caso, cada B j rotula uma sub-população cujos elementos se distribuem pelas r modalidades do atributo A, e o que se pretende saber é se existe homogeneidade, isto é, se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A. 46
47 Tabelas de Contingência À semelhança do teste de independência, a estatística do teste é χ 2 = r s i= 1j= 1 (O ij ê ê ij ij ) 2, que, sob o pressuposto de H 0 ser verdadeira, tem distribuição assimptótica do Qui-Quadrado com (r-1)(s-1) graus de liberdade. Valores muito grandes da estatística de teste traduzem um grande afastamento dos dados em relação à hipótese nula, conduzindo à rejeição desta. Assim, a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade. 47
48 Tabelas de Contingência Para aplicar os testes de independência e de homogeneidade devem ser seguidas as mesmas regras que vimos para o teste de ajustamento do Quiquadrado, isto é, se tivermos: ou, - mais de 20% das frequências esperadas, e i s, inferiores a 5 - alguma frequência esperada inferior a 1 devemos proceder à agregação de algumas classes contíguas. 48
49 Tabelas de Contingência Teste exacto de Fisher O teste do Qui-quadrado é, como já se disse, baseado numa distribuição assimptótica, o que portanto limita a sua aplicação ao caso de grandes amostras (recorde as limitações sobre as frequências esperadas). Em tabelas de contingência 2x2, existe uma alternativa ao teste do Qui-quadrado, o teste de Fisher, que é um teste exacto, i.e., a distribuição da estatística é exacta (os pontos críticos e valores-p são calculados de forma exacta). 49
50 Ajuste entre duas Amostras Independentes AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas populações, pretende-se testar a hipótese H 0 de que as duas distribuições populacionais são idênticas, isto é, as duas amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Hipóteses a testar: H 0 : As duas amostras são retiradas de populações com a mesma distribuição H 1 : As duas amostras são retiradas de populações com distribuições diferentes 1
51 Ajuste entre duas Amostras Independentes Teste do Qui-quadrado Os valores possíveis da característica em estudo são repartidos por m classes mutuamente exclusivas A 1, A 2,...,A m. A hipótese H 0 que se pretende testar é a de que as duas populações em estudo têm a mesma distribuição, isto é, não há diferença entre as duas populações no modo como os seus elementos se distribuem pelas diversas classes. Por outras palavras, as duas populações são homogéneas. Trata-se então do teste do Qui-quadrado de homogeneidade para duas populações (s=2). 2
52 Ajuste entre duas Amostras Independentes Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas. Comparam-se as frequências relativas acumuladas registadas nas duas amostras (digamos A e B). Se não se registarem diferenças significativas, não é rejeitada a hipótese nula de que as duas amostras provêm de populações com a mesma distribuição. A estatística de teste considera a maior das diferenças, em valor absoluto, entre as proporções de valores inferiores ou iguais a x observadas em cada amostra, S A (x) S B (x). Estatística de teste: D' = sup < x<+ S A ( x) S Para um nível de significância α, a hipótese H 0 é rejeitada se o valor observado da estatística de teste for superior ao ponto crítico B ( x) D ' α (a ser consultado numa tabela). 3
53 Ajuste entre duas Amostras Independentes Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante A de uma dada doença, obtendo-se os seguintes resultados VALORES N.º indivíduos Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença. Os valores da análise para estes 70 indivíduos estão registados seguidamente. VALORES N.º indivíduos Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B desta doença? (Use α=0.01) 4
54 Ajuste entre duas Amostras Independentes Variante A: Variante B: VALORES N.º indivíduos Freq. acumuladas S A (x) 2/80 5/80 14/80 26/80 53/80 69/80 76/80 78/80 1 VALORES N.º indivíduos Freq. acumuladas S B (x) 1/70 3/70 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1 5
55 Ajuste entre duas Amostras Independentes Cálculo do valor observado da estatística de teste: Valores S A (x) 2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/ S B (x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1 S A (x)- S B (x) 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014 0 O valor observado da estatística de teste é então D obs = Para α=0.01, o ponto crítico é (consulte tabela): 1.63 =
56 Ajuste entre duas Amostras Independentes Dado que o valor observado da estatística de teste é 0.491>0.267, então rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao nível de significância de 0.01, de que os valores da análise de distribuem de forma diferente na variante A e B da doença. 7
57 Teste de Kruskal_Wallis TESTE DE KRUSKAL-WALLIS Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde foram extraídas k amostras aleatórias e independentes, pretende-se testar a hipótese H 0 de que as distribuições populacionais são idênticas, isto é, as k amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um factor, a ser abordada mais tarde, quando os pressupostos desta não podem ser verificados. 1
58 Teste de Kruskal_Wallis Hipóteses a testar: H 0 : As k amostras são retiradas de populações com a mesma distribuição H 1 : As k amostras não são retiradas de populações com a mesma distribuição, isto é, há pelo menos duas populações com distribuições diferentes O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas de localização. Por esta razão as hipóteses são geralmente formuladas em termos das médias ou das medianas populacionais. 2
59 Teste de Kruskal_Wallis Notação: µ i média da i-ésima população M i mediana da i-ésima população H 0 : µ 1 =µ 2 = =µ k H 1 : µ i µ j, i j (as médias populacionais são iguais para as k populações) (há pelo menos duas populações com médias diferentes) H 0 : M 1 =M 2 = =M k (as k medianas populacionais são iguais) H 1 : M i =M j, i j (há pelo menos duas populações com medianas diferentes) 3
60 Teste de Kruskal_Wallis Notação: n i - o tamanho da amostra retirada da população i (i=1,...k); N = k n i i= 1 - nº total de observações; X ij - a j-ésima observação da amostra da população i. Procedimento: ordenam-se todas as observações por ordem crescente dos seus valores; atribui-se um nº de ordem, ou posto, R ij, a cada observação X ij (a observação mais pequena fica com o nº de ordem, ou posto, 1 e a observação maior com o posto N); para cada população i determina-se o valor R i da soma dos postos das observações correspondentes a esse grupo populacional: R n = i i R ij j= 1 4
61 Teste de Kruskal_Wallis Quando há empates nos valores observados, o número de ordem, ou posto, que deve ser atribuído a cada valor empatado deve ser a média dos números de ordem que seriam atribuídos a estes valores se não estivessem empatados. Por exemplo, suponhamos que ordenando os valores observados obtínhamos 100, 102, 102, 102, 102.5, 103, 103, 104. Neste caso, os números de ordem seriam respectivamente, 1, 3, 3, 3, 5, 6.5, 6.5, 8. 5
62 Teste de Kruskal_Wallis Quando não há empates nos valores observados das amostras, ou o nº de empates é muito pequeno, a estatística de teste é: 12 k R H= i 3(N + 1) N(N + 1) = n i 1 A hipótese nula deve ser rejeitada se o valor observado da estatística H for muito grande, i.e., superior ao ponto crítico (teste unilateral à direita). Pontos críticos: o Se k=3 e n i 5 para todo i=1,...,k, consultar tabela da distribuição exacta da estatística H, sob H 0. o Se n i 5 para todo i=1,...,k, sob H 0, H tem aproximadamente 2 distribuição ; consultar tabela desta distribuição. χ k 1 2 i 6
63 Teste de Kruskal_Wallis Quando há muitos empates nos valores observados das amostras a estatística de teste a usar deve ser: onde, 1 H'= S 2 k 2 Ri N(N + 1) i= 1 ni 4 2 Pontos críticos: S 2 1 k ni 2 N(N + 1) Rij N 1 i= 1 j= 1 4 = 2 o Se n i 5 para todo i=1,...,k, sob H 0, H tem aproximadamente 2 distribuição ; consultar tabela desta distribuição. χ k 1 7
64 Teste de Kruskal_Wallis Exemplo: Para avaliar o mérito de três métodos de ensino diferentes, cada um de 14 estudantes foi aleatoriamente matriculado em uma de três turmas. Em cada turma utilizou-se um método de ensino diferente. Após algumas aulas, pediu-se a cada estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos) constam do quadro seguinte. Método 1 Método 2 Método Será possível afirmar que os métodos de ensino produzem resultados diferentes no que diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05) 8
65 Teste de Kruskal_Wallis Ordenam-se as observações, registando o grupo (mét. ensino) a que pertencem, e determina-se o posto de cada uma: Observação Posto - R ij Grupo (mét.) R 1 = =32 R 2 = =25 R 3 = =48 9
66 Teste de Kruskal_Wallis 12 k R Não havendo empates, a estatística de teste é H= i 3(N + 1) N(N + 1) = n i 1 2 i cujo valor observado é: H obs = (14 + 1) = (14 + 1) Consultando a tabela da distribuição exacta de H, sob H 0, retira-se o ponto crítico para α=0.05: Dado que H obs =1.963<5.6429, não se rejeita a hipótese nula dos três métodos de ensino produzirem efeitos idênticos. Por outras palavras, não há evidência estatística de que o tipo de método de ensino influencie o desempenho dos estudantes na resolução de problemas. 10
67 Teste de Kruskal_Wallis Testes de Comparações múltiplas Quando rejeitamos a hipótese H 0, surge a questão de identificar onde se encontram as diferenças, i.e., quais são as amostras onde se encontram diferenças significativas. Para isso temos de comparar cada par de amostras da seguinte maneira: para cada amostra, calcula-se o posto médio postos R i pelo tamanho da amostra n i ; R i, dividindo a soma dos Determinam-se as diferenças absolutas entre cada par de postos médios R i R j, i,j=1,,k 11
68 Teste de Kruskal_Wallis Cada diferença absoluta R R é comparada com o valor crítico i j c ij 2 = χα,k 1 N(N + 1) 12 1 n i + 1 n j onde, 2 α, k 1 χ é o ponto crítico usado para o teste de Kruskal-Wallis. Se R R > i j c ij, então, considera-se significativa a diferença entre as amostras i e j, havendo, portanto, evidência de existirem diferenças entre as populações de onde se extraíram estas amostras. 12
TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA
TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma
Leia maisCapítulo 4 Inferência Estatística
Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a variância de
Leia maisTESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)
TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição
Leia maisTESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)
TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição
Leia maisTestes Qui-Quadrado - Teste de Aderência
Testes Qui-Quadrado - Teste de Aderência Consideremos uma tabela de frequências com k frequências, k 2 k: total de categorias frequências observadas: O 1,, O k seja p 1 = p 01,, p k = p 0k as probabilidades
Leia maisAULA 11 Experimentos Multinomiais e Tabelas de Contingência
1 AULA 11 Experimentos Multinomiais e Tabelas de Contingência Ernesto F. L. Amaral 24 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG)
Leia maisMétodos Quantitativos Aplicados
Métodos Quantitativos Aplicados Aula 5 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise de dados bivariada: cruzamentos e medidas de associação variáveis nominais e ordinais e variáveis
Leia maisConsideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:
Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar: o tempo médio de efeito de dois analgésicos não é o mesmo; a popularidade de determinado partido político aumentou; uma
Leia maisAnálise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira
Análise estatística Aula de Bioestatística 17/9/2008 (2.ª Parte) Paulo Nogueira Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs.
Leia maisAula 8. Teste Binomial a uma proporção p
Aula 8. Teste Binomial a uma proporção p Métodos Estadísticos 2008 Universidade de Averio Profª Gladys Castillo Jordán Teste Binomial a uma Proporção p Seja p ˆ = X n a proporção de indivíduos com uma
Leia maisMAE116 - Noções de Estatística
MAE116 - Noções de Estatística Grupo A - 1 semestre de 2015 Gabarito da Lista de exercícios 10 - Introdução à Estatística Descritiva - CASA Exercício 1. (2 pontos) Sabe-se que, historicamente, 18% dos
Leia maisAula 12 Teste de hipótese sobre proporções amostras grandes
Aula 12 Teste de hipótese sobre proporções amostras grandes Objetivos Na aula anterior, você aprendeu a construir testes de hipóteses sobre a média de uma população normal com variância σ 2 conhecida.
Leia maisTeste de Hipótese e Intervalo de Confiança. Parte 2
Teste de Hipótese e Intervalo de Confiança Parte 2 Questões para discutirmos em sala: O que é uma hipótese estatística? O que é um teste de hipótese? Quem são as hipóteses nula e alternativa? Quando devemos
Leia maisINTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição
Leia maisEstimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança
Estimação Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança Motivação A partir da média de uma a amostra em uma colheita recente, o conselho de qualidade
Leia maisAULA 12 Inferência a Partir de Duas Amostras
1 AULA 12 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 15 de setembro de 2011 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro:
Leia maisIntrodução. Ou seja, de certo modo esperamos que haja uma certa
UNIVERSIDADE FEDERAL DA PARAÍBA Teste de Independência Luiz Medeiros de Araujo Lima Filho Departamento de Estatística Introdução Um dos principais objetivos de se construir uma tabela de contingência,
Leia maisModelos de Probabilidade e Inferência Estatística
Modelos de Probabilidade e Inferência Estatística Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Distribuições Qui-quadrado, t-student e F de Snedecor 04/14
Leia maisDistribuições Conjuntas (Tabelas de Contingência)
Cruzamento de Dados Distribuições Conjuntas (Tabelas de Contingência) Lorí Viali, Dr. DESTAT/FAMAT/PUCRS viali@pucrs.br http://www.pucrs.br/famat/viali Distribuição Conjunta Exemplo (tabela um) Suponha
Leia maisPlano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.
Metodologia de Diagnóstico e Elaboração de Relatório FASHT Correlação e Plano da Apresentação Correlação linear Diagrama de dispersão Covariância Coeficiente de correlação de Pearson Teste de correlação
Leia maisCorrelação e Regressão linear simples
Metodologia de Diagnóstico e Elaboração de Relatório FASHT Correlação e Regressão linear simples Prof. Cesaltina Pires cpires@uevora.pt Plano da Apresentação Correlação linear Diagrama de dispersão Covariância
Leia maisTeorema do Limite Central e Intervalo de Confiança
Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),
Leia maisBIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados
BIOESTATÍSTICA Parte 1 - Estatística descritiva e análise exploratória dos dados Aulas Teóricas de 17/02/2011 a 03/03/2011 1.1. População, amostra e dados estatísticos. Dados qualitativos e quantitativos
Leia maisANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior
ANOVA (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior Para que serve a ANOVA? Para comparar três ou mais variáveis ou amostras. Por exemplo, queremos testar os efeitos cardiorrespiratórios
Leia maisAULA 04 Estimativas e Tamanhos Amostrais
1 AULA 04 Estimativas e Tamanhos Amostrais Ernesto F. L. Amaral 27 de agosto de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario
Leia maisEstatística. Slide 0. Ana M. Abreu - 2006/07
Estatística Slide 0 Capítulo 1 Estatística Descritiva Slide 1 I-1 Introdução à organização e ao processamento de dados. I-2 Amostra e população; cuidados a ter na recolha da amostra. I-3 Ordenação dos
Leia maisAMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA
AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA META Dimensionar o tamanho ideal de amostra para cada população.
Leia maisESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA
ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA Apresentar a Estatística no contexto do dia-a-dia e fazendo uso da planilha Excel. Espera-se que o estudante ao término do curso esteja apto a usar a planilha
Leia maisIND 1115 Inferência Estatística Aula 8
Conteúdo IND 5 Inferência Estatística Aula 8 Setembro 4 Mônica Barros O - aproximação da Binomial pela Este teorema é apenas um caso particular do teorema central do limite, pois uma variável aleatória
Leia maisEstatística - exestatmedposic.doc 25/02/09
Medidas de Posição Introdução Vimos anteriormente que, através de uma distribuição de freqüências se estabelece um sistema de classificação que descreve o padrão de variação de um determinado fenômeno
Leia maiscuja distribuição é t de Student com n 1 graus de liberdade.
Aula 13 Teste de hipótese sobre a média de uma população normal σ 2 desconhecida Objetivos: Nesta aula você completará seu estudo básico sobre testes de hipóteses, analisando a situação relativa a uma
Leia maisAula 8 Intervalos de confiança para proporções amostras grandes
Aula 8 Intervalos de confiança para proporções amostras grandes Objetivos Na aula anterior, foram apresentadas as idéias básicas da estimação por intervalos de confiança. Para ilustrar o princípio utilizado
Leia maisRegressão linear múltipla. Prof. Tatiele Lacerda
Regressão linear múltipla Prof Tatiele Lacerda Yi = B + Bx + B3X3 + u Plano de resposta E(Y i ) = 0,00 Y i i 0 (,33;,67) Y i 0 X i Xi X p i, p i 3 Modelo de regressão linear múltipla em termos matriciais,
Leia maisAnálise de Regressão Linear Simples III
Análise de Regressão Linear Simples III Aula 03 Gujarati e Porter Capítulos 4 e 5 Wooldridge Seção.5 Suposições, Propriedades e Teste t Suposições e Propriedades RLS.1 O modelo de regressão é linear nos
Leia maisInferência sobre duas proporções
Teste para duas populações duas populações Amostra :,,,, alor comum para delta 0 Amostra 2:,,,, Tamanho Tamanho Média amostral x Média amostral x Desvio-padrão Desvio-padrão Teste para duas populações
Leia maisAnálise de Regressão. Notas de Aula
Análise de Regressão Notas de Aula 2 Modelos de Regressão Modelos de regressão são modelos matemáticos que relacionam o comportamento de uma variável Y com outra X. Quando a função f que relaciona duas
Leia maisESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010. Curso: 12/06/2010.
ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010 Curso: 12/06/2010 Nome: N o Instruções: Estaprovatemaduraçãode120 minutos e é constituída
Leia maisVariáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência
Tipos de Variáveis Problema Motivador: Um pesquisador está interessado em fazer um levantamento sobre aspectos sócio-econômicos dos empregados da seção de orçamentos de uma companhia (vide tabela). Algumas
Leia maisRegressão Linear Múltipla
UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EATAS E NATURAIS FACULDADE DE ESTATÍSTICA DISCIPLINA: Estatística Aplicada PROFESSORES: Heliton Tavares e Regina Madruga ALUNO: Wemenson avier Trabalho
Leia maisUnidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança
Hipótese estatística Unidade 5. Teste de Hipóteses (uma população) Hipótese estatística-qualquer afirmação feita sobre um parâmetro populacional desconhecido. Hipótese: Duração média da bateria (µ) > 300
Leia maisMatemática Aplicada às Ciências Sociais
ESCOLA SECUNDÁRIA DE AMORA PLANIFICAÇÃO ANUAL Matemática Aplicada às Ciências Sociais Ensino Regular Curso Geral de Ciências Sociais e Humanas 11º ANO Ano Letivo 2014 / 2015 PLANIFICAÇÃO A LONGO PRAZO
Leia maisDesvio Padrão ou Erro Padrão
NOTAS METODOLÓGICAS ISSN 0871-3413 ArquiMed, 2006 Desvio Padrão ou Erro Padrão Nuno Lunet, Milton Severo, Henrique Barros Serviço de Higiene e Epidemiologia da Faculdade de Medicina da Universidade do
Leia maisTeste de hipóteses para médias e proporções amostrais
Teste de hipóteses para médias e proporções amostrais Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais Intervalo de confiança: outro entendimento É o intervalo que contém o parâmetro que queremos
Leia maisCapítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão
Capítulo 5 Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão Hipóteses do Modelo de Regressão Linear Simples RS1. y x e t 1 t t RS. RS3. RS4. RS5. RS6. Ee
Leia mais1 Introdução. 1.1 Importância da Utilização da Amostragem
1 Introdução Um dos principais objetivos da maioria dos estudos, análises ou pesquisas estatísticas é fazer generalizações seguras com base em amostras, sobre as populações das quais as amostras foram
Leia maisx = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.
1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem. Determine a média aritmética da distribuição: A mediana não é tão sensível, como a média, às observações que são muito
Leia maisAGRUPAMENTO DE ESCOLAS DA SÉ GUARDA. MATEMÁTICA B Curso de Artes Visuais
Direção-Geral dos Estabelecimentos Escolares Direção de Serviços da Região Centro AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA MATEMÁTICA B Curso de Artes Visuais ANO LECTIVO: 2015/2016 11º ANO 1º PERÍODO PLANIFICAÇÃO
Leia maisPopulação e Amostra POPULAÇÃO AMOSTRA AMOSTRAGEM TIPOS DE AMOSTRAGEM I. Amostra probabilística: II. Amostra não-probabilística
População e Amostra POPULAÇÃO A palavra população, na sua acepção mais comum, representa o conjunto de habitantes de uma dada região em determinado período. Em estatística, população (ou universo) é o
Leia maisDISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)
DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS) O QUE É ESTATÍSTICA Estatística é a ciência de obter conclusões a partir de dados. Envolve métodos para
Leia maisProbabilidade e Estatística, 2009/2
Probabilidade e Estatística, 2009/2 CCT - UDESC Prof. Fernando Deeke Sasse Problemas Resolvidos - Testes de Hipóteses 1. Uma empresa de manufatura têxtil está testando rolos de fio que o fornecedor afirma
Leia maisEXAME DE MACS 2º FASE 2014/2015 = 193
EXAME DE MACS 2º FASE 2014/2015 1. Divisor Padrão: 00+560+80+240 200 = 190 = 19 200 20 Filiais A B C D Quota Padrão 1,088 58,01 86,010 24,870 L 1 58 86 24 L(L + 1) 1,496 58,498 86,499 24,495 Quota Padrão
Leia maisTestes de variância e Análise de Variância (ANOVA)
Testes de variância e Análise de Variância (ANOVA) Introdução à Inferência Estatística Introdução à Inferência Estatística TESTE DE VARIÂNCIAS E DISTRIBUIÇÃO F Testes sobre variâncias Problema: queremos
Leia maisé 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.
Desvio Padrão From Wikipedia, the free encyclopedia probabilidade e estatística, o desvio padrão de uma distribuição de probabilidade, de uma variável aleatória, ou população é uma medida do espalhamento
Leia maisStela Adami Vayego DEST/UFPR
Resumo 5 - Análise Bivariada (Bidimensional) 5.1. Introdução O principal objetivo das análises nessa situação é explorar relações (similaridades) entre duas variáveis. A distribuição conjunta das freqüências
Leia maisLição 5 Medidas Descritivas Medidas de Dispersão
99 Lição 5 Medidas Descritivas Medidas de Dispersão Após concluir o estudo desta lição, esperamos que você possa: identifi car o objetivo das medidas de dispersão; identifi car o conceito de variância;
Leia maisANÁLISE EXPLORATÓRIA DE DADOS
ANÁLISE EXPLORATÓRIA DE DADOS 1.0 Conceitos A estatística descritiva tem o objetivo de organizar, resumir e apresentar de forma adequada os dados, para que estes se tornem informativos. A análise exploratória
Leia maisAula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida
Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida Objetivo: Nesta aula, iremos aplicar os conceitos básicos sobre a teoria de teste de hipótese a uma situação específica.
Leia maisMedidas de Tendência Central. Introdução Média Aritmética Moda Mediana
Medidas de Tendência Central Introdução Média Aritmética Moda Mediana Introdução A maioria dos dados apresenta uma tendência de se concentrar em torno de um ponto central Portanto, é possível selecionar
Leia maisMedidas de dispersão e assimetria
Metodologia de Diagnóstico e Elaboração de Relatório FASHT Medidas de dispersão e assimetria Profª Cesaltina Pires cpires@uevora.pt Plano da Apresentação Medidas de dispersão Variância Desvio padrão Erro
Leia maisPlanejamento e Análise Estatística de Experimentos Fatoriais em blocos completos
Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos Contexto Já vimos como analisar um experimento em blocos na presença de um único fator de interesse. Podemos ter experimentos
Leia maisAula 1 Variáveis aleatórias contínuas
Aula 1 Variáveis aleatórias contínuas Objetivos: Nesta aula iremos estudar as variáveis aleatórias contínuas e você aprenderá os seguintes conceitos: função de densidade de probabilidade; função de distribuição
Leia maisUNIDADE 6 TESTES DE HIPÓTESES OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM
Unidade 6 Testes de Hipóteses UNIDADE 6 TESTES DE HIPÓTESES OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Ao finalizar esta Unidade, você deverá ser capaz de: Escolher o teste de hipótese adequado; Formular um
Leia maisModelo Uniforme. como eu e meu colega temos 5 bilhetes, temos a mesma probabilidade de ganhar a rifa:
Modelo Uniforme Exemplo: Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de 21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93. Quem
Leia maisCoeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos
Coeficiente de Assimetria e Curtose Rinaldo Artes 2014 Padronização Seja X uma variável aleatória com E(X)=µ e Var(X)=σ 2. Então a variável aleatória Z, definida como =, tem as seguintes propriedades:
Leia maisProbabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período 2014.1
Probabilidade III Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2014.1 Ulisses Umbelino (DE-UFPB) Probabilidade III Período 2014.1 1 / 42 Sumário 1 Apresentação
Leia mais1. Estatística Descritiva
Introdução à Estatística Estatística Descritiva 1 1. Estatística Descritiva Suponhamos que dispomos de um conjunto de dados (sem nos preocuparmos como foram obtidos) e pretendemos desenvolver processos
Leia maisConteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná
1º Sorteio Eletrônico da Nota Fiscal Paraná Relatório parcial contendo resultados 1 da análise estatística dos bilhetes premiados Conteúdo 1 Introdução Este relatório apresenta uma análise estatística
Leia maisConteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná
Quinto Sorteio Eletrônico da Nota Fiscal Paraná Relatório parcial contendo resultados 1 da análise estatística dos bilhetes premiados Conteúdo 1 Introdução Este documento apresenta a análise dos resultados
Leia maisMEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.
UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Tarciana Liberal As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar
Leia maisAvaliação e Desempenho Aula 1 - Simulação
Avaliação e Desempenho Aula 1 - Simulação Introdução à simulação Geração de números aleatórios Lei dos grandes números Geração de variáveis aleatórias O Ciclo de Modelagem Sistema real Criação do Modelo
Leia maisTécnicas estatísticas para análise de dados e de resultados de modelos de simulação
Parte XIV Técnicas estatísticas para análise de dados e de resultados de modelos de simulação A saída de um modelo de simulação geralmente constitui-se de VA s, muitas das quais podem ter variância grande.
Leia maisPlano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292
Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292 Título PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA Código da disciplina SIA CCE0292 16 Número de semanas de aula 4 Número
Leia maisOs dados quantitativos também podem ser de natureza discreta ou contínua.
Natureza dos Dados Às informações obtidas acerca das características de um conjunto dá-se o nome de dado estatístico. Os dados estatísticos podem ser de dois tipos: qualitativos ou quantitativos. Dado
Leia maisQuímica Analítica IV ERRO E TRATAMENTO DE DADOS ANALÍTICOS
Química Analítica IV 1 semestre 2012 Profa. Maria Auxiliadora Costa Matos ERRO E TRATAMENTO DE DADOS ANALÍTICOS Todas as medidas físicas possuem um certo grau de incerteza. Quando se faz uma medida, procura-se
Leia maisIV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla
IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla Significância Estatística Existe uma estatítica, o t-estatístico,associado a cada estimativa O t-estatístico mede
Leia maisModelos de Probabilidade e Inferência Estatística
Modelos de Probabilidade e Inferência Estatística Ronei Marcos de Moraes Análise de Variância e Estatística Nãoparamétrica UFPB Maio/2011 ANOVA - Análise de Variância O caso da comparação de várias médias
Leia mais2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.
1) Inicializar um vetor de inteiros com números de 0 a 99 2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média 3)
Leia maisErros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.
Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.) I. INTRODUÇÃO Quando se faz um experimento, deseja-se comparar o resultado obtido
Leia mais(1, 6) é também uma solução da equação, pois 3 1 + 2 6 = 15, isto é, 15 = 15. ( 23,
Sistemas de equações lineares generalidades e notação matricial Definição Designa-se por equação linear sobre R a uma expressão do tipo com a 1, a 2,... a n, b R. a 1 x 1 + a 2 x 2 +... + a n x n = b (1)
Leia maisAmostragem: Desenho e Procedimentos
Amostragem: Desenho e Procedimentos 1-1 Sumário do Capítulo 1) Amostragem ou censos 2) Desenho de um processo de amostragem i. Definir população alvo ii. Determinar o quadro de amostragem iii. Escolha
Leia maisEstatística Não Paramétrica
Estatística Não Paramétrica com uso de softwares Angelo Cabral UFPR 16 de novembro de 2015 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 1 / 53 Sumário 1 Softwares Utilizados
Leia maisCAPÍTULO 8. de Variância - ANOVA ANOVA. Análise
CAPÍTULO 8 Análise de Variância - UFRGS Os testes de hipótese apresentados até aqui limitaram-se à comparação de duas médias ou duas variâncias. Contudo, há situações onde se deseja comparar várias médias,
Leia maisMedidas de Localização
MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS RESUMO Estatística 2 Medidas de Localização e Dispersão 10º ano Cláudia Henriques Medidas de Localização Estatísticas Medidas que se calculam a partir dos dados
Leia mais3 Modelos de Simulação
43 3 Modelos de Simulação 3.1 Simulação de Monte Carlo O método de Monte Carlo foi concebido com este nome nos anos 40 por John Von Neumann, Stanislaw Ulam e Nicholas Metropolis durante o projeto de pesquisa
Leia maisProbabilidade e Estatística, 2011/2
média verdadeira de 104F? Estabeleçamos a média 100F como um limite não tolerado:, Probabilidade e Estatística, 2011/2 CCT - UDESC Prof. Fernando Deeke Sasse Testes de Hipóteses Problemas Resolvidos em
Leia maisProcessos Estocásticos
Processos Estocásticos Hélio Lopes INF2035 - Introdução à Simulação Estocástica 1 Introdução Um processo estocástico é uma família de variáveis aleatórias {X(t), t T } definidas em um espaço de probabilidade,
Leia maisContabilometria. Análise Discriminante
Contabilometria Análise Discriminante Fonte: Corrar, L. J.; Theóphilo, C. R. Pesquisa Operacional para Decisão em Contabilidade e Administração, Editora Atlas, São Paulo, 010 Cap. 3 Análise Discriminante
Leia maisCapítulo 6 Estatística não-paramétrica
Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Testes dos sinais e de Wilcoxon Teste de Mann-Whitney Teste
Leia maisTestes de Ajustamento (testes da bondade do ajustamento)
Testes de Ajustamento (testes da bondade do ajustamento) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição
Leia mais25 a 30 de novembro de 2013
LSD Introdução à Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 25 a 30 de novembro de 2013 LSD 1 2 3 LSD 4 Parte 2 - Conteúdo LSD Quando o F da ANOVA está sendo utilizado
Leia maisAula 6 Medidas de Tendência Central
1 Estatística e Probabilidade Aula 6 Medidas de Tendência Central Professor Luciano Nóbrega Somatório Quando queremos representar uma soma de valores que obedecem à uma sequência, podemos codificá-la através
Leia maisUnidade 5 5.1 Medidas de Posição ou de Tendência Central
Unidade 5 5.1 Medidas de Posição ou de Tendência Central 1- Introdução Se estivermos numa parada de ônibus urbano e nos pedirem alguma informação sobre a demora em passar um determinado ônibus, que diremos?
Leia maisDiplomados com o Ensino Superior
Ensino dos 30 aos 34 anos - dados e projeções Julho de 2016 Direção-Geral de Estatísticas da Educação e Ciência Ensino Julho de 2016 Ensino dos 30 aos 34 anos - dados e projeções Esta nota técnica visa
Leia maisMedidas e Escalas: Escalas não Comparativas
Medidas e Escalas: Escalas não Comparativas 1-1 Sumário do Capítulo 1) Escalas não comparativas 2) Escalas de rácios contínuos 3) Escalas de Itens i. Escala de Likert ii. iii. Escala de Diferencial semântico
Leia maisAula 6 Propagação de erros
Aula 6 Propagação de erros Conteúdo da aula: Como estimar incertezas de uma medida indireta Como realizar propagação de erros? Exemplo: medimos A e B e suas incertezas. Com calcular a incerteza de C, se
Leia maisProbabilidade. Distribuição Binomial
Probabilidade Distribuição Binomial Distribuição Binomial (Eperimentos de Bernoulli) Considere as seguintes eperimentos/situações práticas: Conformidade de itens saindo da linha de produção Tiros na mosca
Leia maisíndice Introdução Estatística Descritiva Capítulo 1 Capítulo 2 O que é a Estatística Escalas de medida Escalas Nominais Escalas Ordinais
índice MENSAGEM DO AUTOR 11 AGRADECIMENTOS 13 Capítulo 1 Introdução Importância da estatística 17 O que é a Estatística? Escalas de medida Escala de medida qualitativa Escalas Nominais Escalas Ordinais
Leia maisPara mais de duas variáveis independentes, em função de uma variável dependente.
MÉTODOS QUANTlTATlVOS APLlCADOS À CONTABlLlDADE Prof. Héber Lavor Moreira Plano de Aula TEMA: REGRESSÃO MÚLTlPLA - Caso Multiplan S/A lntrodução Em muitos casos uma variável pode estar relacionada com
Leia maisTeste 1. (a) 0.33 (b) 0.50 (c) 0.30 (d) 0.20
Teste 1 1. Das 4 afirmações seguintes qual a que é falsa? a) O primeiro quartil é o valor da observação tal que existem 25% de observações menores o iguais a ela; b) A mediana é sempre igual ao percentil
Leia mais