Algumas vantagens. Algumas restrições ao seu uso

Documentos relacionados
Prof. Lorí Viali, Dr.

O teste qui-quadrado. A variável teste é: χ E. Os testes. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes

Os testes. Objetivo. O teste de Kruskal-Wallis (Análise de variância de uma classificação por postos) O teste qui-quadrado

Testes não-paramétricos

Objetivos. Testes não-paramétricos

Probabilidade e Estatística

Estimação e Testes de Hipóteses

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

ESTATÍSTICA NÃO-PARAMÉTRICA Aula 4

Prof. Lorí Viali, Dr. Mat2282 Análise Estatística Não Paramétrica

Os testes. O teste de McNemar O teste de Wilcoxon O teste do sinais

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Estatística Não Paramétrica. Como construir testes de aderência

Teste de Hipóteses Paramétricos

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr.

Intervalos de Confiança

SÉRIE: Exatas Texto: Estatística Não Paramétrica SUMÁRIO 1. INTRODUÇÃO TESTES PARA UMA AMOSTRA... 11

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

Análise de Aderência e de Associação

Stela Adami Vayego Estatística II CE003/DEST/UFPR

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

mat.ufrgs..ufrgs.br br/~viali/ mat.ufrgs..ufrgs.br

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

6 Teste de Normalidade das Cargas Fatoriais

TESTES DE HIPÓTESES. HIPÓTESES: São suposições que fazemos para testar a fixação de decisões, que poderão ser verdadeiras ou não.

Estatística Aplicada

TESTE DE KOLMOGOROV-SMIRNOV. Professor Ewaldo Santana Universidade Estadual do Maranhão - UEMA

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

1 Probabilidade - Modelos Probabilísticos

AULA 07 Inferência a Partir de Duas Amostras

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

AULA 05 Teste de Hipótese

Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba.

Análise Multivariada Aplicada à Contabilidade

1. INTRODUÇÃO TIPOS DE TESTES PARAMÉTRICOS...12

1 Teoria da Decisão Estatística

SÉRIE: Estatística Básica Texto iv: TESTES DE HIPÓTESES PARAMÉTRICOS SUMÁRIO 1. INTRODUÇÃO TIPOS DE TESTES PARAMÉTRICOS...

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Capítulo 6 Estatística não-paramétrica

Experiência para o qual o modelo probabilístico é adequado. Efeito. Causas. Prof. Lorí Viali, Dr.

7 Teste de Hipóteses

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Testes de Aderência, Homogeneidade e Independência

Testes para dados categóricos

Capítulo 6 Estatística não-paramétrica

TESTE DE HIPÓTESE. Introdução

CONHECIMENTOS ESPECÍFICOS

Stela Adami Vayego DEST/UFPR

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses Paramétricos

Testes de Aderência, Homogeneidade e Independência

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Testes de Hipóteses Paramétricos

Medidas de Dispersão ou variabilidade

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

TESTE DE HIPÓTESES NÍVEL DESCRITIVO

Aula 16: Análise de Aderência e Associação

Testes de Aderência, Homogeneidade e Independência

SUMÁRIO 1. INTRODUÇÃO Generalidades Metodologia do teste de hipóteses As hipóteses A escolha do teste estatístico 5

Testes de Hipóteses: exemplos

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

Os testes. Hipóteses e Cálculo

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Unidade IV Inferência estatística

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

Cruzamento de Dados. Lorí Viali, Dr. DESTAT/FAMAT/PUCRS

TESTES NÃO-PARAMÉTRICOS

Estatística Aplicada

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Prof. Lorí Viali, Dr.

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Estatística e Probabilidade

CONHECIMENTOS ESPECÍFICOS

Testes não-paramétricos: amostras simples

Prof. Lorí Viali, Dr.

AULA 8 Experimentos multinomiais e tabelas de contingência

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

Sumário. Sumário 1 1. Introdução 3

Teste de hipóteses para proporção populacional p

2. EXERCÍCIOS PROPOSTOS SOBRE V.A. E DISTRIB.PROBAB.

Uma Avaliação do Erro Tipo II no Uso do Teste t-student

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr.

Transcrição:

Testes não-paramétricos Pro. Lorí Viali, Dr. http://www.pucrs.br/amat/viali/ viali@pucrs.br Um teste não paramétrico testa outras situações que não parâmetros populacionais. Estas situações podem ser relacionamentos, modelos, dependência ou independência e aleatoriedade. Algumas vantagens São menos exigentes do que os paramétricos. Dispensam, por exemplo, a normalidade dos dados; Independem da orma da população da qual a amostra oi obtida; Em geral, as probabilidades das estatísticas são exatas, salvo quando se usam aproximações para grandes amostras. Algumas restrições ao seu uso Em, geral, não permitem testar interações. Isto restringe a sua aplicação aos modelos mais simples; A obtenção, utilização e interpretação das distribuições de probabilidade, são em geral, mais complexas. Existem muitos testes estatísticos não paramétricos. Alguns itens devem ser levados em conta na sua escolha: a maneira como a amostra oi obtida, a natureza da população da qual se extraiu a amostra, o tipo de variável envolvida e o tamanho da amostra disponível. 1

Formular as hipóteses; Deinir ou ixar um valor crítico (α); Deinir a região crítica (ponto de corte); Identiicar e calcular a estatística teste; Tomar uma decisão; Formular (expressar) a conclusão. Uma amostra Duas amostras Várias amostras Dependentes Independentes Dependentes Independentes O teste qui-quadrado O teste ² de uma amostra pode ser utilizado para veriicar se os valores de uma variável se enquadram em duas ou mais categorias. Veriica-se se existe dierença signiicativa entre o número observado de valores, em cada categoria, e o número esperado, baseado na hipótese de nulidade.

Hipóteses H 0 : O modelo é adequado H 1 : O modelo não é adequado A variável teste é: k ( ) O -E i 1 i E i i Onde: O i número de casos observados classiicados na categoria i. E i número de casos esperados na categoria i sob H o, onde k número de categorias. Se há concordância entre os valores observados e os esperados, as dierenças (O i - E i ) serão pequenas e, conseqüentemente, será também pequeno. Se as divergências, entretanto, orem grandes, o valor de, será também grande. Pode-se mostrar que a distribuição amostral de, sob H o, calculada pela órmula acima, segue a distribuição quiquadrado com um número de graus de liberdade igual a k-1 onde k é igual ao número de categorias em que a variável oi classiicada. Suponha que uma moeda é lançada 800 vezes ornecendo 43 caras. Veriique se a moeda pode ser considerada viciada ao nível de % de signiicância. Realize o teste paramétrico correspondente para veriicar se a mesma conclusão poderá ser obtida. 3

Hipóteses H 0 : A moeda é honesta H 1 : A moeda não é honesta Dados: Moeda Cara Coroa Resultados 43 368 800 Moeda Caras Coroas O i 43 368 800 Resultado E i (Oi Ei) /E i 400,6 400,6 800,1 1 A variável vel teste é: Então: (43-400) + 400,6+,6,1 k ( ) O -E i 1 i E (368-400) i 400 i Qual X utilizar? O número n de graus de liberdade é dado por: v k 1, onde k número n de linhas das tabela. Como k, então v 1. Ponto de Corte Região Crítica Como α % e v 1, tem-se: α % Assim: 1 3,84 Região de Não Rejeição c RC,1 [ 3,84 ; ) 4

DECISÃO e CONCLUSÃO: O valor crítico é tal que: P( > 3,84) %. Então RC [3,84; ). Como,1 RC ou,1 > 3,84, Rejeito H 0, isto é,, a % de signiicância, pode-se airmar que a moeda é viciada. OPÇÃO Trabalhar com o valor p, isto é,, com a signiicância dor resultado obtido. Como este valor é,1, tem-se: Assim o valor-p,37% que é menor que a signiicância do teste que é %. Portanto, rejeita-se a hipótese de que a moeda é honesta e airma-se, com base nesta amostra, e a uma signiicância de %, que ela é viciada. Objetivos Hipóteses O teste de Kolmogorov-Smirnov, ou simplesmente K-S, tem o mesmo propósito do teste qui-quadrado, mas além de mais poderoso, pode ser aplicada a amostras, em geral, menores. H 0 : O modelo é adequado H 1 : O modelo não é adequado A variável teste é: d max F ( x ) -G ( x )

Onde: F(x) P(X x) é a unção de distribuição acumulada do modelo, isto é, de acordo com a hipótese nula G(x) representa as reqüências acumuladas da amostra. Se a dierença observada d, de acordo com a expressão dada or maior do que o valor crítico tabelado em unção de α e n, rejeita-se a hipótese nula. A tabela Para valores de n até 0 existe uma tabela que ornece os valores críticos da dierença d, para os valores de α % e α 1%. Se n > 0 os valores críticos para os valores de ala acima são dados por: 1,36 1,63 e n n Respectivamente. Uma amostra de n 10 valores, orneceu o seguinte resultado: 1,9 9,16 8,07 7,17 9,74 10,66 13,10 11,6 9,6 7,41 10,81 10,6 11,73 9,41 10,70 9,6 9,8 8,60 8,84 10,10 6

x F(x) G(x) Esquerda Direita 7,11 0,0741 0,1000 0,0741 0,09 Teste a hipótese de que ela 8,84 8,89 0,804 0,900 0,000 0,3000 0,1804 0,0900 0,0804 0,0100 possa ter sido originada de uma população normal de média 10 e desvio padrão. 9,4 10,98 11,09 11,64 1,30 0,4086 0,6877 0,707 0,794 0,8747 0,4000 0,000 0,6000 0,7000 0,8000 0,1086 0,877 0,07 0,194 0,1747 0,0086 0,1877 0,107 0,094 0,0747 13,4 0,9476 0,9000 0,1476 0,0476 14,0 0,9786 1,0000 0,0786 0,014 Conclusão Veriica-se, portanto que a maior dierença em valores absolutos é: 0,877. Consultando a tabela dos valores críticos da distribuição desta dierença tem-se: 0,410 para uma signiicância de % e e 0,490 para uma signiicância de 1%. Como a maior dierença obtida D 0,88 não supera os valores críticos 0,410 e 0,490, aceito H 0, isto é, a % (1%) de signiicância não se pode airmar que a população não é proveniente de uma N(10; ). Opção Realizar o teste utilizando o SPSS. Exercício! 7

O teste qui-quadrado O teste ² de duas ou mais amostras independentes pode ser utilizado para veriicar a dependência ou independência entre as variáveis sendo consideradas. As variáveis devem estar tabuladas em tabelas de contingência. Para o caso de duas variáveis tem-se uma tabela de dupla entrada. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes A variável teste é: k l O -E i 1 j 1 υ E ( ) Expressão alternativa A variável teste é: υ k E ( ) O -E i 1 E O k i 1 l j 1 l j 1 - n Onde: Onde: r número de linhas da tabela; L número de colunas da tabela; O reqüência observada na interseção da linha i com a coluna j. E número de casos esperados na interseção da linha i com a coluna j. υ n é a estatística teste; k 1 i l O tamanho da amostra; j 1 E n p são as reqüências esperadas de cada célula da tabela. 8

p é a probabilidade de ocorrer uma observação na célula. Se as variáveis são supostamente independentes (H 0 é Verdadeira), então p p i. p.j, onde p i. é a probabilidade marginal correspondente à linha i e p.j é a probabilidade marginal correspondente a coluna j. Como não se conhecem as probabilidades marginais, elas devem ser estimadas através das correspondentes reqüências relativas. Então: E n p n p i.. p. j n. n i.. n. j i. n. j i. l j 1 e. j k 1 i A tabela mostra os resultados de uma avaliação de satisação com a compra de um novo modelo de automóvel de luxo. Teste a hipótese de que o novo modelo está agradando mais aos consumidores homens do que os consumidores mulheres. Consumidores Homens Mulheres Muito 30 Avaliação Pouco Não Satiseito 0 1 9

Hipóteses Totais marginais H 0 : Homens e mulheres estão igualmente satiseitos. H 1 : Homens e mulheres não estão igualmente satiseitos. Consumidores Homens Mulheres M 30 P 0 NS 1 0 6 3 100 Freqüências Esperadas Cálculo do Qui-Quadrado Consumidores Homens Mulheres M 3,7 19, P 16, 8,7 NS 13 7 0 6 3 100 Consumidores Homens Mulheres M 0,9 1,71,64 P 0,86 1,607,473 NS 0,310 0,70 0,880,100 3,900,990 A estatística stica amostral O grau de liberdade é: ν ( k -1 )( l -1 ) ( -1).( 3-1) Então: ( ) O -E i 1 3 j 1 E,990 Qual a signiicância deste resultado? Estes resultado 4,99% < % signiicância do teste. Rejeito H 0. 10

Objetivos A prova de Kolmogorov-Smirnov de duas amostras veriica se elas oram extraídas da mesma população (ou de populações com a mesma distribuição). A prova bilateral é sensível a qualquer dierença nas distribuições das quais se extraíram as amostras (posição central, dispersão ou assimetria). Metodologia A prova unilateral é utilizada para determinar se os valores da população da qual se extraiu uma das amostras são, ou não, estocasticamente maiores do que os valores da população que originou a outra amostra. O teste utiliza as distribuições acumuladas. A prova de uma amostra veriica a concordância entre a distribuição de um conjunto de valores amostrais e uma distribuição teórica. A prova de duas amostras visa a concordância entre dois conjuntos de valores amostrais. Aplicação Se as duas amostras oram extraídas da mesma população, então se espera que as distribuições acumuladas das amostras estejam próximas. Se as distribuições estão distantes isto sugere que as amostras provenham de populações distintas e um desvio grande pode levar a rejeição da hipótese de nulidade. Para aplicar a prova constrói-se a distribuição das reqüências acumuladas relativas de cada uma das amostras, utilizando os mesmos intervalos (amplitude de classes) para cada uma delas. Em cada intervalo subtraí-se uma unção da outra. A prova utiliza como estatística o maior destas dierenças. 11

Hipóteses H 0 : As amostras são da mesma pop. H 1 : As amostras não são da mesma pop. A variável teste é: d max S 1 ( x ) - S ( x ) S 1 (x) Fr 1 (x) é a Freqüência acumulada da amostra 1 e Onde: S (x) Fr (x) é a Freqüência acumulada da amostra. Se a dierença observada d, de acordo com a expressão dada or maior do que o valor crítico tabelado em unção de α e n, rejeita-se a hipótese nula. A tabela Se o n > 40 e o teste é bilateral, então o valor crítico é dado por: d 1,36 n1 + n n n Se o teste é unilateral, então o valor crítico é dado por: n n 1 4 D n + n 1 1 Amostras de n 1 n 0 valores das opiniões de diretores inanceiros de grandes e pequenas empresas mostraram os resultados da tabela seguinte, medidos em uma escala Likert de pontos: 1

Amostras de n 1 n 0 valores das opiniões de diretores de empresas Grande e Pequenas Escala 1 3 4 Grandes 8 10 1 1 0 Pequenas 1 13 10 8 4 0 Teste a hipótese de que opiniões dos diretores dos dois tipos de empresa são divergentes. Determinação das Dierenças Escala 1 3 4 Grandes 8 10 1 1 0 Pequenas 1 13 10 8 4 0 Fr 1 (x) 0,10 0,6 0,46 0,76 1,00 Fr (x) 0,30 0,6 0,76 0,9 1,00 D 0,0 0,30 0,30 0,16 0,00 0,30 Como as amostras são grandes n > 40, o qui-quadrado deve ser utilizado. Assim: d 1,36 n n n + 1 n 1 0,7 Conclusão Conclusão - SPSS A menos de um erro de % (signiicância), posso airmar que as opiniões dos diretores inanceiros de empresas grandes e pequenas são divergentes. Most Extreme Dierences K-S Z Assymp. Sig. (-tailed) Absolute Positive Negative Result 0,3 0,00-0,3 1,600 0,01 13