Stela Adami Vayego Estatística II CE003/DEST/UFPR

Documentos relacionados
Stela Adami Vayego DEST/UFPR

Stela Adami Vayego DEST/UFPR

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

16/6/2014. Teste Qui-quadrado de independência

Análise Multivariada Aplicada à Contabilidade

Probabilidade e Estatística

AULA 8 Experimentos multinomiais e tabelas de contingência

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Capítulo 6 Estatística não-paramétrica

Métodos Não Paramétricos

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Prof. Lorí Viali, Dr.

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

Intervalos de Confiança

Estimação e Testes de Hipóteses

Bioestatística e Computação II

Estatística aplicada a ensaios clínicos

Análise de Aderência e de Associação

Testes para dados categóricos

Prof. Lorí Viali, Dr.

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior

Por que testes não-paramétricos?

7 Teste de Hipóteses

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

MAE0229 Introdução à Probabilidade e Estatística II

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Capítulo 6 Estatística não-paramétrica

Parte 8 Testes de hipóteses Comparação de dois grupos

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

1 Probabilidade - Modelos Probabilísticos

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

Os testes. O teste de McNemar O teste de Wilcoxon O teste do sinais

O teste qui-quadrado. A variável teste é: χ E. Os testes. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes

TESTES NÃO-PARAMÉTRICOS

Delineamento e Análise Experimental Aula 3

Testes de Aderência, Homogeneidade e Independência

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

- Testes Qui-quadrado - Aderência e Independência

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

1 Teoria da Decisão Estatística

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

Estatística Não Paramétrica. Como construir testes de aderência

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Testes de Hipótese PARA COMPUTAÇÃO

Teste U de Mann-Whitney BRUNA FERNANDA BATTISTUZZI BARBOSA KAUANA SOARES PAULO ROGÉRIO DA SILVA

2. Testes de Independência

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

- Testes Qui-quadrado - Aderência e Independência

Testes de Hipóteses Não Paramétricos

AULA 05 Teste de Hipótese

Testes de Hipóteses Genéticas. Alan Silva. Doutorando PPG-GEN AU08

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Prof. Lorí Viali, Dr.

Testes de Aderência, Homogeneidade e Independência

- Testes Qui-quadrado. - Aderência e Independência

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

Testes de Aderência, Homogeneidade e Independência

TESTE DE MANN-WHITNEY

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Comparando Duas Amostras (abordagem não-paramétrica)

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Conceitos centrais em análise de dados

Teste de Hipóteses Paramétricos

10.3 Métodos estatísticos

Bioestatística. Mestrado Saúde Materno Infantil 2005 Prof. José Eulálio Cabral Filho

- Testes Qui-quadrado - Aderência e Independência

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Análise de Dados Categóricos

Estatística Não Paramétrica

Medidas de associação entre duas variáveis qualitativas

Testes de Aderência Testes de Independência Testes de Homogeneidade

Unidade IV Inferência estatística

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

TESTES NÃO PARAMÉTRICOS (para mediana/média)

Professora Ana Hermínia Andrade. Período

DELINEAMENTO EM BLOCOS AO ACASO

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto

AULA 04 Teste de hipótese

AULA 07 Inferência a Partir de Duas Amostras

Sistema de Informações e Pesquisa de Marketing Aula 12 24/10/17

Métodos Estatísticos Avançados em Epidemiologia

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

CONHECIMENTOS ESPECÍFICOS

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

CONHECIMENTOS ESPECÍFICOS

Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Transcrição:

Resumo 1 Teste de hipóteses não paramétricos Os métodos não-paramétricos fazem poucas suposições sobre a natureza das distribuições dos dados. Não exige que as distribuições nas populações sejam normais, nem são baseados em parâmetros (estimadores) da população. Os testes não-paramétricos são denominados métodos de distribuição livre (free distribution). Vantagens: As técnicas não-paramétricas têm diversas vantagens sobre os métodos paramétricos de inferência estatística. Uma delas é que não incorporam todas as suposições restritivas características dos testes paramétricos, nem exigem que as populações sejam normalmente distribuídas. Os testes não paramétricos, em geral, exigem apenas que a variável em estudo seja ordenável, podendo ser aplicado também para variáveis semiquantitativas e qualitativas. Além disso, por tratarem de ordenações em vez de valores reais das observações, os testes paramétricos podem ser realizados de modo relativamente rápido para pequenas amostras. O uso de postos torna as técnicas não-paramétricas menos sensíveis aos erros de medidas do que os testes paramétricos, permitindo assim o uso de ordinais em vez de dados contínuos. Desvantagens: Se as suposições básicas de um teste paramétrico são satisfeitas, os testes não-paramétricos são menos poderosos do que a técnica paramétrica correspondente, o que significa que, se a hipótese nula for falsa, o teste não-paramétrico exigirá uma amostra maior para fornecer evidências suficientes para rejeitá-la. Além disso, hipóteses testadas por testes não-paramétricos tendem a ser menos específicas do que as testadas por testes tradicionais. Como contam com ordenações em vez de valores das observações, os testes nãoparamétricos não usam toda informação disponível sobre a distribuição. Finalmente, se uma grande proporção de observações são empatadas os desvios-padrão, σ T e σ U, superestimam os valores da estatística, T e U, e correções precisam ser adicionadas aos cálculos. 1.1. Teste dos Postos Sinalizados de Wilcoxon para duas amostras dependentes Alternativa para o teste t. Embora não exista nenhuma suposição sobre a forma da distribuição das observações, o teste é mais poderoso para distribuições simétricas. Hipótese formuladas em função das medianas. H 0 : não existe efeito do tratamento (a diferença mediana é igual a zero ou se a distribuição for simétrica a diferença entre antes e depois é iguas a zero) H A : existe efeito do tratamento (a diferença mediana é diferente de zero ou se a distribuição for simétrica a diferença entre antes e depois é diferente de zero) Para pequenas amostras (até 5 pares), o p-valor deve ser obtido através de uma tabela especial não incluída nesse texto. Para grandes amostras procedimento é: 1) para cada par, determinar a diferença (di) entre os escores, considerando o sinal da diferença; ) considerar as diferenças em valor absoluto, ordená-las e atribuir postos a cada uma delas. No caso de empates, calcular a média dos postos e atribuir, a cada diferença (di) empatada, o posto médio; 3) atribuir a cada posto o sinal positivo (+) ou negativo (-) da respectiva diferença (di); 4) calcular a soma dos postos com sinal negativo e a soma dos postos com sinal positivo. A menor dessas somas, em valor absoluto, atribuir o valor da estatística T; 5) contar o número de pares onde as diferenças (di) são diferente de zero e considerar este número como n (pares onde ocorrem emapates não contribuem para a diferença entre amostras); 6) se n > 5 (grandes amostras), a estatística do teste (T) tem distribuição aproximadamente normal com média T = n n 1 4 ~N(0; 1); 7) calcular o valor de Z e verificar sua significância. n n 1 n 1 e desvio padrão T = 4, de modo que Z = T T T Exemplo 1.1: Ratos submetidos situações estressantes desenvolvem úlceras estomacais. O número de pontos de úlcera e o tamanho desses pontos são indicadores da maior ou menor gravidade do problema. Suponha uma situação em que os tamanhos das úlceras sejam mais ou menos uniformes de tal sorte que o número de pontos seja um indicador razoável da gravidade. Para verificar o efeito de dois tipos de estresse térmico, um prolongado a uma temperatura de 5 o C (G1) e outro agudo a uma temperatura de 0 o C (G), foram utilizados 30 pares de ratos gêmeos, sendo cada elemento do par de gêmeos sorteado para um dos dois grupos. Foram obtidos os resultados apresentado na tabela a seguir. Verifique se existe diferença entre os grupos. 1

G1 G 8 10 3 3 0 0 1 0 4 4 0 0 10 6 30 6 8 7 1 0 40 35 17 14 6 1 7 4 18 19 1 0 4 5 95 90 8 0 7 5 0 38 36 4 7 5 7 57 56 15 11 60 5 10 8 7 4 15 16 1.. Teste U de Mann Whitney para duas amostras independentes Alternativa para o teste t. Para grandes amostras procedimento é: 1) considerar n 1 como o tamanho amostral do menor grupo e o tamanho amostral do maior grupo (se n 1 ) e n = n 1 + ; ) atribuir postos à distribuição conjunta dos valores dos dois grupos, após ordená-los. Estes postos irão de 1 até n se não ocorrerem empates. No caso de ocorrência de empates, utilizar a média dos postos; 3) calcular a soma dos postos nos dois grupos (R 1 e R ); 4) calcular as estatísticas U 1 e U, dadas por: U 1 =n 1 n 1 n 1 1 R 1 e U =n 1 n 1 n 1 1 R ; 5) denomina-se U como o menor valor entre U 1 e U ; 6) para grande amostras (pelo menos 10 em cada grupo), a estatística do teste U tem distribuição aproximadamente normal com média U = n 1 modo que Z = U U U ~N(0; 1); 7) calcular o valor de Z e verificar sua significância. e desvio padrão U = n 1 n 1 1 1, de Exemplo 1.: A avaliação clínica de pacientes submetidos a cirurgia foi feita considerando a variável estado geral do paciente, que pode assumir os valores: 1(péssimo), (ruim), 3(regular), 4(bom) e 5(ótimo). Para comparar dois tipos de cirurgia, 40 pacientes homogêneos quanto à gravidade da doença e outros possíveis fatores interferentes (idade, sexo) foram utilizados, sendo 0 aleatoriamente designados a cada grupo. Um dos pacientes de G1 não foi avaliado. Foram obtidos os dados apresentados na tabela a seguir.

(R1 = 99,5, R = 480,5, U = 109,50, Z=,619 e p=0,037) G1 G 1 1 1 1 1 3 3 3 3 3 3 5 3 5 4 5 5 5 5 1.3. Teste de aderência (qui-quadrado) útil para verificar se a distribuição das freqüências observadas dos dados se ajusta a um modelo teórico prédeterminado; recomendado para amostras grandes ( n > 50 ) e tem por finalidade comparar se as freqüências observadas na amostra estão próximas das freqüências esperadas para um modelo de probabilidade proposto (normal, binomial, poisson, etc); Se as freqüências esperadas não diferirem estatisticamente das freqüências observadas, pode-se inferir que a característica em estudo da população seguem a distribuição proposta; de outra maneira, possui distribuição diversa; O teste que mede a eficiência do ajuste da distribuição, ou seja, o quanto a freqüência observada está próxima da freqüência esperada, daí o nome de aderência, é o teste de quiquadrado ( χ ). Como todo teste estatístico, alguns passos devem ser seguidos até à conclusão. 1o Passo: Formulação das hipóteses H 0 : As freqüências observadas não diferem das freqüências esperadas em relação à distribuição proposta, ou seja, a característica em estudo da população segue a distribuição proposta. H A : As freqüências observadas diferem das freqüências esperadas em relação à distribuição proposta,ou seja, a característica em estudo da população não segue a distribuição proposta. o Passo: Escolha da significância α 3o Passo: Estatística apropriada = O i E i E ~ v ; i onde O i : valores (ou frequências) observadas na i-ésima classe; E i : valores (ou frequências) esperadas na i-ésima classe, supondo H 0 verdadeira; v = k p 1 (v : graus de liberdade; k : número de classes da distribuição de freqüência; p : número de parâmetros estimados ). 4o Passo: Região crítica 5o Passo: Conclusão Exemplo 1.3: Em uma certa população, 100 descedenntes estudados forneceram os seguintes dados: 6 indivíduos com genótipo AA, 45 com o genótipo Aa e 9 com o genótipo aa. Verificar se o modelo genético proposto é adequado para essa população. (Qui calculado = 1,18) 3

Exemplo 1.4: Levantou-se uma amostra de 100 indivíduos de uma população em que se observou a altura das pessoas. A amostra forneceu os seguintes dados (em cm): Altura frequência 150-155 1 155-160 160-165 5 165-170 13 170-175 0 175-180 3 180-185 19 185-190 11 190-195 4 195-00 Verificar se os dados se ajustam (aderem) à uma distribuição normal com um nível de,5% de significâcia, considerandoas estimativas da média e do desvio padrão populacional igualis a 176,85 cm e 8,75 cm, respectivamente. (Qui calculado = 16,01) 1.4. Teste de independência (qui-quadrado) Em pesquisas ou levantamentos feitos por meio de entrevistas, questionários ou fichas, quando o pesquisador classifica os indivíduos amostrados segundo duas ou mais variáveis qualitativas categóricas ou ordinais, a apresentação tabular das freqüências observadas pode ser feita através de uma tabela de contingência, isto é, uma tabela com duas ou mais entradas, cada entrada relativa a uma das variáveis. Com a tabela de contingência, conseguimos uma maneira conveniente de fazer descrição dos dados da amostra quando temos duas ou mais variáveis qualitativas a considerar. Passamos agora à análise dos dados fornecidos pela tabela. Uma indagação que pode ser objeto de um teste bastante simples é se as variáveis qualitativas envolvidas são ou não independentes. Ou seja, podemos desejar testar as hipóteses: H 0: as variáveis são independentes H 1: as variáveis não são independentes, ou seja, elas apresentam algum grau de associação entre si. Tal teste pode ser feito pelo Qui-Quadrado de Pearson, χ = r s i = 1 j = 1 ( Oij E ij ) onde r : o número de linhas do corpo da tabela; s : o número de colunas do corpo da tabela; O ij : a freqüência observada na intersecção da linha i com a coluna j; E ij : a freqüência esperada na intersecção da linha i com a coluna j; n = r s O ij i = 1 j= 1 : o número de elementos da amostra. E ij ~ χ ( υ ) As freqüências esperadas de cada cela da tabela são calculadas por: E ij = x x i + + j n Isso nos fornece a regra prática para o cálculo das freqüências esperadas: multiplicar o total da linha pelo total da coluna e dividir pela freqüência total n. Toda vez que o valor calculado da estatística de teste é igual ou maior que o valor tabelado χ ( υ ), a hipótese nula, H 0, é rejeitada ao nível de significância estipulado. Quanto ao número de graus de liberdade com que a variável de teste χ ( υ ) deverá ser testada, sua determinação pode ser feita verificando-se quantas das freqüências observadas O ij permanecem livres após a 4

determinação das freqüências esperadas. Ora, estas foram determinadas com base na fixação dos totais marginais. Então, respeitados esses totais, o número de valores O ij com grau de liberdade será v = (r - 1) (s - 1), pois fatalmente a última freqüência observada a ser considerada em cada linha ou coluna estará determinada pelo total fixado da linha ou coluna, o que equivale a ter-se uma linha e uma coluna sem graus de liberdade. Exemplo 1.5: Uma amostra de pacientes com câncer de mama de aparência maligna, mas com um pequeno grau de reação inflamatória, foi classificada segundo uma variável qualitativa ordinal: a faixa etária por ocasião do diagnóstico (menos de 50 anos, entre 50 e 70 anos e mais de 70 anos) e uma variável qualitativa categórica: sobrevivência após três anos (sim e não). Os dados estão apresentados Sobrevivência Faixa Etária Sim Não Total Menos de 50 anos 11 6 17 Entre 50 e 70 anos 18 8 6 Mais de 70 anos 15 9 4 Total 44 3 67 Exemplo 1.6: Muitas vezes, uma das variáveis praticamente representa uma classificação dos elementos em populações distintas. Por exemplo, considere uma amostra de 100 pessoas, que foram entrevistadas quanto a suas opiniões sobre um determinado projeto de lei, tendo sido obtidos os resultados Opinião Sexo Favorável Desfavorável Indiferente Totais Homens 33 1 15 60 Mulheres 7 0 10 Totais 40 3 8 100 5