Análise de Dados Categóricos
|
|
|
- Mariana Weber Guterres
- 8 Há anos
- Visualizações:
Transcrição
1 Universidade Federal Fluminense Instituto de Matemática e Estatística Análise de Dados Categóricos Ana Maria Lima de Farias Fábio Nogueira Demarqui Departamento de Estatística Março 2017
2 Sumário 1 Análise de dados categóricos Introdução Dados univariados: Teste de aderência Dados bivariados: Teste de homogeneidade Dados bivariados: Teste de independência Exercícios propostos Solução dos exercícios propostos i
3 Capítulo 1 Análise de dados categóricos 1.1 Introdução Vamos, agora, estudar algumas técnicas de inferências para dados qualitativos. Assim como no estudo anterior de populações normais, vamos considerar os casos de uma população, em que cada indivíduo é classificado segundo alguma variável qualitativa, e duas populações, das quais amostras retiradas podem ser independentes ou dependentes (dados emparelhados) e para cada elemento da amostra são observadas duas variáveis qualitativas. Os objetivos da inferência variam para as diferentes situações. A título de ilustração, vamos considerar os seguintes exemplos. EXEMPLO 1.1 Meio de transporte Em uma pesquisa com alunos da UFF em Niterói, perguntou-se a cada um deles o meio de transporte que utilizavam no trajeto de casa para a universidade. Cada aluno escolhia entre uma das seguintes possibilidades: só ônibus, só barca, ônibus e barca, carro, caminhada/bicicleta. As proporções amostrais P 1, P2, P3, P4 e P 5 são estimadores das verdadeiras proporções populacionais p 1, p 2, p 3, p 4 e p 5 de usuários de cada meio de transporte e um interesse poderia ser testar se p 1 = 0, 60, p 2 = 0, 10, p 3 = 0, 20, p 4 = 0, 05 e p 5 = 0, 05. Esse é um teste de aderência, ou seja, estamos testando se nossos dados são compatíveis com (aderem a) determinada distribuição. EXEMPLO 1.2 Meio de transporte e gênero Ainda no estudo sobre meio de transporte, um interesse poderia ser estudar se há diferença entre homens e mulheres no meio de transporte utilizado. Para isso, amostras independentes de homens e mulheres seriam retiradas da população de todos os estudantes da UFF em Niterói e para cada indivíduo da amostra seriam registradas as variáveis gênero e meio de transporte. O interesse aqui seria testar p 1H = p 1M, p 2H = p 2M, p 3H = p 3M, p 4H = p 4M e p 5H = p 5M, em que p ih e p im representam as proporções de homens e mulheres que utilizam o meio de transporte i. Este é um exemplo de um teste de homogeneidade, ou seja, estamos testando se as populações de homens e mulheres são homogêneas em relação à variável meio de transporte. EXEMPLO 1.3 Meio de transporte e uso do bandejão Continuando com o estudo sobre alunos da UFF em Niterói, outro interesse poderia ser a relação entre meio de transporte utilizado e uso do bandejão da UFF. Assim, para cada aluno da amostra seriam
4 2 CAPÍTULO 1. ANÁLISE DE DADOS CATEGÓRICOS registradas duas variáveis: meio de transporte utilizado e uso do bandejão (Sim ou Não). Agora temos dados emparelhados (amostras dependentes) e nosso interesse é um teste de independência entre as variáveis. Os três testes citados acima se basearão numa estatística que compara as frequências observadas O com as frequências esperadas E sob a suposição de veracidade da hipótese nula. Grandes diferenças entre tais frequências são indicativo de que a hipótese nula não é verdadeira. Mas para termos uma medida de distância, consideraremos as diferenças ao quadrado, isto é, (O E) 2. Além disso, iremos considerar distâncias relativas: uma distância (O E) 2 = 50 será mais relevante para um valor esperado de 30 do que para um valor esperado de 100. Dessa forma, nossa estatística de teste terá a forma final dada por (O i E i ) 2 (1.1) E i i e essa estatística terá (aproximadamente) uma distribuição qui-quadrado com número de graus de liberdade que varia de acordo com o teste considerado. Vamos, agora, detalhar cada um dos testes. 1.2 Dados univariados: Teste de aderência Consideremos uma população descrita por uma variável categórica X que assume k valores (no Exemplo 1.1, X é o meio de transporte com k = 5 categorias). Sejam p 1, p 2,, p k as proporções populacionais das categorias 1, 2,, k, respectivamente. Queremos testar H 0 : p 1 = p 10, p 2 = p 20,, p k = p k0 (1.2) H 1 : p i p i0 para pelo menos um i (1.3) em que p i0, i = 1, 2,, k são as proporções hipotéticas que devem satisfazer k p i0 = 1. Suponha que uma amostra de tamanho n seja selecionada de tal população. Seja n i o número de observações da amostra pertencentes à categoria i, i = 1, 2,, k. Se H 0 é verdadeira, o número esperado de observações na categoria i é e i = np i0 e a estatística de teste é X 2 = k (n i np i0 ) 2 np i0 χ 2 k 1 (1.4) Tal aproximação é boa e i = np i0 5 para todo i = 1, 2,..., k. Valores grandes indicam grandes afastamentos entre os valores observados e esperados; assim, a região crítica para um nível de significância α é X 2 > χ 2 k 1;α (1.5) EXEMPLO 1.4 Meio de transporte continuação Uma amostra de 200 estudantes da UFF de Niterói mostrou que 65 usam apenas ônibus como meio de transporte, 7 usam apenas barca, 20 usam ônibus e barca, 5 usam carro e 2 caminham ou vão de bicicleta até a universidade. Vamos testar Na tabela a seguir ilustram-se os cálculos necessários. H 0 : p 1 = 0, 60, p 2 = 0, 10, p 3 = 0, 20, p 4 = p 5 = 0, 05 (1.6) (1.7)
5 1.3. DADOS BIVARIADOS: TESTE DE HOMOGENEIDADE 3 Categoria i Valor observado O i Valor esperado E i Parcela de X 2 1=Só ônibus , 6 = 120 2=Só barca , 1 = 20 3=Ônibus e barca , 2 = 40 4=Carro , 05 = 10 5=Caminhada/bicicleta , 05 = 10 ( ) (22 20) 2 20 (35 40) 2 40 (9 10) 2 10 (10 10) 2 10 Todos os valores esperados são maiores que 5 e, assim, podemos usar a aproximação qui-quadrado com 4 graus de liberdade. A região crítica é X 2 > 9, 4877 para um nível de significância α = 0, 05. O valor observado da estatística de teste é x0 2 = = = 129 = 1, Como 1, 075 < 9, 4877, não rejeitamos H 0, ou seja, não há evidências de que as proporções populacionais sejam diferentes das hipotéticas. É interessante observar as seguintes propriedades sobre os valores observados e esperados. k e i = n k De fato: e i = k k np i0 = n p i0 = n 1 = n k (n i e i ) = 0 k De fato: (n i e i ) = k k n i e i = n n = Dados bivariados: Teste de homogeneidade Consideremos, agora, a situação em que os indivíduos de pesquisa são classificados de acordo com duas variáveis qualitativas. Podemos resumir as informações através de uma tabela de dupla entrada com as J categorias de uma variável sendo exibidas nas colunas e as I categorias da outra variável nas linhas. Na tabela a seguir ilustra-se a notação a ser utilizada nos testes. O ponto no subscrito indica soma dos valores ao longo da respectiva dimensão. Variável coluna 1 2 J Total de linha 1 n 11 n 12 n 1J n 1 2 n 21 n 22 n 2J n 2 Variável linha I n I1 n I2 n IJ n I Total de coluna n 1 n 2 n J n = n Tabela 1.1 Tabela de dados bivariados
6 4 CAPÍTULO 1. ANÁLISE DE DADOS CATEGÓRICOS n ij = frequência observada na cela (i, j) J n i = n i1 n i2 n ij = n ij (total da linha i) I n j = n 1j n 2j n Ij = n ij (total da coluna j) I n = n = J j=1 n ij j=1 (total de observações na amostra) Um dos contextos que origina dados bivariados é quando amostras independentes são retiradas de várias populações e cada indivíduo ou objeto é classificado de acordo com uma variável qualitativa. Neste caso, uma das variáveis é a que identifica a população e a outra é a que classifica os sujeitos. Em tal contexto, nosso interesse é testar se as proporções em cada categoria são as mesmas em todas as populações. No Exemplo 1.2, as populações são formadas pelos homens e pelas mulheres e a variável de classificação é o meio de transporte. O interesse é testar se as proporções de homens e mulheres que usam cada tipo de transporte são iguais. Na Tabela 1.1, suponhamos que haja J populações com a variável de classificação tendo I categorias. Nosso interesse é testar H 0 : p i1 = p i2 = = p ij i Vamos ver como calcular os valores esperados em cada cela sob a suposição de veracidade de tal hipótese. A proporção de elementos na amostra que pertencem à categoria i é p i = n i n Se não há diferença nas proporções ao longo das populações, então a proporção esperada na categoria i em cada população deve ser igual à proporção na amostra toda. Como há n j elementos na população j, esperamos, então, que uma proporção p i desses elementos esteja na categoria i, ou seja, e ij n j = p i = n i n Isso nos dá que e ij = n i n j n (1.8) Como antes, a estatística de teste é uma medida de distância relativa entre frequências observadas e frequências esperadas: e se e ij 5 i, j X 2 = I j=1 J (n ij e ij ) 2 e ij (1.9) X 2 χ 2 (I 1)(J 1) (1.10) Valores grandes da estatística levam à rejeição da hipótese nula de igualdade das proporções em cada categoria ao longo das populações. EXEMPLO 1.5 Meio de transporte e gênero continuação
7 1.3. DADOS BIVARIADOS: TESTE DE HOMOGENEIDADE 5 Com relação ao Exemplo 1.2, suponhamos que amostras independentes de 300 homens e de 250 mulheres tenham revelado a seguinte distribuição: Frequências observadas Meio de transporte Homens Mulheres Total Ônibus Barca Ônibus e barca Carro Caminhada/bicicleta Total Vamos realizar o teste de homogeneidade, ou seja, vamos testar, ao nível de significância α = 0, 05, se as proporções em cada categoria de meio de transporte são iguais entre homens e mulheres. Para isso, precisamos calcular as frequências esperadas em cada cela. Para a cela (1,1) (Homens que vão de ônibus) temos e 11 = n 1 n = = 105, n 550 De forma análoga obtemos as frequências esperadas para as outras celas, que estão na tabela a seguir: Frequências esperadas Meio de transporte Homens Mulheres Total Ônibus 105, , Barca 36, , Ônibus e barca 55, , Carro 67, , Caminhada/bicicleta 35, , Total Como todas as frequências esperadas são maiores que 5, podemos usar a aproximação qui-quadrado, ou seja, X 2 χ 2 4. Note que o número de graus de liberdade é (5 1)(2 1) = 4 e F 4;0,05 = 9, A parcela da cela (1,1) na estatística qui-quadrado é x 11 = (77 105, 27273)2 105, Na tabela a seguir, apresentamos as contribuições de cada cela: = 7, Contribuição para o X 2 Meio de transporte Homens Mulheres Ônibus 7, ,11173 Barca 3, ,30828 Ônibus e barca 1, ,42592 Carro 11, ,27331 Caminhada/bicicleta 0,3366 0,40392 Somando todas essas celas, obtemos X 2 = 54, 1258 > 9, Dessa forma, rejeitamos a hipótese nula, ou seja, as proporções em cada categoria de meio de transporte não são iguais entre homens e mulheres. Analisando a tabela das contribuições, podemos ver que as maiores diferenças estão nas categorias de ônibus e carro. Há mais mulheres utilizando ônibus e mais homens utilizando carros do que se esperaria. Na Figura 1.1 temo a saída do programa Minitab para essa análise.
8 6 CAPÍTULO 1. ANÁLISE DE DADOS CATEGÓRICOS Figura 1.1 saída do Minitab para o Exemplo 1.5 As mesmas propriedades sobre os valores observados e esperados coninuam valendo. I J e ij = n j=1 De fato: I J e ij = 1 n j=1 I n i J n j = 1 n n n = n j=1 I J (n ij e ij ) = 0 j=1 De fato: I J (n ij e ij ) = j=1 I J I J n ij e ij = n n = 0 j=1 j=1 1.4 Dados bivariados: Teste de independência Consideremos, agora, o caso de dados emparelhados, ou seja, cada indivíduo da amostra é classificado segundo duas variáveis qualitativas X e Y. Embora a representação tabular dos dados amostrais seja a mesma apresentada na Tabela 1.1, a interpretação e uso dos dados é completamente
9 1.5. EXERCÍCIOS PROPOSTOS 7 diferente. Em cada cela, a contagem n ij nos dá o número de sujeitos para os quais X = i e Y = j; nosso interesse é determinar se as variáveis X e Y são independentes. Sabemos que, se X e Y são independentes, então Então, sob a veracidade de H 0, temos que ter P(X = i, Y = j) = P(X = i) P(Y = j) e ij n = n i n n j n = e ij = n i n j n Se todas as frequências esperadas forem de pelo menos 5, pode-se mostrar que X 2 = I J (n ij e ij ) 2 j=1 e ij χ 2 (I 1)(J 1) (1.11) EXEMPLO 1.6 Meio de transporte e uso do bandejão continuação A título de ilustração da diferença de interpretação da estatística qui-quadrado no contexto de dados emparelhados, vamos considerar os mesmos dados do exemplo anterior, mas agora representando uma amostra de 550 alunos, dos quais 300 usam o bandejão e 250 não usam, de acordo com a seguinte distribuição: Meio de transporte Usa bandejão Não usa bandejão Total Ônibus Barca Ônibus e barca Carro Caminhada/bicicleta Total O cálculo das frequências esperadas e da estatística de teste é o mesmo e concluímos, ao nível de significância α = 0, 05, que as variáveis meio de transporte e uso do bandejão não são independentes. 1.5 Exercícios propostos 1. Em recente estudo, obteve-se uma amostra aleatória de proprietários de pequenas empresas, e pediu-se a cada um que apontasse o maior problema enfrentado por sua empresa. Os resultados são apresentados na seguinte tabela de frequências de uma entrada. Problema Frequência Custo do seguro saúde 430 Seguro de responsabilidade 145 Indenização ao trabalhador 135 Custo de combustíveis 90 Em um relatório econômico, as verdadeiras proporções para cada categoria foram dadas como 0,50, 0,20, 0,20 e 0,10. Esses dados fornecem alguma evidência que contradiga o relatório econômico? Ache limites para o valor P associado a esse teste.
10 8 CAPÍTULO 1. ANÁLISE DE DADOS CATEGÓRICOS 2. Os escritórios de admissão dos campi da Universidade da Califórnia mantêm registros históricos cuidadosos dos candidatos. Em 2008, as proporções de estudantes que se candidataram para as faculdades do sistema universitário por localização na Califórnia foram as seguintes: Los Angeles (LA), 29,2%; San Francisco (SF), 26,1%; Orange County (OC), 9,9%; Riverside/San Bernardino (RS), 7,7%; todas as outras (O), 27,1%.1 Suponha que se tenha obtido uma amostra aleatória de candidatos em 2009 para a qual foram obtidas as seguintes frequências para as localizações. Localização LA SF OC RS O Frequência Há alguma evidência de mudança na proporção de candidatos por localização na Califórnia? Use α = 0, Embora a harmonização de alimento e vinho seja subjetiva e uma ciência não exata, tradicionalmente diz-se que vinho tinto combina com carne vermelha, e vinho branco combina com peixe e aves. Obtevese uma amostra aleatória de jantares em restaurantes quatro estrelas, e cada jantar foi classificado de acordo com a comida e o vinho pedido. Eis a tabela de frequências de dupla entrada resultante. Comida Vinho Tinto Branco Carne vermelha Peixe ou ave Há alguma evidência de que a comida e o vinho sejam dependentes? Teste a hipótese relevante com α = 0, 005. Esses dados sugerem que os jantares ainda estejam seguindo as harmonizações tradicionais de comida e vinho? 4. Obtiveram-se amostras aleatórias de apostadores em quatro cassinos de Las Vegas, e perguntou-se a cada apostador qual jogo jogava mais. Os resultados são apresentados na tabela de frequências de dupla entrada que segue. Jogo Blackjack Pôquer Roleta Caça-níquel Bellagio Cassino Caesar s Golden Nugget Harrah s Realize um teste para homogeneidade de populações. Há alguma evidência que sugira que a verdadeira proporção de apostadores em cada jogo não seja a mesma para todos os cassinos? Use α = 0, Foram obtidas amostras aleatórias de clientes de duas lojas diferentes de material para escritório, e perguntou-se a cada cliente qual tipo de recurso para escrita preferiam. Os resultados estão resumidos na seguinte tabela de frequências de dupla entrada. Loja Recurso para escrita Lápis Lapiseira Caneta Casa Cruz Kalunga Realize um teste para homogeneidade de populações. Use α = 0, 01. Estabeleça sua conclusão, justifique sua resposta e ache limites para o valor P associado a esse teste.
11 1.6. SOLUÇÃO DOS EXERCÍCIOS PROPOSTOS Solução dos exercícios propostos 1. Teste de aderência p 10 = 0, 5 p 20 = 0, 2 p 30 = 0, 2 p 40 = 0, 1 H 0 : p i = p i0 i H 1 : pelo menos um p i p i0 Sob H 0, as frequências esperadas são E 1 = 0, = 400 E 2 = 0, = 160 E 3 = 0, = 160 E 4 = 0, = 80 E i 5 i aproximação qui-quadrado OK! k = 4 χ3;0,05 2 = 7, 815 Valor observado da estatística de teste: χ 2 0 = ( )2 400 ( )2 160 ( )2 160 (90 80)2 80 = 8, 8125 Rejeita-se H 0 ; há evidências, ao nível de 5%, de que pelo menos uma das proporções p i é diferente do valor dado no relatório. Veja saída do Minitab na Figura Teste de aderência Figura 1.2 Saída do Minitab para o Exercício 1 p LA,0 = 0, 292 p SF,0 = 0, 261 p OC,0 = 0, 099 p RS,0 = 0, 077 p O,0 = 0, 271 H 0 : p i = p i0 i H 1 : pelo menos um p i p i0
12 10 CAPÍTULO 1. ANÁLISE DE DADOS CATEGÓRICOS Sob H 0, as frequências esperadas são E LA = 0, = 127, 896 E SF = 0, = 114, 318 E OC = 0, = 43, 362 E RS = 0, = 33, 726 E O = 0, = 118, 698 E i 5 i aproximação qui-quadrado OK! k = 5 χ4;0,005 2 = 14, 860 Valor observado da estatística de teste: χ 2 0 = ( , 896)2 127, 896 (96 114, 318)2 114, 318 (45 43, 362)2 43, 362 (44 33, 726)2 33, 726 ( , 698)2 118, 698 Rejeita-se H 0 ; há evidências, ao nível de 0,5%, de que pelo menos uma das proporções p i de 2009 é diferente do valor em Veja saída do Minitab na Figura 1.3. = 6, Dados emparelhados - teste de independência Figura 1.3 Saída do Minitab para o Exercício 2 Sob H 0, as frequências esperadas são H 0 : vinho e carne são independentes H 1 : vinho e carne não são independentes e 11 = = 72, 9756 e 12 = = 59, e 21 = = 63, 0244 e 12 = = 50,
13 1.6. SOLUÇÃO DOS EXERCÍCIOS PROPOSTOS 11 E i 5 i aproximação qui-quadrado OK! gl = (2 1)(2 1) = 1 χ1;0,005 2 observado da estatística de teste: = 7, 879 Valor χ 2 0 = (86 72, 9756)2 72, 9756 (46 59, 0244)2 59, 0244 (50 63, 0244)2 63, 0244 (64 50, 9756)2 50, 9756 = 11, 2178 Rejeita-se H 0 ; há evidências, ao nível de 0,5%, de que as variáveis escolha do vinho e escolha da carne não são independentes. Veja saída do Minitab na Figura 1.4. Figura 1.4 Saída do Minitab para o Exercício 3 4. Teste de homogeneidade O objetivo é testar se as proporções de usuários de cda tipo de recurso de escrita são as mesmas para as 2 lojas. Na Figura 1.6 temos a saída o Minitab. Aí podemos ver que todas as frequências esperadas são maiores que 5, o que permite o uso da aproximação qui-quadrado. O número de graus de liberdade é gl = (2 1)(3 1) = 2 e o valor crítico para α = 0, 01 é 9,210. O valor da estatística de teste é 13,388, o que nos leva à rejeição da hipótese nula, ou seja, as proporções de usuários dos diferentes tipos de recursos não são as mesmas nas 2 lojas. Pela tabela, temos que o valor P está entre 0,001 e 0,005. O Minitab dá P = 0, 001, mas o valor mais preciso é 0, Teste de homogeneidade O objetivo é testar se as proporções de jogadores em cada um dos jogos são as mesmas nos 4 cassinos. Na Figura 1.5 temos a saída o Minitab. Aí podemos ver que todas as frequências esperadas são maiores que 5, o que permite o uso da aproximação qui-quadrado. O número de graus de liberdade é gl = (4 1)(4 1) = 9 e o valor crítico para α = 0, 05 é 16,919. O valor da estatística de teste é 18,801, o que nos leva à rejeição da hipótese nula, ou seja, as proporções de jogadores nos diferentes jogos não são as mesmas em todos os cassinos. Pela tabela, temos que o valor P está entre 0,025 e 0,05. O Minitab dá P = 0, 027.
14 12 CAPÍTULO 1. ANÁLISE DE DADOS CATEGÓRICOS Figura 1.5 Saída do Minitab para o Exercício 4 Figura 1.6 Saída do Minitab para o Exercício 5
Aula 16: Análise de Aderência e Associação
Aula 16: Análise de Aderência e Associação Professor: José Luiz Padilha da Silva email: [email protected] Departamento de Estatística Universidade Federal do Paraná Curitiba, 2018 José Luiz Padilha da
Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Testes de Hipóteses Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais
- Testes Qui-quadrado - Aderência e Independência
- Testes Qui-quadrado - Aderência e Independência 1 1. Testes de Aderência Objetivo: Testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados Exemplo 1: Segundo Mendel (geneticista
Testes para dados categóricos
Testes para dados categóricos Teste de homogeneidade Objetivo: testar se existe diferença entre frequências observadas (O ij ) e frequências esperadas (E ij ). Dados amostrais: amostras aleatórias independentes
MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência
MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência Introdução 1 Muito frequentemente fazemos perguntas do tipo se alguma coisa tem relação com outra. Estatisticamente
- Testes Qui-quadrado - Aderência e Independência
- Testes Qui-quadrado - Aderência e Independência 1 1. Testes de Aderência Objetivo: Testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados Exemplo 1: Segundo Mendel (geneticista
2. Testes de Independência
. Testes de Independência Objetivo: Verificar se existe independência entre duas variáveis medidas nas mesmas unidades experimentais. Exemplo 3: A Associação de Imprensa do Estado de São Paulo fez um levantamento
Inferência a partir de duas amostras
Inferência a partir de duas amostras Inferência a partir de duas amostras. Inferência sobre duas médias: amostras dependentes. Inferência sobre duas médias: amostras grandes e independêntes 3. Comparação
Medidas de associação entre duas variáveis qualitativas
Medidas de associação entre duas variáveis qualitativas Hoje vamos analisar duas variáveis qualitativas (categóricas) conjuntamente com o objetivo de verificar se existe alguma relação entre elas. Vamos
AULA 8 Experimentos multinomiais e tabelas de contingência
1 AULA 8 Experimentos multinomiais e tabelas de contingência Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas
Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07
-027/031 07/06/2018 10:07 9 ESQUEMA DO CAPÍTULO 9.1 TESTE DE HIPÓTESES 9.2 TESTES PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 9.3 TESTES PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA
X 2. (σ 2 + µ 2 ) = 1 n (nσ 2 + nµ 2 ) = σ 2 + µ 2. µ = 0 E(T ) = σ 2
Estatística II (GET00182) Turma A1 Prova 1 20/10/2017 2/2017 NOME: GABARITO 1. Seja X 1, X 2,, X n uma amostra aleatória simples de uma população X com média µ e variância σ 2. (a) Mostre que, se µ = 0,
TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA
TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma
(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC
Exercício 1 Contexto: amostras independentes de populações normais (a) Teste e IC para Duas Variâncias Método Hipótese nula Variância(Primeiro) / Variância(Segundo) = 1 Hipótese alternativa Variância(Primeiro)
Estimação e Testes de Hipóteses
Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda
AULA 07 Inferência a Partir de Duas Amostras
1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,
Stela Adami Vayego Estatística II CE003/DEST/UFPR
Resumo 1 Teste de hipóteses não paramétricos Os métodos não-paramétricos fazem poucas suposições sobre a natureza das distribuições dos dados. Não exige que as distribuições nas populações sejam normais,
CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO
CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO Ana Paula Araujo Correa Eder Queiroz Newton Trevisan DEFINIÇÃO É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis
Inferência para Duas Populações
Universidade Federal Fluminense Instituto de Matemática e Estatística Inferência para Duas Populações Ana Maria Lima de Farias Fábio Nogueira Demarqui Departamento de Estatística Março 07 Sumário Inferência
Inferência para Duas Populações
Universidade Federal Fluminense Instituto de Matemática e Estatística Inferência para Duas Populações Ana Maria Lima de Farias Fábio Nogueira Demarqui Departamento de Estatística Março 07 Sumário Conceitos
MAE Introdução à Probabilidade e Estatística II Resolução Lista 5
MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão
INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p
INFERÊNCIA ESTATÍSTICA ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p Objetivo Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir
GET00182 Estatística II Aula de exercícios 13/11/2017 Profa. Ana Maria Farias. Considerações gerais
GET0018 Estatística II Aula de exercícios 13/11/017 Profa. Ana Maria Farias Considerações gerais Vocês têm que prestar atenção na construção da estatística de teste, que tem que seguir a especificação
7 Teste de Hipóteses
7 Teste de Hipóteses 7-1 Aspectos Gerais 7-2 Fundamentos do Teste de Hipóteses 7-3 Teste de uma Afirmação sobre a Média: Grandes Amostras 7-4 Teste de uma Afirmação sobre a Média : Pequenas Amostras 7-5
Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó
Lista 2 - Amostragem - Testes de aderência, homogeneidade, independência - Testes ANOVA Parte 1: AMOSTRAS E AMOSTRAGEM 1.1. A empresa Highwaytohell deseja conhecer o tempo médio de vida de seus pneus.
Testes de Hipótese para uma única Amostra - parte II
Testes de Hipótese para uma única Amostra - parte II 2012/02 1 Teste para média com variância conhecida 2 3 Objetivos Ao final deste capítulo você deve ser capaz de: Testar hipóteses para média de uma
Testes de Aderência, Homogeneidade e Independência
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa
Testes de Aderência, Homogeneidade e Independência
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa
Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski
Testes de hipóteses Wagner H. Bonat Fernando P. Mayer Elias T. Krainski Universidade Federal do Paraná Departamento de Estatística Laboratório de Estatística e Geoinformação 07/06/2018 WB, FM, EK ( LEG/DEST/UFPR
1 Teoria da Decisão Estatística
1 Teoria da Decisão Estatística 1.1 Teste de Hipótese É uma metodologia estatística que permite tomar decisão sobre uma ou mais populações baseando no conhecimento de informações da amostra. Ao tentarmos
- Testes Qui-quadrado - Aderência e Independência
- Testes Qui-quadrado - Aderência e Independência 1 1. Testes de Aderência Objetivo: Testar a validade de um modelo probabilístico discreto a um conjunto de dados observados Exemplo 1: Segundo Mendel (geneticista
Testes de hipóteses com duas amostras CURSO DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA. Módulo: ESTIMATIVA E TESTE DE HIPÓTESE.
CURSO DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA Módulo: ESTIMATIVA E TESTE DE HIPÓTESE slide Testes de hipóteses com duas amostras slide Larson/Farber 4th ed Descrição - Testar a diferença entre médias
Universidade Federal do Paraná Seminário de Bioestatistica. Teste de Wilcoxon. Danielle Pierin Olivia Cleto
Universidade Federal do Paraná Seminário de Bioestatistica Teste de Wilcoxon Danielle Pierin Olivia Cleto Teste de Postos com Sinais de Wilcoxon para Pares Combinados Esse teste é usado com dados amostrais
Capítulo 4 Inferência Estatística
Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a diferença de
- Testes Qui-quadrado. - Aderência e Independência
- Testes Qui-quadrado - Aderência e Independência 1 1. Testes de Aderência Objetivo: Testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados Exemplo 1: 1 Genética Equilíbrio
Testes de Aderência, Homogeneidade e Independência
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa
AULA 05 Teste de Hipótese
1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução
Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese
Teste de Hipótese Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral 2 Fundamentos do teste de hipótese z 3 Teste de uma afirmativa sobre uma Proporção z 4 Teste de uma afirmativa
Intervalos de Confiança
Intervalos de Confiança INTERVALOS DE CONFIANÇA.1 Conceitos básicos.1.1 Parâmetro e estatística Parâmetro é a descrição numérica de uma característica da população. Estatística é a descrição numérica de
Estatística aplicada a ensaios clínicos
Estatística aplicada a ensaios clínicos RAL - 5838 Luís Vicente Garcia [email protected] Faculdade de Medicina de Ribeirão Preto Estatística aplicada a ensaios clínicos aula 12 1 grupo 2 grupos > 2
1. (a) Lembre-se que a média de uma variável aleatória discreta é uma média ponderada de seus valores, com as probabilidades sendo os pesos.
GET00172 - Fundamentos de Estatística Aplicada Gabarito da Lista de Exercícios Inferência rofa. Ana Maria Farias 1. a Lembre-se que a média de uma variável aleatória discreta é uma média ponderada de seus
Inferência para duas populações
Inferência para duas populações Capítulo 13, Estatística Básica (Bussab&Morettin, 8a Edição) 7a AULA 27/04/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 7a aula (27/04/2015) MAE229 1 / 27 1.
Professora Ana Hermínia Andrade. Período
Teste de Hipóteses Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2016.1 Teste de Hipóteses O Teste de Hipóteses
Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó. Categoria O 1 O 2 O 3 O 4 Freqüência
Lista 2 - Testes de aderência, homogeneidade, independência - Testes ANOVA Parte 1: ADERÊNCIA, HOMOGENEIDADE E INDEPENDÊNCIA 1.1. Um modelo de estudos de populações considera que elas podem ser classificadas
Probabilidade e Estatística
Probabilidade e Estatística Aula 9 Fundamentos de Testes de Hipóteses Leitura: Devore, Capítulo 8 Chap 9-1 Objetivos Neste capítulo, vamos aprender: Os princípios básicos de testes de hipóteses Estabelecer
Testes de Hipótese para uma única Amostra - parte II
Testes de Hipótese para uma única Amostra - parte II 01 de Julho de 2014 Objetivos Ao final deste capítulo você deve ser capaz de: Testar hipóteses para média de uma população. Serão usadas as distribuições
Testes de Aderência Testes de Independência Testes de Homogeneidade
Testes de Aderência Testes de Independência Testes de Homogeneidade 1 1. Testes de Aderência Objetivo: Testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados Exemplo 1: Genética
Análise de Aderência e de Associação
Análise de Aderência e de Associação Capítulo 14, Estatística Básica (Bussab & Morettin, 8a Edição) Capítulo 8, Introdução Computacional à Probabilidade e Estatística (Pedrosa & Gama, Porto Editora) 8a
Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Testes de Hipóteses Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais
TESTES NÃO-PARAMÉTRICOS
Les-0773: ESTATÍSTICA APLICADA III TESTES NÃO-PARAMÉTRICOS AULA 3 26/05/17 Prof a Lilian M. Lima Cunha Maio de 2017 Revisão... Teste dos Sinais A Comparar valores de medianas de uma amostra com um valor
1. Hipótese nula H0 é uma hipótese que contém uma afirmação de igualdade, tal como, = ou.
Aula 8 Testes de hipóteses Introdução Teste de hipótese é um processo que usa estatísticas amostrais para testar a afirmação sobre o valor de um parâmetro populacional. Pesquisas em campos tais como medicina,
MAE0229 Introdução à Probabilidade e Estatística II
Exercício A fim de comparar os salários médios anuais de executivos e executivas de uma determinada cidade, amostras aleatórias de n = 26 executivos e n 2 = 24 executivas foram coletadas obtendose os valores
Capítulo 6 Estatística não-paramétrica
Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Testes dos sinais e de Wilcoxon Teste de Mann-Whitney Teste
Distribuição F: testando a variância
Estatística plicada II Comparação das variâncias de Duas populações Normais UL 6/09/6 Prof a Lilian M. Lima Cunha Distribuição F: testando a variância -Testar igualdade de variâncias entre populações -
Teste Qui-Quadrado para Independência Texto criado na data. 7 de novembro de 2018
Teste Qui-Quadrado para Independência Texto criado na data 7 de novembro de 2018 Exemplo 1. Um exemplo típico do tema Teste de Independência. Os resultados da classificação de pessoas segundo a cor dos
Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Teste de hipótese Queremos saber se a evidência que temos em mãos significa que encontramos
Razão para rejeitar H 0
Processo do teste de hipótese Hipótese de pesquisa: a idade média da população é 5 H : μ = 5 H 1 : μ 5 É X = improvável se μ =5? População Selecionar amostra aleatória Sim: Rejeite Ho Para definir pouco
AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2
AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2 Susan Schommer Econometria I - IE/UFRJ Testes de hipóteses sobre combinação linear dos parâmetros Na aula passada testamos hipóteses sobre
Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó
Lista 2 - Amostragem - Testes de aderência, homogeneidade, independência - Testes ANOVA Parte 1: AMOSTRAS E AMOSTRAGEM 1.1. A empresa Highwaytohell deseja conhecer o tempo médio de vida de seus pneus.
Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Teste de Hipóteses
Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo Teste de Hipóteses Professora Renata Alcarde Sermarini Piracicaba maio 2014 Renata Alcarde Sermarini Estatística Geral 5 de Junho
TESTE DE HIPÓTESE. Introdução
TESTE DE HIPÓTESE Introdução O teste de hipótese estatística objetiva decidir se uma afirmação sobre uma população, usualmente um parâmetro desta, é, ou não, apoiada pela evidência obtida dos dados amostrais.
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 2 de Agosto de 2013 3 Modelos de Poisson podem ser usados para analisar tabelas de contingência.
Testes de Hipóteses Paramétricos
Testes de Hipóteses Paramétricos Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução Exemplos Testar se mais de metade da população irá consumir um novo produto
X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H
NOÇÕES DE TESTE DE HIPÓTESES (II) Nível Descritivo valor P Resumo X ~ Binomial (n ; p) (1) Estabelecer as hipóteses sobre p: H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) (2) Escolher um nível de
TESTE DE HIPÓTESES NÍVEL DESCRITIVO
TESTE DE HIPÓTESES NÍVEL DESCRITIVO Exemplo 2: A diretoria de uma escola acredita que neste ano a proporção p de alunos usuários da Internet é maior que os 70% encontrados no ano anterior. Se uma pesquisa
AULA 04 Teste de hipótese
1 AULA 04 Teste de hipótese Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal
ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt
ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt [email protected] Estimação de parâmetros Média Variância Proporção Estimação de parâmetros Média: " estimador
Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados Aula 6 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise de dados bivariada: os casos dos testes de proporções para duas amostras independentes e emparelhadas
Testes de Hipóteses Paramétricos
Testes de Hipóteses Paramétricos Departamento de Matemática Escola Superior de Tecnologia de Viseu (DepMAT ESTV) Testes de Hipóteses Paramétricos 1 / 41 Introdução. Hipóteses Estatísticas. Erro Tipo I
mat.ufrgs..ufrgs.br br/~viali/ mat.ufrgs..ufrgs.br
Prof. Lorí Viali, Dr. http://www. ://www.mat mat.ufrgs..ufrgs.br br/~viali/ viali@mat mat.ufrgs..ufrgs.br Média Uma amostra Proporção Variância Dependentes Diferença de médias m Duas amostras Independentes
Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)
Prof. Lorí Viali, Dr. http://www.mat.ufrgs.br/viali/ [email protected] Os testes O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos) William Gemmell Cochran (1909-1980)
Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p
Inferência Estatística Básica Teste de Hipóteses para uma média populacional Cálculo do Valor p Exemplo 1 Um restaurante compra frangos abatidos inteiros com peso médio de 3 Kg há vários anos de um mesmo
Probabilidade e Estatística
Probabilidade e Estatística Teste Qui-quadrado Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva Teste Qui-quadrado É um teste não paramétrico, pois independe dos parâmetros
Testes t para comparação de médias de dois grupos independentes
Testes t para comparação de médias de dois grupos independentes Acadêmicas do curso de Zootecnia - Aline Cristina Berbet Lopes Amanda da Cruz Leinioski Larissa Ceccon Universidade Federal do Paraná UFPR/2015
Inferência para várias populações normais análise de variância (ANOVA)
Inferência para várias populações normais análise de variância (ANOVA) Capítulo 15, Estatística Básica (Bussab&Morettin, 8a Edição) 9a AULA 11/05/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues
TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)
TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição
MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 3 4 5 6 7 8 9 10 11 1 13 14 15 e 16 Introdução à probabilidade (eventos,
Capítulo 6 Estatística não-paramétrica
Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Algumas considerações Slide 2 As secções deste capítulo referem-se
Distribuições Amostrais
Distribuições Amostrais 1 Da população, com parâmetro, retira-se k amostras de tamanho n e calcula-se a estatística. Estas estatísticas são as estimativas de. As estatísticas, sendo variáveis aleatórias,
AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2
AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2 Susan Schommer Econometria I - IE/UFRJ Testes de hipóteses sobre combinação linear dos parâmetros Na aula passada testamos hipóteses sobre
A teoria postulada por Mendel estabelece que a segregação, neste caso, deve ocorrer na seguinte proporção: 9/16 : 3/16 : 3/16 : 1/16
O teste de χ 2 tem como objetivo verificar se existe associação entre duas, ou mais, variáveis qualitativas. Este teste faz uma comparação entre a freqüência observada e a freqüência esperada. Existem
Correlação e Regressão
Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe
Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.
Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Distribuições Amostrais O intuito de fazer uma amostragem
TÉCNICAS DE AMOSTRAGEM
TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Amostragem estratificada Divisão da população em
