SLIDES DE APOIO. (aulas teóricas) J. Cadima (ISA) Estatística e Delineamento / 476

Documentos relacionados
Breve revisão sobre Testes de Hipóteses

SLIDES DE APOIO. (aulas teóricas) J. Cadima (ISA - ULisboa) Estatística e Delineamento / 461

SLIDES DE APOIO. (aulas teóricas) J. Cadima (ISA) Estatística e Delineamento / 475

Estatística Descritiva SLIDES DE APOIO. A Inferência Estatística (cont.) Inferência Estatística POPULACAO. AMOSTRA (conhecida)

Estatística Descritiva SLIDES DE APOIO. A Inferência Estatística (cont.) Inferência Estatística POPULACAO. AMOSTRA (conhecida)

= Assim, toma-se ˆp= x m =

INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 2014/15 Resoluções de exercícios de testes com a estatística de Pearson

INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO Resoluções de exercícios de testes com a estatística de Pearson

AULA 05 Teste de Hipótese

Estimação e Testes de Hipóteses

É dada uma tabela de contingências, sendo os factores de classificação as proveniências (a=3 níveis) e os terrenos (b=3 níveis).

= < 5. O segundo menor valor esperado estimado corresponde à célula (3,3), com Ê33 = 29 30

Capítulo 4 Inferência Estatística

AULA 04 Teste de hipótese

Estatística e Delineamento

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Análise de Aderência e de Associação

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

b χ 2 (a 1)(b 1), sob H 0,

TESTE DE HIPÓTESE. Introdução

Capítulo 6 Estatística não-paramétrica

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Capítulo 6 Estatística não-paramétrica

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses Paramétricos

Teste de hipóteses para proporção populacional p

Testes de Hipóteses Paramétricos

Prof. Lorí Viali, Dr.

Inferência para duas populações

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

7 Teste de Hipóteses

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

AULA 07 Inferência a Partir de Duas Amostras

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

1 Teoria da Decisão Estatística

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

= = Assim, o valor estimado de p será ˆp= x m =

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Aula 6. Testes de Hipóteses Paramétricos (I)

Testes de Hipóteses I

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Estatística e Modelos Probabilísticos - COE241

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

Probabilidade e Estatística

Professora Ana Hermínia Andrade. Período

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

Inferência Estatística

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

b χ 2 (a 1)(b 1), sob H 0,

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Estatística e Delineamento

Inferência para várias populações normais análise de variância (ANOVA)

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Unidade IV Inferência estatística

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

AULA 11 Teste de Hipótese

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Inferência Estatistica

1 Probabilidade - Modelos Probabilísticos

Filho, não é um bicho: chama-se Estatística!

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

Aula 2 Uma breve revisão sobre modelos lineares

Teste de hipóteses Página 1 de 8. Teste de hipóteses

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Cap. 4 - Estimação por Intervalo

Introdução à probabilidade e estatística II

( ) = σ 2. Capítulo 8 - Testes de hipóteses. 8.1 Introdução

Inferência estatística

ESTATÍSTICA ECONÔMICA A 6EMA

Fernando de Pol Mayer

7. Testes de Hipóteses

INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 23 de Janeiro, 2017 SEGUNDO EXAME Uma resolução possível

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Introdução à Probabilidade e à Estatística II

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Testes de Hipótese para uma única Amostra - parte II

Intervalos de Confiança

Aula 8 - Testes de hipóteses

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Intervalos de Confiança

Catarina Marques. Estatística II Licenciatura em Gestão. Conceitos: População, Unidade Estatística e Amostra

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

Final exam June 25, 2007 Statistics II

Transcrição:

SLIDES DE APOIO (aulas teóricas) J. Cadima (ISA) Estatística e Delineamento 2016-17 17 / 476

Estatística Descritiva É útil dividir a metodologia estatística em duas grandes classes: descritiva e inferencial. Estatística Descritiva: Métodos visando organizar, apresentar e extrair informação dum conjunto de dados. Os dados podem ser relativos a uma população inteira (censo), a uma amostra (aleatória ou não). As conclusões apenas dizem respeito às entidades observadas. Exemplos de ferramentas descritivas: Para dados de uma só variável Cálculo de indicadores (média, variância, quantis, etc.). Tabelas de frequências. Histogramas, boxplots ou outras ferramentas gráficas. Para dados relativos a duas variáveis Indicadores (Coeficientes de correlação, covariâncias, etc..) Nuvens de pontos (e, se for adequado, rectas de regressão) J. Cadima (ISA) Estatística e Delineamento 2016-17 18 / 476

Inferência Estatística O problema conceptualmente mais complexo, de procurar conclusões relativas a um conjunto vasto de elementos (a população), a partir da observação apenas dum subconjunto dessa população (a amostra) designa-se inferência. Para que se possa falar em inferência estatística, é necessário que a amostra tenha sido escolhida de forma aleatória. A inferência estatística baseia-se na Teoria de Probabilidades, que estuda os fenómenos aleatórios. Exemplos de ferramentas inferenciais: Estimadores e estudo das suas propriedades. Intervalos de confiança para parâmetros populacionais. Testes de Hipóteses. J. Cadima (ISA) Estatística e Delineamento 2016-17 19 / 476

A Inferência Estatística (cont.) POPULACAO (desconhecida) AMOSTRAGEM ALEATORIA INFERENCIA ESTATISTICA AMOSTRA (conhecida) J. Cadima (ISA) Estatística e Delineamento 2016-17 20 / 476

Breve revisão sobre Testes de Hipóteses Na UC Estatística, dos primeiros ciclos do ISA, estudam-se técnicas de Estatística Descritiva e de Inferência Estatística. Em particular, estudam-se Testes de Hipóteses para indicadores quantitativos de populações: média µ duma população; variância σ 2 duma população; comparação de médias de duas populações (µ 1 µ 2 ); comparação de variâncias de duas populações ( σ 1 2 ). σ2 2 As hipóteses dizem respeito à população. Opta-se entre hipóteses alternativas com base numa amostra aleatória dessa população (Estatística 2014, Cap.III - Introdução à Inferência Estatística: Acetatos p.161-185, Apontamentos p.142-147). J. Cadima (ISA) Estatística e Delineamento 2016-17 21 / 476

Revisão de Testes de Hipóteses Num teste de Hipóteses há cinco passos a seguir. Exemplificamos estes cinco passos no contexto dum teste (que se presume ter sido já estudado) a uma média populacional µ. O objectivo é testar alguma afirmação sobre o valor médio µ duma variável numérica X numa dada população, por exemplo, saber se é admissível que µ = 5. A informação de que se dispõe diz respeito a uma amostra concreta: (x 1,x 2,...,x n ), que se admite ser a concretização dum amostra aleatória: (X 1,X 2,...,X n ). Uma amostra aleatória é uma colecção de variáveis aleatórias X i (em geral, independentes e identicamente distribuídas). J. Cadima (ISA) Estatística e Delineamento 2016-17 22 / 476

Testes de Hipóteses (cont.) POPULACAO AMOSTRAGEM ALEATORIA INFERENCIA ESTATISTICA Amostra concreta Universo de amostras Uma amostra aleatória é a ferramenta para descrever a possibilidade de sair qualquer uma das possíveis amostras concretas. J. Cadima (ISA) Estatística e Delineamento 2016-17 23 / 476

Testes de Hipóteses (cont.) Informação disponível: uma amostra concreta (x 1,x 2,...,x n ), com: a dimensão da amostra, n; n o valor médio na amostra, x = 1 n x i ; e i=1 o desvio padrão amostral, s= 1 (x i x) 2. n n 1 i=1 a Teoria de Probabilidades, que permite (sob certas condições) conhecer a distribuição de probabilidades dum estimador de µ, em particular, do estimador X = 1 n n i=1 X i. Ou seja, permite conhecer a distribuição dos valores das médias amostrais x de cada amostra concreta, ao longo do universo de possíveis amostras. J. Cadima (ISA) Estatística e Delineamento 2016-17 24 / 476

Testes de Hipóteses: Passo 1 Passo 1. Formulam-se as hipóteses em confronto Hipótese Nula H 0 Hipótese Alternativa H 1 Há que distinguir entre: a realidade (H 0 ou H 1 ); e a decisão (H 0 ou H 1 ). Existem quatro possíveis combinações: (e.g., µ = 2) tem o benefício da dúvida (e.g., µ 2) tem o ónus da prova Decisão Realidade Admitir H 0 Rejeitar H 0 (optar por H 1 ) H 0 verdade Certo Erro (Tipo I) H 0 falso (H 1 verdade) Erro (Tipo II) Certo J. Cadima (ISA) Estatística e Delineamento 2016-17 25 / 476

Testes de Hipóteses: Passo 2 Mas como optar entre H 0 e H 1? Passo 2. Identifica-se uma estatística de teste É uma quantidade numérica, cujo valor depende apenas da amostra e de H 0. É preciso conhecer a distribuição de probabilidades da estatística de teste, caso seja verdade H 0. Para alguns valores da estatística de teste rejeitar-se-á H 0, para outros não. J. Cadima (ISA) Estatística e Delineamento 2016-17 26 / 476

Testes de Hipóteses: Passo 2 (cont.) Num teste a uma média µ duma população Normal, a estatística de teste usual é: T = X µ H 0 S/ n t n 1, sendo X e S, respectivamente, a média e desvio padrão amostrais, n o tamanho da amostra e µ H0 o valor da média populacional sob a hipótese nula. O símbolo indica com a distribuição, neste caso uma distribuição t-student com n 1 graus de liberdade. dt(x, 6) 0.0 0.1 0.2 0.3 4 2 0 2 4 Numa amostra com x próximo de µ H0, a estatística T tomará um valor T calc próximo de zero. Quanto mais x e µ H0 diferirem, menos plausível será µ H0 e maior será T calc. Mas que valores de T calc aconselham a rejeição de H 0? x J. Cadima (ISA) Estatística e Delineamento 2016-17 27 / 476

Testes de Hipóteses: Passo 3 Passo 3. Define-se o nível de significância do teste (α) α = P[ Erro de Tipo I ] α = P[ Rejeitar H 0 H 0 verdade ] O ideal seria α = 0, mas isso só é possível nunca rejeitando H 0. E nesse caso P[ Erro Tipo II ] = P[ Não rejeitar H 0 H 0 falso ] = 1. Não é possível reduzir simultaneamente a probabilidade dos dois tipos de erro: diminuir P[Erro Tipo I] significa reduzir a gama de valores que levam à rejeição de H 0, o que leva a aumentar P[Erro Tipo II]. Procedimento: Controlar α. Corresponde a admitir que o Erro de Tipo I é o mais grave. Sendo a probabilidade de um erro, queremos α pequeno: Valores usuais: α = 0.05, α = 0.01. J. Cadima (ISA) Estatística e Delineamento 2016-17 28 / 476

Testes de Hipóteses: Passo 4 Passo 4. Definir a Região Crítica (Região de Rejeição) É o conjunto de valores da estatística ao qual associamos a rejeição de H 0 ; É constituída pelos valores da estatística de teste menos plausíveis, caso fosse verdade H 0 (pode ser bilateral ou unilateral, dependendo da hipótese H 1 ); É uma região de probabilidade α, se fôr verdade H 0. Exemplo de Região Crítica bilateral (adequada ao exemplo): dt(x, 6) 0.0 0.1 0.2 0.3 3 2 1 0 1 2 3 x J. Cadima (ISA) Estatística e Delineamento 2016-17 29 / 476

Testes de Hipóteses: Passo 5 Passo 5. Conclusão Escolhe-se uma amostra concreta; Calcula-se o valor da estatística para essa amostra; Toma-se a decisão de Rejeitar H 0 ou de Não rejeitar H 0, consoante o valor da estatística calculado para a amostra escolhida recaia, ou não, na Região Crítica. É o único passo onde é preciso que existam dados. Os passos 3 a 5 podem ser substituídos pela indicação duma medida de plausibilidade de H 0, designada valor de prova ou p-value, definido como a probabilidade de obter um valor tão ou mais extremo quanto o observado na estatística do teste, caso seja verdade H 0. Quando um p-value é muito pequeno, considera-se H 0 irrealista, optando-se pela sua rejeição. J. Cadima (ISA) Estatística e Delineamento 2016-17 30 / 476

Testes χ 2 de Pearson Neste primeiro Capítulo estudamos uma classe específica de testes de Hipóteses, que partilham uma mesma estatística de teste: a estatística de Pearson. Estes testes são também chamados testes χ 2, uma vez que a estatística de teste segue, assintoticamente, uma distribuição qui-quadrado. Estes testes χ 2 surgem associados a dados de contagem, que contam as frequências observadas de várias categorias ou classes. Começamos por considerar o caso de contagens em classes definidas por um só factor/variável. J. Cadima (ISA) Estatística e Delineamento 2016-17 31 / 476

Dados de contagem unidimensionais Exemplo 1: Controlo de qualidade numa linha de produção de embalagens (packs) de 6 latas de cerveja. Para cada embalagem, conta-se o número de latas que não passam o controlo de qualidade, havendo assim k = 7 possíveis resultados (0, 1, 2, 3, 4, 5 ou 6 latas rejeitadas). Em N = 200 embalagens inspeccionadas, contou-se o número O i de embalagens com i latas rejeitadas no controlo (i {0, 1, 2, 3, 4, 5, 6}). Foram obtidos os seguintes valores: No. latas impróprias 0 1 2 3 4 5 6 No. embalagens (O i ) 141 48 9 2 0 0 0 Hipótese: É admissível que as contagens sigam uma lei Binomial? J. Cadima (ISA) Estatística e Delineamento 2016-17 32 / 476

Contagens unidimensionais: Exemplo 1 (cont.) Recordar: a distribuição Binomial surge associada a variáveis aleatórias X que contam o número de êxitos em m provas de Bernoulli, ou seja, experiências aleatórias que se podem repetir indefinidamente em condições análogas e que: são efectuadas m vezes de forma independente: cada prova só tem dois possíveis resultados ( êxito e fracasso ); cada prova tem igual probabilidade p de êxito. Neste exemplo, é natural admitir que o número de latas impróprias em cada embalagem (representado pela variável aleatória X) possa seguir uma distribuição Binomial, com primeiro parâmetro m=6, porque em cada embalagem repetimos 6 vezes a experiência que resulta no resultado lata imprópria (êxito) ou lata aceite (fracasso). A validade da distribuição Binomial corresponde a admitir a independência de sucessivos controlos. J. Cadima (ISA) Estatística e Delineamento 2016-17 33 / 476

Testes χ 2 (cont.) Nos testes χ 2 comparam-se: as contagens observadas (indicadas pela letra O); com as contagens esperadas ao abrigo de alguma hipótese (no nosso caso a hipótese de distribuição Binomial), indicadas pela letra E. A maior ou menor proximidade global entre contagens observadas e esperadas contém informação sobre a plausibilidade da hipótese que gerou os valores esperados. Notação: N observações independentes (N = 200 no exemplo), que podem recair numa de k categorias (k=7). O número de observações na categoria i representa-se por O i. O número esperado de observações na categoria i, ao abrigo da hipótese a testar, representa-se por E i. J. Cadima (ISA) Estatística e Delineamento 2016-17 34 / 476

Como calcular os valores esperados E i? No exemplo, admitimos a hipótese nula que as contagens tenham uma lei Binomial, isto é, X B(m=6, p). Se assim fôr, a probabilidade de uma observação recair na categoria i (i = 0,1,...,6) é dada por: ( ) m π i = P[X=i] = p i (1 p) m i. i Ao abrigo dessa hipótese, e tendo em conta o total de N observações, o número esperado de observações na categoria i seria E i = N π i. Falta determinar o segundo parâmetro da Binomial, p, a fim de se poder calcular as probabilidades π i. J. Cadima (ISA) Estatística e Delineamento 2016-17 35 / 476

A hipótese nula Vamos inicialmente admitir que o outro parâmetro da Binomial tem valor p=0.04, ou seja, que a hipótese nula do teste é que o número de latas impróprias em cada embalagem (representado pela variável aleatória X) segue uma distribuição Binomial, de parâmetros m=6 e p=0.04: H 0 : X B(6, 0.04). Nesse caso, a probabilidade de haver i latas impróprias numa embalagem de 6 latas é dada por: ( ) 6 π i = 0.04 i 0.96 6 i, i = 0,...,6. i A hipótese alternativa será: H 1 : outros π i H 1 : X B(6, 0.04). J. Cadima (ISA) Estatística e Delineamento 2016-17 36 / 476

Valores esperados No exemplo, ter-se-á E i = 200 π i e: i 0 1 2 3 4 5 6 π i 0.7828 0.1957 0.0204 0.0011 0.0000 0.0000 0.0000 E i 156.552 39.138 4.077 0.226 0.007 0.000 0.000 comparando-se com os valores observados: O i 141 48 9 2 0 0 0 Questão: a distribuição observada é compatível com a distribuição esperada? J. Cadima (ISA) Estatística e Delineamento 2016-17 37 / 476

A estatística de Pearson No contexto agora descrito, Pearson mostrou que a estatística X 2 = k (O i E i ) 2 i=1 E i segue assintoticamente (i.e., para grandes amostras) uma distribuição χ 2 k 1, caso H 0 seja verdade. dchisq(x, 4) 0.00 0.05 0.10 0.15 0 5 10 15 x NOTA: o número de graus de liberdade na distribuição é dado pelo número total de contagens (k) menos o número de restrições nessas contagens, que neste contexto é apenas 1, uma vez que a soma de todas as contagens tem de ser N (há apenas k 1 contagens livres ). J. Cadima (ISA) Estatística e Delineamento 2016-17 38 / 476

Hipóteses do teste Em geral, defina-se a hipótese nula como H 0 : a hipótese que gera os valores esperados E i e a hipótese alternativa como H 1 : outra distribuição de probabilidades para os π i. Quanto mais os O i s e E i s diferirem, mais duvidosa a hipótese nula, i.e., quanto maior o valor calculado da estatística X 2 calc, mais duvidosa H 0. Logo, é natural definir uma Região Crítica unilateral direita. J. Cadima (ISA) Estatística e Delineamento 2016-17 39 / 476

Região Crítica Região Crítica unilateral direita: Rejeitar H 0 (hipótese subjacente aos E i ) se X 2 calc > χ2 α;(k 1), sendo χ 2 α;(k 1) o valor que, numa distribuição χ2 com k 1 graus de liberdade, deixa à sua direita uma região de probabilidade α. dchisq(x, 4) 0.00 0.05 0.10 0.15 RC 0 5 10 15 x A probabilidade de recair na Região Crítica, se H 0 é verdade, será α. J. Cadima (ISA) Estatística e Delineamento 2016-17 40 / 476

Validade da distribuição assintótica A distribuição da estatística de Pearson é apenas assintótica, ou seja, aproximada para grandes amostras. Há critérios diferentes para quando se considera a aproximação adequada. Um critério, proposto por Cochran, é: nenhum E i inferior a 1; não mais do que 20% dos E i s inferiores a 5. Caso estas condições não se verifiquem, podem-se agrupar classes de forma a satisfazer o critério. J. Cadima (ISA) Estatística e Delineamento 2016-17 41 / 476

Exemplo Seguindo o critério de Cochran (de forma flexível!), no exemplo anterior será necessário agrupar as classes correspondentes a 2 ou mais latas rejeitadas, obtendo-se a nova tabela com apenas k = 3 classes: i 0 1 2 π i 0.7828 0.1957 0.0216 E i 156.552 39.138 4.311 O i 141 48 11 A estatística de Pearson calculada tem valor: X 2 calc = 13.9327. Numa distribuição χ3 1 2 o limiar da região crítica ao nível α = 0.05 é = 5.991, pelo que se rejeita a hipótese nula X B(6,0.04). χ 2 0.05(2) Opta-se pela hipótese H 1 de a distribuição não ser Binomial, ou ser Binomial, mas com outro valor do parâmetro p. J. Cadima (ISA) Estatística e Delineamento 2016-17 42 / 476

Pearson com a estimação de parâmetros Por vezes, pode existir uma hipótese incompletamente especificada relativa aos valores esperados E i. No exemplo anterior, se é natural admitir uma distribuição Binomial cujo primeiro parâmetro seja m=6, é discutível qual deva ser o valor do segundo parâmetro p (que representa a probabilidade duma lata individual estar imprópria). Admitir que o número de latas impróprias por embalagem segue uma distribuição Binomial B(6,p), mas com p desconhecido, não chega para calcular os valores esperados E i. É necessária a estimação de p. Quando o cálculo dos valores esperados exige a estimação de um ou mais parâmetros da distribuição (porque a hipótese nula está incompletamente especificada), é necessário retirar um grau de liberdade por cada parâmetro estimado. J. Cadima (ISA) Estatística e Delineamento 2016-17 43 / 476

A estimação de parâmetros no exemplo Só é possível calcular os valores esperados E i conhecendo o valor do parâmetro p. Uma boa forma de estimar p será a partir da expressão para o valor esperado, numa distribuição Binomial. Recorde-se que X B(m,p) E[X]=mp, Pode então usar-se a média amostral x para estimar p: x = mˆp. Com base nos dados, o número médio de latas impróprias por embalagem, nas 200 embalagens, é x = 0.36. Como m = 6, tem-se ˆp = x m = 0.36 6 = 0.06. J. Cadima (ISA) Estatística e Delineamento 2016-17 44 / 476

Exemplo Agora, a probabilidade estimada de haver i latas impróprias numa embalagem de 6 latas será dada por: ( ) 6 ˆπ i = 0.06 i 0.94 6 i. i Para N = 200 embalagens, tem-se Êi = 200 ˆπ i. Reconstruindo a tabela para uma Binomial B(6, 0.06), tem-se: i 0 1 2 3 4 5 6 ˆπ i 0.6899 0.2642 0.0422 0.0036 0.0002 0.0000 0.0000 Ê i 137.974 52.841 8.432 0.718 0.034 0.001 0.000 comparando-se com os (mesmos) valores observados: O i 141 48 9 2 0 0 0 J. Cadima (ISA) Estatística e Delineamento 2016-17 45 / 476

Pearson com estimação de parâmetros (cont.) Sendo necessário estimar r parâmetros, a estatística X 2 = k (O i Êi) 2 i=1 Ê i segue assintoticamente uma distribuição χ 2 k 1 r. Definindo a hipótese nula como hipótese que (após a estimação de parâmetros) gerou os valores esperados estimados Êi Define-se uma Região Crítica unilateral direita, ou seja: Rejeita-se H 0 (hipótese subjacente aos Êi) se X 2 calc > χ2 α;k 1 r J. Cadima (ISA) Estatística e Delineamento 2016-17 46 / 476

Exemplo (cont.) De novo, colapsa-se a tabela para satisfazer o critério de Cochran (que garante a qualidade da aproximação assintótica à distribuição χ 2 ): i 0 1 2 ˆπ i 0.6899 0.2642 0.0459 Ê i 137.974 52.841 9.185 O i 141 48 11 A estatística de Pearson calculada tem agora valor: Xcalc 2 = 0.8686 Agora há apenas k=3 classes e r=1 parâmetro estimado. Numa distribuição χ3 1 1 2 o limiar duma região crítica ao nível α = 0.05 é χ0.05(1) 2 = 3.841, pelo que não se rejeita a hipótese de a distribuição subjacente ser Binomial (em particular, B(6,0.06)). J. Cadima (ISA) Estatística e Delineamento 2016-17 47 / 476

O teste χ 2 de ajustamento a distribuições discretas Os exemplos que acabámos de considerar mostram como o teste χ 2, baseado na estatística de Pearson, pode ser usado como um teste de ajustamento duma amostra a uma dada distribuição de probabilidades. No exemplo considerado, tratava-se duma distribuição discreta (a Binomial). Para outras distribuições discretas (Poisson, Geométrica, Binomial Negativa ou qualquer outra, adequada ao problema sob estudo) pode proceder-se de forma análoga. No caso de distribuições contínuas, o teste pode ainda ser utilizado, definindo classes de possíveis valores da variável. J. Cadima (ISA) Estatística e Delineamento 2016-17 48 / 476

O teste χ 2 de ajustamento a distribuições contínuas Definidas k classes de possíveis valores da variável, Contam-se as observações que recaem em cada classe. Essas frequências absolutas constituem os valores observados O i ; Os valores esperados E i, calculam-se a partir das probabilidades π i de recair na classe i, dada a distribuição de H 0 : E i = N π i. AVISO: Caso seja necessário estimar algum parâmetro da distribuição, procede-se como antes: calcular valores esperados estimados, (Êi = N ˆπ i ), e retirar um grau de liberdade por cada parâmetro estimado. AVISO: Para testar a Normalidade, é preferível utilizar o teste de Shapiro-Wilks, já estudado na disciplina de Estatística do 1o. ciclo. J. Cadima (ISA) Estatística e Delineamento 2016-17 49 / 476

Teste χ 2 com tabelas de contingência Admita-se agora um novo contexto para a questão discutida antes: classificam-se observações em várias categorias, mas essas categorias resultam de combinar os níveis de 2 factores. No contexto dum exemplo de biodiversidade, admita-se que: há a locais geográficos, que constituem os níveis de um factor A; em cada local se contam as observações de cada uma de b espécies, que definem os níveis dum factor B. J. Cadima (ISA) Estatística e Delineamento 2016-17 50 / 476

Tabelas de contingência Assim, as N observações são classificadas de acordo com dois diferentes factores (o que obrigará a usar uma dupla indexação). Chama-se tabela de contingência a uma tabela com o número O ij de observações em cada célula (i,j) (nível i do factor A e j do factor B): Níveis do Níveis do Factor B Marginal Factor A 1 2 3 b de A 1 O 11 O 12 O 13 O 1,b N 1 2 O 21 O 22 O 23 O 2,b N 2 3 O 31 O 32 O 33 O 3,b N 3............... a O a1 O a2 O a3 O a,b N a Marginal de B N 1 N 2 N 3 N b N b a N i. = O ij N.j = O ij j=1 i=1 J. Cadima (ISA) Estatística e Delineamento 2016-17 51 / 476

Diferentes contextos para tabelas de contingência Tal como no contexto unidimensional, também no estudo de tabelas de contingência, surgem diferentes situações. As probabilidades π ij de recair em cada célula (i,j) podem ser totalmente especificadas por alguma hipótese. Vamos exemplificar esta situação com exemplos ligados à genética. As probabilidades π ij de recair em cada célula (i,j) podem ser desconhecidas, mas estimáveis, dada alguma hipótese. Vamos exemplificar esta situação com dois contextos frequentes: testes de homogeneidade. testes de independência. J. Cadima (ISA) Estatística e Delineamento 2016-17 52 / 476

Situação 1: probabilidades totalmente especificadas Exemplo 1: Supõe-se que, em coelhos, existe: um gene que controla a cor do pêlo, com: um alelo determinante do cinzento (dominante); um alelo determinante do branco (recessivo). outro gene que controla o tipo de pelagem, com: um alelo determinante do pêlo normal (dominante); um alelo determinante da pelagem tipo Rex (recessivo). Para avaliar esta hipótese, realiza-se uma experiência cruzando coelhos duma população inicial que são heterozigóticos nos dois genes, i.e., têm um alelo de cada cor e um alelo de cada tipo de pelagem. J. Cadima (ISA) Estatística e Delineamento 2016-17 53 / 476

Exemplo 1 (cont.) Se a segregação dos genes fôr independente, isto é, se o alelo da cor fôr independente do alelo do tipo de pelagem, seria de esperar que os descendentes desta população surgissem nas seguintes proporções: 9/16 coelhos cinzentos de pelagem normal; 3/16 coelhos cinzentos de pelagem tipo Rex; 3/16 coelhos brancos de pelagem normal; 1/16 coelhos brancos de pelagem tipo Rex; Numa descendência de N = 232 coelhos, observaram-se: Pêlo Normal Rex Cor Cinzento 134 44 Branco 42 12 J. Cadima (ISA) Estatística e Delineamento 2016-17 54 / 476

Exemplo 1 (cont.) Neste exemplo existem a=2 cores do pêlo e b = 2 tipos de pelagem, num total de ab=4 situações experimentais. Caso sejam verdadeiros os pressupostos de segregação independente e dominância/recessividade dos genes, o número esperado de observações em cada célula será dado por E ij = N π ij, sendo as probabilidades π ij de cada célula iguais às proporções esperadas dadas no acetato : Pêlo E ij Normal Rex Cor Cinzento 232 16 9 = 130.5 232 3 16 = 43.5 Branco 232 16 3 = 43.5 232 1 16 = 14.5 Estes valores esperados são compatíveis com os observados? J. Cadima (ISA) Estatística e Delineamento 2016-17 55 / 476

Estatística do teste para tabelas bidimensionais No contexto agora descrito, a estatística de Pearson tem a forma X 2 = a b i=1j=1 (O ij E ij ) 2 E ij e segue assintoticamente uma distribuição χ 2 ab 1. Os graus de liberdade são o número de células (ab) menos o número de restrições, que neste caso é apenas um: o número total de observações N que foi utilizado na experiência. Tem-se uma Região Crítica unilateral direita, ou seja: Rejeita-se H 0 se X 2 calc > χ2 α;(ab 1), sendo H 0 a hipótese resultante da teoria genética (a hipótese que gerou os valores esperados E ij ). J. Cadima (ISA) Estatística e Delineamento 2016-17 56 / 476

Exemplo 1 (cont.) O valor da estatística de Pearson para a amostra referida é X 2 calc = (134 130.5)2 130.5 + (44 43.5)2 43.5 + (42 43.5)2 43.5 + (12 14.5)2 14.5 = 0.5823755. A fronteira da região crítica ao nível α = 0.05 é χ 2 0.05(3) = 7.814728. Logo, não se rejeita H 0, isto é, não se rejeitam as hipóteses genéticas referidas (dominância/recessividade e segregação independente dos genes). J. Cadima (ISA) Estatística e Delineamento 2016-17 57 / 476

Segunda situação: Testes de homogeneidade Consideremos agora situações onde as hipóteses nulas a testar não estão totalmente especificadas, e exigem a estimação de parâmetros. Veremos dois casos particulares frequentes, desta situação. Inicialmente, admitimos que o número de observações em cada nível de um dos factores é previamente fixado pelo experimentador. Para fixar ideias, admita-se que os a totais de linha, N i., foram previamente determinados pelo experimentador. Neste caso, objectivo de interesse pode ser o de ver se as N i. observações de cada linha (nível do factor A) se distribuem de forma análoga (homogénea) pelas b colunas (níveis do factor B). Um teste com este objectivo chama-se um teste de homogeneidade. J. Cadima (ISA) Estatística e Delineamento 2016-17 58 / 476

Exemplo 2 - Teste de Homogeneidade Nos solos duma dada região foi assinalada a presença de larvas de 4 espécies de insectos que afectam as principais culturas da região. Pretende-se investigar se as frequências relativas das espécies são ou não iguais nos vários tipos de solos. Classificaram-se os solos em três tipos: arenosos, limosos e argilosos (Factor A, com a=3 níveis). Em cada tipo de solos foram recolhidas 100 larvas, e classificadas de acordo com a respectiva espécie (Factor B, com b=4 níveis). J. Cadima (ISA) Estatística e Delineamento 2016-17 59 / 476

Exemplo 2 (cont.) Feita a classificação das larvas, obtiveram-se os seguintes resultados: Espécie de larva 1 2 3 4 Total Tipos Arenosos 27 24 23 26 100 de Limosos 20 32 18 30 100 solos Argilosos 13 37 16 34 100 Total 60 93 57 90 300 O objectivo é o de saber se se pode admitir que, nos três tipos de solos, a distribuição das quatro espécies é idêntica. J. Cadima (ISA) Estatística e Delineamento 2016-17 60 / 476

Hipóteses num teste de homogeneidade Seguindo com o exemplo, a hipótese nula é que as probabilidades de cada espécie, condicionais ao solo i, (π 1 i, π 2 i, π 3 i e π 4 i ), não dependem do tipo de solo i dado. Designando por π j i a probabilidade da espécie j, para o solo i: H 0 : π 1 1 = π 1 2 = π 1 3 [ = π.1 ] π 2 1 = π 2 2 = π 2 3 [ = π.2 ] π 3 1 = π 3 2 = π 3 3 [ = π.3 ] π 4 1 = π 4 2 = π 4 3 [ = π.4 ] A hipótese alternativa H 1 é que pelo menos uma das igualdades acima referidas não é verdadeira. Mas que valores usar para as probabilidades π.j (j = 1,2,3,4)? J. Cadima (ISA) Estatística e Delineamento 2016-17 61 / 476

A estimação das probabilidades A linha final da tabela, com as frequências absolutas N.j de cada espécie de larva, representa uma base para estimar o que serão as probabilidades de cada espécie de larva, caso haja uma única distribuição das espécies, comum aos três tipos de solo. Espécie de larva 1 2 3 4 Total Tipos Arenosos 27 24 23 26 100 de Limosos 20 32 18 30 100 solos Argilosos 13 37 16 34 100 Total 60 93 57 90 300 A probabilidade estimada da espécie j será ˆπ.j = N.j N, ou seja: ˆπ.1 = 60 300 = 0.20 ˆπ.2= 93 300 = 0.31 ˆπ.3= 57 300 = 0.19 ˆπ.4= 90 300 = 0.30 J. Cadima (ISA) Estatística e Delineamento 2016-17 62 / 476

Os valores esperados (estimados) Uma vez que em cada tipo de solo há N i. = 100 observações, o número esperado de observações na célula (i,j) é dado por Ê ij = N i. ˆπ.j = N i. N.j N A tabela com os valores esperados estimados entre parenteses: Espécie de larva 1 2 3 4 Total Tipos Arenosos 27 (20) 24 (31) 23 (19) 26 (30) 100 de Limosos 20 (20) 32 (31) 18 (19) 30 (30) 100 solos Argilosos 13 (20) 37 (31) 16 (19) 34 (30) 100 Total 60 93 57 90 300 Entre as observações O ij e os correspondentes valores esperados estimados (Êij), existe concordância suficiente para admitir que as espécies se distribuem de forma análoga nos três tipos de solos? J. Cadima (ISA) Estatística e Delineamento 2016-17 63 / 476

As restrições Admitindo que se fixou o número de observações em cada linha (níveis do factor A), tal facto impõe a restrições. A necessidade de estimar as probabilidades dos níveis do outro factor (no nosso caso, as probabilidades de espécie, ou seja as probabilidades marginais de coluna) impõe mais b 1 restrições. (NOTA: Não são b restrições pois a soma dos ˆπ i tem de ser 1, logo estimar b 1 probabilidades determina a última estimativa.) Assim, ao todo foram impostas a+b 1 restrições. J. Cadima (ISA) Estatística e Delineamento 2016-17 64 / 476

A estatística de Pearson em testes de homogeneidade No contexto agora descrito, a estatística de Pearson tem a forma X 2 = a b i=1j=1 (O ij Êij) 2 Ê ij e segue assintoticamente uma distribuição χ 2 (a 1)(b 1). NOTA: Os graus de liberdade são o número de células (ab) menos o número de restrições (a+b 1), i.e., ab (a+b 1)=(a 1)(b 1) Tem-se uma Região Crítica unilateral direita, ou seja: Rejeita-se H 0 se X 2 calc > χ2 α;(a 1)(b 1), sendo H 0 a hipótese de homogeneidade na distribuição das amostras de cada população (a hipótese que gerou os valores esperados Êi). J. Cadima (ISA) Estatística e Delineamento 2016-17 65 / 476

Exemplo 2 (cont.) A estatística de Pearson calculada no exemplo das larvas tem valor X 2 calc = 10.10928. Este valor calculado deve ser comparado com o valor que, numa distribuição χ6 2 (pois (a 1)(b 1)=2 3=6), deixa à direita uma região de probabilidade α = 0.05: χ 2 0.05(6) = 12.591. Como X 2 calc < χ2 0.05(6) não se rejeita H 0, a hipótese de homogeneidade das distribuições de espécies de larva, nos três tipos de solos. Tal como nos casos anteriores, pode ser necessário agrupar classes do factor B, se o número esperado de observações nalgumas classes fôr demasiado baixo. Neste exemplo, tal não é necessário. J. Cadima (ISA) Estatística e Delineamento 2016-17 66 / 476

Terceiro contexto: testes de independência Numa tabela bidimensional, há independência quando as probabilidades conjuntas são o produto das probabilidades marginais: onde H 0 : π ij = π i. π.j, i,j π ij indica a probabilidade duma observação recair na célula (i,j); π i. indica a probabilidade marginal duma observação recair no nível i do factor A (seja qual fôr o nível do outro factor); π.j indica a probabilidade marginal duma observação recair no nível j do factor B (seja qual fôr o nível do outro factor); J. Cadima (ISA) Estatística e Delineamento 2016-17 67 / 476

Estimação das probabilidades Pode haver situações onde as probabilidades marginais sejam conhecidas, mas em geral não o são. É possível estimar as probabilidades marginais a partir das frequências relativas marginais (como foi feito nos testes de homogeneidade, para o factor B): ˆπ i. = N i. N ˆπ.j = N.j N, i = 1,2,...,a, j = 1,2,...,b, onde N é o número total de observações (fixo), N i. é o número (livre) de observações no nível i do factor A e N.j é o número (livre) de observações no nível j do factor B. J. Cadima (ISA) Estatística e Delineamento 2016-17 68 / 476

Valores esperados Caso se verifique a independência, o número esperado de observações na célula (i,j) é dado por: E ij = N π ij = N π i. π.j i,j. Estimando as probabilidades marginais, caso se verifique a independência, o número esperado estimado de observações na célula (i,j) é: Ê ij = N ˆπ ij = N ˆπ i. ˆπ.j = N N i. N N.j N = N i. N.j N, i,j. J. Cadima (ISA) Estatística e Delineamento 2016-17 69 / 476

As restrições Foram estimadas: a 1 probabilidades marginais do factor A (a última tem de dar a soma 1); e b 1 probabilidades marginais do factor B (a última tem de dar a soma 1). Juntamente com 1 restrição imposta pelo número total fixo de observações (N), tem-se um total de (a 1)+(b 1)+1= a+b 1 restrições. J. Cadima (ISA) Estatística e Delineamento 2016-17 70 / 476

Testes χ 2 de independência (cont.) Estes valores esperados estimados Êij em cada uma das ab células serão comparados com os valores observados, O ij, com base na estatística de Pearson. NOTA: Repare-se que, embora com motivações diferentes, as expressões de cálculo dos Êij são iguais, nos testes de homogeneidade e nos testes de independência; o número de restrições impostas é igual nos dois tipos de teste. Logo, a estatística X 2 de Pearson terá uma expressão idêntica, e uma distribuição assintótica idêntica, quer nos testes de homogeneidade, quer nos testes de independência. Mas importa não perder de vista que se trata de contextos diferentes, com hipóteses de referência diferentes e conclusões diferentes. J. Cadima (ISA) Estatística e Delineamento 2016-17 71 / 476

A estatística do teste Quer no contexto de testes de homogeneidade, quer no contexto de testes de independência, a estatística de Pearson tem a forma X 2 = a b i=1j=1 (O ij Êij) 2 Ê ij = a b i=1 j=1 ( O ij N i. N.j N e segue assintoticamente uma distribuição χ 2 (a 1)(b 1). N i. N.j N Em ambos os casos tem-se uma Região Crítica unilateral direita, ou seja: Rejeita-se H 0 se X 2 calc > χ2 α;(a 1)(b 1). ) 2 J. Cadima (ISA) Estatística e Delineamento 2016-17 72 / 476

Exemplo 3 - Teste de independência Um estudo de N = 6800 alemães do sexo masculino analisou a cor do cabelo e a cor dos olhos de cada indivíduo. Os resultados foram: Cabelo Olhos Louro Castanho Preto Ruivo Total Azuis 1768 807 189 47 2811 Cinz./Verde 946 1387 746 53 3132 Castanhos 115 438 288 16 857 Total 2829 2632 1223 116 6800 Pretende-se testar se existe independência entre as características cor do cabelo e cor dos olhos (sendo natural que se rejeite esta hipótese). J. Cadima (ISA) Estatística e Delineamento 2016-17 73 / 476

Exemplo 3 (cont.) As frequências marginais de linha dão estimativas das probabilidades marginais de cada cor de olhos (ˆπ i. = N i. N ): ˆπ 1. = 2811 6800 = 0.4134 ˆπ 2. = 3132 6800 = 0.4606 ˆπ 3. = 857 6800 = 0.1260 De forma análoga se obtêm estimativas das probabilidades marginais de cores de cabelo (ˆπ.j = N.j N ): ˆπ.1 = 2829 6800 = 0.416, ˆπ.2= 2632 6800 = 0.387, ˆπ.3= 1223 6800 = 0.180, ˆπ.4= 116 6800 = 0.017 Os valores esperados estimados em cada célula, caso haja independência, são dados por: Ê ij = N ˆπ ij = N ˆπ i. ˆπ.j = N i. N.j N. Por exemplo, Ê11 = 2811 2829 6800 = 1169.4587. J. Cadima (ISA) Estatística e Delineamento 2016-17 74 / 476

Exemplo 3 (cont.) A tabela com os valores esperados (estimados) entre parenteses é: Cabelo Olhos Louro Castanho Preto Ruivo Total Azuis 1768 (1169.46) 807 (1088.02) 189 (505.57) 47 (47.95) 2811 Cin./Verde 946 (1303.00) 1387 (1212.27) 746 (563.30) 53 (53.43) 3132 Castanhos 115 (356.54) 438 (331.71) 288 (154.13) 16 (14.62) 857 Total 2829 2632 1223 116 6800 A estatística de Pearson será então: Xcalc 2 3 4 = (O ij Êij) 2 i=1j=1 Ê ij = (1768 1169.46)2 +...+ (16 14.62)2 1169.46 14.62 = 1073.508. As dimensões da tabela são iguais às do Exemplo 2, logo a fronteira da região crítica foi dada no acetato 66: χ 2 0.05(6) = 12.591. Como esperado, rejeita-se claramente a hipótese de independência. J. Cadima (ISA) Estatística e Delineamento 2016-17 75 / 476

Analisando as parcelas da estatística Em qualquer dos contextos considerados, a região de rejeição é unilateral direita, isto é, são os valores grandes da estatística que rejeitam a hipótese nula, num teste baseado na estatística de Pearson. No caso de rejeição de H 0, e como a estatística X 2 de Pearson é uma soma de parcelas não-negativas, é possível identificar a(s) categoria(s)/célula(s) que contribuem com parcelas de maior valor e que são, por isso mesmo, maiormente responsáveis pela rejeição de H 0. J. Cadima (ISA) Estatística e Delineamento 2016-17 76 / 476

Ainda o exemplo de teste de independência As parcelas individuais da estatística de Pearson, (O ij E ij ) 2 E ij, no caso do teste de independência acima referido, são: Cabelo Olhos Louro Castanho Preto Ruivo Azuis 306.340 72.585 198.222 0.019 Cin./Verde 97.814 25.185 59.257 0.003 Castanhos 163.630 34.059 116.263 0.130 Uma vez que χ0.05(6) 2 = 12.592, quase todas as células (excepto as referentes aos ruivos) são, só por si, responsáveis pela rejeição de H 0, com destaque para as associações de olhos azuis com cabelo louro e de olhos azuis com cabelo preto. J. Cadima (ISA) Estatística e Delineamento 2016-17 77 / 476

Ainda o exemplo da independência (cont.) No entanto, o sentido destas duas associações é diferente: para olhos azuis/cabelo louro, tem-se 1768 = O 11 Ê11 = 1169.46. Trata-se duma associação positiva. para olhos azuis/cabelo preto, tem-se 189 = O 13 Ê13 = 505.57. Trata-se duma associação negativa. A identificação das parcelas que mais contribuem para uma rejeição de H 0 pode ajudar a identificar outras hipóteses, mais realistas, subjacentes às contagens observadas. J. Cadima (ISA) Estatística e Delineamento 2016-17 78 / 476

Testes usando p values Em alternativa a fixar previamente o nível de significância α, é possível indicar apenas o valor de prova (ou p-value) associado ao valor calculado da estatística dum qualquer teste. O p-value é a probabilidade da estatística de teste tomar valores mais extremos que o valor calculado a partir da amostra, sob H 0 O cálculo do p-value é feito de forma diferente, consoante a natureza das hipóteses nula e alternativa conduza a regiões de rejeição unilaterais ou bilaterais. Mas no contexto dos testes χ 2, baseados na estatística de Pearson, e em que a região crítica é unilateral direita, o p-value é sempre calculado como: p = P[χ 2 > X 2 calc ]. J. Cadima (ISA) Estatística e Delineamento 2016-17 79 / 476

A relação de p-values e níveis de significância p value > α não rejeição de H 0 ao nível α; p value < α rejeição de H 0 ao nível α; p value > α p value < α densidade χ 2 0.00 0.05 0.10 0.15 2 χ calc p value χ α 2 RC α densidade χ 2 0.00 0.05 0.10 0.15 χ α 2 α RC 2 χ calc p value 0 5 10 15 x 0 5 10 15 x Em geral: p-value muito pequeno implica rejeição H 0. J. Cadima (ISA) Estatística e Delineamento 2016-17 80 / 476