Aula 5. Itervalos de Cofiaça Métodos Estadísticos 008 Uiversidade de Averio Profª Gladys Castillo Jordá Duas Fases da Estatística Estatística Descritiva: descrever e estudar uma amostra Estatística Idutiva (iferecial): a partir de uma amostra iferir sobre as características de uma população Fote Diagrama: Projecto ALEA Noçoes de Estatística http://alea-estp.ie.pt/html/ocoes/html/exemplo_4.html
População vs. Amostra Podemos iferir (deduzir) determiadas características de uma população se extraímos uma amostra represetativa desta População: colecção de uidades idividuais (pessoas ou resultados experimetais) com uma ou mais características comus, que se pretedem estudar. Amostra: Cojuto de dados ou observações, recolhidos a partir de um subcojuto da população, que se estuda com o objectivo de tirar coclusões para a população de ode foi recolhida amostragem Images extraídas da referêcia 3 Amostragem Processo pelo qual se extraem dados de uma população Existem vários tipos de amostragem: Vamos usar apeas este tipo Amostragem Aleatória Simples: cada elemeto da amostra é retirado aleatoriamete de toda a população (com ou sem reposição) cada possível amostra tem a mesma probabilidade de ser recolhida Amostragem Estratificada: subdividir a população em, pelo meos, dois subgrupos distitos que partilham alguma característica e, em seguida, recolher uma amostra de cada um dos subgrupos (estratos) Amostragem por clusters: dividir a população em secções (clusters); seleccioar aleatoriamete algus desses clusters; escolher todos os membros dos clusters seleccioados. 4
Amostra Aleatória Note que usamos letras miúsculas pois estamos a defiir cocretizações (observações) de variáveis aleatórias acetato adaptado de referecia Note que usamos letras maiúsculas, pois estamos a defiir variáveis aleatórias e medidas em fução dessas variáveis 6 Parâmetro vs. Estatística Parâmetro Medida usada para descrever a distribuição da população a médiaµ e o desvio padrão são parâmetros de uma distribuição Normal - N(µ, ) a probabilidade de sucesso p é um parâmetro da distribuição Biomial - B(,p) Estatística Fução de uma amostra aleatória que ão depede de parâmetros descohecidos Média amostral: = i = i Variâcia amostral: Amplitude da amostra: S = = ( i i R = : : ) 7 3
Parâmetro vs. Estatística Proporção dos iquiridos de raça braca uma população e uma amostra π p exemplo extraído da referêcia 8 Estimação de Parâmetros População Amostra Distribuição da População Parâmetros (valor fixo) estimar Distribuição Amostral Estatísticas (fução da amostra) Estimação potual (estatísticas) por itervalo (itervalos de cofiaça) OBS: estatística: é a v.a. que estima (potualmete) um parâmetro (populacioal) as vezes é chamada simplesmete de estimador estimativa: é o valor do estimador obtido para uma amostra específica acetato adaptado de referecia 3 9 4
Itervalo de Cofiaça Um itervalo de cofiaça para um parâmetro θ, a um grau de cofiaça -, é um itervalo aleatório (L if, L sup ) tal que: P(L if < θ < L sup ) = -, (0,) ode deve ser um valor muito reduzido por forma a temos cofiaças elevadas Valores usuais para o grau de cofiaça: 95%, 99% e 90% 3 Itervalo de Cofiaça () I. para a média µ com variâcia cohecida Caso : população Normal Caso : população qualquer (>>30) aproximada pela Normal II. para a média µ com variâcia descohecida Caso : população Normal Caso : população qualquer (>>30) aproximada pela Normal III. para a difereça de médias de duas populações Normais Caso : duas amostras idepedetes, variâcias cohecidas Caso : duas amostras idepedetes, variâcias descohecidas Caso 3: amostras emparelhadas, variâcias descohecidas IV. para uma proporção 4 5
para µ com variâcia cohecida Caso : População Normal ~ N ( µ, ) µ descohecido, mas cohecido ~ N? ( µ, ) cetrado e reduzido: µ ~? N (0,) (Normal Padrão) Z P( z < Z < z) = µ P( z < < z) = P( z < µ < z ) = P( z < µ < + z ) = L if L sup - -z 0 z + z / z - / quatil de ordem / quatil de ordem -/ para µ a grau de cofiaça - N(0,) ) = z + z ( )( µ, acetato adaptado de referecia 3 5 Iterpretação do para µ Para uma amostra aleatória de tamaho 50 seguido uma distribuição Normal com média µ = 0 e variâcia = 4 ~ N (0, 4), determiamos o para µ com 95% de grau cofiaça: P(, 96 < µ < +,96 ) = 95% 50 50 < < + = µ ) = ( 0.5544, 0.5544) P( 0,5544 µ 0,5544) 95% %( 95 + µ=0 Iterpretação: 95% dos possíveis s obtidos a partir de uma amostra de tamaho 50, coterão de facto o verdadeiro valor da média µ=0 6 6
para µ com variâcia cohecida Caso : População Normal Exemplo: Uma v.a. qualquer tem uma distribuição Normal com média µ descohecida e variâcia = 6. Retira-se uma amostra de 5 valores e calcula-se a média amostral. Costrua um de 95% para µ supodo que =,7. ) = z + z ( )( µ, z 0,9750 =,96 ) = z + z 95 %( µ 0.9750, 0. 9750 =,7,96 = ( 95 % µ ) = 4,,7 +.96 5 (,7,568,,7 +,568 ) (.3, 4.68) P (,3 < µ < 4, 68) = 0, 95 4 5,5% 95% 0.7,5% Java Applet em: http://psych.colorado.edu/~mcclella/java/ormal/ormz.html 7 Determiado o Quatil de Ordem -/ Distribuição Normal Padroizada Tabela 3.a. Normal Distributio Para grau de cofiaça (-)x00 = 95% ível de sigificâcia =0.05 φ(z) = P(Z < z) = - / z = z - / quatil de ordem -/ φ(z) = P(Z < z) = - (0.05/ ) = 0.975 buscar valor de z a tabela: φ(z) = 0.9750 z =.96 Grau de Cofiaça 90% 95% 99% Valor z.65.96.58 90% grau de cofiaça existem 0 possibilidades de 00 que o ão coteha a média populacioal 95% grau de cofiaça existem 5 possibilidades de 00 que o ão coteha a média populacioal 99% grau de cofiaça existe possibilidade de 00 que o ão coteha a média populacioal 8 7
& Grau de Cofiaça Como poderia obter itervalos de cofiaça mais estreitos, ou seja, com limites mais próximos a média verdadeira? Dimiuido o grau de cofiaça figura extraída da referêcia Dimiuido o grau de cofiaça de 99% a 95%, aumetamos o risco de estar errados: de % de risco passamos a 5% de risco, ou seja temos mais possibilidades (5/00 em vez de /00) de que o ão coteha a média populacioal. Ao aumetar o risco, o itervalo deve ser mais preciso 9 & Dimesão da Amostra Como poderia obter itervalos de cofiaça mais estreitos, ou seja, com limites mais próximos a média verdadeira? Aumetado a dimesão da amostra Tabela extraída da referêcia 0 8
para µ com variâcia cohecida Caso : População Geérica aproximada pela Normal Se uma distribuição qualquer tiver média µ (descohecida) e variâcia (cohecida) e se forem validas as codições do TLC (>>30) podemos obter um aproximado para a média µ para µ a grau de cofiaça - N (0,) ( µ ) z + z, - -z 0 z + quatil de ordem -/ z - / para µ com variâcia cohecida Resumo µ descohecido, mas cohecido º caso para µ a grau de cofiaça - ( ) = ± z µ quato maior z meos preciso ± z Se aumetarmos o grau de cofiaça a precisão dimiui porque aumeta o valor z se 90% z =.65 se 95% z =.96 se 99% z =.58 º caso ( ) ± z µ quato maior meor o erro padrão mais preciso A expressão é chamada erro padrão (stadard error) 9
para µ com variâcia descohecida Se o valor de é descohecido substituir por uma estimativa Estimadores potuais para o desvio padrão : desvio padrão amostral ão-corrigido = S = i= ( i ) desvio padrão amostral corrigido = S c = i= ( ) i Se descohecida podemos distiguir dois casos: Caso. população Normal usar distr.t de Studet µ N( µ, ) T = ~ t S ~ c Caso. q.q. distribuição aproximada pela Normal, amostras grades usar distribuição Normal padroizada µ q.q. com >> 30 Z = ~ N (0,) S a c Sc ) = t,, + t ( µ, Sc ( ) z + z µ, Sc Sc 3 para µ com variâcia descohecida Caso : População Normal Exemplo: Uma v.a. qualquer tem uma distribuição Normal com média µ e variâcia descohecidas. Retira-se uma amostra de 5 valores e calcula-se a média amostral e variâcia amostral. Costrua um de 95% para µ supodo que =,7 e S = 6 S ) = t, + t, ( )( µ, S Distribuição t de Studet com 4 graus de liberdade t 4 S 95 %(µ) = t0.9750,4, + t0.9750, 4 =,7,06 = 4,,7 +,06 5 (,7,648,,7 +,648 ) ( 95 % µ ) = S 4 5 (.05, 3.648),5% 95%,5% - -t 0 t + t 0,9750,? 4 =,06 4 0
Determiado t -/, - - quatil de ordem -/ de uma distribuição t-studet com - graus de liberdade Tabela 8. Studet s t-distributio Por defiição de quatil de ordem -/: z = z - / F(z) = P(Z < z) = - / Para grau de cofiaça 95% ível de sigificâcia =0.05 F(z) = P(Z < z) = - (0.05/ ) = 0.975 F(z) = 0.9750 Para =5 4 graus de liberdade Determiar t 0.9750, 4 usado Tabela 8: t 0.9750, 4 =.06 5 para µ com variâcia descohecida Caso : População Normal Uma amostra aleatória de 0 cigarros foi aalisada para estimar a quatidade de icotia por cigarro, observado-se a média de, mg e variâcia amostral corrigida de 0.04. Pressupodo que as observações têm distribuição Normal, determie um para o valor médio da quatidade de icotia por cigarro, grau de cofiaça de 99% Usado esta amostra determiamos um aproximado para µ a 99%: Sc ) = t, + t, ( ) ( µ, (µ) = t 99 % 0.995,9, Determiar t 0.995, 9 usado Tabela 8 t 0.995, 9 =.86 99 %( µ ) =,,86 SC + t 0.995,9 0,04,, +,86 0 Sc SC 0,04 0 exercício 5, capítulo 4 Para grau de cofiaça 99%: (-) x 00% = 99% (-) =0.99 =0.0 Por defiição de quatil de ordem -/: F(z) = P(Z < z) = - (0.0/ ) = 0,995 F(z) = 0.995 Para =0 9 graus de liberdade = (,,86 0,0447,, +,86 0,0447) 99 %( µ ) = (.07,.379) 6
para µ com variâcia descohecida Exemplo: População qualquer, amostra grade Igressos dos emigrates hispâicos em EU segudo ceso de 980 Origem cubaos mexicaos portoriquehos cubaos: mexicaos: porto-riq.: Nº pessoas amostra 3895 579 5908 Redimeto Médio $6 368 $3 34 $ 587 3069 erro padrão = = 49.7 3985 Desvio Padrão Amostral $3 069 $9 44 $8 647 944 erro padrão = = 4.4 579 8647 erro padrão = =.5 5908 para µ a grau de cofiaça 95% S 95 %( µ ).96, +. 96 ( 95 % µ ) 6368 ±.96 49.7 S ( 67, 6464 ) ( 95 % µ ) 334 ±.96 4.4 ( 3098, 3586 ) ( 95 % µ ) 587 ±.96.5 ( 367, 807 ) 7 para µ com variâcia descohecida Exemplo: População qualquer, amostra grade Exemplo adaptado de referêcia 8
Iferêcia etre parâmetros de duas populações E µ P P ( ) = E ( Y ) = µ Y m Y Mesmo ão se cohecedo as médias µ e µ, seria possível verificar se elas são iguais a partir de seus valores amostrais? Se µ e µ são iguais, etão µ - µ = 0. Podemos a partir da difereça das médias amostrais da difereça das médias de duas populações Y iferir o valor acetato adaptado de referecia 3 9 Itervalo de Cofiaça para µ - µ Duas populações Normais. Amostras idepedetes Sejam,, e Y,, Y m duas amostras aleatórias costituídas por observações idepedetes e proveietes de duas populações Normais N(µ, ) e N(µ Y, Y ), respectivamete para µ µ a grau de cofiaça - Caso : variâcias cohecidas Caso : variâcias descohecidas mas iguais 30 3
Itervalo de Cofiaça para µ - µ Populações Normais. Amostras emparelhadas Sejam,, e Y,, Y duas amostras proveietes de populações Normais Amostras emparelhadas: se pares de observações ( i, Y i ) são depedetes sedo todos os restates pares ( i, Y j ), i j idepedetes Cosideram-se as difereças: Di = ( i Yi ) ~ N( µ D, D ) µ D = µ - µ Y difereça das médias populacioais D desvio padrão das difereças - descohecido mas pode ser estimado através das difereças D,, D D, D,...D a.a. com população Normal e variâcia descohecida D D µ D ~ N( µ D, D ) T = ~ t Sc D para µ D = µ -µ Y a grau de cofiaça - Sc D ) = D t +,, D t ( µ D, S cd desvio padrão amostral corrigido das difereças S CD 3 Itervalo de Cofiaça para Proporção = Cosidere que uma ura cotêm bolas vermelhas e azúis e que bolas são escolhidas ao acaso (com reposição), defiido-se como o úmero de bolas vermelhas etre as seleccioadas Y i i= Se p- descohecido, um estimador potual para p é a proporção amostral: Z p ˆ = cetrado e reduzido: pˆ p = p( p), Y i ~ Beroulli sedo p = P( i = ), a probabilidade de se seleccioar um bola vermelha p( p) pˆ ~ N( p, ) a p p( p) I.C. para Z com grau de cofiaça - P( z < Z < z) = ~ N(0,) a (se é grade, pelo TLC) N (0,) - -z 0 z + z / z - / quatil de ordem / quatil de ordem -/ ~ Biomial(,p) P( pˆ z pˆ( pˆ), pˆ + z pˆ( pˆ) ) = 3 4
Itervalo de Cofiaça para Proporção Seja p ˆ = a proporção de idivíduos com uma certa característica de iteresse uma amostra aleatória de dimesão, e p a proporção de idivíduos com essa característica a população. Um itervalo de cofiaça aproximado para p, a um grau de cofiaça -, é dado por: p) pˆ z pˆ( pˆ), pˆ + z ( )( pˆ( pˆ) 33 para uma proporção Exemplo: Proporção de acessos a págias de Iteret acioais Em 00 acessos a págias de iteret escolhidos ao acaso 30 são as págias acioais. Determie um a 95% para a proporção de acessos a págias acioais - úmero de acessos á págias de iteret acioais p proporção de acessos a págias acioais (em geral) Usado esta amostra determiamos um aproximado para p a 95%: p ( pˆ z S p pˆ ( ) ( ), + z S ) pˆ ( pˆ ) p com p ˆ = e S p = º. Determiar z -/ para =0,05 z 0,9750 =,96 ( 95%) ( p) ( pˆ z0.9750s p, pˆ + z0. 9750S p ) ( p) pˆ,96 S, pˆ +, 96 30 p ˆ = = = 0.3 00 ( 0,3,96 0,0458, 0,3 +,96 0,0458) ( 0,3 0,08988, 0,3 + 0,08988) ( 95%) ( p) = ( ) º. Determiar as estimativas ^ p e S p S p 3º. Substituir a fórmula: = pˆ( pˆ) = 0,3 0,7 = 0,0458 00 (95%) 95 %( p) exercício 6, capítulo 4 ~ Biomial(00,p) p descohecido p S p ( 0.0, 0.3898) 34 5
Formulário F O R M U L Á R I O 35 Referêcias Livro: Grade Maratoa de Estatística o SPSS Adreia Hall, Cláudia Neves e Atóio Pereira Capítulo 4. Itervalos de Cofiaça Acetatos dispoíveis o-lie usados a elaboração destes acetatos: Estatística Iferecial e Itervalos de Cofiaça, Amostragem Adreia Hall URL: http://www.mat.ua.pt/pessoais/ahall/me/files/acetatos.htm http://www.mat.ua.pt/pessoais/ahall/bioestat%edstica/bioestat%edstica.htm Chapter : Samplig ad Samplig Distributio, Chapter : Estimatio Prof. J. Schwab, Uiversity of Texas at Austi disciplia: Data Aalysis I (sprig 004) URL: www.utexas.edu/courses/schwab/sw38_sprig_004/textbooklecturenotes Estimação Camilo Daleles Reó, Istituto Nacioal de Pesquisas Espaciais, Brasil disciplia:estatística: Aplicação ao Sesoriameto Remoto (008) URL: http://www.dpi.ipe.br/~camilo/estatistica/otas.html Estimação por Itervalos Aa Pires, IST Lisboa disciplia: Probabilidades e Estatística URL: : http://www.math.ist.utl.pt/~apires/materialpe.html 36 6