PROBABILIDADE E ESTATÍSTICA UIA 3 ESTATÍSTICA INFERENCIAL

Tamanho: px
Começar a partir da página:

Download "PROBABILIDADE E ESTATÍSTICA UIA 3 ESTATÍSTICA INFERENCIAL"

Transcrição

1 VERSÃO PARA IMPRESSÃO PROBABILIDADE E ESTATÍSTICA UIA 3 ESTATÍSTICA INFERENCIAL

2 2 Este material é destinado exclusivamente aos alunos e professores do Centro Universitário IESB, contém informações e conteúdos protegidos e cuja divulgação é proibida por lei. O uso e/ou reprodução total ou parcial não autorizado deste conteúdo é proibido e está sujeito às penalidades cabíveis, civil e criminalmente.

3 3 SUMÁRIO Aula 9 Estimadores e Estimativas Noções sobre Amostras Tipos de Amostragem Amostragem Aleatória Simples Amostragem Sistemática Amostragem Estratificada Amostragem por Conglomerados Estimadores e Estimativas Estimador Propriedades Desejáveis dos Estimadores Viés Consistência Eficiência Aula 10 Intervalos de Confiança Introdução Intervalo de Confiança de Variável Normal Intervalos de Confiança para Médias IC de uma Média com Variância Conhecida IC de uma Média com Variância Desconhecida Caso 1: Amostras Pequenas Caso 2: Amostras Grandes Intervalos de Confiança para Variâncias Intervalos de Confiança para Proporções Populações Finitas Aula 11 Testes de Hipóteses Hipótese Estatística Teste de Hipótese Tipos de Erro Teste de Significância para a Média Populacional Aula 12 Estatística Não Paramétrica Introdução Teste de Ajustamento Teste dos Sinais... 35

4 4 Aula 9 ESTIMADORES E ESTIMATIVAS Olá, estudante, bem-vindo(a) à terceira Unidade de Interação e Aprendizagem (UIA). Começa agora nosso conteúdo sobre Estatística Inferencial. Nesta nossa primeira aula, estudaremos estimadores e estimativas. Essas noções são essenciais para o dia a dia profissional e para o estudioso(a) da área. Boa aula! 9.1. NOÇÕES SOBRE AMOSTRAS n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n Assista ao vídeo de introdução à UIA 3 acessando o link a seguir. n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n Sabemos que a Estatística Descritiva utiliza medidas para descrever um grupo. Quando se coletam dados de toda a população para descrevê-la, temos o chamado censo. Ocorre que, na maioria das vezes, o censo é impraticável, ou mesmo inconveniente. Assim, usa-se um procedimento de amostragem. Amostragem é a seleção de parte da população em estudo para coleta de informações sobre os dados que se desejam determinar. Há vários métodos de amostragem, que devem ser usados conforme o objetivo buscado. O sentido do processo de amostragem é aquela famosa frase: você não precisa tomar toda a panela de sopa para saber se está bem temperada; uma colherada basta. Ou seja, você colhe uma amostra de toda a população e verifica se o tempero está bom. Há grande probabilidade de que o resultado seja aplicável a toda a panela. Assista a um trecho do filme 300, disponível no link a seguir. Perceberam que, quando acusado de ter trazido menos soldados do que os árcades, o rei espartano Leônidas perguntou a três daqueles sua profissão? E, apesar de o número de árcades ser aparentemente maior que o de espartanos, ele concluiu que havia menos soldados do que havia entre os trezentos espartanos. A pergunta: Leônidas precisou perguntar a todos os árcades sua profissão para tirar sua conclusão?

5 5 Não! Usando seu conhecimento sobre os árcades, mais a amostra que ele colheu, ele pôde generalizar sua análise para todo o grupo. Claramente, não podemos aplicar esse princípio a estudos estatísticos propriamente ditos, mas o espírito do processo é o mesmo: não precisamos de toda a população para tirar algumas conclusões sobre seus parâmetros. Uma boa amostra e mais alguns testes fornecem informações suficientes para a tomada de decisões. É o que veremos nesta aula e nas seguintes TIPOS DE AMOSTRAGEM Silva et al. (2011, p ) apresentam uma classificação dos processos de amostragem. Vamos focar a amostragem aleatória. A não aleatória pode ser intencional (quando o pesquisador seleciona os elementos pesquisados) ou voluntária (quando o elemento da população se apresenta para a pesquisa). Vejamos as aleatórias a seguir AMOSTRAGEM ALEATÓRIA SIMPLES A amostragem aleatória simples é aquela em que se toma a população e se sorteiam os n elementos pretendidos para a amostra. Esse sorteio pode ser feito por meio de cartões numerados, ou por uma tábua de números aleatórios. Obviamente, é necessário, antes do sorteio, atribuir a cada elemento da população um número para que se saiba qual elemento foi sorteado AMOSTRAGEM SISTEMÁTICA Se tivermos uma população com N elementos conhecidos, e queremos uma amostra com n elementos, numeramos cada elemento da população e obtemos o número inteiro k que é o número inteiro mais próximo de N/n, mas menor que essa fração. Daí, contamos os elementos de k em k, e tomamos todos os que ocupam a posição k. Veja o exemplo a seguir para entender uma aplicação frequente desse método de amostragem. Considere que uma consultoria esteja realizando uma auditoria nas notas fiscais de uma empresa. Essas notas estão numeradas de 1 até , e de acordo com os critérios do consultor, seriam necessárias 500 notas fiscais de amostra para realizar uma auditoria. O consultor resolve fazer uma amostragem sistemática. Ele realiza a conta: = 77,348 O número inteiro mais próximo desse resultado, e menor que ele, é 77. Logo, ele selecionará cada 77ª nota para obter sua amostra. Ou seja, tomará as notas numeradas com 77, 154, 231, 308 até a nota número , que será a 500ª nota fiscal de sua amostra.

6 AMOSTRAGEM ESTRATIFICADA Esta amostragem leva em conta a divisão da população em grupos (estratos) de acordo com um critério importante para a característica em estudo. Nesse caso, tomamos as amostras distribuídas pelos diversos estratos, de modo que os n elementos sorteados estão proporcionalmente distribuídos entre os estratos. Digamos que queiramos saber a opinião sobre um novo shopping center numa região administrativa do DF. Essa opinião, entre outras coisas, pode ser afetada pela idade das pessoas pesquisadas. Assim, se temos 30% de pessoas de 15 a 30 anos, 45% de pessoas de 30 a 60 anos e 25% de pessoas com mais de 60 anos, poderíamos compor nossa amostra com essas proporções em suas respectivas faixas etárias. As faixas são nossos estratos AMOSTRAGEM POR CONGLOMERADOS Numa abordagem semelhante à estratificada, essa modalidade de amostragem identifica, dentro da população, um grupo com características semelhantes às da população em estudo, e apenas características que sejam importantes na determinação dos resultados procurados. Assim, procede-se à amostragem dentro apenas desse grupo. Um exemplo citado em Silva et al. (2011, p. 90) é o de empresas que, para avaliar a aceitação de seu produto no eixo Rio-São Paulo, costumam lançá-lo previamente em Curitiba, região com composição bem semelhante à do eixo, e que pode servir de miniatura da população em apreço ESTIMADORES E ESTIMATIVAS Para o que segue neste item, vamos imaginar uma população e uma variável aleatória X, para a qual se estuda determinado parâmetro θ (letra grega theta). Esse parâmetro pode ser, por exemplo, a média de X. Com o intuito de se conhecer o parâmetro, poderia ser realizado um censo que coletaria os N valores de X para a população e caracterizaria o parâmetro completamente. Porém, como vimos anteriormente, quase nunca se procede esse tipo de pesquisa, por inconveniência ou impossibilidade. Assim, precisamos de um método que permita trabalhar o parâmetro θ por meio de amostras. Essas amostras serão entendidas como uma sequência de n valores de X coletados da população, indicada genericamente por x!, x! x!. A partir daí, podemos definir o que é um estimador ESTIMADOR O estimador é uma fórmula, uma função dos elementos amostrais, usada para a estimação de um parâmetro populacional desconhecido. Como exemplos, têm-se estimadores para a média, o desvio padrão, as demais medidas de posição (moda, mediana etc.).

7 7 Se o parâmetro populacional procurado é θ, seu estimador é indicado, em geral, por θ ( theta chapéu 1 ). O estimador, portanto, é uma fórmula que envolve os valores encontrados na amostra. Por isso, é costume escrever: Vejamos alguns exemplos. θ = f x 1, x 2 x n João pretende calcular a renda média das famílias de sua região administrativa. Para tanto, tomou uma amostra de 75 famílias para fazer tal estimativa. Uma proposta que ele apresentou foi estimar a média usando a mediana de sua amostra. Isso significa que ele ordenou suas amostras em ordem crescente x! x! x! x!" x!" e tomou o elemento do meio. O elemento do meio é o 38º valor. Assim, a média estimada por João pode ser descrita, em fórmula, por: μ = x!" Em resposta a João, o professor de Estatística lhe sugeriu que usasse uma fórmula semelhante à da média populacional. Já que a média populacional é obtida somando-se todos os elementos e dividindo-os pelo número total de elementos, a estimativa amostral poderia ser feita de maneira análoga, ou seja, somando todos os elementos e dividindo-os pela quantidade total de elementos da amostra. Essa fórmula para a média amostral é a mais usada, uma vez que emula a própria metodologia de cálculo da média nas amostras. Por isso, ela tem um símbolo próprio, ainda que μ seja perfeitamente aceitável. A fórmula do estimador amostral de média populacional fica, então: X = x! + x! + x! + + x!" + x!" 75 Pedro, por sua vez, pesquisou sobre como estimar a variância. Ele encontrou duas fórmulas, na verdade. A primeira delas é a chamada estimador de máxima verossimilhança. Esse estimador tem características probabilísticas interessantes, e é dado por: σ! =!!!! x! x! n 1 Na estatística, um "chapéu" sobre uma letra geralmente significa a estimativa de um parâmetro.

8 8 Ou seja, basicamente imita a fórmula da variância populacional, limitada pelos elementos da população. A segunda fórmula encontrada por Pedro em seus estudos está abaixo. Ela é a mais usada, devido a características desejáveis que carrega em sua estrutura, as quais veremos a seguir. Por ser tão usada, não é costume usar o ^ (chapéu) como diferenciador da variância amostral, mas se usa S! como referência. A fórmula desse estimador é: S! =!!!! x! x! n 1 Perceba que ela muda em relação ao anterior no denominador: divide-se por n 1, e não por n PROPRIEDADES DESEJÁVEIS DOS ESTIMADORES Um estimador perfeito não existe. Melhor dizendo, perfeito no sentido de sempre acertar o valor populacional. O fato de tomarmos amostras, apesar de metodologicamente testado e correto, não substitui totalmente o censo. Assim, cada estimador de parâmetro tem em si características que o podem tornar mais ou menos desejável. Antes de vê-las, vamos destacar o que segue. Um estimador depende das amostras colhidas. Essas amostras são colhidas aleatoriamente, conforme destacamos no item 9.1. Assim sendo, cada valor pode ser considerado uma variável aleatória diferente. Cuidado! Mesmo que as amostras sejam referentes a uma mesma variável de estudo, o fato de elas serem independentes uma das outras faz possível enxergá-las como sendo n variáveis aleatórias diferentes, com a mesma distribuição de probabilidades. Vejamos um exemplo. A idade das mulheres do nosso último exemplo é uma variável aleatória. Mas, ao coletarmos as amostras, cada valor pode ser visto, isoladamente, como uma variável aleatória independente das outras. A cada observação que fizemos, todo o espaço amostral podia ter ocorrido, com a distribuição de probabilidades peculiar àquela população. Com isso, podemos concluir que qualquer estimador também é uma variável aleatória, uma vez que seu valor depende de variáveis sujeitas a probabilidades, também esse valor está sujeito a probabilidades. Logo, ao estimador se aplicam conceitos de valor esperado e de variância (e desvio padrão). É com base nisso que estabelecemos suas características desejáveis.

9 VIÉS Seja um parâmetro θ cujo valor se refere a uma variável aleatória X. Um estimador θ do parâmetro é não viesado (ou justo, ou não viciado, ou não tendencioso) quando seu valor esperado é igual ao real valor populacional do parâmetro. Em outras palavras: E θ = θ Chamamos de viés do estimador a diferença E θ θ. O estimador da média amostral X é um estimador não viesado da média populacional μ. Isso significa que o valor esperado de X, tomando todas as amostras possíveis com as respectivas probabilidades, é igual à própria média populacional. O estimador de máxima verossimilhança da variância σ! é um estimador viesado da variância populacional σ!. Isso significa que existe uma diferença entre o valor esperado do estimador e a variância populacional. Essa diferença é eliminada quando usamos o denominador n 1 no lugar de n, conforme a fórmula de S! vista anteriormente. Ou seja, o estimador S! já é um estimador não viesado da variância populacional CONSISTÊNCIA Seja um parâmetro θ cujo valor se refere a uma variável aleatória X. Um estimador θ do parâmetro é consistente quando for não tendencioso e sua variância tender a zero com o aumento da amostra. Em outras palavras: E θ = θ e lim n! V θ = 0 Perceba que a consistência está diretamente ligada à estabilidade do estimador, ou seja, quanto maior a amostra (ou quanto mais próxima a amostra se encontra da população), menor tende a ser a variação das estimativas em torno do valor esperado. Isso faz com que a média das estimativas se aproxime do real valor do parâmetro com cada vez menos efeito de valores aleatórios.

10 EFICIÊNCIA Seja um parâmetro θ cujo valor se refere a uma variável aleatória X. Um estimador θ! do parâmetro é mais eficiente que um estimador θ! quando a variância de θ! for menor que a variância de θ! : V θ 1 < V θ 2 Leia mais a respeito de estimativa e estimação acessando o link a seguir. Termina aqui nossa primeira aula desta unidade. Introduzimos conceitos que serão importantes ao longo desta parte do conteúdo. Continue os estudos desta disciplina e até breve! Aula 10 INTERVALOS DE CONFIANÇA Caro(a) estudante, nesta aula introduziremos os conceitos de intervalos de confiaça aplicado ao assunto dos estimadores e estimativas. Bom estudo! INTRODUÇÃO Vimos o que são estimadores e como se calculam estimativas. Continuaremos esse estudo aqui a partir da classificação de estimativa em dois tipos (COSTA, 2012, p. 89): a) Estimativa pontual: ocorre quando, a partir de uma amostra, toma-se o valor do parâmetro populacional desconhecido por um único número (estatística amostral). O exemplo da aula 9, da idade de indivíduos do sexo feminino, pode ser considerado uma estimativa pontual. b) Estimativa por intervalo: é quando, a partir de uma amostra, toma-se o valor do parâmetro populacional desconhecido por um conjunto ou intervalo de estimativas. Assim, esse tipo de estimativa é um intervalo determinado por dois números, obtidos a partir de elementos amostrais, que se espera que contenha o valor do parâmetro populacional com um dado nível de confiança 2 : 90%, 95%, 97,5% etc. Um exemplo de estimativa por intervalo seria tomar, com 95% de confiança, 2 Se repetirmos um número muito grande de amostras para calcular, por exemplo, a média, e se em aproximadamente 5% dessas amostras, rejeitarmos a hipótese nula quando ela é verdadeira, espera-se que ao coletar uma amostra dessa população tenhamos 95% de casos em que a hipótese nula seja realmente falsa. Assim estabelece-se a confiança no resultado do experimento. No caso, um intervalo de confiança de 95% equivalente a dizer que existe um erro Tipo I de 5%.

11 11 um intervalo que contenha a proporção de pessoas com nível superior, concursadas, na cidade de Brasília. Essas estimativas por intervalos serão tratadas nesta aula INTERVALO DE CONFIANÇA DE VARIÁVEL NORMAL Imagine que X seja uma variável aleatória com distribuição normal, ou seja, X~N μ, σ!. Já aprendemos a calcular a probabilidade P a X b, por meio da padronização de X. Basicamente, encontra-se o intervalo de Z resultante da padronização e calcula-se a probabilidade consultando a tabela normal de distribuição acumulada. Bem, agora queremos o seguinte: temos uma variável normal, conhecemos sua média populacional e sua variância, queremos ter um intervalo para essa variável. Em outras palavras, se formos dar uma estimativa de X, não apenas pontual, mas com um intervalo (a chamada margem de erro), como podemos fazer isso? O intervalo de confiança é a sistemática de estabelecer um conjunto de estimativas para o parâmetro populacional com a finalidade de mensurar num intervalo o seu valor. Logo, enquanto a estimativa pontual estabelece apenas um único valor, a estimativa intervalar indica para o valor do parâmetro populacional um intervalo, um conjunto de estimativas. Busca-se, assim, um intervalo no qual tenhamos confiança adequada para tomada de decisão de acordo com o estudo que está sendo feito. Nesse sentido, o conjunto de estimativas estabelece várias alternativas para o valor que estamos procurando a partir da amostra. Existem mais estimativas à medida que a confiança requerida aumenta, e cada estimativa contemplada no intervalo de confiança passa a ser uma informação a mais com relação ao valor do parâmetro. Assim, a confiança intervalar está diretamente ligada ao número de estimativas que, num estudo exploratório, deseja-se disponibilizar para conhecer ou se ter informação sobre o parâmetro desejado (COSTA, 2012, p. 93). Destaca-se que o intervalo de confiança é construído em torno de uma estimativa pontual, considerando-se o erro padrão, que informa o domínio em que o parâmetro populacional desconhecido deve estar situado. Essa certeza é quantificada em termos de probabilidades e é conhecida como confiança do intervalo (β, lê-se beta ). A probabilidade de o intervalor não conter o parâmetro populacional desconhecido é chamado de nível de significância 3 (α, lê-se alfa ). Assim, temos que: α = 1 β. 3 No teste de hipóteses, a significância de um teste está relacionada ao nível de confiança ao rejeitar-se hipótese nula quando ela é verdadeira, decisão conhecida como erro do tipo I. O nível de significância de um resultado é também chamado de α.

12 12 As confianças mais utilizadas nos estudos e trabalhos exploratórios em estatística são: 68%, 90%, 95% e 99%, conhecidos como intervalos de confiança notáveis. O procedimento para determinar o intervalo de confiança de uma variável normal, uma vez escolhido o nível de confiança desejado, é praticamente o inverso do cálculo da probabilidade. Veja o exemplo a seguir para entender melhor. Um estudo mostrou que os sacos de bala de uma fábrica, que nominalmente pesam 500 gramas, têm, na verdade, uma margem de erro, uma vez que cada bala pode ter peso levemente diferente. Assim, o Controle de Qualidade da fábrica fez um estudo e determinou que, em média, cada saco de bala pesa 500 gramas, mas que esse peso tem uma variância de 16 gramas quadrados. Vamos determinar um intervalo de confiança para o peso dos sacos de bala, assumindo que esse peso seja uma variável aleatória de distribuição normal. Queremos uma confiança de 90%. O gráfico que ajuda a visualizar a situação é o seguinte: Perceba que estamos montando um intervalo simétrico em relação à média; por isso temos a mesma probabilidade nas duas caudas. Bem, como já mencionado, o procedimento que seguiremos é o caminho inverso ao do cálculo das probabilidades. Enquanto ali padronizávamos a variável X e consultávamos os valores de Z que forneciam as probabilidades acumuladas, aqui nós partimos da probabilidade já conhecida (nível de confiança) e vemos qual o valor de Z que fornece aquela probabilidade acumulada. Em seguida, revertemos a padronização, alcançando um intervalo para X. Vejamos, então. Como a tabela de que dispomos fornece a distribuição acumulada, temos condição de determinar o valor Z que determina o limite direito do intervalo. Chamemos esse valor de z tabelado (z!"# ). Para o limite à direita, a probabilidade acumulada é de 95% (0,90 da faixa do intervalo de confiança procurado, mais 0,05 da cauda esquerda). Assim, vejamos na tabela qual o valor de Z que tem a acumulada mais próxima de 0,95. Esse valor é z!"# = 1,64. Como o intervalo é simétrico em relação à média (que, para Z da tabela, é zero), temos que o limite à esquerda é z = 1,64. Assim, podemos escrever: P 1,64 Z 1,64 = 0,90 Em outras palavras, o intervalo de uma v.a. normal padronizada que tem 90% de confiança é o que vai de 1,64 até 1,64. Precisamos, agora, encontrar os valores de X que correspondem a esses limites. Veja que a fórmula de padronização é:

13 PROBABILIDADE E ESTATÍSTICA UIA 3 𝑍= 13 𝑋 𝜇 𝜎 Assim, podemos encontrar os limites de 𝑋, lembrando que o desvio padrão é 𝜎 = 16 = 4: 𝑍 = 1,64 𝑋 𝜇 𝑋 500 = 1,64 = 1,64 𝜎 4 𝑋 500 = 1,64 4 𝑋 = 493,44 𝑍 = 1,64 𝑋 𝜇 𝑋 500 = 1,64 = 1,64 𝜎 4 𝑋 500 = 1,64 4 𝑋 = 506,56 Logo, podemos concluir que: 𝑷 𝟒𝟗𝟑, 𝟒𝟒 𝑿 𝟓𝟎𝟔, 𝟓𝟔 = 𝟎, 𝟗𝟎 Ou seja, com 90% de confiança, podemos afirmar que o peso de um saco de balas varia de 493,44 a 506,56 gramas. Ou, de outra forma, podemos afirmar que 90% dos sacos de bala saem da fábrica com peso nesse intervalo. Alternativamente, poderíamos dizer que o peso de um saco de balas é de 500 g, em média, com margem de erro de 6,56 g para mais ou para menos. Em vez de realizar todo esse cálculo, podemos montar uma fórmula genérica para intervalos de confiança de variáveis com distribuição normal. Chamemos o valor de 𝑍 encontrato na tabela para o nível de confiança desejado por 𝑧!"#. O intervalo de confiança pode ser escrito assim (lembrando que 𝛼 é a significância, ou seja, a probabilidade de 𝑋 estar fora do intervalo determinado): 𝑷 𝝁 𝒛𝒕𝒂𝒃 𝝈 𝑿 𝝁 + 𝒛𝒕𝒂𝒃 𝝈 = 𝟏 𝜶 INTERVALOS DE CONFIANÇA PARA MÉDIAS Neste item, veremos como se determinam intervalos de confianças (IC) para médias. Já vimos que uma média pode ser estimada, caracterizando-se, neste caso, como variável aleatória. Essa estimativa pode ser pontual ou pode ser por intervalo, como já vimos. Vamos aprender a montar um IC para a média, ou seja, vamos ver como calcular a margem de erro de uma média amostral, de modo que esse intervalo contenha a média populacional com certo nível de confiança. São dois os casos possíveis IC DE UMA MÉDIA COM VARIÂNCIA CONHECIDA Suponha que você tenha uma variável aleatória 𝑋. Você quer estimar a média populacional 𝜇 dessa v.a., e fará isso com o estimador 𝑋. De alguma maneira, você conhece a variância populacional 𝜎! (p. ex., usando estimativas anteriores comprovadas por meio de um censo). Qual seria um intervalo de confiança para a média populacional 𝜇?

14 PROBABILIDADE E ESTATÍSTICA UIA 3 14 O teorema central do limite garante que a média amostral 𝑋 de uma variável aleatória 𝑋, calculada com uma amostra de 𝑛 elementos, é também uma variável aleatória, com as seguintes características: é normalmente distribuída (ainda que 𝑋 não seja); tem média 𝑬 𝑿 = 𝝁, igual à média de 𝑿; tem variância 𝑽 𝑿 = 𝝈𝟐 𝒏. Ora, o fato de a média amostral ter distribuição normal, qualquer que seja a variável 𝑋 é muito interessante e positivo, uma vez que simplifica nossa vida no cálculo dos ICs. Só devemos tomar cuidado com a variância, que é igual à variância de 𝑿 dividida pelo tamanho da amostra. Aplicando a fórmula do tópico 10.2, podemos escrever o seguinte, observando que o desvio padrão é a raiz quadrada da variância, ou seja, 𝑑𝑝 𝑋 = 𝑷 𝑿 𝒛𝒕𝒂𝒃 𝝈 𝒏 𝝁 𝑿 + 𝒛𝒕𝒂𝒃 𝝈 𝒏 𝑉 𝑋 : =𝟏 𝜶 Uma pesquisa de mercado selecionou 20 pessoas de forma aleatória e revelou que o salário médio foi de R$ 1.500,00. O desvio padrão fornecido a partir de pesquisas anteriores dessa população foi de R$ 150,00 reais. Determine o intervalo de confiança considerando 5% de significância para a média salarial do mercado considerado. Temos que 95% = 1 𝛼, pois 𝛼 = 5%. Assim: 𝑃 𝑋 𝑧!"# 𝜎 𝑛 𝜇 𝑋 + 𝑧!"# 𝜎 𝑛 =1 𝛼 Para calcular o intervalo, temos que verificar o valor de 𝑧!"# na tabela da normal padrão. Da mesma forma que no exemplo anterior, se temos 95% de significância, isso indica que há duas caudas de área 0,025 na curva normal, uma à direita e uma à esquerda. Como a tabela da distribuição normal fornece os valores da distribuição acumulada de até 𝑧!"#, temos que essa área é de 0,975. Veja a figura: Consultando a tabela para esse último valor, temos que 𝑧!"# = 1,96. 𝑃 1.500,00 1,96 150,00 20 𝜇 1.500,00 + 1,96 150,00 𝑷 𝟏. 𝟒𝟑𝟒, 𝟐𝟔 𝝁 𝟏. 𝟓𝟔𝟓, 𝟕𝟒 = 𝟎, 𝟗𝟓 20 = 0,95

15 15 Dessa forma, a média salarial do mercado deve estar entre R$ 1.434,26 e R$ 1.565,74 com 95% de certeza IC DE UMA MÉDIA COM VARIÂNCIA DESCONHECIDA No tópico anterior vimos como estimar um intervalo de confiança para a média de uma variável aleatória, contanto que conheçamos sua variância. O problema é que, em quase todas as vezes, não conhecemos a variância populacional. Ela também é estimada no momento em que estimamos a média. Dessa maneira, o procedimento tem uma pequena mudança. Vamos separar essa situação em dois casos: uma em que a amostra é pequena, e outra em que a amostra é grande. Agora trataremos de ambas detalhadamente a seguir CASO 1: AMOSTRAS PEQUENAS Quando mexemos com amostras pequenas, a distribuição normal não é a melhor distribuição para essa estimação. Nesse caso, usamos a distribuição t-student. Na ocasião, vimos que a referência para uma amostra pequena, neste curso, são 35 elementos. Assim, quando formos estimar um IC para a média de uma variável aleatória sem conhecer a variância populacional, calculamos a variância pelo estimador S! (visto no tópico 9.2.1) e usamos a distribuição de Student no lugar da normal. Isso implica que a fórmula vista para o IC deve trocar o valor de z!"# pelo valor de t tabelado, que indicaremos por t!"#. Para referência, a fórmula é: P X t tab S n μ X + t tab S n = 1 α Considere a amostra da idade de indivíduos do sexo feminino do tópico , X = 18, 22, 19, 33, 41, 27, 25, 55, retirada de forma aleatória, de uma população. Já vimos que a média amostral é de X = 30. Construa um intervalo de confiança para a média de idades ao nível de 95%. Perceba que não foi dada a variância populacional, e a amostra é pequena (n = 8). Assim, vamos usar a distribuição t-student. Vamos calcular a variância amostral e o desvio padrão, em sequência. Para a variância, a fórmula que vimos na prática do tópico (Aula 9) é a seguinte: S! = 1 n 1!!!! x! X! Veja que precisamos da soma dos quadrados das diferenças entre cada elemento e a média. Assim, vamos montar uma tabela para ajudar:

16 PROBABILIDADE E ESTATÍSTICA UIA 3 𝑿 𝑿 𝑿 𝑿 𝑿 = = = = = = = = SOMA 𝟎 𝟏𝟏𝟏𝟖 16 𝟐 Assim, a variância amostral fica: 𝑆! = = 𝑆! = 159, O desvio padrão amostral é a raiz quadrada deste resultado: 𝑆= 𝑆! = 12,64 Agora, precisamos consultar a tabela t-student. Essa tabela se baseia não na distribuição acumulada, mas na área da cauda direita. Como queremos uma confiança de 95%, cada uma das caudas terá área de 0,025 =!,!"!. Os graus de liberdade, já vimos, são dados por: 𝜑 = 𝑛 1 𝜑 = 7 Consultando a tabela na linha de 𝜑 = 7 e na coluna de 0,025, encontramos 𝑡!"# = 2,365. Assim, 𝑃 𝑋 𝑡!"# 𝑃 30 2,365 𝑆 𝑛 12,64 8 𝜇 𝑋 + 𝑡!"# 𝑆 𝑛 𝜇 ,365 =1 𝛼 12,64 8 = 0,95 𝑷 𝟏𝟗, 𝟒𝟑 𝝁 𝟒𝟎, 𝟓𝟕 = 𝟎, 𝟗𝟓 Dessa forma, a média de idades de indivíduos do sexo feminino deve estar entre 19,43 e 40,57 anos com 95% de certeza. Um intervalo muito amplo, pode-se pensar, mas devemos considerar que a amostra é muito pequena. Não podemos tirar nenhuma conclusão mais precisa CASO 2: AMOSTRAS GRANDES Para os casos em que as amostras são grandes, ou seja, 𝑛 > 35, já vimos que a distribuição t-student se aproxima muito da distribuição normal. Assim, podemos montar um intervalo de confiança para a média

17 17 usando a distribuição normal, considerando que o desvio padrão será o obtido pela amostra S, como, por exemplo, vimos no último exercício INTERVALOS DE CONFIANÇA PARA VARIÂNCIAS Vimos no item anterior que, em muitas situações, a própria variância deve ser estimada. Assim, é necessário que estabeleçamos um IC para saber se a estimativa encontrada está dentro de parâmetros aceitáveis ou não. Um intervalo de confiança para a variância de X normalmente distribuída não pode seguir o padrão que já vimos nos itens anteriores porque a variância não tem distribuição normal nem aproximadamente normal (como a t-student, p. ex.). Se observarmos a fórmula da variância, porém, veremos que ela se compõe da soma de quadrados. Cada elemento elevado ao quadrado, X X, pode ser considerado normalmente distribuído, uma vez que X é normalmente distribuída e também a média amostral, pelo teorema central do limite. Assim, a variância segue uma fórmula semelhante à da definição dada na Aula 9 para a distribuição χ!. A bem da verdade, a estimativa S! segue uma distribuição dada por: σ! S! ~ n 1 χ!!! Ou seja, a distribuição de probabilidades de S! é igual à distribuição qui-quadrado com n 1 graus de liberdade multiplicada por uma constante (lembre-se de que σ! é um parâmetro da população, ainda que desconhecido; logo, é uma constante). Lançando essa fórmula, e vendo que a distribuição qui-quadrado não é simétrica, temos a seguinte fórmula para o IC da variância:! P S2 n 1 χ 2 sup σ 2 S2 n 1 χ 2 inf = 1 α Perceba que há dois valores de χ! a serem encontrados, um inferior e um superior. O exemplo a seguir dará maiores esclarecimentos a esse respeito. Considere uma amostra, com tamanho igual a 15, extraída de uma população com distribuição normal. Seja a variância amostral igual a 3. Construa um IC para a variância populacional com nível de significância igual a 10%. Temos que n = 15, o que implica que temos 14 graus de liberdade (φ = 15 1 = 14). A estimativa amostral da variância foi S! = 3. Pretende-se, também, ter significância de 10%. Isso significa que a área do IC deve ser de 90%. Vamos supor que o intervalo deixe 5% de área em cada cauda. O gráfico ficaria assim:

18 18 Para consultar nossa tabela da distribuição χ!, devemos lembrar que a probabilidade ali! fornecida se refere à cauda direita. Logo, para achar χ!"#, olhamos a linha de φ = 14 e a! coluna referente a 0,05. Isso nos dá χ!"# = 23,68. Já para achar o limite inferior, perceba que ele tem uma cauda à esquerda de área 0,05, mas que isso equivale a uma cauda à direita de área 0,95. Assim, olharemos a tabela na linha de φ = 14 e na coluna de área 0,95. O resultado! encontrado é χ!"# = 6,57. Lançando esses resultados na fórmula do IC, obtemos: P 3 (15 1) σ! 3 (15 1) 23,68 6,57 = 0,90 P 1, 77 σ 2 6, 39 = 90% Dessa forma, a variância populacional, com nível de significância igual a 10% (ou confiança de 90%), encontra-se no intervalo de 1,77 a 6, INTERVALOS DE CONFIANÇA PARA PROPORÇÕES Este com certeza é um dos itens mais esperados do curso! Quando falamos de proporções, é importante destacar que incluímos também as porcentagens. Ou seja, vamos aprender aqui a montar intervalos de confiança para pesquisas de opinião, como as pesquisas eleitorais. Para tanto, vamos lembrar que uma porcentagem é uma espécie de média. Assim, montamos o IC da mesma forma como montamos as médias, a diferença está na variância, que é bem mais simples, neste caso. Quando se pesquisa uma proporção (ou porcentagem) p e se encontra, na amostra, um valor estimado p, a variância amostral é dada por: S! p 1 p = n S = p 1 p n Assim, pode-se usar a fórmula vista no tópico (apesar de a variância populacional ser, em geral desconhecida, nunca se usam amostras pequenas em pesquisas em que porcentagens estão envolvidas). Veja um exemplo.

19 PROBABILIDADE E ESTATÍSTICA UIA 3 19 Um grupo de estudos procurou saber a taxa de aprovação das políticas da ONU entre os brasileiros. Para tanto, selecionou uma amostra de pessoas e obteve uma aprovação de 60%. Vamos montar um intervalo de confiança com 10% de significância para essa proporção. Esse IC terá a seguinte estrutura: 𝑃 𝑝 𝑧!"# 𝑝 1 𝑝 𝑝 𝑝 + 𝑧!"# 𝑛 𝑝 1 𝑝 𝑛 = 0,90 Como queremos um intervalo com confiança 90%, então a significância está dividida em duas caudas de área 0,05. Logo, o 𝑧!"# será encontrado pela área mais próxima à acumulada de 0,95, como já vimos anteriormente. Esse valor é 𝑧!"# = 1,64. A porcentagem encontrada na amostra é 𝑝 = 0,60 e 𝑛 = Isso nos dá, então: 𝑃 0,60 1,64 0,60 0,40 𝑝 0,60 + 1, ,60 0,40 = 0, 𝑃 0,60 1,64 0,00016 𝑝 0,60 + 1,64 0,00016 = 0,90 𝑃 0,60 1,64 0,0126 𝑝 0,60 + 1,64 0,0126 = 0,90 𝑃 0,60 0,0207 𝑝 0,60 + 0,0207 = 0,90 𝑷 𝟎, 𝟓𝟕𝟗𝟑 𝒑 𝟎, 𝟔𝟐𝟎𝟕 = 𝟎, 𝟗𝟎 Logo, o IC para a porcentagem é de 57,93% até 62,07% de aprovação. Veja que, aproximadamente, é como se disséssemos que a aprovação é de 60%, com margem de erro de 2 pontos percentuais para mais ou para menos, como costumamos ouvir nos noticiários em época de eleição. Perceba que a construção do intervalo para a média faz exatamente isso: pega a porcentagem encontrada na amostra e, por meio da distribuição normal, com auxílio da variância, determina uma margem de erro positiva e negativa, que permite conhecer com certo nível de confiança (no caso, 90%), onde deve estar a real porcentagem POPULAÇÕES FINITAS Um estudo interessante deve ser feito quando temos populações finitas em estudo. Obviamente, toda população estudada pela Estatística é finita, afinal é composta por pessoas, índices calculados, ou qualquer coisa que o valha. Entretanto, populações muito grandes ( muito grandes aqui entendido como milhares) tendem a não afetar os resultados apresentados até agora em termos de estimativa intervalar.

20 20 Você ter uma população de 1 milhão de pessoas ou 10 milhões não faz diferença nenhuma, em termos de precisão da estimativa. Todavia, quando você coleta uma amostra de 50 pessoas numa população de 200, sem reposição, isso passa a ter significado, pois sua amostra é relativamente grande (você tomou 25% da população de amostra!) e as probabilidades de cada sorteio passam a ser afetadas pelos sorteios anteriores (fere a condição de independência da distribuição normal). Assim, fazem-se necessárias algumas correções nas fórmulas vistas. Vamos nos preocupar aqui só com a estimativa das médias, que é onde o tamanho da população vai afetar mais. Basicamente, o efeito é percebido na variância. Acrescenta-se o chamado fator de correção à fórmula da variância. Se a população tem tamanho N e a amostra tem tamanho n, esse fator é dado por: N n N 1 Assim, quando a população for pequena, o cálculo de probabilidades e de IC para as médias usará a variância corrigida. A variância da média amostral será dada, então, por: V X = σ2 n N n N 1 No caso de se estimar um IC para proporções, a variância corrigida para populações finitas é: p 1 p V p = n N n N 1 Vejamos um exemplo de cálculo de probabilidade. Exercícios com IC podem ser feitos da mesma forma que fizemos todos os desta aula, apenas acrescentando o fator de correção ao lado da variância. Num processo de fabricação, 500 esferas têm peso médio de 5 gramas e o desvio padrão de 0,3 gramas. Determine a probabilidade de uma amostra de 100 esferas, escolhidas ao acaso, ter o peso total de acima de 505 gramas. Considere a amostragem sem reposição. Resposta: Temos que: μ = 5; n = 100; N = 500. O que se procura é a probabilidade de a média amostral ser dada por: X = = 5,05 Estamos trabalhando com as médias porque a referência dada no início foi a média. Além do mais, é a medida certa para comparar grupos com tamanhos distintos (a população de 500 esferas e a amostra de 100). Vejamos, agora, a variância amostral. Como a amostra é significativa perto da população (20% da população), podemos considerar a população como sendo finita. Então, precisamos do fator de correção:

21 21 V X = σ! n N n N 1 = 0, O desvio padrão da proporção fica igual a: = 0, dp X = σ! = V p = 0, = 0,027 Pelo teorema central do limite (conceito dado no tópico 10.3), a média tem distribuição normal. Assim, para calcular probabilidades envolvendo a média, precisamos padronizar a variável. Temos: Z = X μ σ! = 5,05 5 0,027 = 1,85 Logo, consultando a tabela da distribuição normal: P Z > 1,85 = 1 P Z 1,85 = 1 0,9678 P Z > 1, 85 = 0, 0322 Concluímos, então, que haverá apenas 3,22% de chance de o peso estar acima de 505 g. A Khan Academy tem vários vídeos sobre intervalos de confiança. Vale a pena conferir os links seguintes, nesta ordem: Detalhe mais os conceitos e exercite mais a respeito de intervalos de confiança acessando o link a seguir. Os conceitos apreendidos aqui têm grande valia para a formação nessa área. Continue estudando!

22 22 Aula 11 TESTES DE HIPÓTESES Na maioria das vezes, os pesquisadores dependem de amostras para que possam tomar decisões nas quais representem uma população em estudo. Existe, assim, a necessidade de se testar a veracidade desses resultados amostrais. Pode-se, então, testá-los a partir de técnicas estatísticas denominadas de testes de hipóteses 4, assunto desta próxima aula. Bom estudo! HIPÓTESE ESTATÍSTICA O processo de hipótese estatística inicia-se a partir de um valor hipotético para um parâmetro populacional e, com base nas informações da amostra, é feito o teste estatístico. A decisão para se aceitar ou rejeitar a hipótese é feita de acordo com os elementos gerados a partir de uma amostra. Sabe-se que, com o resultado de uma amostra, não é possível tomar decisões exatamente corretas, assim, tomar-se-á decisões em condição de incerteza, portanto, sujeitas a erro. Trata-se de um critério no qual o valor de um parâmetro populacional ou uma determinada distribuição de probabilidades é testada como uma suposição. São apresentados a seguir alguns exemplos: O peso médio da população de uma determinada cidade do Sul do país é de 75 kg, assim, a hipótese pode ser representada da seguinte forma: H: μ = 75 kg O desvio padrão do salário mínimo no Brasil é de R$ 50,00, logo: H: σ = 50 A proporção de mulheres com o mal de Alzheimer no Brasil é de 3%, logo: H: p = 0,03 4 A hipótese estatística é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade para uma ou mais populações.

23 23 A distribuição da média populacional no Brasil é descrita como sendo uma distribuição normal. As hipóteses estatísticas são elaboradas pelo pesquisador com base em premissas de seu estudo a respeito de determinados fenômenos ou de teorias. Vamos, então, verificar como dimensionar a probabilidade da decisão de aceitar ou rejeitar a hipótese estatística e qual o risco envolvido nesse processo TESTE DE HIPÓTESE Existem dois tipos de hipóteses, a hipótese nula e a hipótese alternativa. A hipótese nula é denominada por H! (lê-se também como H zero ). Refere-se à hipótese a ser testada. A hipótese nula expressa sempre uma igualdade. A hipótese alternativa é denominada por H! (lê-se H um ). A hipótese alternativa expressa sempre uma desigualdade negando a hipótese nula (não negando do ponto de vista lógico, mas tornando-a falsa de alguma forma). A seguir, são apresentados alguns exemplos de hipótese que serão estudados para um teste estatístico, com as diversas opções para a hipótese alternativa: H! : μ = 75 kg H! : μ 75 kg H! : μ = 75 kg H! : μ > 75 kg H! : μ = 75 kg H! : μ < 75 kg H! : σ = 50 H! : σ 50 H! : σ = 50 H! : σ > 50 H! : σ = 50 H! : σ < 50

24 24 H! : p = 0,03 H! : p 0,03 H! : p = 0,03 H! : p > 0,03 H! : p = 0,03 H! : p < 0, TIPOS DE ERRO Conforme já comentado, ao se tomar a decisão de aceitar ou rejeitar a hipótese, fica-se numa eminente condição de incerteza, portanto sujeita a erro. Assim, quando realizamos um teste estatístico para aceitar ou rejeitar a hipótese nula H! é possível encontrar dois tipos de erro. Pode-se rejeitar a H!, quando ela é verdadeira, ou aceitá-la, quando ela for falsa. O erro de rejeitar H! quando ela é verdadeira é conhecido como erro tipo I, e a probabilidade associada ao cometer-se esse tipo de erro é designada como α. Por sua vez, o erro de aceitar H! quando ela é falsa é conhecido como erro tipo II, e a probabilidade associada ao cometer-se esse tipo de erro é designada como β (lêse beta). O quadro abaixo resume as condições dos erros do tipo I e II: Decisão Realidade H 0 verdadeira H 0 falsa Não rejeitar H 0 Decisão correta (1 α) Erro do tipo II (β) Rejeitar H 0 Erro do tipo I (α) Decisão correta (1 β) Fonte: MARTINS, Gilberto de Andrade; DOMINGUES, Osmar. Estatística geral e aplicada. São Paulo: Atlas, p O pesquisador que deseja tomar a decisão procura, sempre, minimizar as probabilidades dos dois tipos de erro. Um dos fatores que pode reduzir o erro é o aumento do tamanho da amostra. Seja o exemplo dado do peso médio da população de uma determinada cidade do Sul do país, temos que μ = 75 kg. Suponha que a variância da população é igual a 16 e que foi extraída uma amostra de 20 elementos. Vamos testar a hipótese abaixo: H! : μ = 75 kg; H! : μ > 75 kg.

25 25 Como a média X é estimador de μ, podemos utilizar a distribuição normal conforme visto na aula anterior. O esquema a seguir demonstra como se comportam tais valores, considerando-se as regiões consideradas de não rejeição e de aceitação para a hipótese nula (H! ): Fonte: adaptado de O valor X! representa a posição da linha de corte entre as regiões de rejeição e não rejeição da hipótese nula. Por essa razão, é denominado valor crítico. A área hachurada à direita de X! equivale à probabilidade de rejeitar H! quando ela for verdadeira, ou seja, é a probabilidade de ocorrer um erro tipo I (α). Para determinar o limite crítico X!, escolhe-se um valor para α. Vamos atribuir-lhe o valor de 5% = 0,05 neste exemplo. Daí, partimos para a padronização dos valores uma vez que usaremos a distribuição normal. Sabemos que, com o intuito da área hachurada ser 0,05, a probabilidade da região de não rejeição deve ser 0,95, e ela representa exatamente a distribuição acumulada de uma distribuição normal. Assim, para encontrarmos z!"# (que aqui poderá ser chamado z crítico, e indicado por z! ), vemos qual valor mais se aproxima de uma acumulada de 0,95, e esse valor é z! = 1,64. Para finalizar, precisamos do desvio padrão, que é calculado a partir da variância populacional, dada da seguinte forma: σ = σ! = 16 σ = 4 Logo, montamos o intervalo de rejeição (ou de não rejeição, qualquer dos dois dará o

26 26 mesmo valor crítico, uma vez que o limite coincide): P X > X! = 0,05 P X > μ + z! σ n = 0,05 Perceba que usamos o sinal +, pois o valor crítico está à direita da média populacional. Substituindo os valores: P X > , = 0,95 P X > ,64 0,8944 = 0,05 P X > 76, 4669 = 0, 05 Ou seja, o valor crítico é X! = 76,4669 kg. Isso significa que, se o peso médio de alguma amostra passar desse limite, pode-se rejeitar a hipótese nula, com significância de 5% (ou seja, com probabilidade de α = 5% de rejeitar uma hipótese verdadeira). Vamos entender esse resultado!? Ele mostra que, caso a hipótese nula lançada (μ = 75) seja verdadeira, a probabilidade de encontrarmos uma amostra com peso médio acima de 76,47 kg é de 5%. Esses 5% são um limite estabelecido por nós. Ele mede uma forma de tolerância, ou seja, se ocorrer um negócio que tem só 5% de probabilidade de ocorrer, é porque a hipótese inicial está errada. Veja que podemos ser mais ou menos tolerantes. Se impusermos uma significância de α = 10%, significa que ocorrências com 10% de probabilidade são consideradas raras, e devem ser motivo de rejeição de uma hipótese que não as inclua. Se impusermos uma significância de α = 1%, nos tornamos mais tolerantes, afinal, apenas eventos tão raros quanto 1% de probabilidade incorrerá na rejeição da hipótese lançada. Esse é o sentido de um teste de hipóteses, razão pela qual também são chamados testes de significância. Leia mais a respeito de testes de hipóteses e faça exercícios disponíveis no link a seguir. Detalhe mais os conceitos do erro tipo I e do erro tipo II no teste de hipóteses. Acesse o link a seguir.

27 TESTE DE SIGNIFICÂNCIA PARA A MÉDIA POPULACIONAL n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n Assista ao vídeo sobre teste de significância para a média populacional. Acesse através do link a seguir. n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n Vimos no item anterior que o teste de hipótese passa por um intervalo de confiança. Assim, para testar uma estimativa da média populacional, vamos construir um IC para a média. A construção do IC passará por um dos casos já vistos na aula 15. Os critérios para decisão são os mesmos. Uma vez construído o IC, verifica-se se a estimativa está na região de rejeição ou de não rejeição da hipótese nula. Vamos ver um passo a passo desse procedimento (SIEGEL; CASTELLAN, 2006, p. 27; MARTINS; DOMINGUES, 2011, p. 325): a) Estabelecer a hipótese nula (H! ) e sua hipótese alternativa (H! ). Deve-se decidir quais dados serão coletados e qual o teste estatístico será aplicado (bicaudal ou unicaudal). b) Especificar um nível de significância (α) e identificar a variável de teste. c) Determinar a região crítica 5 ou de rejeição (RC) e a região de não rejeição (RA) para H! (calcular valores críticos). d) Decidir pela não rejeição ou rejeição de H!. Vamos usar um exemplo para explicar cada passo. Vejamos abaixo um teste de qualidade. Uma fábrica multinacional deseja produzir no Brasil um automóvel com componentes de energia solar que faz reduzir o consumo do veículo. O fabricante afirma que o carro consome em média 15 litros de combustível a cada 100 km, com um desvio padrão de 0,8 litros. Uma empresa especializada fez uma pesquisa com uma amostra de 50 carros e constatou que o consumo médio foi de 14,2 litros a cada 100 km. Considerando o nível de significância de 5%, podemos considerar que a média informada pelo fabricante é a mesma da equipe especializada? Vamos retomar a explicação dos primeiros tópicos da Aula 9. O fabricante fez uma afirmação sobre o rendimento do veículo que ele vende: o consumo médio é de 15 litros de combustível para cada 100 km de deslocamento. Queremos testar essa média e colher algumas amostras. Obviamente, é difícil nossas amostras baterem com o rendimento 5 É uma região na distribuição de probabilidades que está sendo usada no teste de hipóteses, na qual um conjunto de valores assumidos pela variável aleatória pode rejeitar a hipótese nula.

28 28 médio anunciado. Mas, se conseguirmos algo muito próximo (digamos, 14,9 litros), podemos tranquilamente considerar que o anúncio está correto, pois um errinho tão pequeno é perfeitamente justificável pelo fato de nossas amostras diferirem da população de referência do anunciante. Porém, se encontrarmos um rendimento de 10 litros para cada 100 km deslocados, aí a diferença seria gritante. É quase impossível encontrar uma amostra com média 10 nas condições dadas pelo exercício (média populacional 15 e desvio padrão 0,8). Ou seja, sabemos que há valores distintos da média aceitáveis e outros não. Então vem a pergunta: qual o critério de aceitação? Aí entram as probabilidades e os ICs. Ao estabelecer uma significância, estamos limitando qual é a probabilidade para aceitarmos uma eventual coincidência. Se a probabilidade de ocorrência da amostra for muito pequena, não podemos aceitá-la como um acidente : a hipótese nula deve ser rejeitada. Foi o nosso raciocínio com a amostra de média 10 no parágrafo anterior. O intervalo de confiança nada mais é que o estabelecimento dos limites da amostra, com base na significância desejada. Perceba que há certa subjetividade aqui, não existe um nível de significância certo, está à escolha do pesquisador. Também não podemos esquecer que há sempre a probabilidade de a decisão tomada (rejeitar ou não a hipótese nula) estar errada (erros tipo I e II). Compreendida essa situação, voltemos ao exercício. Vamos montar o IC para a média amostral. Sigamos os passos descritos acima. a) A hipótese nula (H! ) é simples de encontrar. Ela é a alegação que se está testando, no caso, o valor do consumo médio. A hipótese alternativa (H! ) é uma desigualdade que contrarie H!. Há três maneiras de fazer isso. Podemos usar uma hipótese alternativa com a relação. Nesse caso, teríamos que o fabricante ficaria desacreditado por sua afirmação se o consumo médio fosse maior ou menor que o alegado. Esse é o caso, pois, se o consumo for maior que o alegado, levando inclusive o fabricante a ser processado judicialmente por propaganda enganosa. Já se o consumo for menor, apesar de o consumidor ser beneficiado pelo fato, a alegação depõe contra o fabricante e seus gerentes, que confessarão ignorância sobre o próprio produto vendido. Assim, faremos um teste com as seguintes hipóteses: H! : μ = 15 H! : μ 15 Como podemos rejeitar H! tanto por valores muito maiores quanto por valores muito menores que o alegado, o teste é chamado bicaudal, indicando que a área de rejeição do teste se concentra nas duas caudas da curva normal. b) A significância desejada já foi dada pelo enunciado, é α = 5%. A variável aleatória para o teste é a normal, uma vez que temos uma média e a variância populacional é conhecida (aplica-se o teorema central do limite). Assim, usaremos a distribuição normal acumulada. c) Uma vez que o teste é bicaudal, as regiões de rejeição e de não rejeição ficam como no gráfico abaixo. Perceba que usamos RA para indicar não rejeição, sendo o A

29 PROBABILIDADE E ESTATÍSTICA UIA 3 referente à palavra aceitação. Alguns autores falam em aceitar a hipótese nula. Ainda que semanticamente sejam coisas quase equivalentes, o mais correto, do ponto de vista formal, é não rejeição, uma vez que o teste não dá critérios para aceitar a hipótese. Apenas tenta rejeitá-la e não consegue. Por isso preferimos dizer que aqui não se rejeita a hipótese nula. Observe o gráfico a seguir. 𝐻! : 𝜇 15 RA 1,96 1,96 Perceba que já marcamos nele os valores críticos de 𝑧. Esses valores são encontrados na tabela normal, lembrando que a significância está igualmente dividida entre as duas caudas (duas áreas de 0,025). Ou seja, o valor positivo de 𝑧!"# se refere ao da probabilidade acumulada de 0,975 (o total de 1 subtraído de toda a probabilidade desse 𝑧!"# até o infinito negativo). Consultando o valor acumulado de 0,975, encontramos o valor 𝑧!"# = 1,96. d) Para decidir pela rejeição ou não da hipótese nula, precisamos do intervalo. O IC bicaudal da média amostral é dado por: 𝑃 𝜇 𝑧!"# 𝜎 𝑛 𝑋 𝜇 + 𝑧!"# 𝜎 𝑛 =1 𝛼 Substituindo os valores já conhecidos nessa fórmula: 𝑃 15 1,96 0,8 50 𝑋 ,96 0,8 50 = 0,95 𝑃 15 1,96 0,1131 𝑋 ,96 0,1131 = 0,95 𝑷 𝟏𝟒, 𝟕𝟕𝟖𝟑 𝑿 𝟏𝟓, 𝟐𝟐𝟏𝟕 = 𝟎, 𝟗𝟓 Logo, a região RA de não rejeição da hipótese nula é limitada pelos números 14,78 e 15,22 litros. Como encontramos uma média X = 14,2 litros consumidos, optamos por rejeitar a hipótese lançada pelo fabricante, com 𝟓% de significância. Vejamos, agora, um teste unicaudal. 29

30 30 No Exame Nacional de Desempenho de Estudantes (ENADE), verificou-se que, nos últimos anos, a média de notas dos alunos foi de 80. O MEC quer verificar se as notas do novo grupo de alunos continuam com a mesma média de aprovação. Dessa forma, foi retirada, ao acaso, uma amostra de 25 alunos, obtendo-se a média de 83 e desvio padrão de 15. Considerandose 5% de nível de significância, faça o teste para verificar se a média aumentou. Siga os passos. a) Temos neste exercício uma média populacional μ = 80. Queremos saber se a média se manteve ou se a mudança detectada na amostra é significativa. Veja que a mudança procurada tem sentido definido: pergunta-se se a média aumentou. Assim, se a hipótese de igualdade (H! ) for rejeitada, deve sê-lo pela alternativa de a média ter aumentado. Assim, faremos um teste unicaudal com as seguintes hipóteses: H! : μ = 80 H! : μ > 80 Observe que a área de rejeição do teste se concentra na cauda direita da curva. b) A significância desejada já foi dada pelo enunciado, é α = 5%. A variável aleatória para o teste poderia ser a normal, uma vez que temos uma média. Porém a variância populacional é desconhecida, e a amostra é pequena (n = 25). Assim, usaremos a distribuição t-student. c) Uma vez que o teste é unicaudal, as regiões de rejeição e de não rejeição ficam como no gráfico a seguir: Precisamos do valor crítico de t, que indicaremos por t!"#. Para consultar a tabela da distribuição t-student, precisamos dos graus de liberdade. A fórmula aprendida fornece φ = 25 1 = 24. O valor crítico, então, é obtido na nossa tabela, na linha de 24 graus de liberdade e significância 0,05. Perceba que não dividimos por 2, uma vez que toda a significância está concentrada na cauda da direita. Encontramos t!"# = 1,71. d) Para decidir pela rejeição ou não da hipótese nula, precisamos do intervalo. O IC unicaudal da média amostral é dado por (usaremos o sinal de >, indicando a área

Aula 00 Aula Demonstrativa

Aula 00 Aula Demonstrativa Aula 00 Modelos de questões comentadas CESPE-UnB... 4 Relação das questões comentadas... 13 Gabaritos... 14 1 Olá, pessoal. Vamos começar a estudar Estatística para o futuro concurso do TCU? Esta é a aula

Leia mais

Aula demonstrativa Apresentação... 2 Modelos de questões comentadas CESPE-UnB... 3 Relação das questões comentadas Gabaritos...

Aula demonstrativa Apresentação... 2 Modelos de questões comentadas CESPE-UnB... 3 Relação das questões comentadas Gabaritos... Aula demonstrativa Apresentação... 2 Modelos de questões comentadas CESPE-UnB... 3 Relação das questões comentadas... 12 Gabaritos... 13 www.pontodosconcursos.com.br 1 Apresentação Olá, pessoal Tudo bem

Leia mais

Hewlett-Packard FUNÇÃO EXPONENCIAL. Aulas 01 e 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz

Hewlett-Packard FUNÇÃO EXPONENCIAL. Aulas 01 e 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Hewlett-Packard FUNÇÃO EXPONENCIAL Aulas 0 e 06 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ano: 06 Sumário Equação Exponencial... Equação Exponencial... Exemplo... Método da redução à base comum...

Leia mais

Hewlett-Packard FUNÇÃO EXPONENCIAL. Aulas 01 a 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz

Hewlett-Packard FUNÇÃO EXPONENCIAL. Aulas 01 a 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Hewlett-Packard FUNÇÃO EXPONENCIAL Aulas 0 a 06 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Sumário Equação Exponencial... Equação Exponencial... Exemplo... Método da redução à base comum... Exemplo......

Leia mais

PROGRESSÃO ARITMÉTICA

PROGRESSÃO ARITMÉTICA Hewlett-Packard PROGRESSÃO ARITMÉTICA Aulas 01 a 04 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Ano: 016 Sumário Progressão Aritmética... 1 PRELIMINAR 1... 1 Definição de progressão aritmética

Leia mais

PROGRESSÃO GEOMÉTRICA

PROGRESSÃO GEOMÉTRICA Hewlett-Packard PROGRESSÃO GEOMÉTRICA Aulas 01 a 05 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Ano: 2015 Sumário PROGRESSÃO GEOMÉTRICA (P.G.)... 1 PRELIMINAR 1... 1 DEFINIÇÃO... 1 A RAZÃO DE

Leia mais

Medidas de Dispersão ou variabilidade

Medidas de Dispersão ou variabilidade Medidas de Dispersão ou variabilidade A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou

Leia mais

Estatística e Probabilidade

Estatística e Probabilidade Teste de hipóteses Objetivo: Testar uma alegação sobre um parâmetro: Média, proporção, variação e desvio padrão Exemplos: - Um hospital alega que o tempo de resposta de sua ambulância é inferior a dez

Leia mais

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos Testes de Hipóteses Paramétricos Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução Exemplos Testar se mais de metade da população irá consumir um novo produto

Leia mais

Aula 10 Estimação e Intervalo de Confiança

Aula 10 Estimação e Intervalo de Confiança Aula 10 Estimação e Intervalo de Confiança Objetivos da Aula Fixação dos conceitos de Estimação; Utilização das tabelas de Distribuição Normal e t de Student Introdução Freqüentemente necessitamos, por

Leia mais

Prova de Análise de Dados

Prova de Análise de Dados Prova de Análise de Dados Página 1 de (D1) Pulsar Binário Através de buscas sistemáticas ao longo das últimas décadas, astrônomos encontraram um grande número de pulsares de milissegundo (período de rotação

Leia mais

Aula 00 Aula Demonstrativa

Aula 00 Aula Demonstrativa Aula 00 Modelos de questões comentadas CESPE-UnB... 3 Relação das questões comentadas... 12 Gabaritos... 13 1 Olá, pessoal. Como vocês já sabem, saiu o edital para o concurso do TCE-SC. Esta é a aula demonstrativa

Leia mais

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA) 1. Sabe-se que o nível de significância é a probabilidade de cometermos um determinado tipo de erro quando da realização de um teste de hipóteses. Então: a) A escolha ideal seria um nível de significância

Leia mais

Intervalos de Confiança

Intervalos de Confiança Intervalos de Confiança INTERVALOS DE CONFIANÇA.1 Conceitos básicos.1.1 Parâmetro e estatística Parâmetro é a descrição numérica de uma característica da população. Estatística é a descrição numérica de

Leia mais

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva Inferência Estatística: Prof.: Spencer Barbosa da Silva Amostragem Estatística Descritiva Cálculo de Probabilidade Inferência Estatística Estimação Teste de Hipótese Pontual Por Intervalo Conceitos básicos

Leia mais

Conceito de Estatística

Conceito de Estatística Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir

Leia mais

GRANDEZAS PROPORCIONAIS

GRANDEZAS PROPORCIONAIS Hewlett-Packard GRANDEZAS PROPORCIONAIS Aulas 01 a 03 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Sumário GRANDEZAS... 2 O QUE É UMA GRANDEZA?... 2 PRELIMINAR 1... 2 PRELIMINAR 2... 2 GRANDEZAS DIRETAMENTE

Leia mais

Hewlett-Packard PORCENTAGEM. Aulas 01 e 02. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos

Hewlett-Packard PORCENTAGEM. Aulas 01 e 02. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Hewlett-Packard PORCENTAGEM Aulas 0 e 02 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Sumário Porcentagem... REFLITA... PRELIMINAR... REFLITA 2... Porcentagem... EXERCÍCIOS FUNDAMENTAIS... AUMENTO

Leia mais

Trabalho de Grupo de Otimização Ano letivo: 2014/2015

Trabalho de Grupo de Otimização Ano letivo: 2014/2015 1. Formule o problema de Programação Linear. Defina convenientemente as variáveis que achar mais relevantes e explique as restrições utilizadas. Através da análise do problema torna-se relevante definir

Leia mais

Colégio Militar de Manaus Concurso de Admissão ao 1º ano do Ensino Médio 2013/2014 Prova de Matemática 06 de Outubro de 2013.

Colégio Militar de Manaus Concurso de Admissão ao 1º ano do Ensino Médio 2013/2014 Prova de Matemática 06 de Outubro de 2013. Colégio Militar de Manaus Concurso de Admissão ao 1º ano do Ensino Médio 2013/2014 Prova de Matemática 06 de Outubro de 2013 Prova Resolvida http://estudareconquistar.wordpress.com/ Prova e Gabarito: http://estudareconquistar.wordpress.com/downloads/

Leia mais

Aula 7 Intervalos de confiança

Aula 7 Intervalos de confiança Aula 7 Intervalos de confiança Nesta aula você aprenderá um método muito importante de estimação de parâmetros. Na aula anterior, você viu que a média amostral X é um bom estimador da média populacional

Leia mais

CÁLCULO I. Lista Semanal 2 - Gabarito. Questão 1. Considere a função f(x) = x 3 + x e o ponto P (2, 10) no gráco de f.

CÁLCULO I. Lista Semanal 2 - Gabarito. Questão 1. Considere a função f(x) = x 3 + x e o ponto P (2, 10) no gráco de f. CÁLCULO I Prof. André Almeida Prof. Marcos Diniz Lista Semanal 2 - Gabarito Questão 1. Considere a função f(x) = x 3 + x e o ponto P (2, 10) no gráco de f. (a) Utilizando um recurso computacional, plote

Leia mais

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I 8/8/05 Universidade Federal do Pará Instituto de Tecnologia Estatística Aplicada I Prof. Dr. Jorge Teófilo de Barros Lopes Campus de Belém Curso de Engenharia Mecânica 8/08/05 06:55 ESTATÍSTICA APLICADA

Leia mais

Teste de hipóteses. Estatística Aplicada Larson Farber

Teste de hipóteses. Estatística Aplicada Larson Farber 7 Teste de hipóteses Estatística Aplicada Larson Farber Seção 7.1 Introdução ao teste de hipóteses Uma hipótese estatística é uma alegação sobre uma população. A hipótese nula H 0 contém uma alternativa

Leia mais

Introdução à Inferência Estatística

Introdução à Inferência Estatística Introdução à Inferência Estatística Capítulo 10, Estatística Básica (Bussab&Morettin, 7a Edição) 2a AULA 02/03/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 2a aula (02/03/2015) MAE229 1 / 16

Leia mais

AULA 02 Distribuição de Probabilidade Normal

AULA 02 Distribuição de Probabilidade Normal 1 AULA 02 Distribuição de Probabilidade Normal Ernesto F. L. Amaral 20 de agosto de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario

Leia mais

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida Teste de hipóteses para uma média populacional com variância conhecida e desconhecida Teste de hipóteses para uma média populacional com variância conhecida Tomando-se como exemplo os dados de recém-nascidos

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Santana do Ipanema, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 438,99 km² IDHM 2010 0,591 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo

Leia mais

Professor Mauricio Lutz DISTRIBUIÇÃO NORMAL

Professor Mauricio Lutz DISTRIBUIÇÃO NORMAL 1 DISTRIBUIÇÃO NORMAL Entre as distribuições teóricas de variável contínua, uma das mais empregadas é a distribuição normal. O aspecto gráfico de uma distribuição normal é o da figura abaio. Para uma perfeita

Leia mais

HEP-5800 BIOESTATÌSTICA

HEP-5800 BIOESTATÌSTICA HEP-58 BIOESTATÌSTICA UNIDADE IV INFERÊNCIA ESTATÍSTICA: TESTES DE HIPÓTESES Nila Nunes da Silva Regina I. T. Bernal I. QUADRO CONCEITUAL São procedimentos estatísticos que consistem em usar dados de amostras

Leia mais

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja: Pessoal, trago a vocês a resolução da prova de Estatística do concurso para Auditor Fiscal aplicada pela FCC. Foram 10 questões de estatística! Não identifiquei possibilidade para recursos. Considero a

Leia mais

Unidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno

Unidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno Unidade I ESTATÍSTICA APLICADA Prof. Mauricio Fanno Estatística indutiva Estatística descritiva Dados no passado ou no presente e em pequena quantidade, portanto, reais e coletáveis. Campo de trabalho:

Leia mais

Hewlett-Packard PIRÂMIDES. Aulas 01 a 03. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos

Hewlett-Packard PIRÂMIDES. Aulas 01 a 03. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Hewlett-Packard PIRÂMIDES Aulas 01 a 0 Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Ano: 2016 Sumário PIRÂMIDES... 1 CLASSIFICAÇÃO DE UMA PIRÂMIDE... 1 ÁREAS EM UMA PIRÂMIDE... 1 VOLUME DE UMA

Leia mais

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5 MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão

Leia mais

Estatística e Probabilidade. Aula 11 Cap 06

Estatística e Probabilidade. Aula 11 Cap 06 Aula 11 Cap 06 Intervalos de confiança para variância e desvio padrão Confiando no erro... Intervalos de Confiança para variância e desvio padrão Na produção industrial, é necessário controlar o tamanho

Leia mais

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://páginapessoal.utfpr.edu.br/ngsilva Estimação de Parâmetros Intervalo de Confiança Introdução A inferência estatística é o processo

Leia mais

Intervalos de Confiança

Intervalos de Confiança Intervalos de Confiança Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques e Nuno Bastos (DepMAT) Intervalos de Confiança 2010/2011 1 / 33 Introdução

Leia mais

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p INFERÊNCIA ESTATÍSTICA ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p Objetivo Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir

Leia mais

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA DOCENTE: CIRA SOUZA PITOMBO UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA ENG J21 Ajustamentos de observações geodésicas A AULA 9 TESTES ESTATÍSTICOS DE

Leia mais

PROPOSTA DE RESOLUÇÃO DA PROVA DO ENSINO SECUNDÁRIO DE MATEMÁTICA APLICADA Às CIÊNCIAS SOCIAIS (CÓDIGO DA PROVA 835) 1ª FASE 23 DE JUNHO 2017

PROPOSTA DE RESOLUÇÃO DA PROVA DO ENSINO SECUNDÁRIO DE MATEMÁTICA APLICADA Às CIÊNCIAS SOCIAIS (CÓDIGO DA PROVA 835) 1ª FASE 23 DE JUNHO 2017 Associação de Professores de Matemática Contactos: Rua Dr. João Couto, n.º 27-A 1500-236 Lisboa Tel.: +351 21 716 36 90 / 21 711 03 77 Fax: +351 21 716 64 24 http://www.apm.pt email: geral@apm.pt PROPOSTA

Leia mais

UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DEPARTAMENTO DE ECONOMIA

UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DEPARTAMENTO DE ECONOMIA UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DEPARTAMENTO DE ECONOMIA EAE 206 Macroeconomia I 1º Semestre de 2017 Professor Fernando Rugitsky Gabarito da Lista de Exercícios

Leia mais

Importantes propriedades da Média, da Variância e do Desvio Padrão:

Importantes propriedades da Média, da Variância e do Desvio Padrão: Importantes propriedades da Média, da Variância e do Desvio Padrão: É importantíssimo o perfeito conhecimento de algumas propriedades da Média, da Variância e do Desvio Padrão para resolver, com facilidade,

Leia mais

Colégio Militar do Rio de Janeiro Concurso de Admissão ao 6º Ano 2014/2015 Prova de Matemática 21 de Setembro de 2014.

Colégio Militar do Rio de Janeiro Concurso de Admissão ao 6º Ano 2014/2015 Prova de Matemática 21 de Setembro de 2014. Colégio Militar do Rio de Janeiro Concurso de Admissão ao 6º Ano 2014/2015 Prova de Matemática 21 de Setembro de 2014 Prova Resolvida http://estudareconquistar.wordpress.com/ Prova e Gabarito: http://estudareconquistar.wordpress.com/downloads/

Leia mais

Estatística Aplicada. Prof. Carlos Alberto Stechhahn PARTE I ESPAÇO AMOSTRAL - EVENTOS PROBABILIDADE PROBABILIDADE CONDICIONAL.

Estatística Aplicada. Prof. Carlos Alberto Stechhahn PARTE I ESPAÇO AMOSTRAL - EVENTOS PROBABILIDADE PROBABILIDADE CONDICIONAL. Estatística Aplicada Administração p(a) = n(a) / n(u) PARTE I ESPAÇO AMOSTRAL - EVENTOS PROBABILIDADE PROBABILIDADE CONDICIONAL Prof. Carlos Alberto Stechhahn 2014 1. Noções de Probabilidade Chama-se experimento

Leia mais

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos Aula 2 ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos 1. DEFINIÇÕES FENÔMENO Toda modificação que se processa nos corpos pela ação de agentes físicos ou químicos. 2. Tudo o que pode ser percebido

Leia mais

AULA 07 Inferência a Partir de Duas Amostras

AULA 07 Inferência a Partir de Duas Amostras 1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,

Leia mais

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Capítulo 3 Introdução à Probabilidade e à Inferência Estatística INTERVALOS DE CONFIANÇA: Diferentes pesquisadores, selecionando amostras de uma mesma

Leia mais

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média µ = 505g e desvio padrão σ = 9g. a) Selecionado ao acaso um pacote embalado

Leia mais

ANOVA - parte I Conceitos Básicos

ANOVA - parte I Conceitos Básicos ANOVA - parte I Conceitos Básicos Erica Castilho Rodrigues 9 de Agosto de 2011 Referências: Noções de Probabilidade e Estatística - Pedroso e Lima (Capítulo 11). Textos avulsos. Introdução 3 Introdução

Leia mais

1. Hipótese nula H0 é uma hipótese que contém uma afirmação de igualdade, tal como, = ou.

1. Hipótese nula H0 é uma hipótese que contém uma afirmação de igualdade, tal como, = ou. Aula 8 Testes de hipóteses Introdução Teste de hipótese é um processo que usa estatísticas amostrais para testar a afirmação sobre o valor de um parâmetro populacional. Pesquisas em campos tais como medicina,

Leia mais

Intervalos de conança

Intervalos de conança Intervalos de conança Prof. Hemílio Fernandes Campos Coêlho Departamento de Estatística - Universidade Federal da Paraíba - UFPB Exemplo Suponha que se deseja estimar o diâmetro da pupila de coelhos adultos.

Leia mais

Técnicas de Amostragem. É o estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer.

Técnicas de Amostragem. É o estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer. Técnicas de Amostragem O que é? É o estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer. Esses pequenos grupos retirados da população são chamados de Amostras. Por

Leia mais

Probabilidade e Estatística

Probabilidade e Estatística Aula 3 Professora: Rosa M. M. Leão Probabilidade e Estatística Conteúdo: 1.1 Por que estudar? 1.2 O que é? 1.3 População e Amostra 1.4 Um exemplo 1.5 Teoria da Probabilidade 1.6 Análise Combinatória 3

Leia mais

Estatística

Estatística Estatística 1 2016.2 Sumário Capítulo 1 Conceitos Básicos... 3 MEDIDAS DE POSIÇÃO... 3 MEDIDAS DE DISPERSÃO... 5 EXERCÍCIOS CAPÍTULO 1... 8 Capítulo 2 Outliers e Padronização... 12 VALOR PADRONIZADO (Z)...

Leia mais

Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta

Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta Distribuição Conjunta Suponha que se queira analisar o comportamento conjunto das variáveis = de Instrução e = Região de procedência. Neste caso, a distribuição de freqüências é apresentada como uma tabela

Leia mais

Interpolação polinomial: Polinômio de Lagrange

Interpolação polinomial: Polinômio de Lagrange Interpolação polinomial: Polinômio de Lagrange Marina Andretta ICMC-USP 09 de maio de 2012 Baseado no livro Análise Numérica, de R. L. Burden e J. D. Faires. Marina Andretta (ICMC-USP) sme0500 - cálculo

Leia mais

Inferência Estatística

Inferência Estatística Metodologia de Diagnóstico e Elaboração de Relatório FASHT Inferência Estatística Profa. Cesaltina Pires cpires@uevora.pt Plano da Apresentação Duas distribuições importantes Normal T- Student Estimação

Leia mais

Inferência Estatística: Conceitos Básicos II

Inferência Estatística: Conceitos Básicos II Inferência Estatística: Conceitos Básicos II Distribuição Amostral e Teorema do Limite Central Análise Exploratória de dados no SPSS Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação

Leia mais

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO Ana Paula Araujo Correa Eder Queiroz Newton Trevisan DEFINIÇÃO É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis

Leia mais

Testes de Hipóteses. Professor: Josimar Vasconcelos Contato: ou

Testes de Hipóteses. Professor: Josimar Vasconcelos Contato: ou Testes de Hipóteses Professor: Josimar Vasconcelos Contato: josimar@ufpi.edu.br ou josimar@uag.ufrpe.br http://prof-josimar.blogspot.com.br/ Universidade Federal do Piauí UFPI Campus Senador Helvídio Nunes

Leia mais

Instrumentação Industrial. Fundamentos de Instrumentação Industrial: Introdução a Metrologia Incerteza na Medição

Instrumentação Industrial. Fundamentos de Instrumentação Industrial: Introdução a Metrologia Incerteza na Medição Instrumentação Industrial Fundamentos de Instrumentação Industrial: Introdução a Metrologia Incerteza na Medição Introdução a Metrologia O que significa dizer: O comprimento desta régua é 30cm. A temperatura

Leia mais

1 Introdução. 2 Variáveis Aleatórias Discretas (VAD)

1 Introdução. 2 Variáveis Aleatórias Discretas (VAD) Prof. Janete Pereira Amador 1 1 Introdução Muitas situações cotidianas podem ser usadas como experimento que dão resultados correspondentes a algum valor, e tais situações podem ser descritas por uma variável

Leia mais

Noções de Amostragem

Noções de Amostragem Noções de Amostragem AMOSTRAGEM Amostragem: é a área da estatística que estuda técnicas e procedimentos para retirar e analisar uma amostra com o objetivo de fazer inferência a respeito da população de

Leia mais

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Agora,

Leia mais

1.1. Definições importantes

1.1. Definições importantes Parte I. Inferência Estatística Trata-se do processo de se obter informações sobre uma população a partir dos resultados observados numa amostra. De um modo geral, tem-se uma população com um grande número

Leia mais

População e Amostra. População: O conjunto de todas as coisas que se pretende estudar. Representada por tudo o que está no interior do desenho.

População e Amostra. População: O conjunto de todas as coisas que se pretende estudar. Representada por tudo o que está no interior do desenho. População e Amostra De importância fundamental para toda a análise estatística é a relação entre amostra e população. Praticamente todas as técnicas a serem discutidas neste curso consistem de métodos

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ Distribuição Conjunta Suponha que se queira analisar o comportamento conjunto das variáveis X = Grau de Instrução e Y = Região

Leia mais

Distribuição t de Student

Distribuição t de Student Distribuição t de Student Introdução Quando o desvio padrão da população não é conhecido (o que é o caso, geralmente), usase o desvio padrão da amostra como estimativa, substituindo-se σ x por S x nas

Leia mais

Medidas de Dispersão 1

Medidas de Dispersão 1 Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti Medidas de Dispersão 1 Introdução Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não

Leia mais

Fı sica Experimental IV

Fı sica Experimental IV E rica Polycarpo Sandra Amato Instituto de Fı sica Universidade Federal do Rio de Janeiro com base no material do curso / 2/ E rica Polycarpo - poly@if.ufrj.br - sala A-30 Pa gina do curso: http://www.if.ufrj.br

Leia mais

Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba.

Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba. Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba. 1 Introdução Erivaldo de Araújo Silva Edwirde Luiz Silva Os testes

Leia mais

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc. Estatística II Aula Prof.: Patricia Maria Bortolon, D. Sc. Distribuições Amostrais ... vocês lembram que: Antes de tudo... Estatística Parâmetro Amostra População E usamos estatíticas das amostras para

Leia mais

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. AMOSTRAGEM É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. Nos planejamentos amostrais, a coleta dos dados deve ser realizada

Leia mais

Os Atrasos das Dezenas na Mega Sena Parte 02

Os Atrasos das Dezenas na Mega Sena Parte 02 Os Atrasos das Dezenas na Mega Sena Parte 02 (b) Atraso: Esperado e Médio Vamos supor que houvesse uma sucessão de Sorteios, um após o outro, sem repetir uma Dezena já sorteada. Assim, seriam sorteadas

Leia mais

Análise da Variância. Prof. Dr. Alberto Franke (48)

Análise da Variância. Prof. Dr. Alberto Franke (48) Análise da Variância Prof. Dr. Alberto Franke (48) 91471041 Análise da variância Até aqui, a metodologia do teste de hipóteses foi utilizada para tirar conclusões sobre possíveis diferenças entre os parâmetros

Leia mais

Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo.

Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo. UNIVERSIDADE FEDERAL DA PARAÍBA Amostragem Luiz Medeiros de Araujo Lima Filho Departamento de Estatística INTRODUÇÃO Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é,

Leia mais

De onde vêm as expressões para variâncias e desvios padrão? 37

De onde vêm as expressões para variâncias e desvios padrão? 37 APÊNDICE 03 Uma questão de estatística De onde vêm as expressões para variâncias e desvios padrão? 37 Conforme já foi antecipado no primeiro texto de apoio da segunda atividade experimental prevista neste

Leia mais

Unidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos

Unidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos Unidade I ESTATÍSTICA Prof. Celso Ribeiro Campos Visão geral da estatística Estatística: Conjunto de métodos e processos destinados a permitir o entendimento de um universo submetido a certas condições

Leia mais

Fernando de Pol Mayer

Fernando de Pol Mayer Fernando de Pol Mayer Laboratório de Estatística e Geoinformação (LEG) Departamento de Estatística (DEST) Universidade Federal do Paraná (UFPR) Este conteúdo está disponível por meio da Licença Creative

Leia mais

Aula 4 Conceitos Básicos de Estatística

Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos Básicos de Estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa e interpreta informações numéricas para

Leia mais

25/08/2009 TÁ NA MÉDIA! FILIPE S. MARTINS

25/08/2009 TÁ NA MÉDIA! FILIPE S. MARTINS ESTATÍSTICA BÁSICA AULA 03 TÁ NA MÉDIA! FILIPE S. MARTINS ESTATÍSTICA - ROTEIRO POPULAÇÃO E POPULAÇÃO GEM CASUAL OU ALEATÓRIA SIMPLES EXERCÍCIOS ESTRATIFICADA SISTEMÁTICA 1 POPULAÇÃO CONJUNTO DE ENTES

Leia mais

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013 Análise da Regressão múltipla: Inferência Revisão da graduação Aula 4 6 de maio de 2013 Hipóteses do modelo linear clássico (MLC) Sabemos que, dadas as hipóteses de Gauss- Markov, MQO é BLUE. Para realizarmos

Leia mais

Medidas de Dispersão para uma Amostra. Conteúdo: AMPLITUDE VARIÂNCIA DESVIO PADRÃO COEFICIENTE DE VARIAÇÃO

Medidas de Dispersão para uma Amostra. Conteúdo: AMPLITUDE VARIÂNCIA DESVIO PADRÃO COEFICIENTE DE VARIAÇÃO Medidas de Dispersão para uma Amostra Conteúdo: AMPLITUDE VARIÂNCIA DESVIO PADRÃO COEFICIENTE DE VARIAÇÃO Medidas de Dispersão para uma Amostra Para entender o que é dispersão, imagine que quatro alunos

Leia mais

ESTATÍSTICA ANALÍTICA. Prof. Dr. Guanis de Barros Vilela Junior

ESTATÍSTICA ANALÍTICA. Prof. Dr. Guanis de Barros Vilela Junior ESTATÍSTICA ANALÍTICA Prof. Dr. Guanis de Barros Vilela Junior Introdução Permite ao pesquisador ir além da descrição dos dados e fazer inferências sobre a população, a partir da amostra. Estas inferências

Leia mais

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016. de Matemática Financeira e Estatística do ISS Teresina, aplicada em 8/08/016. 11 - (ISS Teresina 016 / FCC) Joana aplicou todo seu capital, durante 6 meses, em bancos ( e Y). No Banco, ela aplicou 37,5%

Leia mais

Fração como Probabilidade - União e Interseção de Eventos. Sexto Ano do Ensino Fundamental

Fração como Probabilidade - União e Interseção de Eventos. Sexto Ano do Ensino Fundamental Material Teórico - Módulo de FRAÇÃO COMO PORCENTAGEM E COMO PROBABILIDADE Fração como Probabilidade - União e Interseção de Eventos Sexto Ano do Ensino Fundamental Prof. Francisco Bruno Holanda Prof. Antonio

Leia mais

Lecture 3a Testes de Hipótese

Lecture 3a Testes de Hipótese Métodos Quantitativos em Contabilidade I Programa de Pós-Graduação em Controladoria e Contabilidade Lucas Barros lucasbarros@usp.br Henrique Castro hcastro@usp.br Universidade de São Paulo 1 of 19 Lecture

Leia mais

ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim. ICMS PE 2014: Resolução da prova de Estatística Prof.

ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim. ICMS PE 2014: Resolução da prova de Estatística Prof. ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim 1 de 6 Pessoal, segue a resolução das questões de Estatística da prova realizada pela SEFAZ-PE, para o cargo de Auditor Fiscal do Tesouro

Leia mais

Teste Chi-Quadrado de Independência. Prof. David Prata Novembro de 2016

Teste Chi-Quadrado de Independência. Prof. David Prata Novembro de 2016 Teste Chi-Quadrado de Independência Prof. David Prata Novembro de 2016 Duas Variáveis Categóricas Análise de variância envolve o exame da relação entre uma variável categórica explicativa e uma variável

Leia mais

Estatística. Probabilidade. Conteúdo. Objetivos. Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal.

Estatística. Probabilidade. Conteúdo. Objetivos. Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal. Estatística Probabilidade Profa. Ivonete Melo de Carvalho Conteúdo Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal. Objetivos Utilizar a probabilidade como estimador

Leia mais

COLÉGIO SÃO JOÃO GUALBERTO

COLÉGIO SÃO JOÃO GUALBERTO RESOLUÇÃO COMENTADA Prof.: Pedro Bittencourt Série: 1ª Turma: A Disciplina: Física Nota: Atividade: Avaliação mensal 1º bimestre Valor da Atividade: 10 Instruções Esta avaliação é individual e sem consulta.

Leia mais

Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo.

Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo. UNIVERSIDADE FEDERAL DA PARAÍBA Amostragem Luiz Medeiros de Araujo Lima Filho Departamento de Estatística INTRODUÇÃO Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é,

Leia mais

Amostragem. Amostragem. Técnica: possibilita realizar a pesquisa em universos infinitos.

Amostragem. Amostragem. Técnica: possibilita realizar a pesquisa em universos infinitos. Técnica: possibilita realizar a pesquisa em universos infinitos. A Estatística pode ser estendida ao estudo das populações chamadas infinitas nas quais não temos a possibilidade de observar todos os elementos

Leia mais

Respostas. Resposta 1: Considerando que o objetivo é calcular a proporção de hipertensos, recorremos à fórmula abaixo:

Respostas. Resposta 1: Considerando que o objetivo é calcular a proporção de hipertensos, recorremos à fórmula abaixo: Deseja-se saber a proporção de pacientes com hipertensão arterial entre os pacientes de um ambulatório de diabetes mellitus. Estudos anteriores de diabetes têm encontrado uma proporção de 18,5%. 1. Qual

Leia mais

A ESTATÍSTICA Introdução Histórica

A ESTATÍSTICA Introdução Histórica A ESTATÍSTICA Introdução Histórica Desde a antigu idade, os homens faziam registros: Número de habitantes; Nascimentos e óbitos; Avaliavam bens e riquezas do povo, para cobrar impostos; Estoque de alimentos,

Leia mais

MAT 461 Tópicos de Matemática II Aula 8: Resumo de Probabilidade

MAT 461 Tópicos de Matemática II Aula 8: Resumo de Probabilidade MAT 461 Tópicos de Matemática II Aula 8: Resumo de Probabilidade Edson de Faria Departamento de Matemática IME-USP 28 de Agosto, 2013 Probabilidade: uma Introdução / Aula 8 1 Desigualdades de Markov e

Leia mais

SEXO POPULAÇÃO AMOSTRA

SEXO POPULAÇÃO AMOSTRA Amostragem É o estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer. Esses pequenos grupos retirados da população são chamados de Amostras. Como a amostragem considera

Leia mais

Administração Financeira

Administração Financeira Administração Financeira Vale a pena ser consultora? Qual meu retorno financeiro? O que é Administração financeira? É uma ferramenta ou técnica utilizada para identificar a realidade da empresa, contas

Leia mais

Hewlett-Packard LOGARITMO. Aulas 01 a 08. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz

Hewlett-Packard LOGARITMO. Aulas 01 a 08. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Hewlett-Packard LOGARITMO Aulas 0 a 08 Ano 06 Sumário LOGARITMO... PRELIMINAR... LOGARITMO...... CONSEQUÊNCIAS... CONSEQUÊNCIAS...... PROPRIEDADES OPERATÓRIAS... PROPRIEDADES OPERATÓRIAS... PRODUTO...

Leia mais

Hewlett-Packard TRIÂNGULOS. AULAS 01 a 03. Prof. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos

Hewlett-Packard TRIÂNGULOS. AULAS 01 a 03. Prof. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos Hewlett-Packard TRIÂNGULOS AULAS 01 a 03 Sumário Triângulos... 1 DEFINIÇÃO E ELEMENTOS... 1 SOMA DAS MEDIDAS DOS ÂNGULOS INTERNOS DE UM TRIÂNGULO... 1 ÂNGULO EXTERNO DE UM TRIÂNGULO... 1 SOMA DAS MEDIDAS

Leia mais