Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva
Introdução Hipóteses Estatísticas São suposições quanto ao valor de um parâmetro populacional ou quanto à natureza da distribuição de probabilidade. Exemplos: a) O tempo médio de vida do brasileiro é de 78 anos. b) A proporção dos alunos da UTFPR-CT que serão aprovados na disciplina de Probabilidade e Estatística é 80%. A hipótese pode ser verdadeira ou falsa
Introdução Tipos de Hipóteses Existem dois tipos de hipóteses: a) Hipótese nula, indicada por H o. É a hipótese estatística a ser testada que é expressa por uma igualdade. Esta hipótese afirma que não há diferença entre o estimador e o parâmetro populacional. b) Hipótese alternativa, indicada por H 1, é expressa por uma desigualdade. Esta hipótese contradiz a hipótese nula. Exemplo: H o : = 78 anos H 1 : 78 anos
Introdução É uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos dados amostrais. Supondo que a média μ populacional seja o parâmetro a ser testado, as hipóteses podem ser: a) Bicaudal ou bilateral: H o : μ = μ o e H 1 : μ μ o b) Unicaudal ou unilateral à direita H o : μ = μ o e H 1 : μ > μ o c) Unicaudal ou unilateral à esquerda H o : μ = μ o e H 1 : μ < μ o
Nível de significância Quando um decisão é tomada a partir da verificação das hipóteses estatísticas, existe a probabilidade de se cometer um erro, representado pela rejeição de uma hipótese verdadeira. Esta probabilidade é denominada nível de significância (α).
Tipos de erros Erro do Tipo I É o erro que se comete ao rejeitar a hipótese H o quando ela é verdadeira. A probabilidade de cometer um erro do tipo I é α (nível de significância). Erro do Tipo II É o erro que se comete ao aceitar a hipótese H o quando ela é falsa. A probabilidade de cometer um erro do tipo II é 1 α. Rejeitar H o implica em aceitar H 1 e vice-versa.
Regiões de aceitação e rejeição Região de aceitação (RA) A região de aceitação da hipótese nula (H o ) é a região representada pelo nível de confiança (1 α). Região de rejeição (RR) ou região crítica (RC) A região de rejeição da hipótese nula (H o ) é a região representada pelo nível de significância (α).
Regiões de aceitação e rejeição Bicaudal ou bilateral H o : μ = μ o H 1 : μ μ o Aceita H o Rejeita H o Rejeita H o
Regiões de aceitação e rejeição Unicaudal ou unilateral à direita H o : μ = μ o H 1 : μ > μ o Aceita H o Rejeita H o
Valores críticos da distribuição normal
Etapas para realizar um teste de hipótese 1 a ) Definir a hipótese nula H o 2 a ) Definir a hipótese alternativa H 1 3 a ) Fixar o nível de significância α 4 a ) Determinar a região de aceitação de H o 5 a ) Extrair a amostra e calcular o valor da estatística pré-estabelecida 6 a ) Aceitar H o se valor da estatística calculada está na região de aceitação (RA), caso contrário, rejeitar
Teste de hipótese para a média populacional (μ) As hipóteses podem ser: a) Bilateral: H o : µ = µ o e H 1 : µ µ o b) Unilateral à direita: H o : µ = µ o e H 1 : µ > µ o c) Unilateral à esquerda: H o : µ = µ o e H 1 : µ < µ o
Teste de hipótese para a média populacional (μ) A estatística é calculada através da expressão: Variância da população conhecida: Variância da população desconhecida: Onde:
para a Média Exemplos 1) Um fabricante de material esportivo desenvolve uma nova linha de pescar sintética sobre a qual afirma que tem resistência média à ruptura de 8 kg com desvio padrão de 0,5 kg. Uma amostra de 50 linhas foi testada e apresentou uma média de resistência à ruptura de 7,8 kg. Ao nível de significância de 1% é correta a afirmação do fabricante?
para a Média Exemplos 2) Um fabricante de cigarro anuncia que o índice de nicotina de uma determinada marca tem média de 26 mg por cigarro. Para a redução do índice de nicotina foi adicionado um novo produto na fabricação do cigarro. Para testar a eficiência da nova fórmula foi realizada análises em 30 amostras obtendo média de 25,3 mg de nicotina por cigarro e variância de 5,18 mg 2. Pode-se aceitar que realmente reduziu o índice de nicotina, ao nível de 5% de significância?
para a Média Exemplos 3) Uma indústria de lajotas utilizou adição de sílica ativa no concreto e acredita que aumentará a resistência à compressão média que é de 20 MPa. Realizou-se o ensaio de resistência à compressão em 10 lajotas com a adição de sílica ativa, obtendo as seguintes resistências (em MPa): 20, 21, 22, 19, 23, 21, 20, 18, 24, 22 Ao nível de confiança de 95%, é correto afirmar que a resistência média das lajotas realmente aumentou com a adição de sílica ativa?
Tabela t de Student
Teste de hipótese para a proporção populacional (p) As hipóteses podem ser: a) Bilateral: H o : p = p o e H 1 : p p o b) Unilateral à direita: H o : p = p o e H 1 : p > p o c) Unilateral à esquerda: H o : p = p o e H 1 : p < p o A estatística é calculada através da expressão:
para a Proporção Exemplos 1) Um arqueiro afirma que, em média, acerta 80% das flechas que atira. Num certo dia atirou 45 flechas e acertou 27. Você concorda com a afirmação do arqueiro, ao nível de 5% de significância? 2) Um candidato a vereador afirma que terá acima de 60% dos votos dos eleitores de uma determinada cidade. Um instituto de pesquisa realizou entrevistas com 300 eleitores dessa cidade, constando que 200 votarão no candidato. Com base na pesquisa realizada, pode-se aceitar que a afirmação do candidato é verdadeira, o nível de 90% de confiança?
Teste de hipótese para a diferença entre duas médias populacionais (variâncias conhecidas) As hipóteses podem ser: a) Bilateral: H o : µ 1 = µ 2 e H 1 : µ 1 µ 2 b) Unilateral à direita: H o : µ 1 = µ 2 e H 1 : µ 1 > µ 2 c) Unilateral à esquerda: H o : µ 1 = µ 2 e H 1 : µ 1 < µ 2 A estatística é calculada através da expressão:
Teste de hipótese para a diferença entre duas médias Exemplo Um experimento foi realizado para comparar o desgaste de duas diferentes peças. As variâncias da medida do desgaste é igual a 26 mm² para a peça 1 e 18 mm² para a peça 2. Foram selecionadas aleatoriamente 40 amostras da peça 1 e 32 amostras da peça 2 para serem submetidas ao mesmo ensaio para a medida do desgaste. Os resultados apontaram um desgaste médio de 84 mm para a peça 1 e 82 mm para a peça 2. Ao nível de confiança de 90%, é possível afirmar que há diferença significativa entre as médias de desgastes das duas peças?
Teste de hipótese para a diferença entre duas proporções populacionais As hipóteses podem ser: a) Bilateral: H o : p 1 = p 2 e H 1 : p 1 p 2 b) Unilateral à direita: H o : p 1 = p 2 e H 1 : p 1 > p 2 c) Unilateral à esquerda: H o : p 1 = p 2 e H 1 : p 1 < p 2 A estatística é calculada através da expressão:
Teste de hipótese para a diferença entre duas proporções Exemplo Foi realizado um plebiscito entre os moradores de um município para avaliar a viabilidade de construção de uma hidroelétrica. Foi decidido que a hidroelétrica será construída se houver uma diferença significativa entre as proporções de eleitores da região rural e urbana que são favoráveis a construção. A apuração demonstrou que de 600 eleitores da região urbana, 240 são favoráveis a construção da hidroelétrica, enquanto que de 700 eleitores da região rural, 250 são favoráveis. Ao nível de significância de 95%, a hidroelétrica será construída?