AULA 02 Distribuição de probabilidade normal

Documentos relacionados
AULA 02 Distribuição de Probabilidade Normal

AULAS 08 E 09 Distribuição de Probabilidade Normal

AULA 03 Estimativas e tamanhos amostrais

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano

AULA 07 Inferência a Partir de Duas Amostras

Notas de Aula. Capítulo 6 Distribuição de Probabilidade Normal. Seção 6-1 Visão Geral. Estatística Elementar 10ª Edição. by Mario F.

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

AULA 04 Teste de hipótese

AULA 05 Teste de Hipótese

5- Variáveis aleatórias contínuas

MÉTODOS EXPERIMENTAIS E TÉCNICAS DE MEDIDAS

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine)

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

Capítulo 5 Distribuições de probabilidade normal Pearson Prentice Hall. Todos os direitos reservados.

Estatística Aplicada II. } Revisão: Probabilidade } Propriedades da Média Amostral

Cálculo das Probabilidades e Estatística I

Estatística 1. Resumo Teórico

5 Distribuição normal de probabilidade. Estatística Aplicada Larson Farber

Distribuições Contínuas de Probabilidade

ESTATÍSTICA. x(s) W Domínio. Contradomínio

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

5- Variáveis aleatórias contínuas

Lucas Santana da Cunha 12 de julho de 2017

14. Distribuição de Probabilidade para Variáveis Aleatórias Contínuas

Lucas Santana da Cunha de junho de 2018 Londrina

Escola Politécnica da USP Engenharia de Petróleo e Gás DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA. Aulas 10, 11,12 e 13 - Prof. Regina Meyer Branski

Estatística Descritiva

Lucas Santana da Cunha de junho de 2018 Londrina

Capítulo 3. Introdução à Probabilidade E à Inferência Estatística

Conceito de Estatística

AULA 07 Distribuições Discretas de Probabilidade

Estatística I Aula 8. Prof.: Patricia Maria Bortolon, D. Sc.

( x) = a. f X. = para x I. Algumas Distribuições de Probabilidade Contínuas

Probabilidade e Estatística

Les Estatística Aplicada II AMOSTRA E POPULAÇÃO

Cap. 4 - Estimação por Intervalo

Probabilidade e Estatística

Distribuição Gaussiana

Teorema do Limite Central

Aula de hoje. administração. São Paulo: Ática, 2007, Cap. 3. ! Tópicos. ! Referências. ! Distribuição de probabilidades! Variáveis aleatórias

AULA 8 Experimentos multinomiais e tabelas de contingência

Notas de Aula. Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Probabilidade e Estatística

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Variáveis Aleatórias Contínuas

Distribuições Amostrais

AULA 10 Estimativas e Tamanhos Amostrais

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Distribuição Normal de Probabilidade

Capítulo 5 Distribuições de Probabilidades. Seção 5-1 Visão Geral. Visão Geral. distribuições de probabilidades discretas

Estatística Aplicada

Distribuição Normal. Apontamentos para a disciplina de Estatística I. Tomás da Silva, 2003/2006

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Inferência Estatistica

6- Probabilidade e amostras: A distribuição das médias amostrais

Exploração e Transformação de dados

Distribuições Amostrais

Palestra - Matemática Aplicada

Capítulo 4 Inferência Estatística

Variável Aleatória Contínua:

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano

Estatística Aplicada II. } Estimação e Intervalos de Confiança

Tutorial para o desenvolvimento das Oficinas

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Métodos Estatísticos

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Distribuições de Probabilidade

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 08

Probabilidade e Estatística

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Estatística Indutiva

FMU- Cursos de Tecnologia Disciplina: Métodos Quantitativos em Gestão e Negócios-

Intervalos de Confiança Prof. Walter Sousa

Estimativas e Tamanhos de Amostras

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 09

Inferência Estatística: Conceitos Básicos II

à Análise de Padrões

Teorema do Limite Central

Inferência Estatística

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Estatística e Probabilidade Aula 06 Distribuições de Probabilidades. Prof. Gabriel Bádue

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Aproximação da Distribuição Binomial pela Distribuição Normal

Estatística e Probabilidade Aula 08 Estimativas e Tamanho Amostral. Prof. Gabriel Bádue

Aula 9: Introdução à Inferência Estatística

Universidade Federal de Lavras

3 Estatística p/ Descrição, Exploração e Comparação de Dados (Triola 10 a ed.)

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Bioestatística e Computação I

Professora Ana Hermínia Andrade. Período

1 Introdução. 2 Variáveis Aleatórias Discretas (VAD)

Estatística Descritiva

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

AULA 01 Introdução e estatísticas descritivas

Distribuições de Probabilidade Contínuas 1/19

Transcrição:

1 AULA 02 Distribuição de probabilidade normal Ernesto F. L. Amaral 02 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo 6 (pp.192-249).

ESQUEMA DA AULA 2 A distribuição normal padrão Aplicações da distribuição normal O Teorema Central do Limite Determinação de normalidade Utilização de pesos amostrais

A DISTRIBUIÇÃO NORMAL PADRÃO 3

VARIÁVEL ALEATÓRIA 4 Variável aleatória é uma variável que tem um único valor numérico, determinado pelo acaso, para cada resultado de um experimento. Distribuição de probabilidade descreve a probabilidade de cada valor da variável aleatória. Variável aleatória discreta tem uma quantidade finita de valores ou uma quantidade enumerável de valores. Variável aleatória contínua tem infinitos valores, sem saltos ou interrupções.

GRÁFICOS DAS DISTRIBUIÇÕES 5 O histograma de probabilidade é um gráfico de uma distribuição de probabilidade discreta. A curva de densidade é um gráfico de uma distribuição de probabilidade contínua, em que: A área total sob a curva tem que ser igual a 1. Cada ponto na curva tem que ter uma altura vertical que é 0 ou maior, não estando abaixo do eixo x.

DISTRIBUIÇÕES DE PROBABILIDADE 6 Como a área total sob o gráfico de uma distribuição de probabilidade é igual a 1, há correspondência entre área e probabilidade (ou frequência relativa). Isto possibilita calcular probabilidades com utilização das áreas. É importante: Desenvolver a habilidade para determinar áreas correspondentes a várias regiões sob o gráfico da distribuição. Encontrar valores da variável z que correspondem a áreas sob o gráfico.

DISTRIBUIÇÕES UNIFORMES 7 Na distribuição uniforme, uma variável aleatória contínua apresenta valores de probabilidade que se espalham uniformemente sobre a faixa de valores possíveis. Em geral, a área de um retângulo se torna 1 quando fazemos sua altura igual ao valor de 1/amplitude.

DISTRIBUIÇÃO NORMAL 8 As distribuições normais são importantes, porque elas ocorrem frequentemente em situações reais e desempenham papel importante nos métodos de inferência estatística. A distribuição é normal se uma variável aleatória contínua tem uma distribuição com um gráfico simétrico em forma de sino. Qualquer distribuição normal é determinada pela média (μ) e desvio padrão (σ):

GRÁFICO DA DISTRIBUIÇÃO NORMAL 9 De posse de valores específicos para μ e σ, podemos fazer o seguinte gráfico da distribuição normal.

VARIAÇÃO NAS DISTRIBUIÇÕES NORMAIS 10 Há muitas distribuições normais diferentes, dependendo de dois parâmetros: a média populacional (μ) e o desvio padrão populacional (σ).

DISTRIBUIÇÃO NORMAL PADRÃO 11 A distribuição normal padrão é uma distribuição de probabilidade normal com média (μ) igual a 0 e desvio padrão (σ) igual a 1.

12 ENCONTRE PROBABILIDADES A PARTIR DE ESCORES z Usando a tabela das páginas 618-619, é possível achar áreas (ou probabilidades) para muitas regiões diferentes. Se refere à distribuição normal padrão (μ=0 e σ=1). Possui resultados para escores z negativos e positivos. Escore z: distância na escala horizontal da distribuição normal padrão: Parte inteira e decimal: coluna à esquerda da tabela. Parte do centésimo: linha no topo da tabela. Área: região sob a curva (valores no corpo da tabela).

13 Área acumulada à esquerda de z=1,13 é igual a 0,8708. Há uma probabilidade de 0,8708 de selecionarmos aleatoriamente um escore z menor que 1,13.

ENCONTRANDO PROBABILIDADES 14 Para encontrar o valor da probabilidade, primeiro desenhe um gráfico, sombreie a região desejada e pense em uma maneira de achar a área correspondente. P(a<z<b): probabilidade do escore z estar entre a e b. P(z>a): probabilidade do escore z ser maior que a. P(z<a): probabilidade do escore z ser menor que a.

PROBABILIDADE DE VALOR EXATO É IGUAL A ZERO 15 Com uma distribuição de probabilidade contínua, a probabilidade de se obter qualquer valor único exato é zero: P(z = a) = 0 Por exemplo, há uma probabilidade 0 de selecionarmos aleatoriamente uma pessoa com altura exatamente igual a 1,763947 metros. Um ponto isolado na escala horizontal é representado por uma linha vertical, e não uma área sob a curva: P(a z b) = P(a < z < b). A probabilidade de se obter um valor no máximo igual b é igual à probabilidade de se obter um valor menor que b. É importante saber interpretar frases-chave: no máximo, pelo menos, mais do que, não mais do que...

APLICAÇÕES DA DISTRIBUIÇÃO NORMAL 16

APLICAÇÕES DA DISTRIBUIÇÃO NORMAL 17 Vamos tratar de métodos para trabalhar com distribuições normais que não são padrões (ou μ 0, ou σ 1, ou ambos). Podemos fazer conversão para transformar qualquer distribuição normal em distribuição normal padrão. Se convertermos valores para escores padronizados, os procedimentos para trabalhar com distribuições normais serão os mesmos daqueles usados para distribuição normal padrão: z = (x μ) / σ

EQUIVALÊNCIA ENTRE NORMAL E NORMAL PADRÃO 18 A área em qualquer distribuição normal limitada por um escore x é igual à área limitada pelo escore z equivalente na distribuição normal padrão.

O TEOREMA CENTRAL DO LIMITE 19

DISTRIBUIÇÕES AMOSTRAIS E ESTIMADORES 20 Distribuição amostral de uma estatística (média amostral) é a distribuição de todos valores da estatística, quando todas amostras possíveis de mesmo tamanho n tiverem sido extraídas da mesma população. A distribuição amostral de uma estatística é geralmente representada por uma tabela, histograma de probabilidade ou fórmula. Estatísticas que atingem parâmetro (estimadores nãoviesados): proporção, média, variância. Estatísticas que não atingem parâmetro (estimadores viesados): mediana, amplitude, desvio padrão.

ALGUNS PRINCÍPIOS 21 Ao selecionar uma amostra aleatória de uma população com média (μ) e desvio padrão (σ): Se n>30, então as médias amostrais têm uma distribuição que pode ser aproximada por uma distribuição normal com média (μ) e desvio padrão (σ/ n), independente da distribuição da população original. Se n 30 e a população original tem uma distribuição normal, então as médias amostrais têm uma distribuição normal com média (μ) e desvio padrão (σ/ n). Se n 30, mas a população original não tem uma distribuição normal, então os métodos a seguir não se aplicam.

TEOREMA CENTRAL DO LIMITE (TCL) 22 O teorema central do limite diz que... se tamanho amostral é grande o suficiente... a distribuição das médias amostrais pode ser aproximada por uma distribuição normal... mesmo que a população original não seja normalmente distribuída.

PRESSUPOSTOS DO TCL 23 A variável aleatória x tem uma distribuição (que pode ou não ser normal) com média μ e desvio padrão σ. Amostras aleatórias simples (AAS), com mesmo tamanho amostral n, são selecionadas da população. AAS são amostras selecionadas de uma população de modo que todas possíveis amostras de tamanho n têm a mesma chance de ser escolhidas.

CONCLUSÕES DO TCL 24 Distribuição das médias amostrais irá se aproximar de uma distribuição normal à medida que n aumentar. A média de todas médias amostrais é a média μ da população. O desvio padrão de todas médias amostrais é σ/ n.

DETERMINAÇÃO DE NORMALIDADE 25

DETERMINAÇÃO DE NORMALIDADE 26 Alguns métodos estatísticos exigem que os dados amostrais tenham sido selecionados aleatoriamente de uma população que tenha distribuição normal. Podemos analisar histogramas, valores extremos (outliers) e gráficos de quantis normais para determinar se as exigências para uma distribuição normal são satisfeitas.

GRÁFICOS QUANTIL-NORMAL Um gráfico dos quantis normais (ou gráfico de probabilidades normais) é um gráfico de pontos (x, y) em que um eixo possui o conjunto original de dados amostrais e o outro eixo apresenta o escore z, correspondente ao valor esperado do quantil da distribuição normal padrão. Se os pontos não se aproximam de uma reta ou se os pontos exibem um padrão simétrico que não seja um padrão linear, então os dados parecem provir de uma população que não tem distribuição normal. Se o padrão dos pontos é razoavelmente próximo de uma reta, então os dados parecem provir de uma população com distribuição normal. Se a variável seguisse uma distribuição normal, os pontos se encontrariam exatamente sobre a linha diagonal. 27

EXEMPLOS DE GRÁFICOS QUANTIL-NORMAL 28 (discrete values) (bimodal) Hamilton (1992: 16).

TRANSFORMAÇÃO DE DADOS 29 Lawrence Hamilton ( Regression with graphics ) pág.18-19: Y 3 >>> q=3 Y 2 >>> q=2 Y 1 >>> q=1 Y 0,5 >>> q=0,5 log(y) >>> q=0 (Y -0,5 ) >>> q= 0,5 (Y -1 ) >>> q= 1 q>1: reduz concentração à direita. q=1: dados originais. q<1: reduz concentração à esquerda. log(x+1) viabiliza transformação quando x=0. Se distribuição de log(x+1) for normal, é chamada de distribuição lognormal.

0 2000 4000 6000 8000 ÍNDICE VALORES RACIONAIS (TRADICIONAL/SECULAR) 30-1 0 1 2 3 4 traditional/secular rational values

ÍNDICE VALORES RACIONAIS (TRADICIONAL/SECULAR) 31-1 0 1 2 3 4 traditional/secular rational values

-4-2 0 2 4 ÍNDICE VALORES RACIONAIS (TRADICIONAL/SECULAR) 32-4 -2 0 2 4 Inverse Normal

0 1000 2000 3000 4000 5000 LOGARITMO DO ÍNDICE VALORES RACIONAIS 33-10 -5 0 lntrad

LOGARITMO DO ÍNDICE VALORES RACIONAIS 34-10 -5 0 lntrad

-10-5 lntrad 0 5 LOGARITMO DO ÍNDICE VALORES RACIONAIS 35-6 -4-2 0 2 4 Inverse Normal

0 500 1000 1500 2000 2500 ÍNDICE VALORES RACIONAIS ELEVADO A 0,4 36 0.5 1 1.5 2 trad04

ÍNDICE VALORES RACIONAIS ELEVADO A 0,4 37 0.5 1 1.5 2 trad04

-1 trad04 0 1 2 ÍNDICE VALORES RACIONAIS ELEVADO A 0,4 38-1 0 1 2 Inverse Normal

UTILIZAÇÃO DE PESOS AMOSTRAIS 39

PESOS EM BANCOS DE DADOS Expande os resultados da amostra para o tamanho populacional. 40 Ao realizar inferência estatística, levamos em consideração o peso, o qual é o inverso da probabilidade da observação ser incluída no banco, devido ao desenho amostral. Por exemplo, o uso desse peso é importante na amostra do Censo Demográfico e na Pesquisa Nacional por Amostra de Domicílios (PNAD) do Instituto Brasileiro de Geografia e Estatística (IBGE) para expandir a amostra para o tamanho da população do país.

DIFERENTES PESOS 41 Indivíduo Número de observações coletadas na amostra Peso para expandir para o tamanho da população (N) Peso para manter o tamanho da amostra (n) João 1 4 0,8 Maria 1 6 1,2 Total 2 10 2 EXEMPLO: Peso amostral do João = Peso de frequência do João * (Peso amostral total / Peso de frequência total)