Inferência Estatística: Conceitos Básicos I

Documentos relacionados
Inferência Estatística: Conceitos Básicos II


CORRELAÇÃO. Flávia F. Feitosa

ASSIMETRIA E CURTOSE

ASSIMETRIA E CURTOSE

Distribuição de frequências:

Medidas de Posição ou Tendência Central

Estatística Aplicada a Negócios

ANÁLISE EXPLORATÓRIA DE DADOS 2ª PARTE

Assimetria e Curtose

Medidas resumo numéricas

Métodos Estatísticos Básicos

Padronização. Momentos. Coeficiente de Assimetria

Tutorial para o desenvolvimento das Oficinas

Unidade III Medidas Descritivas

Estatística Descritiva

14. Distribuição de Probabilidade para Variáveis Aleatórias Contínuas

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza

Estatística Aplicada

Comprovação Estatística de Medidas Elétricas

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Aula 3 MEDIDAS DE DISPERSÃO, ASSIMETRIA E CURTOSE.

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

ESTATÍSTICA DESCRITIVA

NOTAS DE AULA. Medidas Descritivas. Prof.: Idemauro Antonio Rodrigues de Lara

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

5.1 Introdução: As distribuições de freqüências não diferem apenas quanto ao valor médio e a variabilidade, mas também quanto a sua forma.

( x) = a. f X. = para x I. Algumas Distribuições de Probabilidade Contínuas

Métodos Experimentais em Ciências Mecânicas

Prof. Dr. Engenharia Ambiental, UNESP

Unidade II ESTATÍSTICA. Prof. Celso Guidugli

Aula 4 Conceitos Básicos de Estatística

Exploração e Transformação de dados

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

ESTATÍSTICA APLICADA PARA PESQUISA EM MARKETING E COMUNICAÇÃO BASEADO NO LIVRO ESTATÍSTICA FÁCIL ANTÔNIO ARNOT CRESPO

Amostragem Aleatória e Descrição de Dados - parte I

Conceito de Estatística

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

QUESTÕES DE CONCURSOS PÚBLICOS ESTATÍSTICA DESCRITIVA

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

Organização de dados

1. Registou-se o número de assoalhadas de 100 apartamentos vendidos num bairro residencial

4-)Arquivos de dados para exercícios ou

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

MEDIDAS DE TENDÊNCIA CENTRAL

Lista de exercicios 1 Prof.: Marcus Guimaraes Disciplina: Introdução a Estatística Econômica

Capítulo 5 Distribuições de probabilidade normal Pearson Prentice Hall. Todos os direitos reservados.

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

EAC-042: Ajustamento de Observações

Introdução à Bioestatística Turma Nutrição Aula 3 Análise Descritiva: Medidas de Tendência Central Medidas de Variabilidade

Distribuição Normal. Apontamentos para a disciplina de Estatística I. Tomás da Silva, 2003/2006

Amostragem Aleatória e Descrição de Dados - parte II

Stela Adami Vayego DEST/UFPR

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

INTRODUÇÃO A ESTATISTICA PROF. RANILDO LOPES

ESTATÍSTICA. na Contabilidade Parte 6. Medidas Estatísticas

Estatística Descritiva

Aula 4: Medidas Resumo

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

2. Estatística Descritiva

MEDIDAS DE DISPERSÃO. Os dados a seguir referem-se ao índice pluviométrico de três cidades no Estado de São Paulo, em 3 diferentes ocasiões

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

b) 5 6 d) 1 6 e) 7 6

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto

Probabilidade e Estatística. Prof. Dr. Jhames Sampaio

Regressão linear simples

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

I.1. Seleccionado um passageiro ao acaso, qual a probabilidade de ter idade no intervalo [20 a 50) anos e ser fraudulento?

Cap. 4 - Estimação por Intervalo

Universidade Tecnológica Federal do Paraná. CC54Z - Hidrologia. Introdução a hidrologia estatística. Prof. Fernando Andrade Curitiba, 2014

Estatística aplicada a ensaios clínicos

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Curso de IPE Aula 1 de Estatística Descritiva. Prof. Dr. Valdecir Marvulle 2013

Escola Politécnica da USP Engenharia de Petróleo e Gás DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA. Aulas 10, 11,12 e 13 - Prof. Regina Meyer Branski

aula DISTRIBUIÇÃO NORMAL - PARTE I META OBJETIVOS PRÉ-REQUISITOS Apresentar o conteúdo de distribuição normal

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Modelos de Regressão Linear Simples parte I

n = 25) e o elemento (pois = 19) e terá o valor 8. Verifique que antes e depois do 19 o elemento, teremos 18 elementos.

Modelos de Regressão Linear Simples - parte I

Unidade VII Amostragem

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PONTA GROSSA METROLOGIA II

Medidas Descritivas de Posição, Tendência Central e Variabilidade

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS

SIMULADO da 4ª PROVA BIMESTRAL de INTRODUÇÃO À ESTATÍSTICA

Estatística e Probabilidade. Aula 11 Cap 06

Análise Descritiva de Dados

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

Distribuições Amostrais

1 - Noções de álgebra matricial

Módulo III Medidas de Tendência Central ESTATÍSTICA

Coeficiente de Assimetria

Estatística Descritiva

Transcrição:

Inferência Estatística: Conceitos Básicos I Introdução, Medidas de Tendência Central, Medidas de Variabilidade, Distribuições de Frequência e Probabilidade Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015

Populações & Amostras Como pesquisadores, estamos interessados em investigar questões que se apliquem a toda uma população de pessoas ou coisas. ² A população pode ser geral (todos os seres humanos) ou pequena (todos os edifícios de São Caetano com mais de 15 andares) ² Raramente temos acesso aos dados de toda a população, mas apenas de um subconjunto à uma amostra, que utilizamos para inferir coisas sobre toda a população

Inferência Esta8s9ca Método científico para tirar conclusões sobre os parâmetros da população a partir da coleta, tratamento e análise dos dados de uma amostra recolhida dessa população.

Média como um modelo esta8s9co Média do número de habitantes por domicílio Nos ajuda a representar simplificadamente (modelar) este aspecto particular da realidade Digamos que eu tenha uma amostra de 5 domicílios, cada qual com os seguintes números de habitantes: 1 2 3 3 4 Em média temos 2,6 habitantes por domicílio

Média como um modelo esta8s9co Média do número de habitantes por domicílio Em média temos 2,6 habitantes por domicílio (considerando nossa amostra) Mas é impossível ter 2,6 habitantes em um domicílio!!! A média é um valor hipotético, um MODELO criado para resumir nossos dados

Média como um modelo esta8s9co Uma maneira útil de descrever um grupo como um todo: Qual é a renda média das famílias residentes na Mooca? Qual é a altura média dos edifícios em São Caetano? Qual é o PIB médio dos municípios localizados no arco do desmatamento?

Inferência Esta8s9ca se resumindo a uma equação Saída i = (Modelo i ) + erro i Ou seja, os dados que observamos podem ser previstos pelo modelo que escolhemos para ajustar os dados mais um erro

Domicílio Este modelo é preciso? O quão diferente nossos dados reais são do modelo criado? Nr. de habitantes Desvios (erro do modelo) Média (2,6)

Usando os desvios para es9mar a precisão do modelo Erro total = soma dos desvios Nr. de habitantes Zero??? Domicílio Para evitar o problema do erro direcionado (ou seja, positivo ou negativo), elevamos cada erro ao quadrado

Usando os desvios para es9mar a precisão do modelo Soma dos erros ao quadrado (SS) Nr. de habitantes Boa medida de acurácia do nosso modelo! Domicílio Só que quanto mais dados, maior a SS.

Variância Uma opção: Dividir SS pelo número de observações (N) à média do quadrado do erro para a amostra Essa medida é conhecida como VARIÂNCIA média do quadrado dos desvios No entanto, como geralmente queremos usar o erro na amostra para estimar o erro na população, dividiremos o SS pelo nr. de observações menos 1 (graus de liberdade). Assim, aumentamos ligeramente a variância amostral para produzir estimativas não tendenciosas (mais precisas) da variância populacional Estimativa da variância da população usando n amostras aleatórias x i onde i = 1, 2,..., n.

Variância Um problema com o uso da variância como medida de erro: Ela é expressa em unidades quadradas (colocamos cada erro ao quadrado no cálculo) No caso do exemplo, diríamos que o quadrado da média do erro do nosso modelo foi de 1,3 habitantes. Estimativa da variância da população usando n amostras aleatórias x i onde i = 1, 2,..., n. [Alteramos nossa unidade de medida!] Uma alternativa: Tirar a raiz quadrada da variância à DESVIO PADRÃO

Desvio Padrão É simplesmente a raiz quadrada da variância! O desvio padrão (s) é uma medida de quão bem a média representa os dados! à Média dos desvios a contar da média Revela a dispersão dos dados em relação à média. s pequeno: observações estão próximas da média s grande: observações estão distantes da média s = 0 : O que significa? Que todos os escores são os mesmos!

Médias iguais, mas desvios padrão diferentes Nr. de habitantes Nr. de habitantes Domicílio Média com boa aderência aos dados Domicílio Média com pobre aderência aos dados

Distribuições de Frequências HISTOGRAMA: Gráfico com os valores observados no eixo horizontal, com barras mostrando quantas vezes cada valor ocorreu no conjunto de dados Moda Escore que ocorre mais frequentemente no conjunto de dados Útil para avaliar as propriedades de um conjunto de valores

Curva Normal Maioria dos escores está em torno do centro da distribuição. A medida que nos distanciamos do centro (média), a frequência dos escores diminui.

Propriedades das Distribuições de Frequências Uma distribuição pode se desviar de uma normal de 2 maneiras principais: (1) Falta de simetria ASSIMETRIA Positivamente Assimétrica Negativamente Assimétrica (2) Achatamento DESVIO PADRÃO MENOR DESVIO PADRÃO MAIOR CURTOSE Leptocúrtica Platicúrtica

Medidas de Tendência Central Medidas utilizadas para representar um conjunto de valores MODA (Mo): Valor mais frequente em uma distribuição MEDIANA (Me): Medida que separa a distribuição em duas partes iguais MÉDIA (X): Soma de um conjunto de escores dividida pelo número total de escores no conjunto

Curva Normal Simétrica. Média, mediana e moda coincidem! Nem leptocúrtica, nem platicúrtica à Mesocúrtica Do pico central, a curva cai gradualmente em ambas as extremidades, chegando cada vez mais perto da reta básica, sem nunca tocá- la É um modelo teórico ou ideal que foi obtido por meio de uma equação matemática e não de pesquisa e coleta de dados Entretanto, é útil para situação reais de pesquisa pois a distribuição de muitos fenômenos de interesse de pesquisa assume a forma da curva normal

Distribuições de Probabilidade Distribuições de frequência podem ser usadas para obter uma ideia aproximada da probabilidade de um escore ocorrer. Exemplo Aula Anterior: Considerando que a distribuição do número de residentes por domicílio possui a forma de uma distribuição normal, qual seria a probabilidade de termos, nos dados, um domicílio com 4 habitantes ou menos? PROBABILIDADE: NOÇÃO IMPORTANTE PARA A TOMADA DE DECISÃO!!!

Distribuições de Probabilidade Distribuições de frequência podem ser usadas para obter uma ideia aproximada da probabilidade de um escore ocorrer. Exemplo Aula Anterior: Considerando que a distribuição do número de residentes por domicílio possui a forma de uma distribuição normal, qual seria a probabilidade de termos, nos dados, um domicílio com 4 habitantes ou menos? ² Para facilitar nosso trabalho, estatísticos elaboraram uma forma matemática que especifica versões idealizadas das distribuições: DISTRIBUIÇÕES DE PROBABILIDADE

Distribuições de Probabilidade A distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento, ou seja, dá a probabilidade de cada valor de uma variável aleatória. É análoga a uma distribuição de frequência, exceto por ser baseada em teoria ao invés de dados empíricos (observações do mundo real) As probabilidades representam a chance de cada escore ocorrer, diretamente análoga às porcentagens em uma distribuição de frequência.

A curva normal como uma distribuição de probabilidade ² A curva normal é um ideal teórico. ² No entanto, existem muitas distribuições de dados reais que se aproximam da forma da curva normal É sempre importante checar!!!! Construir um histograma é um bom começo! Algumas variáveis nas ciências sociais, não se enquadram (renda e distribuição etária, por exemplo)

A curva normal como uma distribuição de probabilidade

A curva normal como uma distribuição de probabilidade Exemplo Aula Anterior: Residentes por Domicílio Média = 2,6; s = 1,14 1,46 2,6 3,74

Voltando a nossa pergunta: Considerando que a distribuição do número de residentes por domicílio possui a forma de uma distribuição normal, qual seria a probabilidade de termos, nos dados, um domicílio com 4 habitantes ou menos? Residentes por Domicílio Média = 2,6; s = 1,14 1,46 2,6 3,74 4

Distribuição Normal Padrão ² Já calcularam a probabilidade de certos escores ocorrerem numa distribuição normal com Média = 0 & Desvio padrão = 1 DISTRIBUIÇÃO NORMAL PADRÃO

Distribuição Normal Padrão MAS a distribuição dos meus dados não apresenta média = zero e desvio padrão = 1! E aí???? QUALQUER CONJUNTO DE DADOS PODE SER CONVERTIDO EM UM CONJUNTO QUE TENHA MÉDIA ZERO E DESVIO PADRÃO 1! OBA!!!! Como fazer: (1) Para centrar dados em zero, pegamos cada escore e subtraímos dele a média de todos os escores. (2) Dividimos o escore resultante pelo desvio padrão para assegurar os os resultados terão DP = 1 escores- z

Distribuição Normal Padrão Voltando a nossa pergunta: Considerando que a distribuição do número de residentes por domicílio possui a forma de uma distribuição normal, qual seria a probabilidade de termos, nos dados, um domicílio com 4 habitantes ou menos? Considerando que a distribuição dos dados possa ser descrita como uma distribuição normal, com média = 2,6 e desvio padrão = 1,14 Primeiro Passo: Converter o valor 4 em um escore- z à (4-2,6)/1,14 = 1,23 escores- z

Distribuição Normal Padrão 1,23

Distribuição Normal Padrão Voltando a nossa pergunta: Considerando que a distribuição do número de residentes por domicílio possui a forma de uma distribuição normal, qual seria a probabilidade de termos, nos dados, um domicílio com 4 habitantes ou menos? Considerando que a distribuição dos dados possa ser descrita como uma distribuição normal, com média = 2,6 e desvio padrão = 1,14 Primeiro Passo: Converter o valor 4 em um escore- z à (4-2,6)/1,14 = 1,23 escores- z Segundo Passo: Verificar tabela

z = 1,23 A probabilidade de termos um domicílio com até 4 habitantes é de 0,8907 (89,07%) Complementarmente, a probabilidade de termos um domicílio com mais de 4 habitantes é de 0,1093

Alguns z- escores são pontos de corte que destacam pontos importantes da distribuição. z = 1,96 z = - 1,96 Separa os 2,5% do topo/ cauda inferior da distribuição. Ou seja, 95% dos escores estão entre - 1,96 e 1,96

Alguns z- escores são pontos de corte que destacam pontos importantes da distribuição. z = - 2,58 z = +2,58 99% dos escores estão entre - 2,58 e 2,58 z = - 3,29 z = +3,29 99,9% dos escores estão entre - 3,29 e 3,29

O Que Revisamos na Aula de Hoje Populações e Amostras Medidas de Tendência Central: Média, Moda, Mediana Medidas de Variabilidade: Variância e Desvio Padrão Curva Normal Distribuições de Frequência e Probabilidade Escores padrão Cálculo da probabilidade sob a curva normal

Prá9ca O Ambiente SPSS/PSPP