Conceitos Básicos de Estatística Aula 2



Documentos relacionados
Capítulo 8 - Testes de hipóteses. 8.1 Introdução

Estatística descritiva. Também designada Análise exploratória de dados ou Análise preliminar de dados

Capítulo 3 Modelos Estatísticos

Exemplos de Testes de Hipóteses para Médias Populacionais

Revisão: Noções básicas de estatística aplicada a avaliações de imóveis

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Testes (Não) Paramétricos

1. Os métodos Não-Paramétricos podem ser aplicados a uma ampla diversidade de situações, porque não exigem populações distribuídas normalmente.

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

CAP5: Amostragem e Distribuição Amostral

Tipos de Modelos. Exemplos. Modelo determinístico. Exemplos. Modelo probabilístico. Causas Efeito. Determinístico. Sistema Real.

MÓDULO 1. I - Estatística Básica

Distribuição Gaussiana. Modelo Probabilístico para Variáveis Contínuas

Faculdade Sagrada Família

Aula 6. Testes de Hipóteses Paramétricos (I) Métodos Estadísticos 2008 Universidade de Averio Profª Gladys Castillo Jordán. Teste de Hipóteses

Equações Diferenciais Ordinárias

4. Tangentes e normais; orientabilidade

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES SUMÁRIO

Estatística Descritiva I

Variáveis aleatórias contínuas e distribuiçao Normal. Henrique Dantas Neder

Teste de Hipóteses e Intervalos de Confiança

Aula 4 Estatística Conceitos básicos

Curvas em coordenadas polares

Introdução ao estudo de equações diferenciais

A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais.

Estatística Descritiva

Revisão de Estatística Aplicada a Finanças

Processos Estocásticos

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Datas Importantes 2013/01

Análise de Regressão Linear Simples e Múltipla

INSTITUTO TECNOLÓGICO

Tipos de variáveis aleatórias

Eduardo Camponogara. DAS-5103: Cálculo Numérico para Controle e Automação. Departamento de Automação e Sistemas Universidade Federal de Santa Catarina

PROBABILIDADES E ESTATÍSTICA

Aula 1: Introdução à Probabilidade

Testedegeradoresde. Parte X. 38 Testes de Ajuste à Distribuição Teste Chi-Quadrado

Capítulo 5: Aplicações da Derivada

Aula 5 Distribuição amostral da média

Estatística Básica. Armando Oscar Cavanha Filho

Operações sobre uma variável aleatória

Distribuição de probabilidades

29/Abril/2015 Aula 17

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

Análise de Arredondamento em Ponto Flutuante

PROBABILIDADE. Aula 5

Equações Diferenciais Ordinárias

Distribuição de Freqüência

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

Elaborado por Eduardo Rebouças Carvalho Hermano Alexandre Lima Rocha DISTRIBUIÇÃO NORMAL

CAPÍTULO 5 - Exercícios

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG APO

MD Sequências e Indução Matemática 1

Potenciação no Conjunto dos Números Inteiros - Z

a) Suponha que na amostra de 20 declarações foram encontrados 15 com dados incorrectos. Construa um

ESTATÍSTICA. Prof. Ari Antonio, Me. Ciências Econômicas. Unemat Sinop 2012

O teste de McNemar. A tabela 2x2. Depois

Estatística e Probabilidade. Aula 8 Cap 05. Distribuição normal de probabilidade

Aula 6 Derivadas Direcionais e o Vetor Gradiente

Modelos de Filas de Espera

CONCEITOS. Evento: qualquer subconjunto do espaço amostral. Uma primeira idéia do cálculo de probabilidade. Eventos Teoria de conjuntos

ESTATÍSTICA BÁSICA COM ANÁLISE E TRATAMENTO ESTATÍSTICO DE DADOS EM SPSS

Notas de Cálculo Numérico

QUESTÕES COMENTADAS E RESOLVIDAS

Root Locus (Método do Lugar das Raízes)

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS

DISTRIBUIÇÃO NORMAL 1

Notas sobre a Fórmula de Taylor e o estudo de extremos

LISTA DE INTERVALO DE CONFIANÇA E TESTE DE HIPÓTESES

Especialização em Engenharia Clínica

ITA º DIA MATEMÁTICA BERNOULLI COLÉGIO E PRÉ-VESTIBULAR

Representação de números em máquinas

SOCIEDADE BRASILEIRA DE MATEMÁTICA MESTRADO PROFISSIONAL EM REDE NACIONAL PROFMAT

Variáveis Aleatórias Contínuas

XXVI Olimpíada de Matemática da Unicamp. Instituto de Matemática, Estatística e Computação Científica Universidade Estadual de Campinas

CAPÍTULO 6 TRANSFORMAÇÃO LINEAR

Descreve de uma forma adequada o

Problemas de Valor Inicial para Equações Diferenciais Ordinárias

Escola Secundária Gabriel Pereira Évora Matemática A 10º ano. Planificação da Unidade Geometria

Cláudio Tadeu Cristino 1. Julho, 2014

ATAQUE TRIBUTÁRIO À INFORMALIDADE

Eventos independentes

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

Prova Escrita de Matemática Aplicada às Ciências Sociais

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

UNIVERSIDADE FEDERAL DO MATO GROSSO CAMPUS

PROBABILIDADE Prof. Adriano Mendonça Souza, Dr.

MATEMÁTICA 3. Resposta: 29

Momentos de uma variável aleatória

Ajuste de Curvas. Ajuste de Curvas

Pós-Graduação em Economia e Gestão em Saúde Módulo de Estatística Aplicada

EXCEL NA ANÁLISE DE REGRESSÃO

EA616B Análise Linear de Sistemas Resposta em Frequência

Contabilometria. Aula 10 Grau de Ajustamento e Verificação das Premissas MQO

É usual representar uma função f de uma variável real a valores reais e com domínio A, simplesmente por y=f(x), x A

Apresentação Caule e Folha. Exemplo

Probabilidades e Estatística

Resoluções comentadas de Raciocínio Lógico e Estatística SEFAZ - Analista em Finanças Públicas Prova realizada em 04/12/2011 pelo CEPERJ

24/Abril/2013 Aula 19. Equação de Schrödinger. Aplicações: 1º partícula numa caixa de potencial. 22/Abr/2013 Aula 18

Transcrição:

Conceitos Básicos de Estatística Aula 2 ISCTE - IUL, Mestrados de Continuidade Diana Aldea Mendes diana.mendes@iscte.pt 13 de Setembro de 2011 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 1 / 65

Estatística Aplicada (Revisões) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 2 / 65

Programa Introdução Estatística Aplicada Medidas de estatística descritiva com destaque para as medidas de assimetria e de curtose. Variáveis aleatórias. Distribuições: Normal, Qui-quadrado, t-student e F-Snedecor. Intervalos de confiança e testes de hipóteses. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 3 / 65

Estatística Descritiva A Estatística Descritiva consiste na apresentação, análise e interpretação de um conjunto de dados (amostra), através da criação de instrumentos adequados: representação gráfica (séries temporais, dispersão, caixas de bigodes, etc) distribuições de frequências cálculo de valores numéricos que caracterizam os dados de uma forma global: medidas de estatística descritiva. Essas medidas designam-se por parâmetros, quando os dados se referem a uma população e por estatísticas, quando os dados dizem respeito a uma amostra DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 4 / 65

Estatística Descritiva A estatística incide sobre as características relevantes dos elementos que constituem as amostras e as populações. Cada característica é geralmente representada por uma variável, pois os elementos podem ter diferentes posicionamentos relativamente a essa característica. Variáveis Discretas Contínuas A escolha da técnica mais adequada para o tratamento estatístico está condicionada pela natureza das variáveis: dados qualitativos e quantitativos. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 5 / 65

Estatística Descritiva Distribuições de frequências (gráficos de barras) para uma variável discreta e para uma variável contínua 28 24 20 16 12 8 4 0 10 15 20 25 30 35 40 Series: PETROLEO Sample 1986M01 2003M11 Observations 215 Mean 20.94995 Median 19.96000 Maximum 39.53000 Minimum 10.25000 Std. Dev. 5.271820 Skewness 0.823380 Kurtosis 3.524400 Jarque Bera 26.75686 Probability 0.000002 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 6 / 65

Medidas de Estatística Descritiva Medidas de tendência central (posição, localização): identificam o centro de uma distribuição Média (mean, average) Mediana (median) Moda (mode) Medidas de tendência não-central (posição, localização): apontam para outras posições da distribuição Quartis (Q i, i = 1, 2, 3, 4) Decis (D i, i = 1, 2,..., 10) Percentis (P i, i = 1, 2,..., 100) Medidas de dispersão (variabilidade) variância (variance) desvio padrão (standard deviation) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 7 / 65

Medidas de tendência central A média denota-se por µ para uma população e por x para uma amostra Média de uma amostra (x 1, x 2,..., x n ) onde n é o tamanho da amostra e x i é o valor da observação i na amostra, é dada por x = x 1 + x 2 +... + x n n = n x i i=1 n, Exemplo: Dada uma amostra de 5 observações 90, 95, 80, 60, 75, a média é: 90 + 95 + 80 + 60 + 75 x = = 400 5 5 = 80. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 8 / 65

Medidas de tendência central 100 95 90 média 85 80 75 70 65 60 55 50 1 1.5 2 2.5 3 3.5 4 4.5 5 mean = 80; std = 13.6931 = median DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 9 / 65

Medidas de tendência central 2.5 2 1.5 1 0.5 0 0.5 1 1.5 2 2.5 0 10 20 30 40 50 60 70 80 90 100 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 10 / 65

Medidas de tendência central 8 LOGVOL vs. T 6 4 LOGVOL 2 0 2 4 0 100 200 300 400 500 T DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 11 / 65

Medidas de tendência central Mediana: Me - é um outro nome atribuido ao percentile 50% e representa o centro posicional da distribuição Cálculo da mediana de um amostra ordenar os dados em ordem crescente: do mais pequeno para o maior se n (o número de dados na amostra) é ímpar, então a mediana é o número do meio (central) Me = x n+1 2 se n é par, então a mediana é a média dos dois números do meio (centrais) + x n 2 Me = x n+2 2 2 Exemplo 1: amostra com um número ímpar de dados: 2, 8, 3, 4, 1 ordenar os dados: 1, 2, 3, 4, 8, logo Me = 3 Exemplo 2: amostra com um número par de dados: 2, 8, 3, 4, 1, 8 ordenar os dados: 1, 2, 3, 4, 8, 8 logo Me = (3 + 4)/2 = 3.5 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 12 / 65

Medidas de tendência central A moda (Mo) é o valor ou categoria que ocorre com a maior frequência Exemplo: a moda da amostra: 9, 2, 7, 11, 14, 7, 2, 7 é o 7, pois a sua frequência é 3 As distribuições podem ser: Unimodais 1 valor de Mo Bimodais 2 valores de Mo Multimodais vários valores de Mo Amodais Não regista qualquer valor de destaque DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 13 / 65

Medidas de dispersão Variância: σ 2 = Var (x) = n i=1 (x i µ) 2 n s 2 = Var (x) = n i=1 (x i x) 2 n 1 população amostra Desvio padrão (Standard Deviation): é a mais comum medida de variabilidade. Define-se para uma população (σ) e para uma amostra (s) como a seguir: σ = n i=1 (x i µ) 2 n e s = n i=1 (x i x) 2 n 1 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 14 / 65

Outras medidas Momento Estatístico Se x 1, x 2,..., x n são os n valores assumidos pela variável X, definimos o momento de ordem t dessa variável como: m t = n i=1 xt i n Note que se t = 1 temos a média aritmética. O momento de ordem t centrado em uma constante K, com K = 0 é definido como: m K t = n i=1 (x i K) t n DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 15 / 65

Assimetria Assimetria (skewness) é o grau de afastamento que uma distribuição apresenta do seu eixo de simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da distribuição, chamado de assimetria negativa ou positiva respectivamente. Coeficiente do momento de assimetria s k = m 1 3 s 3 = n n i=1 (x i x) 3 ( 1 n n i=1 (x i x) 2) 3 Temos então s k = 0 s k > 0 s k < 0 distribuição simétrica distribuição assimétrica positiva distribuição assimétrica negativa DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 16 / 65

Assimetria 6 Distrib. simétrica 4 2 0 8 1 2 3 4 5 6 7 8 9 Assim. positiva (enviesada à esquerda) 6 4 2 0 6 1 2 3 4 5 6 7 8 9 Assim. negativa (enviesada à direita) 4 2 0 1 2 3 4 5 6 7 8 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 17 / 65

Curtose Curtose é o grau de achatamento da distribuição. Ou o quanto uma curva de frequência será achatada em relação a uma curva normal de referência. Para o cálculo do grau de curtose de uma distribuição utiliza-se o coeficiente do momento de curtose k = m 1 4 s 4 = n n i=1 (x i x) 4 ( 1 n n i=1 (x i x) 2) 2 Temos então k = 3 k > 3 k < 3 distribuição mesocúrtica distribuição leptocúrtica distribuição platicúrtica DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 18 / 65

Curtose 0.8 Curtose 0.7 leptocúrtica 0.6 0.5 f(x) 0.4 mesocúrtica 0.3 platicúrtica 0.2 0.1 x=0.13333 0 6 4 2 0 2 4 6 x DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 19 / 65

Output Eviews (PSI20): distribuição não-normal, assimétrica positiva (s k > 0) e platicúrtica (k < 3) PT 350 300 250 pt 200 150 100 600 500 400 300 200 100 Series: PT Sample 1/02/1990 5/12/2008 Observations 4790 Mean 149.5132 Median 151.5150 Maximum 312.1800 Minimum 58.83000 Std. Dev. 66.51653 Skewness 0.384446 Kurtosis 2.054050 Jarque Bera 296.5841 Probability 0.000000 50 90 92 94 96 98 00 02 04 06 t 0 80 120 160 200 240 280 320 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 20 / 65

Probabilidade de um Acontecimento Um tratamento estatístico é sempre um tratamento numérico, mesmo que a natureza das variáveis envolvidas não o seja. Assim, torna-se necessário encontrar um processo que permita atribuir valores reais aos resultados elementares de qualquer experiência aleatória. Fazer tais atribuições de valores, não é mais do que definir funções reais no espaço de acontecimentos Ω No entanto, não podem ser quaisquer funções. Têm que ser definidas de modo a que, ao trabalhar com elas, não se perca nenhuma informação sobre a forma como se distribuiam as probabilidades, em relação aos acontecimentos da experiência aleatória inicial; Tem que se poder estar seguro em relação à interpretação de qualquer intervalo ou valor real, e ainda assegurar a validade das operações entre acontecimentos. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 21 / 65

Probabilidade de um Acontecimento Se uma experiência é repetida um número grande de vezes, n, e o acontecimento A é observado n A vezes, então a probabilidade de A é P (A) n A n, se n é suficientamente grande onde n A é a frequência do acontecimento A e n A n relativa de A. é a frequência Considere uma experiência aleatória cuja espaço de amostragem é S e com pontos de amostragem E 1, E 2,... Para cada acontecimento E i S define-se um número P(E i ) (a probabilidade do E i ) que satisfaz as seguintes três condições: 0 P(E i ) 1 para todo o i P(S) = 1 Propriedade de aditividade S P (E i ) = 1 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 22 / 65

Variáveis Aleatórias Definição: uma variável aleatória (v.a.) é uma regra (função) que asigna um valor numérico (x) a cada resultado possível de uma experiência aleatória (ω), isto é X : Ω R ω X (ω) = x Uma variável aleatória é discreta se só assume um número finito ou infinito numerável de valores distintos Uma variável aleatória diz-se contínua se assumir um número infinito não numerável de valores distintos A função (densidade) de probabilidade de uma v.a. X é uma função f X que associa a cada valor possível x de X a sua probabilidade de ocorrência: f X (x) = P (X = x). Tem-se que 0 f X (x) 1 e f X (x i ) = 1. x i DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 23 / 65

Variáveis Aleatórias Variável aleatória Discreta Contínua DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 24 / 65

Variáveis Aleatórias A distribuição de probabilidades pode ainda ser descrita através da função de distribuição cumulativa F(x), que, para cada x, dá a probabilidade da v.a. assumir um valor inferior ou igual a x : F (x) = P (X x) (probabilidade acumulada até x), onde 0 F (x) 1, F (x) é não-decrescente lim F (x) = 0 e lim F (x) = 1 x x + DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 25 / 65

Variáveis Aleatórias Se X é uma variável aleatória contínua, então, se existe uma função não-negativa f X (x) 0, x R e integrável com + f X (x) dx = 1 tal que P (a X b) = b a f X (x) dx, a, b R então denotamos a função f X (x) por função densidade de probabilidades (fdp) da v.a. X. Também podemos descrever a distribuição de probabilidades através da função de distribuição cumulativa F (x) = P (X x) = x f X (t) dt F (x) = f X (x) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 26 / 65

Variáveis Aleatórias Experimento: Lançar 2 Moedas. Seja X = # cabeças. 4 possibilidades T T T H H T H H Determinar P(x), i.e., P(X = x), para todo o x: Distribuição de probabilidades Valor de x Probabilidade 0 1/4 =.25 1 2/4 =.50 2 1/4 =.25 Probability 0 1 2 x Statistics for Business and Economics, 6e 2007 Pearson Education, Inc. Chap 5 1 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 27 / 65.50.25

Variáveis Aleatórias f X Área a sombreado = P (a < X < b) a b x DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 28 / 65

Variáveis Aleatórias - Valor esperado e Variância Definição: o valor esperado (média) de uma v.a. µ e é definida como a seguir: µ = E (X) = x f X (x) = x P (x), µ = E (X) = x + x x f X (x) dx, X contínua X denota-se por X discreta Definição: Se X é uma variável aleatória com média µ, então a variância de X é definida por ((X µ) 2) σ 2 = Var (X) = (x µ) 2 f X (x) = x 2 f X (x) µ 2 = E x O desvio padrão de X define-se por σ = Var (X) = (x µ) 2 f X (x) = x x 2 f X (x) µ 2 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 29 / 65

Variáveis Aleatórias Example Continuação da experiência de lansamento de 2 moedas: temos a seguinte tabela x P (x) Calcular o valor esperado E (X) = x x P (x) = ( 0 }{{} 0 0.25 1 0.5 2 0.25 }{{} 0.25) + (}{{} 1 }{{} 0.50) + (2 0.25) = 1 x 1 x 2 P(x 1 ) P(x 2 ) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 30 / 65

Variáveis Aleatórias Teorema: Se f X (x) é a função probabilidade de uma variável aleatória X e g (X) é alguma função de variável X, então o valor esperado da função g é dado por E (g (X)) = g (X) f X (x) x DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 31 / 65

Variáveis Aleatórias Propriedades E (c) = c E (cx) = ce (X) E (ax + by) = ae (X) + be (Y) E (XY) = E (X) E (Y) + cov(x, Y) (se X, Y são independentes, então E (XY) = E (X) E (Y)) Var (X) = E ( X 2) (E (X)) 2 Var (c) = 0 Var (ax + b) = a 2 Var (X) Var(X ± Y) = Var(X) + Var(Y) ± 2cov(X, Y) (se X e Y são independentes, então Var(X ± Y) = Var(X) + Var(Y)) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 32 / 65

Variáveis Aleatórias Bidimensionais Usa-se quando há interesse por dois resultados simultâneos (por exemplo, altura X e peso Y de duas pessoas) Sejam E um experimento aleatório e Ω o espaço amostral associado a E e sejam X = X(ω) e Y = Y(ω) duas funções, cada uma associando um número real a cada resultado ω Ω. Então o par (X, Y) designa-se variável aleatória bidimensional. Para (X, Y) variável aleatória bidimensional e para (x, y) R 2 define-se a função de distribuição conjunta de (X, Y) por: F X,Y (x, y) = P (X x, Y y) = F X,Y (x, y) = P (X x, Y y) = x i x y j y x y P X,Y ( xi, y j ), (discreto) P X,Y (x, y) dxdy, (contín DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 33 / 65

Variáveis Aleatórias Bidimensionais Propriedades da função de distribuição conjunta 0 F X,Y (x, y) 1, (x, y) R 2 F X,Y ( x + x, y + y ) FX,Y (x, y), x, y 0 lim x,y + F X,Y (x, y) = 1 lim F X,Y (x, y) = 0 e x lim F X,Y (x, y) = 0 y DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 34 / 65

Variáveis Aleatórias Bidimensionais Seja (X, Y) uma variável aleatória bidimensional. Então P X,Y (x, y) = P (X = x, Y = y), (x, y) R 2 diz-se a função (densidade) de probabilidade conjunta de (X, Y). P X,Y (x, y) 0, (x, y) R 2 x y P X,Y (x, y) = 1 (discreto) + + P X,Y (x, y) dxdy = 1 (contínuo) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 35 / 65

Variáveis Aleatórias Bidimensionais A partir do conhecimento do comportamento conjunto de (X, Y) é também possível analisar separadamente X e Y uma vez que lim F X,Y (x, y) = F Y (y) e lim F X,Y (x, y) = F X (x) x + y + Função (densidade) de probabilidade marginal de X; p X (x) p X (x) = P (X = x, Y qualquer) = P X,Y (x, y) p X (x) = P (X = x, Y qualquer) = y + P X,Y (x, y) dy Função (densidade) de probabilidade marginal de Y; p Y (y) p Y (y) = P (X qualquer, Y = y) = P X,Y (x, y) p Y (y) = P (X qualquer, Y = y) = x + P X,Y (x, y) dx DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 36 / 65

Variáveis Aleatórias Bidimensionais Dada uma variável aleatória bidimensional (X, Y), diz-se que as v.a. unidimensionais que a integram, X e Y, são independentes, se a sua função de probabilidade conjunta, P X,Y (x, y), for igual ao produto das funções de probabilidade marginais correspondentes, isto é: P X,Y (x, y) = p X (x) p Y (y), (x, y) R 2 Teorema: Se X e Y são variáveis aleatórias independentes então as variáveis aleatórias U = g(x) e V = h(y) são também independentes DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 37 / 65

Variáveis Aleatórias Bidimensionais Sejam X e Y duas variáveis aleatórias discretas. A função probabilidade condicionada (condicional) da v.a. Y exprime a probabilidade de Y assumir o valor y quando é especificado o valor x para X. Define-se por P (Y = y X = x) = Tem-se analogamente P (X = x Y = y) = P (X = x, Y = y) P (X = x) P (X = x, Y = y) P (Y = y) = P X,Y (x, y) p X (x) = P X,Y (x, y) p Y (y) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 38 / 65

Variáveis Aleatórias Bidimensionais Define-se a covariância entre X e Y, e denota-se por Cov(X, Y), como sendo Cov(X, Y) = E[(X µ X )(Y µ Y )] = (x µ X )(y µ Y )P X,Y (x, y) x y = E (XY) E (X) E (Y) A covariância mede a intensidade da relação linear existente entre duas variáveis e assume valores reais. Teorema: Se X e Y forem independentes então Cov(X, Y) = 0 O recíproco não é, em geral, verdadeiro, isto é: Cov(X, Y) = 0 não implica que X e Y sejam v.a. independentes DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 39 / 65

Y Y Y a) Relação linear positiva X b) Relação linear negativa X c) Ausência de relação X Y Y Y d) Relação não lin. posit. X e) Relação linear positiva X com menor grau de relação que em a) f) Relação linear positiva X Com maior grau de relação que em a). DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 40 / 65

Distribuição normal: caracterizada por dois parâmetros: média µ e desvio-padrão σ e dada pela função densidade de probabilidades (fdp) f (x) = 1 σ 2 2π e (x µ) /2σ 2, < x < Uma v.a. normalmente distribuída com µ = 0 e σ = 1 diz-se que tem uma distribuição normal padrão (standard). Denota-se por Z e a sua fdp é dada por f (z) = 1 e z2 /2, 2π < z < Trata-se de uma função em forma de sino, simétrica em relação a média com área abaixo do gráfico =1. Notação: X N ( µ, σ 2) e Z N (0, 1) Padronizar uma variável aleatória normal: z-score Z = X µ X σ X X = µ X + σ X Z, µ Z = 0, σ 2 Z = 1. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 41 / 65

Distribuições Contínuas Distribuição normal 0.8 Distribuição normal 0.7 0.6 0.5 sigma=0.57, mu=0.1 f(x) 0.4 sigma=1.36, mu=0.1 sigma=1.7, mu=0.1 0.3 0.2 0.1 x=0.13333 0 6 4 2 0 2 4 6 x DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 41 / 65

Distribuições Contínuas Distribuição Qui-Quadrado Seja um conjunto de k variáveis Z i (i = 1,..., k) tal que: cada variável Z i segue uma distribuição normal padronizada, Z i N(0, 1) as variáveis Z i são mutuamente independentes A variável aleatória X = i Z 2 i, segue uma Distribuição Qui-quadrado com k graus de liberdade quando a sua função densidade de probabilidades tem a forma f (x) = 1 2 k/2 Γ (k/2) e x/2 x (k/2) 1, Γ função gamma Notação: X = i Z 2 i χ 2 (k) Média: µ = k e Variância: σ 2 = 2k É uma distribuição assimétrica, que se aproxima da distribuição normal, à medida que k aumenta DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 42 / 65

Distribuições Contínuas Distribuição Qui-Quadrado DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 43 / 65

Distribuições Contínuas Distribuição t-student Sejam duas variáveis independentes Z N (0, 1) e V χ 2 (k). Define-se a nova variável X = Z. V/k A variável X tem uma distribuição t de Student com k graus de liberdade se a sua função densidade de probabilidades tem a forma ( ) f (x) = Γ k+1 ) k+1 2 ( (1 + kπγ k 2) x2 2, < x <, k > 0 k Notação: X t (k) Média: µ = 0 para k > 1 e Variância: σ 2 = k k 2 para k > 2 Distrib. simétrica em relação à origem, que se aproxima da distrib. normal à medida que k aumenta; DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 44 / 65

Distribuições Contínuas Distribuição t-student DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 45 / 65

Distribuições Contínuas Distribuição F de Snedecor Sejam duas variáveis independentes V 1 χ 2 (k 1 ) e V 2 χ 2 (k 2 ). Define-se a nova variável X = V 1/k 1 V 2 /k 2. A variável X segue uma distribuição F com k 1 e k 2 graus de liberdade se a sua função densidade de probabilidades tem a forma f (x) = Notação: X F (k1,k 2 ) Γ ( ) k1 +k 2 2 ( ) k2 2 Γ ( k1 2 ) Γ Média: µ = k 2 k 2 2 para k 2 > 2 ( k1 k 2 ) k1 2 x k 1 2 1 (k 2 + k 1 x) k 1 +k 2 2 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 46 / 65

Distribuições Contínuas Distribuição F de Snedecor Variância: σ 2 = 2k2 2 (k 1+k 2 2) k 1 (k 2 2) 2 (k 2 4) para k 2 > 4 É uma distribuição positiva e assimétrica e os seus valores encontram-se em tabelas DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 47 / 65

Inferência Estatística (Estatística Inferencial, Indutiva) A inferência estatística tem como objectivos tirar conclusões sobre os parâmetros da população a partir da recolha, tratamento e análise dos dados de uma amostra, obtida dessa população. População (desconhecida) Amostragem aleatória Inferência estatística Amostra (conhecida) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 48 / 65

Inferência Estatística Parâmetro Medida usada para descrever a distribuição da população a média µ e a variância σ 2 são parâmetros de uma distribuição Normal Estatística Função de uma amostra aleatória que não depende de parâmetros desconhecidos Média amostral, Variância amostral Num problema de inferência estatística a estimação dos parâmetros pode ser pontual (estatística, estimador = é a v.a. que estima (pontualmente) um parâmetro (populacional) ) por intervalos (intervalos de confiança) Estimação pontual: procedimento que vai permitir obter um valor que seja o melhor (de acordo com algum critério) para um parâmetro desconhecido θ. Um estimador de θ é uma v.a. com uma dada distribuição. Chama-se estimativa de θ e representa-se por ˆθ, um valor concreto DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 49 / 65

Inferência Estatística - Propriedades dos estimadores O estimador ˆΘ do parâmetro θ, diz-se centrado ou não enviesado se e só se E( ˆΘ) = θ. Dados dois estimadores centrados para θ, ˆΘ e ˆΘ diz-se que ˆΘ é mais eficiente do que ˆΘ se Var[ ˆΘ] Var[ ˆΘ ]. Um estimador diz-se suficiente, quando utiliza toda a informação disponível na amostra. Seja X 1,..., X n uma amostra aleatória de dimensão n extraída de uma população com média µ e variância σ 2. Então, X = n i=1 X i n ( e S 2 = n i=1 Xi X ) 2 n 1 são estimadores centrados de µ e σ 2, respectivamente. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 50 / 65

Inferência Estatística - Estimação por Intervalos Na estimação por intervalos, em vez de se indicar um determinado valor estimado para certo parâmetro da população, constrói-se um intervalo que, com certo grau de certeza, previamente fixado, o contenha. Um intervalo de confiança para um parâmetro θ, a um grau de confiança 1 α, é um intervalo aleatório (L inf, L sup ) tal que: P(L inf < θ < L sup ) = 1 α, α (0, 1) onde α deve ser um valor muito reduzido por forma a temos confianças elevadas. α é o nível de confiança (significância), ou seja o erro que estamos a cometer DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 51 / 65

Intervalo de confiança IC para a média quando a variância é conhecida Seja X 1,..., X n uma amostra aleatória de dimensão n. Consideramos que a v. a. X tem um distribuiçao normal, i.e., X N ( µ, σ 2). Se σ é conhecido, então considere-se a nova variável Z = X µ σ/ N (0, 1). n Fixamos α (o nível de significância) e notamos por z α/2 o valor crítico de Z tal que P (Z > z α/2 ) = α/2. Então ( P ( z α/2 < Z < z α/2 ) = 1 α P z α/2 < X µ ) σ/ n < z α/2 = 1 α e portanto o intervalo a (1 α) 100% de confiança para µ é X z α/2 σ n < µ < X + z α/2 σ n (1) DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 52 / 65

Intervalo de confiança IC para a média quando a variância é desconhecida Se a variância σ é desconhecida e a amostra é grande, então podemos substituir σ S Se a amostra é pequena, a variável obtida no caso anterior já não é normal. Mas, se a população é normal, então a variável aleatória ( ) X µ T = S/ n t (n 1) tem distribuição t-student com n 1 graus de liberdade. Então, o intervalo a (1 α) 100% de confiança para µ é s s x t α/2,(n 1) < µ < x + t α/2,(n 1) n n DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 53 / 65

Intervalo de confiança Diminuindo o grau de confiança de 99% a 95%, aumentamos o risco de estar errados: de 1% de risco passamos a 5% de risco, ou seja temos mais possibilidades (5/100 em vez de 1/100) de que o IC não contenha a média populacional. Ao aumentar o risco, o intervalo deve ser mais preciso DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 54 / 65

Testes (ensaios) de hipóteses Decisão estatística: tomar uma decisão baseando-nos numa amostra Exemplos: Verificar se mais de metade da população irá consumir um novo produto lançado no mercado; Testar se um sistema educacional é melhor em média que outro Decidir se um novo medicamento cura ou não uma certa doença Uma hipótese estatística é uma afirmação acerca dos parâmetros de uma ou mais populações (testes paramétricos) ou acerca da distribuição da população (testes de ajustamento, não-paramétricos). Os testes de hipóteses têm como objectivo decidir, com base na informação fornecida pelos dados de uma amostra, sobre a aceitação ou não de uma dada hipótese (conjectura sobre aspectos desconhecidos da(s) população(ões)). DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 55 / 65

Testes de hipóteses Formular duas hipóteses: hipótese nula H 0 (aqui se especifica o valor do parâmetro ou a distribuição a verificar) hipótese alternativa H 1 A resposta num teste de hipóteses é dada na forma rejeição ou não rejeição de H 0 Os pontos de fronteira chamam-se valores críticos DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 56 / 65

Testes de hipóteses A tomada de decisões no processo de inferência posui riscos, o que determina a aparição dos erros de decisão Tipos de erros: Erro do tipo I: rejeitar H 0 sendo H 0 verdadeira (erro de rejeição); Erro do tipo II: não rejeitar H 0 sendo H 0 falsa (erro de não-rejeição). Definem-se α = P(erro do tipo I) = P (Rejeitar H 0 H 0 é verdadeira), onde α chama-se nível de significância do teste. Em geral, atribuir-se um valor muito baixo à probabilidade do erro do tipo I (0.05 ou 0.01) β = P(erro do tipo II) = P(Não-rejeitar H 0 H 0 é falsa), onde 1 β chama-se potência do teste DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 57 / 65

Testes de hipóteses Procedimento Geral dos Testes de Hipóteses (Testes de Significância ou Teste Estatístico) Pelo contexto do problema identificar o parâmetro de interesse Especificar a hipótese nula H 0 e a hipótese alternativa apropriada H 1 Escolher o nível de significância, α Escolher uma estatística de teste adequada (variável aleatória utilizada para decidir: por exemplo média amostral) Definir a região crítica ou região de rejeição RC Determinar o valor real da estatística de teste Decidir sobre a rejeição ou não de H 0 Se o valor calculado RC rejeita-se H 0 Se o valor calculado / RC não se rejeita H 0 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 58 / 65

Testes de hipóteses 0.4 0.35 0.3 0.25 0.2 Região de aceitação 0.15 0.1 Região crítica Não rejeitar H 0 Região crítica Rejeitar H 0 Rejeitar H 0 0.05 0 5 4 3 2 1 0 1 2 3 4 5 Valor crítico Valor crítico DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 59 / 65

Testes de hipóteses Teste bilateral: H 0 : µ = µ 0 H 1 : µ = µ 0 Teste unilateral à direita: H 0 : µ = µ 0 H 1 : µ > µ 0 Os valores da estatística de teste que nos levarão a rejeitar H 0 e concluir que µ > µ 0, também nos levarão a rejeitar qualquer valor menor do que µ 0. Teste unilateral à esquerda H 0 : µ = µ 0 H 1 : µ < µ 0 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 60 / 65

Testes de hipóteses 0.4 Testes unilaterais 0.4 0.35 0.35 0.3 0.3 H 1 : mu < mu 0 H 1 : mu > mu 0 0.25 0.25 0.2 0.2 0.15 0.15 0.1 Região crítica 0.1 Região crítica 0.05 Rejeitar H 0 Não rejeitar H 0 Região de aceitação 0 5 4 3 2 1 0 1 2 3 4 5 Valor crítico 0.05 Não rejeitar H 0 Região de aceitação Rejeitar H 0 0 5 4 3 2 1 0 1 2 3 4 5 Valor crítico DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 61 / 65

Testes de hipóteses A indicação do valor observado da estatística do teste, seguido da consulta de uma tabela para a procura de um valor crítico, tem sido recentemente substituído pelo cálculo de: a probabilidade de se observar um valor igual ou mais extremo do que o observado, se a hipótese nula é verdadeira chama-se a isto valor de prova; valor p ( p-value, possível calcular com ajuda do qualquer software ) Podemos interpretar o valor do p-value como o maior nível de significância que levaria à não rejeição da hipótese nula (ou o menor que levaria à rejeição). Assim, quanto menor for o p-value, menor é a consistência entre os dados e a hipótese nula (Quanto mais baixo for o valor-p maior é a evidência contra a hipótese nula.) Habitualmente adopta-se como regra de decisão: rejeitar H 0 se p-value α DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 62 / 65

Testes de hipóteses Examples Máquina de encher pacotes de açúcar. O peso de cada pacote deve ser 8g (isto é, µ = 8). Será que a máquina está a funcionar correctamente? Solution Temos então a hipótese nula H 0 : µ = 8 contra a hipótese alternativa H 1 : µ = 8. Seja X - variável aleatória que representa o peso de um pacote de açúcar, com E (X) = µ e Var (X) = 1. Vamos considerar que numa amostra aleatória de 25 observações: X 1,..., X 25 observou-se x = 8.5. Quer-se saber se, ao nível de significância de 5%, se pode afirmar que a máquina continua afinada. DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 63 / 65

Testes de hipóteses Estatística do teste: Z 0 = X 8 1/ 25 e para α = 0.05 a = 1.96 donde se obtem a região crítica: Com x = 8.5 obtém-se Z 0 < 1.96 ou Z 0 > 1.96. z 0 = 8.5 8 1/ 25 = 2.5. Como z 0 > 1.96 rejeita-se H 0, ou seja existe evidência (ao nível de significância considerado) de que a máquina está desafinada. Considerando agora um valor-p, temos que: quando z 0 = 2.5, para este valor H 0 não é rejeitada se ou seja, p = 0.0124. α 2 (1 Φ (2.5)) = 0.0124 DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 64 / 65

DMQ, ISCTE-IUL (diana.mendes@iscte.pt) Estatística 13 de Setembro de 2011 65 / 65