Medidas de Variação ou Dispersão



Documentos relacionados
Medidas de Variação ou Dispersão

AULAS 04 E 05 Estatísticas Descritivas


Medidas de Tendência Central

Capítulo 7 Medidas de dispersão

Prova Parcial de Estatística I. Turma: AE1 AE2 AE3 AE4

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti

Probabilidade. Distribuição Normal

Distribuição de Freqüência

Medidas de dispersão: os valores estão próximos entre si ou variam muito?

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

MEDIDAS DE DISPERSÃO

Histogramas. 12 de Fevereiro de 2015

CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE

Teorema Central do Limite e Intervalo de Confiança

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

Análise descritiva de Dados. a) Média: (ou média aritmética) é representada por x e é dada soma das observações, divida pelo número de observações.

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG EPPGG

Teorema do Limite Central e Intervalo de Confiança

CURSO ON-LINE PROFESSOR GUILHERME NEVES

Cláudio Tadeu Cristino 1. Julho, 2014

Aula 4 Estatística Conceitos básicos

Revisão: Noções básicas de estatística aplicada a avaliações de imóveis

3. Características amostrais. Medidas de localização e dispersão

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

Omatematico.com ESTATÍSTICA DESCRITIVA

1. Registou-se o número de assoalhadas da população de 100 apartamentos vendidos num bairro residencial

Lista de Exercícios 1 - Estatística Descritiva

Organização e Arquitetura de Computadores I

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

Análise Exploratória de Dados

ARREDONDAMENTO DE NÚMEROS

Análise Exploratória de Dados

Estatística Aplicada ao Serviço Social

Estatística Descritiva

Stela Adami Vayego - DEST/UFPR 1

Sistemas de numeração

Medidas e Incertezas

Exercício de Revisao 1

Estatística e Probabilidade

27/06/14. Tabelas e Gráficos. Tabelas e Gráficos

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

AVALIAÇÃO DO MODELO DE ONDAS

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

Estatística Descritiva I

A Curva Normal Luiz Pasquali

Tecido A B

Florianópolis, 17 de agosto de 2011.

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

Síntese dos resultados

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante

MÉDIA ARITMÉTICA MÉDIA PONDERADA MODA MEDIANA

2. Representação Numérica

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

4Distribuição de. freqüência

Avaliação de Desempenho

Distribuições de Probabilidade Distribuição Normal

ESTATÍSTICA. aula 1. Insper Ibmec São Paulo. Prof. Dr. Marco Antonio Leonel Caetano

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

CAP4: Distribuições Contínuas Parte 1 Distribuição Normal

Álgebra. SeM MiSTéRio

QUEDA NO NÍVEL DE ENDIVIDAMENTO DO CATARINENSE É ACOMPANHADA POR PEQUENA DETERIORAÇÃO DA QUALIDADE DAS DÍVIDAS

Apresentação Prefácio da primeira edição Prefácio da segunda edição Introdução... 33

Hipótese Estatística:

Apresentação Caule e Folha. Exemplo

A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais.

Microsoft Access: Criar consultas para um novo banco de dados. Vitor Valerio de Souza Campos

Capítulo SETE Números em Ponto Fixo e Ponto Flutuante

ANEXO F: Conceitos Básicos de Análise Financeira

Aritmética Binária e. Bernardo Nunes Gonçalves

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Lista IV - Curva Normal. Professor Salvatore Estatística I

7Testes de hipótese. Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno. H 0 : 2,5 peças / hora

Especialização em Engenharia Clínica

Criminalidade. Luciano Nakabashi Juliano Condi

Análise de Componente Principais (PCA) Wagner Oliveira de Araujo

Escolha de Portfólio. Professor do IE-UNICAMP

Lista de Exercícios. Vetores

Ferramentas da Qualidade. Professor: Leandro Zvirtes UDESC/CCT

Tópico 2. Conversão de Unidades e Notação Científica

Aula 11 Esperança e variância de variáveis aleatórias discretas

TADI Tratamento e Análise. de Dados/Informações. Prof. Camilo Rodrigues Neto. Aula 13 Exercícios

Instituto Politécnico de Viseu Escola Superior de Tecnologia

Lista de Exercícios #1. in Noções de Probabilidade e Estatística (Marcos N. Magalhães et al, 4ª. edição), Capítulo 1, seção 1.4, páginas

1.1. Para determinar a candidata escolhida aplicando o método descrito é necessário considerar

A MULHER EMPREENDEDORA DA REGIÃO METROPOLITANA DE MARINGÁ

Famílias endividadas e com contas em atraso (%)

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

CAPÍTULO 9 Exercícios Resolvidos

RESULTADOS DE OUTUBRO DE 2013

Federação do Comércio do Estado de Santa Catarina ICF

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

CURSO ONLINE REGULAR ESTATÍSTICA BÁSICA PROF. SÉRGIO CARVALHO AULA 13 RELAÇÃO DOS EXERCÍCIOS FINAIS

Lista 2. Considere os dados abaixo sobre distribuição de salário (em reais) num grupo de 1000 individuos.

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas.

Elementos de Estatística (EST001-B)

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

Universidade Federal do Paraná. Setor de Ciências Exatas. Departamento de Matemática

Transcrição:

Medidas de Variação ou Dispersão

Estatística descritiva Recapitulando: As três principais características de um conjunto de dados são: Um valor representativo do conjunto de dados: uma média (Medidas de Tendência Central) Uma medida de dispersão ou variação. A natureza ou forma da distribuição dos dados: sino, uniforme, assimétrica,... (Tabelas de frequência e histogramas)

Medidas de Variação Determina a característica de variação de um conjunto de dados Amplitude Desvio Desvio médio ou desvio absoluto Desvio padrão Variância

Diferença entre o maior e o menor valor Subtraia o menor valor do maior Amplitude = 1,88 1,60 = 0,28 m Amplitude Análise Estatística da Turma de Prob. e Eventos x Aluno 1 1,72 Aluno 2 1,60 Aluno 3 1,74 Aluno 4 1,88 Aluno 5 1,82 Aluno 6 1,75 Aluno 7 1,82 Aluno 8 1,75 Aluno 9 1,73 Aluno 10 1,75 Aluno 11 1,80 Aluno 12 1,75 Aluno 13 1,73 Aluno 14 1,84 Aluno 15 1,76 Aluno 16 1,78 Aluno 17 1,75 Aluno 18 1,69 Soma 31,66 Média 1,759 Amplitude 0,28

Desvio Desvio e desvio absoluto diferença entre cada valor e a média Desvio médio ou absoluto Média dos desvios em termos absolutos x x n x x Análise Estatística da Turma de Prob. e Estatística Eventos x x-x x-x Aluno 1 1,72-0,04 0,04 Aluno 2 1,60-0,16 0,16 Aluno 3 1,74-0,02 0,02 Aluno 4 1,88 0,12 0,12 Aluno 5 1,82 0,06 0,06 Aluno 6 1,75-0,01 0,01 Aluno 7 1,82 0,06 0,06 Aluno 8 1,75-0,01 0,01 Aluno 9 1,73-0,03 0,03 Aluno 10 1,75-0,01 0,01 Aluno 11 1,80 0,04 0,04 Aluno 12 1,75-0,01 0,01 Aluno 13 1,73-0,03 0,03 Aluno 14 1,84 0,08 0,08 Aluno 15 1,76 0,00 0,00 Aluno 16 1,78 0,02 0,02 Aluno 17 1,75-0,01 0,01 Aluno 18 1,69-0,07 0,07 Média Soma Desvio desvios médio 1,759 0,000 0,043

Desvio padrão: medida da variação dos valores em relação à média. Ex.: Calcular o desvio padrão do conjunto de dados ao lado. Passo 1: Calcule a média; Passo 2: Calcule o DESVIO de cada medida sobre a média Desvio = Desvio Padrão x x Análise Estatística da Turma de Prob. e Estatística Eventos x x-x Aluno 1 1,72-0,04 Aluno 2 1,60-0,16 Aluno 3 1,74-0,02 Aluno 4 1,88 0,12 Aluno 5 1,82 0,06 Aluno 6 1,75-0,01 Aluno 7 1,82 0,06 Aluno 8 1,75-0,01 Aluno 9 1,73-0,03 Aluno 10 1,75-0,01 Aluno 11 1,80 0,04 Aluno 12 1,75-0,01 Aluno 13 1,73-0,03 Aluno 14 1,84 0,08 Aluno 15 1,76 0,00 Aluno 16 1,78 0,02 Aluno 17 1,75-0,01 Aluno 18 1,69-0,07 Soma 31,66 0,00 Média 1,759 -------

Desvio Padrão Calcule o desvio padrão do conjunto de dados ao lado. Passo 3: Eleve ao quadrado cada uma das diferenças; Passo 4: Some todos os quadrados obtidos ( x x) 2 Análise Estatística da Turma de Prob. e Estatística Eventos x x-x (x-x) 2 Aluno 1 1,72-0,04 0,0015 Aluno 2 1,60-0,16 0,0252 Aluno 3 1,74-0,02 0,0004 Aluno 4 1,88 0,12 0,0147 Aluno 5 1,82 0,06 0,0037 Aluno 6 1,75-0,01 0,0001 Aluno 7 1,82 0,06 0,0037 Aluno 8 1,75-0,01 0,0001 Aluno 9 1,73-0,03 0,0008 Aluno 10 1,75-0,01 0,0001 Aluno 11 1,80 0,04 0,0017 Aluno 12 1,75-0,01 0,0001 Aluno 13 1,73-0,03 0,0008 Aluno 14 1,84 0,08 0,0066 Aluno 15 1,76 0,00 0,0000 Aluno 16 1,78 0,02 0,0004 Aluno 17 1,75-0,01 0,0001 Aluno 18 1,69-0,07 0,0047 Soma 31,66 0,00 0,065

Passo 5: Divida o total por (n-1), onde n é o número de dados coletados (amostra); Passo 6: Extraia a raiz quadrada do resultado anterior Desvio Padrão ( x x) n 1 Desvio Padrão 2 Análise Estatística da Turma de Prob. e Estatística Eventos x x-x (x-x) 2 Aluno 1 1,72-0,04 0,0015 Aluno 2 1,60-0,16 0,0252 Aluno 3 1,74-0,02 0,0004 Aluno 4 1,88 0,12 0,0147 Aluno 5 1,82 0,06 0,0037 Aluno 6 1,75-0,01 0,0001 Aluno 7 1,82 0,06 0,0037 Aluno 8 1,75-0,01 0,0001 Aluno 9 1,73-0,03 0,0008 Aluno 10 1,75-0,01 0,0001 Aluno 11 1,80 0,04 0,0017 Aluno 12 1,75-0,01 0,0001 Aluno 13 1,73-0,03 0,0008 Aluno 14 1,84 0,08 0,0066 Aluno 15 1,76 0,00 0,0000 Aluno 16 1,78 0,02 0,0004 Aluno 17 1,75-0,01 0,0001 Aluno 18 1,69-0,07 0,0047 Soma 31,66 0,00 0,065 Média 1,759 ------- ------- ( x x ) n 1 2 = 0,062

De uma amostra Desvio Padrão s ( ) = x x n 1 De uma população 2 Observação: A unidade do desvio padrão é a mesma unidade dos valores originais, ou conjunto de dados. σ = ( x N x) 2

Fórmula abreviada para o desvio padrão s 2 n( x ) ( = n( n 1) x) 2 Vantagens e desvantagens: Mais conveniente para uso com números extensos e com grandes conjuntos de valores Maior facilidade de uso com calculadoras e computadores (apenas três registros: n, Σx e Σx 2 ) Elimina erros de arredondamento Não evidencia o conceito de desvio médio da fórmula tradicional

Variância Desvio padrão ao quadrado s 2 variância amostral σ 2 variância populacional s 2 ( ) = x x n 1 ( x x) σ 2 = N 2 2 Observação: A unidade da variância é a mesma unidade do conjunto de dados, elevada ao quadrado.

Considerações finais Arredondamento: Tomar uma casa decimal a mais em relação às que constam dos dados originais. Arredondar apenas o resultado final e não os resultados intermediários. Se necessitarmos arredondar os resultados intermediários, acrescente duas casas decimal a mais em relação às que constam dos dados originais

Para que serve o desvio padrão? Indica a dispersão dos dados; quanto mais dispersos, maior o desvio padrão Regra prática Desvio padrão amplitude/4 *(só usar em casos muito extremos) Portanto: valor mínimo média 2.(s) Valor máximo média + 2.(s) Teorema de Tchebichev A proporção de qualquer conjunto de dados a menos de K desviospadrão a contar da média é sempre ao menos 1-1/k 2, onde k é um número positivo maior do que 1. Para k=2 e k=3, temos: Ao menos ¾ (75%) de todos os valores estão no intervalo de ± 2 desviospadrão em torno da média Ao menos 8/9 (89%) de todos os valores estão no intervalo de ± 3 desviospadrão em torno da média

Teorema de Tchebichev A fração (porcentagem) de QUALQUER conjunto de dados, a menos de K desvios a contar da média, é SEMPRE ao menos: 1-1/ K 2 onde K>1 Para k = 2 e k = 3 isto significa, por exemplo: [ x 2s, x + 2s] 75% dos dados Ou seja, ao menos ¾ de todos os valores estão neste intervalo [ x 3s, x + 3s] 89% dos dados

Teorema de Tchebichev Barbeadores elétricos sem fio da marca XYZ têm vida média de 8,0 anos, com desvio padrão de 3,0 anos. Faça uma estimativa: da vida mais breve => da vida mais longa => Tchebichev também é útil para identificar valores estranhos em um conjunto de dados: aqueles que ficam de fora do intervalo!

Identificando outliers Outliers são valores estranhos que se localizam muito distantes da média Por isso, as estatísticas descritivas são, usualmente, muito influenciadas ( contaminadas ) por eles Podem se originar em erros de coleta OU em desvios de processo Esses outliers devem ser muito bem analisados antes de um possível descarte!

Identificando outliers Tchebichev pode nos ajudar na identificação de outliers Valores fora do intervalo de +/- 2s devem ser analisados para um possível descarte [ x 2s, x + 2s] fora deste intervalo, é estranho

Mais medidas de dispersão O Coeficiente de Variação indica a magnitude relativa do desvio-padrão quando comparado com a média do conjunto de valores CV s x = (amostra) CV = σ μ (população) O Coeficiente de Variação é útil para compararmos a variabilidade (dispersão) de dois conjuntos de dados de ordem de grandezas diferentes

Medidas de dispersão Seja o seguinte conjunto de preços de geladeiras em 7 lojas distintas 750,00 800,00 790,00 810,00 820,00 760,00 780,00 x = 787, 14 s = 2563, Seja o seguinte conjunto de preços de liquidificadores nas mesmas lojas acima 50,00 45,00 55,00 43,00 52,00 45,00 54,00 x = 49, 14 s = 481, Qual dos produtos têm uma maior variabilidade de preços?

Medidas de dispersão Uma vez que, em geral, uma geladeira custa bem mais que um liquidificador, a tendência é que o desvio-padrão da geladeira seja também maior! O coeficiente de variação é uma medida adimensional que normaliza o desvio padrão em relação à média 25,63 CV geladeira = = 3,3% CV liquidific ador 787,14 4,81 49,14 Com o CV podemos concluir que os preços da geladeira têm uma menor variabilidade que os do liquidificador = = 9,8%

Medida de Dispersão: Intervalo interquartil (amplitude interquartílica) Uma medida de dispersão alternativa que pode ser empregada é o chamado intervalo interquartil ou amplitude interquartílica É a diferença entre o terceiro e o primeiro quartis Só aproveita 50% dos dados Pouco influenciada pelos valores extremos D j = Q 3 -Q 1 = P 0,75 -P 0,25

Medidas de posição e dispersão Para o conjunto de valores abaixo: 05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 44 Q1 = 10 Q2 = Md = 16,5 Q3 = 28 Q4 = 44 Dj = 28-10 = 18 Se alterarmos significativamente o último valor: 05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 200 Dj = 28-10 = 18!!!

Escore Padronizado z = x x s Número de desvios-padrão pelo qual um valor dista da média (para mais ou para menos) z = x μ σ

Exercício As alturas da população de homens adultos têm média µ=1,752m, desvio padrão σ=0,071m e distribuição gráfica em forma de sino (normal). O jogador de basquete Michael Jordan, que mede 1,98m, pode ser considerado excepcionalmente alto? Determine o escore padrão z para ele.

Resolução Calcula-se o escore z conforme segue: x 1,98 1,752 z = μ = 3,211 σ 0,071 Este resultado indica que a altura de Michael Jordan está a 3,21 desvios-padrão acima da média da população. Considerando incomuns valores acima ou abaixo de 2 desvios da média, conclui-se que Michael Jordan é de fato excepcionalmente alto comparando com a população geral.