4.1. Medidas de Posição da amostra: média, mediana e moda

Documentos relacionados
Estatística stica Descritiva

Análise descritiva de Dados. a) Média: (ou média aritmética) é representada por x e é dada soma das observações, divida pelo número de observações.

3ª AULA: ESTATÍSTICA DESCRITIVA Medidas Numéricas

IV - Descrição e Apresentação dos Dados. Prof. Herondino

Introdução e Organização de Dados Estatísticos

Y X Baixo Alto Total Baixo 1 (0,025) 7 (0,175) 8 (0,20) Alto 19 (0,475) 13 (0,325) 32 (0,80) Total 20 (0,50) 20 (0,50) 40 (1,00)

Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira

Caderno de Exercícios Resolvidos

Professor Mauricio Lutz CORRELAÇÃO

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação

Regressão e Correlação Linear

As tabelas resumem as informações obtidas da amostra ou da população. Essas tabelas podem ser construídas sem ou com perda de informações.


ANÁLISE EXPLORATÓRIA DE DADOS

Probabilidade e Estatística. Correlação e Regressão Linear

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva.

LQA - LEFQ - EQ -Química Analítica Complemantos Teóricos 04-05

Apostila de Estatística Curso de Matemática. Volume II Probabilidades, Distribuição Binomial, Distribuição Normal. Prof. Dr. Celso Eduardo Tuna

METROLOGIA E ENSAIOS

PROBABILIDADE E ESTATÍSTICA APLICADAS À HIDROLOGIA

NOTA II TABELAS E GRÁFICOS

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

Universidade Federal da Bahia Instituto de Física Departamento de Física da Terra e do Meio Ambiente TEXTOS DE LABORATÓRIO T E O R I A D E E R R O S

Análise de Variância. Introdução. Rejane Sobrino Pinheiro Tania Guillén de Torres

b. As medidas de posição mais importantes são as medidas de tendência central. Dentre elas, destacamos: média aritmética, mediana, moda.

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

Controle Estatístico de Qualidade. Capítulo 8 (montgomery)

Aplicando o método de mínimos quadrados ordinários, você encontrou o seguinte resultado: 1,2

Para quantificar a variabilidade de um conjunto de dados ou medidas é que se usam medidas de dispersão. Vamos estudar algumas delas nesta aula.

Apostila De Estatística

Medidas de tendência central. Média Aritmética. 4ª aula 2012

CQ110 : Princípios de FQ

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 1 Revisões de Estatística

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

ANÁLISE MATRICIAL DE ESTRUTURAS DE BARRAS PELO MÉTODO DE RIGIDEZ

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.

Introdução à Análise de Dados nas medidas de grandezas físicas

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)

ESPELHOS E LENTES ESPELHOS PLANOS

Probabilidade e Estatística. Correlação e Regressão Linear

FACULDADE DE TECNOLOGIA TUPY CURITIBA

CAPÍTULO 4 - Variáveis aleatórias e distribuições de probabilidade

Cálculo do Conceito ENADE

III. Consequências de um novo padrão de inserção das mulheres no mercado de trabalho sobre o bem-estar na região metropolitana de São Paulo

Como aposentadorias e pensões afetam a educação e o trabalho de jovens do domicílio 1

Controle Estatístico de Processos: a questão da autocorrelação, dos erros de mensuração e do monitoramento de mais de uma característica de qualidade

Sistemas de equações lineares

2. BACIA HIDROGRÁFICA

1 a Lei de Kirchhoff ou Lei dos Nós: Num nó, a soma das intensidades de correntes que chegam é igual à soma das intensidades de correntes que saem.

Consideraremos agora, uma de cada vez, as equivalentes angulares das grandezas de posição, deslocamento, velocidade e aceleração.

Variabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?

Comprimento de Arco. Comprimento de Arco

3.1. Conceitos de força e massa

RM 68 INCERTEZA DE MEDIÇÃO: GUIA PRÁTICO DO AVALIADOR DE LABORATÓRIOS SUMÁRIO 1 OBJETIVO E CAMPO DE APLICAÇÃO 2 REFERÊNCIAS 3 DEFINIÇÕES 4 METODOLOGIA

CENTRO UNIVERSITÁRIO DO LESTE DE MINAS GERAIS - UnilesteMG

são os coeficientes desconhecidos e o termo ε (erro)

Medidas de Localização

Elaboração: Fevereiro/2008

Termodinâmica e Termoquímica

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CE 071 ANÁLISE DE REGRESSÃO LINEAR. Cesar Augusto Taconeli

Manual dos Indicadores de Qualidade 2011

PLANILHAS EXCEL/VBA PARA PROBLEMAS ENVOLVENDO EQUILÍBRIO LÍQUIDO-VAPOR EM SISTEMAS BINÁRIOS

ESTATÍSTICA. PROBABILIDADES Professora Rosana Relva Números Inteiros e Racionais ESTATÍSTICA. Professor Luiz Antonio de Carvalho

INTRODUÇÃO À ANÁLISE DE DADOS NAS MEDIDAS DE GRANDEZAS FÍSICAS

ROGÉRIO ALVES SANTANA. AVALIAÇÃO DE TÉCNICAS GEOESTATÍSTICAS NO INVENTÁRIO DE POVOAMENTOS DE Tectona grandis L.f.

INTRODUÇÃO AO CÁLCULO DE ERROS NAS MEDIDAS DE GRANDEZAS FÍSICAS

EST 220 ESTATÍSTICA EXPERIMENTAL

Avaliação da Tendência de Precipitação Pluviométrica Anual no Estado de Sergipe. Evaluation of the Annual Rainfall Trend in the State of Sergipe

Licença de uso exclusiva para Petrobrás S.A. Licença de uso exclusiva para Petrobrás S.A. NBR Forças devidas ao vento em edificações JUN 1988

Polos Olímpicos de Treinamento. Aula 10. Curso de Teoria dos Números - Nível 2. Divisores. Prof. Samuel Feitosa

2 Máquinas de Vetor Suporte 2.1. Introdução

1 Topologias Básicas de Conversores CC-CC não-isolados

DISTRIBUIÇÃO DA AÇÃO DO VENTO NOS ELEMENTOS DE CONTRAVENTAMENTO CONSIDERANDO O PAVIMENTO COMO DIAFRAGMA RÍGIDO: ANÁLISE SIMPLIFICADA E MATRICIAL

PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ

Clause Fátima de Brum Piana

Estimativa da Incerteza de Medição da Viscosidade Cinemática pelo Método Manual em Biodiesel

ESTATÍSTICA. na Contabilidade Revisão - Parte 2. Medidas Estatísticas

Camila Spinassé INTRODUÇÃO À MATEMÁTICA FINANCEIRA PARA ALUNOS NA EDUCAÇÃO DE JOVENS E ADULTOS

Elaboração: Novembro/2005

A ESTIMATIVA DA INCERTEZA DE MEDIÇÃO PELOS MÉTODOS DO ISO GUM 95 E DE SIMULAÇÃO DE MONTE CARLO

2 ANÁLISE ESPACIAL DE EVENTOS

INE 7001 ESTATÍSTICA PARA ADMINISTRADORES I NOTAS DE AULA PROF. MARCELO MENEZES REIS MANOEL DE OLIVEIRA LINO

Influência dos Procedimentos de Ensaios e Tratamento de Dados em Análise Probabilística de Estrutura de Contenção

UM ALGORITMO EXATO PARA A OTIMIZAÇÃO DE CARTEIRAS DE INVESTIMENTO COM RESTRIÇÕES DE CARDINALIDADE

PROBLEMAS SOBRE PONTOS Davi Máximo (UFC) e Samuel Feitosa (UFC)

CURRICULUM VITAE - RESUMIDO

Aplicações de Estimadores Bayesianos Empíricos para Análise Espacial de Taxas de Mortalidade

Probabilidade: Diagramas de Árvore

ANÁLISE DE CONFIABILIDADE DO MODELO SCS-CN EM DIFERENTES ESCALAS ESPACIAIS NO SEMIÁRIDO

Escola Secundária Dr. Ângelo Augusto da Silva Matemática 12.º ano Números Complexos - Exercícios saídos em (Exames Nacionais 2000)

CAPÍTULO 2 BACIA HIDROGRÁFICA

UNIVERSIDADE PRESBITERIANA MACKENZIE CCSA - Centro de Ciências Sociais e Aplicadas Curso de Economia

1.UNIVERSIDADE FEDERAL DE VIÇOSA, VIÇOSA, MG, BRASIL; 2.UNIVERSIDADE FEDERAL DE GOIÁS, GOIANIA, GO, BRASIL.

Princípios do Cálculo de Incertezas O Método GUM

Capítulo 1. O plano complexo Introdução. Os números complexos começaram por ser introduzidos para dar sentido à 2

Matemática Ficha de Trabalho

Despacho Econômico de. Sistemas Termoelétricos e. Hidrotérmicos

Transcrição:

4. Meddas descrtva para dados quanttatvos 4.1. Meddas de Posção da amostra: méda, medana e moda Consdere uma amostra com n observações: x 1, x,..., x n. a) Méda: (ou méda artmétca) é representada por x e é dada soma das observações, dvda pelo número de observações. x n 1 n x Exemplo 1: Sejam os dados:, 3, 6, 3, 5, 4, 3, 4,, 3, 10 logo x 35 x 1 35 10 3.5 Propredade: Se y = ax + b, então, para uma amostra x 1, x,..., x n, temos: y a x b, 1,, n,, e y a x b

Exemplo : Se Y = X 1, então, temos os dados transformados: 3, 5, 11, 5, 9, 7, 5, 7, 3, 5 e y 60 10 1 y 3.5 1 6.0 Note que, para duas varáves x e y, se z = x/y, então: z x y b) Medana: representada por med (x), é dada pela observação que ocupa a posção central das observações ordenadas. Defnção: Estatístca de ordem: a estatístca de ordem é dada pela -ésma observação ordenada, sendo representada por: x (), = 1,,..., n, ou seja: ) x (1) é a prmera estatístca de ordem, ou o valor mínmo da amostra; ) x (n) é a n-ésma estatístca de ordem ou o valor máxmo da amostra. ) x () é a -ésma estatístca de ordem, ou a -ésma observação ordenada; Por exemplo, para =, x () é a segunda estatístca de ordem, ou o segundo menor valor da amostra;

Desta forma, temos que as estatístcas de ordem fornecem a amostra ordenada: x (1) x ()... x (n) Seja a amostra ordenada, x (1) x ()... x (n), então, a posção central é dada pela estatístca de ordem, portanto, med ( x) x n1 Exemplo 3: Sejam os dados:, 3, 6, 3, 5, 4,, 5, (n = 9). Dados ordenados:,,, 3, 3, 4, 5, 5, 6 Então, med ( x ) x 5 3 Notas: ) A medana também é representada por x ~ ; ) Se n é par, a medana é dada pela méda artmétca das duas observações centras. Exemplo 4: Sejam agora:,,, 3, 3, 4, 4, 5, 5, 6 (n = 10). x(5) x(6) 3 4 Então, med ( x) x5.5 3. 5 c) Moda: representada por mo (x), é observação da amostra com maor frequênca, ou seja, a que mas se repete. Um conjunto de dados pode ter mas de uma moda, ou até mesmo, não ter moda.

Classfcação de um conjunto de dados em relação ao número de modas: ) unmodal: quando o conjunto tem uma únca moda; ) bmodal: quando o conjunto tem duas modas; ) multmodal: quando o conjunto tem três ou mas modas; v) amodal: quando o conjunto não tem moda (neste caso, todas as observações aparecem uma únca vez na amostra). Exemplo 5: Com os dados:, 3, 6, 3, 5, 4, 3, 4,, 3 Então, mo ( x) 3 (aparece 4 na amostra) O conjunto é unmodal. O moda pode, anda, ser calculada para varáves categórcas. Neste caso, o resulta será um valor não numérco. Veja o exemplo: Consdere os concetos de n = 10 alunos: D B A B C A A C B B mo(conceto) = B (aparece 4 na amostra) Exemplo 6: Dos alunos de Estatístca 1, dos anos 015, 016 e 017, que pratcam alguma atvdade físca regularmente, seja o número de vezes que pratcam essa atvdade físca na semana. Dados: 3 3 3 3 3 3 3 3 4 5 4 4 5 7 3 1 4 4 3 3 3 1 3 4 3 7 5 5

Dados ordenados: 1 1 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 7 7 37 ) Méda amostral: 10 1 x, Portanto a méda amostral é: 10 x 3,4 vezes/semana 37 n 1 ) Medana amostral: como n = 37, então 19, logo, a medana é a observação ordenada que ocupa a 19ª posção, ou seja: med ( x ) x 19 3 vezes/semana ) Moda da amostra: da tabela de frequêncas verfca-se que a observação mas frequente na amostra é o 3, que aparece 14 vezes. Desta forma, a moda é: mo ( x) 3 vezes/semana

Podemos resumr as meddas de posção numa tabela: Tabela: Meddas de posção amostral da varável número de vezes que pratca atvdade físca na semana. méda medana moda 3,4 vezes/semana 3 vezes/semana 3 vezes/semana Exemplo 7: Altura (em metros) de n = 30 alunos de Estatístca 1, de 015 a 017. X = altura dos alunos (em metros) Dados ordenados: 1,54 1,57 1,59 1,59 1,60 1,6 1,63 1,65 1,67 1,68 1,70 1,70 1,70 1,7 1,7 1,73 1,74 1,74 1,75 1,75 1,77 1,78 1,78 1,79 1,80 1,83 1,84 1,90 1,90 1,95 30 ) Méda amostral: 51, 75 1 x. 51,73 Portanto a méda amostral é: x 1, 74 metros 30 n 1 ) Medana amostral: como n = 30, então 15, 5, logo, a medana é a observação ordenada que ocupa a posção 15,5, ou seja, é dada pela méda artmétca entre a 15ª e 16ª observações ordenadas:

x(15) x(16) 1,7 1,73 med ( x) x15,5 1, 75 metros ) Moda da amostra: a moda é dada pela observação 1,70m, que aparece 3 vezes na amostra: mo ( x) 1,70 metros Comandos do R para as meddas de posção: altura <- c(1.70, 1.73, 1.83, 1.60, 1.75, 1.84, 1.77, 1.78, 1.74, 1.6, 1.70, 1.67, 1.63, 1.90, 1.54, 1.68, 1.95, 1.90, 1.59, 1.74, 1.80, 1.57, 1.75, 1.7, 1.59, 1.70, 1.65, 1.78, 1.79, 1.7) # soma das observações soma <- sum(altura) soma # meda anostral xbar <- mean(altura) xbar # medana amostral medana <- medan(altura) medana

A moda não tem uma função pronta no R, portanto, podemos programar uma função e utlzá-la sempre que for necessáro. # Função no R para a moda ########################## mo <- functon(v){ tabela <- table(as.vector(v)) m <- names(tabela)[tabela == max(tabela)] f(s.numerc(v)){m <- (as.numerc(m))} f(length(m)==length(v)){ prnt("conjunto não possu moda.")} else{return(m)} } x <- c(1,,,,3,3) mo(x) x <- c("e","s","t","a","t","","s","t","","c","a") mo(x) # moda da varável altura moda <- mo(altura) moda # veja sso! altura[1] <- 1.69 mo(altura) # Crando uma lsta com estatístcas descrtvas # de posção méda, medana e moda. ################################################ descr <- as.matrx(c(mean(altura),medan(altura),mo(altura))) dmnames(descr)[[1]] <- c("méda","medana","moda") dmnames(descr)[[]] <- "altura" round(descr,4)

4.1.1. Méda, Moda e Medana e a Smetra dos dados Consdere o hstograma abaxo: Fgura 4: Função de dstrbução de probabldades sobre o hstograma. O que podemos dzer com relação a smetra da dstrbução de frequêncas representa por este hstograma? Quando uma dstrbução de frequêncas é perfetamente smétrca, teremos que a méda artmétca, a moda e a medana serão guas, ou seja: x = mo(x) = med(x)

E quanto ao exemplo acma (Fgura 4), como podemos classfcá-lo em função da sua falta de smetra? Quando a dstrbução não é smétrca, podemos dstngur duas stuações possíves (Fgura 5): ) A cauda superor da dstrbução é mas alongada, puxando a dstrbução para a dreta. Neste caso, a méda é maor do que a moda e a assmetra é dta à dreta ou postva. ) A cauda nferor da dstrbução é mas alongada, puxando a dstrbução para a esquerda. Neste caso, a méda é menor do que a moda e a assmetra é dta à esquerda ou negatva. Fgura 5: Assmetras à dreta e à esquerda, respectvamente.

Assm, para cada stuação, teremos: ) Quando a smetra é perfeta as três meddas são guas. ) Na stuação em que ocorre a assmetra à dreta, teremos a moda menor do que a medana que é menor do que a méda.

) E, para a assmetra à esquerda, devemos ter a méda menor do que a medana que é menor do que a moda. Observação mportante! As relações apresentadas são consequênca da smetra () ou assmetra () e (), não a causa.

Relação entre méda, moda e medana A Méda : usada para resumr dados contínuos smétrcos ou aproxmadamente smétrcos; aproprada quando o tamanho da amostra é moderado ou grande, mesmo quando a smetra não tão boa; é nfluencada por valores extremos, sendo puxada na dreção da cauda mas alongada (ver Fgura 5), especalmente para amostras pequenas. A Moda é o elemento de maor frequênca, sendo o ponto de máxmo de f(x); a moda é aproprada para dados de contagem; pode ser aplcada a dados qualtatvos, nomnas ou ordnas; quando o tamanho da amostra é grande, é robusta a valores extremos. A Medana está sempre no meo do conjunto, dvdndo-o em duas partes guas, fcando entre as duas meddas anterores; por ser uma medda robusta a valores extremos, é aproprada para resumr dados assmétrcos; pode ser utlzada para dados qualtatvos ordnas.

4.1.. As médas geométrca e harmônca a) Méda Geométrca: MG(x) e é dada pela n-ésma raz do produto das n observações da amostra MG( x) n x 1 1/ n n x 1 x x n Exemplo 8: Sejam os dados:, 3, 6, 3, 5, 4, 3, 4,, 3, 10 logo x 15550 1 MG ( x) 1015550 3,305054 Obs: ) para o cálculo da méda geométrca, os valores devem ser todos postvos e dferentes de zero; ) outra forma de apresentação da méda geométrca é dada pela relação: log( x ) log( x ) log( x MG( x) exp 1 n) n exp 1 n log( x ) n 1

Exemplo 9: Com os dados anterores, log( x ) 11, 95453, e 10 1 11,95453 MG ( x) exp 3,305054 10 Propredades: ) Seja a amostra x 1, x,..., x n, então, MG( a x) a MG( x) ; Exemplo 10: Se y = x: MG( y) 101595480 6.610 MG( x) ) Sejam duas varáves X e Y, então, MG x y MG( x). MG( y) Exemplo 11: Seja a segunte amostra de uma varável y: 10,0 15,0 10,0 5,0 7,5 5,0 7,5 7,5 1,5 7,5, então MG ( y) 8,6636 e, x MG y 0.4 MG( x) MG( y)

b) Méda Harmônca: MH(x) e é dada pelo recíproco da méda artmétca dos nversos das observações MH ( x) 1 1/ x1 1/ x n 1/ x n 1 x 1 1 x n 1 x n n 1 n 1 x Obs: também, para o cálculo da méda harmônca, os valores devem ser todos postvos e dferentes de zero. Exemplo 1: Sejam os dados:, 3, 6, 3, 5, 4, 3, 4,, 3, 10 1 logo 3. x 1 10 MH ( x) 3.15 3. Propredade: Seja a amostra x 1, x,..., x n, então, MH ( a x) a MH ( x)

Exemplo 13: Se y = x: 10 1 então, 1. 6 y 1 10 MH ( y) 6.5 MH ( x) 1.6 4.1.3. Relações entre as meddas deposção ) Relação de desgualdades entre as médas artmétca, geométrca e harmônca MH ( x) MG( x) Se todas as observações forem guas, ( x 1 = x =... = x n ), temos a gualdade MH ( x) MG( x) x x ) Relação empírca entre méda artmétca, medana e moda. Karl Pearson, matemátco famoso, no fnal do século XIX e níco do XX, observou emprcamente, a segunte relação entre as três meddas de posção méda, medana e moda: x mo( x) 3 x med( x) ou, anda mo( x) med( x) x

Observações: 1) Se a dstrbução dos dados for perfetamente smétrca, então x med( x) mo( x) ; ) A relação só se aplca a dstrbuções com boa smetra; 3) Só é valda para casos unmodas; 4) Depende de um tamanho de amostra n elevado.

4.1.4. Exemplos de meddas de posção Exemplo 14: uma grande companha está preocupada com o tempo em que seus equpamentos fcam em manutenção na assstênca técnca. Assm sendo, fez um levantamento do tempo de manutenção (das) de 50 equpamentos para um estudo mas detalhado. X = das em manutenção de equpamentos. 15 13 1 9 5 5 10 6 9 10 3 4 13 1 16 7 6 4 11 8 6 6 10 17 13 9 5 5 9 14 15 3 6 18 3 4 5 7 8 3 10 5 5 4 5 Dados Ordenados: 3 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 7 7 8 8 9 9 9 9 10 10 10 10 11 1 13 13 13 14 15 15 16 17 18 1 n = 50 observações Meddas Descrtvas de Posção: n ) Méda: 1 x 39 39 x 7. 84 das ( 8 das) 50

) Medana: Determnando a posção da medana n 1 501 5.5 Logo, a medana é dada pela méda entre a 5ª e 6ª observações ordenadas: x(5) x(6) 6 6 med ( x) 6 das ) Moda: mo(x) = 5 das (aparece 5 na amostra) o conjunto é unmodal. v) Méda geométrca: n 1 x 3.89504610 40 1/ 50 ( x) 3.89504610 6.4835 MG das n Como log( x ) 93. 46311, temos, anda, 1 93.46311 MG ( x) exp e 1.8693 6. 4835 das. 50 40

n 1 v) Méda harmônca: 9.4811 x 1 50 MH ( x) 5.737 das 9.4811 Exemplo 15: Em 1798 o centsta nglês Henry Cavendsh medu a densdade do globo terrestre em 9 ensaos. Os dados foram obtdos do Annals os Statstcs, 1977. X = densdade do globo terrestre (g/cm 3 ). 5.50 5.61 4.88 5.07 5.6 5.55 5.36 5.9 5.58 5.65 5.57 5.53 5.6 5.9 5.44 5.34 5.79 5.10 5.7 5.39 5.4 5.47 5.63 5.34 5.46 5.30 5.75 5.68 5.85 Dados ordenados 4.88 5.07 5.10 5.6 5.7 5.9 5.9 5.30 5.34 5.34 5.36 5.39 5.4 5.44 5.46 5.47 5.50 5.53 5.55 5.57 5.58 5.61 5.6 5.63 5.65 5.68 5.75 5.79 5.85 n = 9 observações Meddas Descrtvas de Posção: n 157.99 ) Méda: 1 x 157. 99 x 5. 448g/cm 3 9 ) Medana: Determnando a posção da medana n 1 30 15

Logo a medana é a 15ª observação ordenada. med x) x ( 5.46g/cm 3 ( 15) ) Moda: mo 1 (x) = 5.9 g/cm 3 e mo (x) = 5.34 g/cm 3 o conjunto é bmodal. v) Méda geométrca: n 1 x.1906510 1 1/ 9 ( x).1906510 5.4435 MG g/cm 3 n Como log( x ) 49.13848, temos, anda, 1 1 49.13848 MG( x) exp e 1.69443 5. 4435g/cm 3. 9 n 1 v) Méda harmônca: 5.331768 x 1 9 MH ( x) 5.4391g/cm 3 5.331768

Exemplo 16: Altura dos alunos das turmas A e B de Estatístca 1 no prmero semestre de 015. X = altura dos alunos (em metros). Dados ordenados 1.5 1.55 1.57 1.58 1.59 1.60 1.60 1.60 1.61 1.63 1.63 1.64 1.65 1.65 1.65 1.67 1.68 1.68 1.68 1.69 1.70 1.70 1.70 1.70 1.70 1.7 1.7 1.73 1.73 1.73 1.73 1.74 1.74 1.74 1.75 1.75 1.76 1.77 1.77 1.78 1.78 1.78 1.79 1.79 1.79 1.80 1.80 1.80 1.83 1.83 1.83 1.83 1.89 1.90 1.95 n = 55 observações Dados: x 94.5; 1 3.094 x Calcule as meddas de posção: médas artmétca, geométrca e harmônca; medana e moda.

Meddas Descrtvas de Posção: 94.5 ) Méda: x = 94.5 x 1. 7185m 55 n 1 56 ) Medana: 8, logo a medana é a 8ª observação ordenada: med ( 8) x) x ( 1.7m ) Moda: mo(x) = 1.70m aparece 5 na amostra, o conjunto é unmodal,

4.. Meddas de Dspersão (ou de varação) a) Ampltude: é dada pela dferença entre o maor e o menor valor da amostra. Sejam x( 1) mn[ x1, x,, xn] e x( n) max[ x1, x,, xn], x então, a ampltude da amostra é defnda por: A x ( x. n) A ampltude A representa o tamanho da regão na qual os dados foram observados. b) Varânca e desvo-padrão amostras: A varânca amostral é defnda pela soma dos quadrados dos desvos das observações em relação à meda amostral x, dvdda por (n 1), ou seja (1) x s 1 n. x x n 1 Mostra-se faclmente que s pode ser escrta como s n 1 x n 1 nx. O desvo padrão amostral, denotado por s, é defndo pela raz quadrada da varânca amostral e é expresso na mesma undade dos dados: s 1 n x x n 1.

c) Ampltude Interquartl: é dada pela dferença entre o 3º e o 1º quarts e representa a regão ocupada pelos 50% das observações centras. Para defnr a ampltude nterquartl, vamos prmero defnr o que são quarts amostras, Quarts amostras são meddas descrtvas que dvdem a amostra ordenada em quatro parcelas guas de 5%, ou seja, 5% 5% 5% 5% ------------ ------------ ------------ ------------ Q 1 Q Q 3 med(x) Assm sendo: ) Q 1 é o prmero quartl; ) Q = med(x), é o segundo quartl, ) Q 3 é o tercero quartl. Desta forma, denotada por A q, é defnda por A q = Q 3 Q 1 A q determna o tamanho da regão em torno da medana que contém 50% das observações centras,

4..1. Métodos para a obtenção dos quarts amostras Para a obtenção dos quarts devemos proceder da mesma forma que para a medana. Uma vez que a medana esteja determnada, temos o conjunto de dados ordenados dvddo em duas partes. Os quarts, então, são dados pelas observações centras destas duas metades. Q 1 med(x) Q 3 Observação central da metade nferor Observação central da metade superor O procedmento para encontrar os quarts é o mesmo usado para a medana, porém, teremos dos procedmentos dependendo do tamanho da amostra n ser par ou ímpar. ) Se o tamanho da amostra n for par: o procedmento é o mesmo da medana, sendo aplcada a cada uma das metades (nferor e superor); Exemplo 17: Dados: 1 1 3 4 5 5 6 6 6 7 8 8 9 n = 14 med ( x) x (7) x (8) 5 6 5.5 A medana med(x) = 5.5 dvde os dados em dos grupos de 7 observações cada um. Assm,

7 1 4 Q 1 é a 4ª observação da metade nferor e, Q 3 é a 4ª observação da metade superor. Desta forma, os quarts serão as observações ordenadas que ocupam as posções 4 e 7 + 4 = 11. 5,5 1 1 3 4 5 5 6 6 6 7 8 8 9 Q 1 x(4) 3 Q 3 x(11) 7 ) Se o tamanho da amostra n for ímpar: devemos optar por nclur, ou não, a medana nos cálculos para a determnação dos quarts..1) se a medana não for ncluída, então teremos dos grupos, nferor e superor à medana, cada um com ( n 1) observações n 1 observações nferores n 1 observações superores Q 1 med(x) Q 3 e os quarts Q 1 e Q 3 são obtdos normalmente.

Exemplo 18: Dados: 1 1 3 4 5 5 6 6 6 7 8 9 n = 13 A medana med x) x ( 5 dvde os dados em dos grupos ( 7) ordenados de 6 observações cada e, os quarts serão as médas entre as observações ordenadas x (3) e x (4) e as observações x (10) e x (11) (7 + 3 = 10). 6 1 3. 5 Q 1 é a méda da 3ª e 4ª observações do grupo nferor e, Q 3 é a méda da 3ª e 4ª observações do grupo superor. 5 1 1 3 4 5 6 6 6 7 8 9 Q x x 3 (3) (4) 1.5 Q x x 6 7 (10) (11) 3 6.5

.) se a medana for ncluída, então, ela deve ser consderada 1 tanto para a obtenção do 1º quartl, na metade nferor como na obtenção do 3º quartl, na metade superor. Desta forma, teremos grupos, com ( n 1) observações cada. grupo nferor grupo superor Q 1 med(x) Q 3 e os quarts Q 1 e Q 3 são obtdos normalmente. Exemplo 19: Dados: 1 1 3 4 5 5 6 6 6 7 8 9 n = 13 A medana med x) x ( 5 dvde os dados em dos grupos ( 7) ordenados de 6 observações cada, Inclundo a medana ao procedmento, teremos uma observação a mas em cada grupo, ou seja, teremos 7 observações 7 1 4 Q 1 é a 4ª observação do grupo nferor e, Q 3 é a 4ª observação do grupo superor, ou seja, a 10ª observação ordenada (6 + 4), 1 Observe que a medana é uma só. Ela é apenas consderada nos dos grupos para as contagens das posções dos quarts.

Q Q 1 1 3 4 5 5 5 6 6 6 7 8 9 1 x(4) 3 x(10) 3 6 ) Outra forma para a obtenção dos quarts é apresentada por Murtera (00), Se a medana ocupa a posção (n + 1)/, então Q 1 deverá ocupar a posção: n 1 1 n 3 4 Para a posção de Q 3 fazemos: ( n 1) n 3 4 3n 1 4 Portanto, Q 1 e Q 3 são dados pelas observações ordenadas que n 3 3n 1 ocupam as posções e, respectvamente, 4 4 n 3 3n 1 Se os valores de e não forem nteros, Q 1 e Q 3 4 4 devem ser obtdos por nterpolação lnear,

Por exemplo, se n 3 4 k, em que k é a parte ntera e a parte decmal, então, Q 1 pertence ao ntervalo x ; x ) e ( ( k ) ( k1) Q 1 x( k ) [ x( k 1) x( k ) Para Q 3 o procedmento é semelhante, ou seja, se 3n 1, 4 então, Q 3 pertence ao ntervalo x ; ) e Q ( ( ) x( 1) 3 x( ) [ x( 1) x( ) Exemplo 0: Dados: 1 1 3 4 5 5 6 6 6 7 8 8 9 n = 14 Para a determnação de Q 1, temos: 14 3 17 posção de Q 1 : 4. 5. 4 4 Como = 0,5, Q 1 é a nterpolação entre a 4ª e 5ª observações ordenadas: Q 3 0.5(4 3) 3.5. 1 ] ] Para a determnação de Q 3, temos:

3141 43 posção de Q 3 : 10. 75. 4 4 Aqu = 0,75 e Q 3 é a nterpolação entre a 10ª e 11ª observações ordenadas: Q 6 0.75(7 6) 6.75. 3 Obs: o tem () com n ímpar é equvalente ao tem (.), Notas: Assm como a medana, os quarts amostras dependem do tamanho da amostra n, fazendo com que nem sempre os quatro grupos tenham o mesmo tamanho; Exstem dversas outras formas para a determnação dos quarts, Nesta dscplna daremos ênfase nos tens () e (.1); Para n pequeno, pode-se, anda, obter os quarts grafcamente pelo hstograma dos dados; Os quarts são casos especas dos quants (ou percents), que são denotados por: x(p) p-ésmo quantl ou quantl de ordem p, Portanto, o quantl x(p) é dado pela observação ordenada que dexa uma frequênca acumulada gual 100p % abaxo de s, Assm sendo temos que: ) Q 1 = x(0.5) quantl de ordem 0.5; ) Q = med(x) = x(0.50) quantl de ordem 0.50; ) Q 3 = x(0.75) quantl de ordem 0.75,

4... Exemplos de meddas de dspersão: Exemplo 1: Número de pessoas com dabetes em 0 grupos de 1000 pessoas cada. Neste caso, foram obtdos os seguntes dados: 7, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 1 n n 1 x 193 e x 1889 1 193 a) Méda: x 9. 65 casos ( 10); 0 x(10 ) x(11) 1010 b) Medana: med ( x) 10 casos c) Moda: mo(x) = 10 casos. d) Varânca e desvo padrão amostral: 1889 0(9.65) 1889186.45 s 01 19 6.55 s 1.397(casos) 19 s 1.397 1.18 casos ( 1)

e) Ampltude amostral: A 17 5 casos f) Ampltude nterquartl: 101 posção de Q 1 : 5. 5, logo, o 1º quartl é dado pela méda entre a 5ª e 6ª observações ordenadas: x(5) x(6) 9 9 Q 1 9 casos. posção de Q 3 : 10 5.5 15. 5, logo o 3º quartl dado pela méda entre a 15ª e 16ª observações ordenadas: x(15) x(16) 1010 Q 3 10 casos. Desta forma, a ampltude nterquartl é: A 10 9 1 caso. q Relação entre as ampltudes amostral e nterquartl: A q A 1 5 0. Ou seja, a metade das observações centras representam 0% da ampltude total dos dados.

Exemplo : Altura dos alunos das turmas A e B de Estatístca 1 no prmero semestre de 015. X = altura dos alunos (em metros). Dados ordenados 1.5 1.55 1.57 1.58 1.59 1.60 1.60 1.60 1.61 1.63 1.63 1.64 1.65 1.65 1.65 1.67 1.68 1.68 1.68 1.69 1.70 1.70 1.70 1.70 1.70 1.7 1.7 1.73 1.73 1.73 1.73 1.74 1.74 1.74 1.75 1.75 1.76 1.77 1.77 1.78 1.78 1.78 1.79 1.79 1.79 1.80 1.80 1.80 1.83 1.83 1.83 1.83 1.89 1.90 1.95 n = 55 observações n Dado: x 94. 5 e x 16.8848 1 94.5 a) Méda: x 1. 7185m; 55 b) Medana: med x) x ( 1. 7m; ( 8) c) Moda: mo ( x) 1. 70. d) Varânca e desvo padrão amostral: 16.8848 55(1.7185) 16.884816.4369 s 0.4479 s 0.00894m 54 551 54

s 0.00894 0. 09107 m e) Ampltude amostral: A 1.95 1.5 = 0.43m f) Ampltude nterquartl: (sem nclur a medana) O prmero quartl é a posção central da metade nferor Q 1 x(14) 1.65m O tercero quartl é a posção central da metade superor Q 3 x(4) 1.78m Desta forma, a ampltude nterquartl é: A 1.78 1.65 = 0.13 q Relação entre as ampltudes amostral e nterquartl: A q A 0.13 0.43 0.30 Metade das observações centras representam 30.% da ampltude total dos dados.

Exemplo 3: Das de manutenção de equpamentos de uma grande companha, (n = 50 observações) X = das em manutenção de equpamentos, Dados Ordenados: 3 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 7 7 8 8 9 9 9 9 10 10 10 10 11 1 13 13 13 14 15 15 16 17 18 1 n n 1 x 39 e x 4178 1 a) 39 x 7. 84 das 50 b) x(5) x(6 ) med ( x) 6 das c) mo(x) = 8 das d) Varânca e desvo padrão amostral: 4178 50(7.84) 41783073.8 s.5453 das 501 49 s.5453 4.748 das e) Ampltude amostral: A 1 19 das

f) Ampltude nterquartl: A medana está entre a 5ª e 6ª posção, logo o prmero quartl é a posção central da metade nferor dos dados, ou seja: 51 13, logo o 1º quartl é a 13ª observação ordenada, Q x 4 das, 1 (13) O tercero quartl é a posção central da metade superor 5 13 38, logo o 3º quartl é a 38ª observação ordenada, Q x 10 das, 3 (38) Desta forma, a ampltude nterquartl é: Aq 10 4 5das Relação da ampltude nterquartl com a ampltude total: A 6 q 0.316 A 19. Metade das observações centras representam 31.6% da ampltude total.

Exemplo 4: Dados Cavendsh. X = densdade do globo terrestre (g/cm 3 ). Dados ordenados 4.88 5.07 5.10 5.6 5.7 5.9 5.9 5.30 5.34 5.34 5.36 5.39 5.4 5.44 5.46 5.47 5.50 5.53 5.55 5.57 5.58 5.61 5.6 5.63 5.65 5.68 5.75 5.79 5.85 n = 9 observações x 157.99 e x 86. 0855 157.99 x 5.448g/cm 3 9 a) Varânca amostral: 86.0855 9(5.4479) 1.36638 s 0.04773 (g/cm 3 ) 91 8 Desvo padrão amostral: s 0.04773 0. 1847 g/cm 3 b) Ampltude amostral: A 5.85 4.88 0. 97 g/cm 3 c) Ampltude nterquartl: A medana é 15ª observação ordenada, o prmero quartl (exclundo-se a medana do cálculo) é a posção central da metade nferor dos dados, ou seja:

x(7) x(8) 5.9 5.30 Q 1 5. 95 g/cm 3, x() x(3) 5.61 5.6 Q 3 5.615 g/cm 3 Desta forma, a ampltude nterquartl é: A 5.615 5.95 = 0.3 g/cm 3, q Relação da ampltude nterquartl com a ampltude total: A 0.3 q 0.330 A 0.97. Metade das observações centras representam 33.0% da ampltude total.

4.3. O coefcente de varação amostral: Uma medda utlzada para quantfcar a varabldade dos dados é o coefcente de varação, ou cv. O cv de varação amostral é dado pela razão do desvo padrão da amostra s e a méda amostral x : cv s x Notas: O coefcente de varação compara a magntude do desvo padrão s com a méda x. Se cv 1 s x. O coefcente de varação é uma medda admensonal (é um número puro) também podendo ser expresso em %. Exemplo 5: a) Número de casos com dabetes em 0 grupos de 1000 pessoas: x 9.65 casos/grupo s 1.397 (casos/grupo) s 1.397 1.18 casos/grupo 1.18 cv 0.1 ou 1.% 9.65

b) Altura dos alunos da dscplna Estatístca 1: x 1.7185m s 0.00894m s 0.00894 0.09107 m 0.09107 cv 0.0530 ou 5.30% 1.7185 c) Das de manutenção de equpamentos: x 7.84 das s.5453 das s.5453 4.748 das 4.748 cv 0.606 ou 60.6% 7.84 d) Dados Cavendsh: x 5.448g/cm 3 s 0.1847 g/cm 3 0.1847 cv 00401 ou 4.01%, 5.448

Nos exemplos acma temos os cv s de quatro processos dstntos, sendo o maor deles (das manutenção) 15 vezes maor do que o menor (Cavendsh), ndcando claramente as dferenças na dspersão dos dados. Tabela: Coefcentes de varação dos exemplos. Dados cv cv (%) Manutenção 0.606 60.6% Dabetes 0.1 1.% Alturas 0.053 5.3% Cavendsh 0.040 4.0% Um ponto de grande nteresse, contudo, dz respeto a classfcar o cv e poder dzer se um conjunto de dados tem uma dspersão muto alta, ou não. A segur serão apresentados três crtéros para classfcação do coefcente de varação. 4.3.1. Como classfcar o Coefcente de Varação O cv tem uma característca partcular de ser ntrínseco a cada processo, tendo sdo muto estudado na área agrícola, mas especfcamente, na expermentação agronômca. Város autores ndcam dferentes métodos para se classfcar o coefcente de varação. A segur, são apresentadas três classfcações.

I) Classfcação segundo Pmentel Gomes (1985), baseada em ensaos agrícolas. Faxa cv dspersão menor ou gual a 10% baxo baxa dspersão dos dados entre 10% e 0% médo méda dspersão dos dados entre 0% e 30% alto alta dspersão dos dados maor do que 30% muto alto dspersão dos dados muto alta II) Classfcação segundo Ferrera, F.V. (1991), Estatístca Expermental Aplcada à Agronoma, classfca com respeto à precsão do processo. Faxa cv precsão Abaxo de 10% muto baxo ótma entre 10% e 15% baxo boa entre 15% e 0% médo regular entre 0% e 30% alto rum maor do que 30% muto alto muto rum (ou péssma) III) Classfcação obtda no ste www.datalyser.com.br, muto utlzada em CEP - Controle Estatístco do Processo. Faxa cv dspersão menor ou gual a 15% baxo baxa dspersão dos dados entre 15% e 30% médo méda dspersão dos dados maor do que 30% Alto alta dspersão dos dados

Exemplo 6: a) Dabetes: 1.18 cv 0.1 (1.%) cv baxo a médo. 9.65 b) Aturas dos alunos: cv (5.3%) cv baxo. c) Das de manutenção de equpamentos: 4.748 cv 0.606 (60.6%) cv alto ou muto alto. 7.84 d) Dados Cavendsh: 0.1847 cv 0.0401 (4.01%) cv baxo. 5.448

4.4. O dagrama box-plot Representação gráfca da dspersão dos dados em torno da medana, é construído com as 5 meddas ordenadas: mínmo, Q 1, med(x), Q 3 e máxmo. As cnco meddas podem ser apresentadas pela representação dos cnco números: med(x) Q Q 1 Q 3 E mín(x) max(x) Observações: ) A representação dos cnco números, além da construção do box-plot, ajuda na comparação da assmetra das caudas; ) Outros percents podem ser ncluídos, amplando a representação. O dagrama box-plot fornece uma vsão smplfcada da dspersão e smetra dos dados, além de ndcar possíves valores fora do padrão (valores dscrepantes). Além dsso, pode ser utlzado na comparação de dferentes processos quanto à centraldade (posção) e varabldade (dspersão). O nome box-plot refere-se à caxa construída para representar a metade das observações centras entre os quarts.

O box plot é consttuído de 3 partes: caxa central, braços e valores dscrepantes. ) A caxa central representa a metade das observações centras entre os quarts Q 1 e Q 3. A medana é destacada na caxa por uma lnha que a dvde em duas partes. Com sso, pode-se avalar a smetra na regão central da dstrbução dos dados; ) Os braços são construídos a partr da caxa central, representando as caudas da dstrbução. A construção dos braços é baseada nos valores dos quarts e, o tamanho dos braços serve para avalar a smetra das caudas. ) Valores dscrepantes são valores fora do padrão de dspersão, aparecendo muto dstantes da maora dos dados, podendo ndcar grande forte assmetra ou varabldade (ou ambos). Os valores dscrepantes nem sempre estão presentes, sendo representados ndvdualmente a partr das caudas. Valores dscrepantes Valores dscrepantes Q 1 1.5A Q Q 1 med(x) Q 3 Q 3 + 1.5A Q

4.4.1. Procedmento para a construção do box-plot ) Construr a caxa ou box com os valores de Q 1 e Q 3 ; ) Com uma lnha, demarcar a medana na caxa, dvdndo-a em duas partes; ) Calcular os lmtes nferor (L I ) e superor (L s ): L I = Q 1 1.5A q L S = Q 3 + 1.5A q Os lmtes L I e L s são utlzados para se dentfcar valores dscrepantes. Valores dscrepantes são observações menores do que L I ou maores do que L S e são destacados ndvdualmente no boxplot com pontos além desses lmtes. v) Para os braços do box-plot, traçar lnhas a partr dos centros das lateras nferor e superor da caxa, obedecendo ao segunte crtéro: traçar uma lnha da lateral nferor da caxa até o menor valor que não seja dscrepante ou até mn(x); marcar os pontos dscrepantes menores do que L I, caso exstam; traçar uma lnha da lateral superor da caxa até o maor valor que não seja dscrepante ou até max(x); marcar os pontos dscrepantes maores do que L S, caso exstam.

Exemplo 7: varável: horas gastas por semana assstndo TV. 0,,,,, 3, 4, 5, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8, 8, 8, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 1, 1, 1, 1, 14, 14, 14, 14, 14, 15, 16, 18, 0, 0, 0, 5, 5, 8, 30 10 Q 5 14 E 0 30 Fgura.: Box-plot s para a varável horas de TV, nas posções vertcal e horzontal. Comandos do R para o box-plot: x <- c( 0,,,,, 3, 4, 5, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8, 8, 8,10,10,10,10,10,10,10,10, 10,10,10,1,1,1,1,14,14,14,14,14,15,16, 18,0,0,0,5,5,8,30) boxplot(x, col="bsque", man="horas assstndo TV", ylab="horas", pch=19)

Freqüênca Freqüênca Exemplo 8: varável Renda PC por exposção de cranças à volênca doméstca (grupos exposto e não exposto). Grupo exposto não exposto 68 96 100 100 11 11 117 10 10 135 150 160 160 00 60 36 50 70 84 108 109 10 10 150 150 180 0 50 60 300 Estatístcas descrtvas (reas), por grupo. Grupo n x med(x) s s Q 1 Q 3 Exposto 15 134.00 10.00 57.9 47.51 100 160 Não exposto 15 147.13 10.00 6376.70 79.85 184 0 8 6 7 6 5 5 4 4 3 3 1 1 0 0 35 85 135 185 35 85 0 66 13 198 64 330 Grupo Exposto Grupo não Exposto Box-plot renda per capta Box-plot renda per capta 50 150 50 0 100 00 300 Grupo Exposto Grupo Não Exposto Fgura.: Hstogramas e box-plot s ndvduas

Fgura.3: box-plot s por grupo lado-a-lado. Comandos do R para o box-plot lado-a-lado: exp <- c(68,96,100,100,11,11,117,10,10,135,150,160, 160,00,60) nexp <- c(36,50,70,84,108,109,10,10,150,150,180,0, 50,60,300) renda <- c(nexp,exp) gr <- c(rep("nexp",length(nexp)), rep("exp",length(exp))) boxplot(renda~gr, pch=19, col=c("medumseagreen","lghtcoral")) # para o box-plot horzontal boxplot(renda~gr, pch=19, horzontal=t, col=c("medumseagreen","lghtcoral"))

Exemplo 9: Peso da carne de mexlhões (g) provenentes de dos locas em Santa Catarna: Sambaqu e Manguezal Exemplo 30: Total de pontos obtdos pelos alunos ngressos na UFSCar no ano de 007, nos dferentes cursos.