Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Documentos relacionados
Medidas de Dispersão e Assimetria Desvio Médio Variância Desvio Padrão Medidas de Assimetria Coeficiente de Assimetria Exemplos.

Capítulo 2 Estatística Descritiva Continuação. Prof. Fabrício Maciel Gomes

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

Resumos Numéricos de Distribuições

Probabilidade e Estatística I Antonio Roque Aula 4. Resumos Numéricos de Distribuições

4.1. Medidas de Posição da amostra: média, mediana e moda

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS 10º ANO DE MATEMÁTICA A Tema III Estatística. Aula 1 do plano de trabalho nº 2

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

CAPÍTULO 2 - Estatística Descritiva

UNIVERSIDADE NOVA DE LISBOA Faculdade de Economia Análise de Dados e Probabilidade 2º Semestre 2008/2009 Exame Final 1ª Época. Grupo I (4 Valores)

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

Medidas de Tendência Central. Prof.: Ademilson Teixeira

2. MEDIDAS DE TENDÊNCIA CENTRAL OU MEDIDAS DE POSIÇÃO

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

Estatística. 2 - Estatística Descritiva

8 - Medidas Descritivas

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

Análise de Regressão

Variável discreta: X = número de divórcios por indivíduo

TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS

Análise Descritiva com Dados Agrupados

ESTATÍSTICA APLICADA À ZOOTECNIA

Estatística stica Descritiva

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Organização; Resumo; Apresentação.

Gráficos de Controle para Processos Autocorrelacionados

Análise da Informação Económica e Empresarial

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Estatística - exestatmeddisper.doc 25/02/09

CURSO de ESTATÍSTICA Gabarito

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

7 - Distribuição de Freqüências

Prof. Lorí Viali, Dr.

PROBABILIDADE ESTATÍTICA

CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

FAAP APRESENTAÇÃO (1)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Representação e Descrição de Regiões

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Algarismos Significativos Propagação de Erros ou Desvios

APOSTILA DE ESTATÍSTICA BÁSICA Parte 1

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

MEDIDAS DE TENDÊNCIA CENTRAL

2ª Atividade Formativa UC ECS

Prof. Lorí Viali, Dr.

Regressão Múltipla. Parte I: Modelo Geral e Estimação

2. VARIÁVEIS ALEATÓRIAS

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

CORRELAÇÃO E REGRESSÃO

CONCEITOS BÁSICOS. Podemos assim caracterizar três áreas de interesse (ramos) da Estatística: Estatística Inferencial ESTATÍSTICA

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

4 Critérios para Avaliação dos Cenários

Licenciatura Análise de Dados e Probabilidade 1 e 2. Clara Costa Duarte. 1º Semestre 2006/2007

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

REGRESSÃO NÃO LINEAR 27/06/2017

Contabilometria. Aula 8 Regressão Linear Simples

ESTATÍSTICA DESCRITIVA. FONTE: CRESPO, ANTÔNIO ARNOT. ESTATÍSTICA BÁSICA FACIL. 15ª ED. SARAIVA.SÃO PAULO Com adaptações.

Estatística e Probabilidade

AEP FISCAL ESTATÍSTICA

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística I Licenciatura MAEG 2006/07

Cap. 11 Correlação e Regressão

Teoria Elementar da Probabilidade

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

1. CORRELAÇÃO E REGRESSÃO LINEAR

3ª AULA: ESTATÍSTICA DESCRITIVA Medidas Numéricas

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

Prof. Lorí Viali, Dr.

Introdução à Estatística. Júlio Cesar de C. Balieiro 1

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

IV - Descrição e Apresentação dos Dados. Prof. Herondino

MEDIDAS DE DISPERSÃO:

Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Tratamento de Dados 2º Semestre 2005/2006 Tópicos de Resolução do Trabalho 1

Neste capítulo abordam-se os principais conceitos relacionados com os cálculos de estatísticas, histogramas e correlação entre imagens digitais.

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CAMPUS DE JABOTICABAL MATERIAL DIDATICO DO CURSO

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Introdução à Estatística

Análise Exploratória de Dados

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Caderno de Exercícios Resolvidos


37 [C] Verdadeira. Veja justificativa do item [B]. Moda = 8

Associação entre duas variáveis quantitativas

Transcrição:

Redução dos Dados Júlo Osóro Meddas Característcas da Dstrbução Tendênca Central (Localzação) Varação (Dspersão) Forma 1

Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão Forma Méda Medana Moda Ampltude Desvo Interquartl Varânca Desvo Padrão Coefcente de Varação Assmetra Curtose Notação Convenconada para as Meddas Medda Amostra População Méda X µ Desvo padrão S σ Varânca S σ Tamanho n N

Meddas de Tendênca Central A méda, or méda artmétca, é a mas vulgarmente utlzada medda de tendênca central, e o seu valor é dado por: Sendo: X n = n X =1 X = n = valores observados da varável X = número de observações (tamanho da amostra) A moda é o valor a que corresponde a maor frequênca, representando o pco mas elevado da dstrbução. A moda é uma boa medda de localzação para varáves ntrnsecamente categórcas, ou para aquelas que o não sendo (ntervalo/razão), tenham sdo agrupadas em categoras. Meddas de Tendênca Central A medana é o valor central da sére quando os dados estão ordenados por ordem crescente ou decrescente. A medana é o Percentl 50 (P 50 ): 50% dos dados são nferores à medana e 50% são superores Se n é ímpar, a sére tem um únco valor central, que é precsamente a medana. Se n é par, a medana é assumda como sendo a méda dos valores centras da sére. A posção da medana vem dada por: + 1 posção = n 3

Meddas de Tendênca Central Propredades da méda artmétca: Únca, smples de calcular e de nterpretar. Entra em lnha de conta com todos os valores da sére. Acentuadamente nfluencada pelos valores extremos: bastam alguns valores acentuadamente baxos/elevados para dar uma medda errónea da tendênca central dos dados. Presta-se ao cálculo algébrco: por exemplo, a partr das médas de duas varáves é possível calcular a méda de uma varável que seja a soma, a dferença, etc. dessas varáves. Exprme-se nas mesmas undades físcas de medda que os dados orgnas. O somatóro dos desvos das observações relatvamente á meda é nulo: _ y = 0 y Meddas de Tendênca Central Propredades da méda artmétca: Se A for um número real arbtráro, quando: Se: então: Se: ( y A) A =y _ =y y' _ y' _ =mínmo + k =y+ k y' = y * k A méda amostral é um bom estmador pontual da méda populaconal, e nela se basea a maor parte dos métodos de estatístca nferencal respetantes à tendênca central: então: _ y = _ ' y * k _ y µ _ y = µ 4

Meddas de Tendênca Central Propredades da medana: Únca, smples de calcular e de nterpretar. Entra em lnha de conta com todos as obervações da sére, mas pela sua ordem e não pelo seu valor. Não é tão acentuadamente nfluencada pelos valores extremos como a méda, sendo a melhor medda de posção no caso de dstrbuções muto assmétrcas. Não se presta ao cálculo algébrco: não é possível calcular a medana da soma de duas varáves a partr das medanas de cada uma delas. Exprme-se nas mesmas undades físcas de medda que os dados orgnas. Meddas de Tendênca Central Propredades da moda: O seu valor é menos afectado pela assmetra da dstrbução que a méda e a medana, mas é em contrapartda mas sujeto às flutuações da amostragem. Muto utlzada como medda de tendênca central em dados de natureza qualtatva (escalas de medda nomnas). Tem relatvamente pouca mportânca na nvestgação bológca, embora seja relevante assnalar o número de modas detectadas, quando haja mas do que uma (Dstrbuções unmodas, multmodas e amodas). Não se presta ao cálculo algébrco. 5

ROL SIMPLES PROCEDIMENTO: Ordenação dos dados orgnas X= peso = número de ordem X 1 963 966 3 967 4 968 5 969 6 970 7 971 8 971 9 97 10 97 11 973 1 974 13 975 14 976 15 977 16 980 17 980 18 980 19 981 0 981 1 981 981 3 981 4 981 X 5 98 6 98 7 984 8 985 9 987 30 988 31 988 3 989 33 989 34 990 35 990 36 990 37 991 38 991 39 991 40 99 41 993 4 993 43 994 44 994 45 994 46 994 47 995 48 995 49 995 X 50 995 51 996 5 996 53 998 54 998 55 998 56 998 57 999 58 1000 59 1000 60 1000 61 1000 6 1000 63 1000 64 1001 65 1001 66 1001 67 1001 68 1001 69 100 70 100 71 1003 7 1003 73 1003 74 1003 X 75 1005 76 1005 77 1007 78 1007 79 1009 80 1009 81 1010 8 101 83 101 84 101 85 101 86 1013 87 1013 88 1013 89 1015 90 1016 91 1017 9 1017 93 1019 94 1019 95 101 96 10 97 103 98 103 99 106 Cálculo da Méda e da Medana (exemplo) Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda. 963 + 966 +... + 103 + 106 9850 x = = = 995. 0mg 99 99 Med x99 1 = x = 995mg 50 = + Suponha-se que a sére de dados só tnha 58 observações, sto é que n=58 (par): Med x x + 9 30 987 + 988 58 1 x = x = = = 987. 5mg "9.5" = + 6

Cálculo da Moda (exemplo) Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda. Hstograma com 7 classes (I=10 mg) Frequênca 8 6 4 0 18 16 14 1 10 A Moda é o centro da classe de maor frequênca: Moda=(990+1000)/ = 995 mg 8 6 4 0 <= 960 (960;970] (970;980] (980;990] (990;1000] (1010;100] (1000;1010] (100;1030] > 1030 Peso da água recolhda (mg) Meddas de Tendênca Central (Sumáro) Medda Equação Descrção Méda Σ X / n Ponto de equlíbro Medana (n+1) (posção) Valor central dos dados ordenados Moda nenhuma Valor mas frequente 7

Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão Forma Méda Medana Moda Ampltude Desvo Interquartl Varânca Desvo Padrão Coefcente de Varação Assmetra Curtose Meddas de Dspersão A ampltude (total) é a dferença entre a maor e a menor observação da sére: ampltude = X máxmo X mínmo O desvo nterquartl (DI) é a dferença entre o Percentl 75 (P 75 ) e o Percentl 5 (P 5 ). DI = P75 P5 Numa sére de dados ordenada, o p-ésmo percentl (P p ) é o valor de tal modo stuado que p% dos dados lhe são nferores e (100 - p)% superores. O desvo nterquartl (DI) também pode ser defndo como a dferença entre o 3º Quartl (Q 3 ) e o 1º Quartl (Q 1 ): DI = Q Q 3 1 Se houver valores atípcos ou aberrantes ( outlers ) na sére de dados, a ampltude total é mas afectada que a ampltude nter-quarts. 8

Meddas de Dspersão A varânca é o valor médo dos quadrados dos desvos das observações em relação à méda: _ = n X X = 1 SQD s = = n 1 gl O numerador de s denomna-se Somatóro dos Quadrados dos Desvos (SQD), e o valor n-1 (denomnador de s ) representa o número de graus de lberdade da amostra (gl). O desvo padrão (s) é a raz quadrada da varânca. A varânca e o desvo padrão nunca assumem valores negatvos. O coefcente de varação (CV) representa razão entre o desvo padrão e a méda, expressa em percentagem. CV é uma medda relatva e admensonal de dspersão: s CV (%) = *100 X Meddas de Dspersão Fórmulas de trabalho para o cálculo da SQD e da varânca da amostra: SQD n = y 1 ( n y 1 n ) s = SQD GL = n y 1 n ( y ) 1 n 1 / n 9

Meddas de Dspersão Propredades da varânca: Entra em lnha de conta com todos os valores da sére. Exprme-se no quadrado das undades de medda dos dados orgnas. É nfluencada por valores extremos (anda que poucos). Se: y = y + k Var( y ) = Var( y ) y y = k * Var( ) = Se X e Y forem duas varáves estatstcamente ndependentes, sto é, se a varação de uma não estver condconada pela varação que ocorre na outra: Var ( X + Y) = Var( X) + Var( Y) Como se presta ao cálculo algébrco ulteror, é a medda de dspersão mas utlzada na nferênca estatístca. y k * Var( y ) A varâca amostral é um bom estmador pontual da varânca populaconal, e nela se basea a maor parte dos métodos de estatístca nferencal respetantes à dspersão: s s = σ σ Meddas de Dspersão Propredades do desvo-padrão: Entra em lnha de conta com todos os valores da sére. Exprme-se nas mesmas undades de medda dos dados orgnas. É nfluencada por valores extremos (anda que poucos). 10

ROL SIMPLES PROCEDIMENTO: Ordenação dos dados orgnas X= peso = número de ordem X 1 963 966 3 967 4 968 5 969 6 970 7 971 8 971 9 97 10 97 11 973 1 974 13 975 14 976 15 977 16 980 17 980 18 980 19 981 0 981 1 981 981 3 981 4 981 X 5 98 6 98 7 984 8 985 9 987 30 988 31 988 3 989 33 989 34 990 35 990 36 990 37 991 38 991 39 991 40 99 41 993 4 993 43 994 44 994 45 994 46 994 47 995 48 995 49 995 X 50 995 51 996 5 996 53 998 54 998 55 998 56 998 57 999 58 1000 59 1000 60 1000 61 1000 6 1000 63 1000 64 1001 65 1001 66 1001 67 1001 68 1001 69 100 70 100 71 1003 7 1003 73 1003 74 1003 X 75 1005 76 1005 77 1007 78 1007 79 1009 80 1009 81 1010 8 101 83 101 84 101 85 101 86 1013 87 1013 88 1013 89 1015 90 1016 91 1017 9 1017 93 1019 94 1019 95 101 96 10 97 103 98 103 99 106 Cálculo da Ampltude e do Desvo Interquartl (exemplo) Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda. Ampltude = x x = 106 963 = 63mg 99 1 Q = 99 + 1 = = 98mg 1 x 4 x Q = 3.(99 + 1) = = 1005mg 3 x 4 5 x DI = Q Q = 1005 98 = 3mg 3 1 75 11

Cálculo da Varânca, Desvo-Padrão e Coefcente de Varação (exemplo) Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda. x = 963 + 966 +... + 103 + 106 = 9850 mg x mg = 963 + 966 +... + 103 + 106 = 9809058 SQD 9850 = 9809058 = 55.9091mg 99 55.9091 s = = 7, 807mg 99 s = + 7.807 = 15. 09mg Sendo n>30, utlzou-se como denomnador, no cálculo de s, n=99 e não GL=99-1. CV = 15.09mg 995mg * 100 = 1.5% Meddas de Dspersão (Sumáro) Medda Equação Descrção Ampltude X máxmo - X mínmo Intervalo total Desvo Interquartl Q 3 - Q 1 Intervalo dos 50% centras Desvo Padrão (Amostra) Varânca (Amostra) ( X X ) n 1 Σ (X - X ) n - 1 Dspersão em torno da méda Quadrado da dspersão em torno da Méda 1

Meddas de Forma Assmetra da Dstrbução: exprme a tendênca para os dados se acumularem mas para uma das extremdades da dstrbução do que para a outra (maor ou menor envesamento relatvamente à dstrbução normal). Curtose da Dstrbução: exprme em que medda a dstrbução é mas ou menos achatada que uma dstrdução normal. Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão Forma Méda Medana Moda Ampltude Desvo Interquartl Varânca Desvo Padrão Assmetra Curtose Coefcente de Varação 13

Meddas de Forma A assmetra mede-se pelo coefcente de assmetra de Fsher (g 1 ; γ 1 ). Assmétrca Negatva Méda Medana Moda Smétrca Méda= Medana= Moda Assmétrca Postva Moda Medana Méda g 1 <0 g 1 =0 g 1 >0 (Normal) Meddas de Forma A assmetra reflecte-se no dagrama de caxa-e-bgodes Assmétrca Negatva Smétrca Assmétrca Postva Q 1 Medana Q 3 Q 1 Medana Q 3 Q 1 Medana Q 3 14

Meddas de Forma A curtose mede-se pelo coefcente de curtose de Fsher (g ; γ ). Mesocúrtca g =0 Leptocúrtca g >0 Platcúrtca g <0 Meddas de Forma PLATICÚRTICA! LEPTOCÚRTICA! 15

Dagrama de Caule-e-Folhas Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda. peso da água (mg) Stem-and-Leaf Plot Caule (multplcar por 10!) Frequency Stem & Leaf 5.00 96. 36789 10.00 97. 01134567 18.00 98. 0001111114578899 4.00 99. 00011133444455556688889 3.00 100. 000000111113333557799 14.00 101. 0333567799 5.00 10. 1336 Stem wdth: 10 Each leaf: 1 case(s) Folhas Dagrama de Caule-e-Folhas Vantagens: Tal como o Hstograma, o Dagrama Caule-e- Folha dá-nos nformação sobre: A localzação da concentração mas forte de dados; O grau de assmetra da dstrbução. Mas, ao contráro do Hstograma, o Dagrama Caule-e-Folha conserva a nformação contda nos dados orgnas, na medda em que estes não são agrupados em classes. 16

Dagrama de Caxa-e-Bgodes Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda. Barrera nferor=q 1-1,5.DI Q 1 Medana(Q ) Q 3 Barrera superor=q 3 +1,5.DI Caxa Mínmo Máxmo Bgodes Não há outlers na dstrbução! Dagrama de Caxa-e-Bgodes Pesos (mg) da água destlada (0º C) recolhda com doseador automátco regulado para 1 cm3, em 99 operações de medda (dados modfcados). Valor Extremo O bgode esquerdo não termna no mínmo, mas no últmo dado que não está fora da barrera Outler Há um outler e um valor extremo! 17