Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 1. ESTATÍSTICA BÁSICA (Profª Mônica Barradas)

Documentos relacionados
1) De acordo com as normas para representação tabular dos dados, quando o valor for zero, deve-se colocar na cédula correspondente:

Introdução à estatística

As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.

Métodos Quantitativos Aplicados a Gestão

Química e Estatística

SÉRIES ESTATÍSTICAS Í N D I C E

Métodos Quantitativos Aplicados a Gestão

GRÁFICOS ESTATÍSTICOS

A Estatística é aplicada como auxílio nas tomadas de decisão diante de incertezas para justificar cientificamente as decisões

AULA DO CPOG. Estatística básica

TABELA É um quadro que resume um conjunto de dados tabulados dispostos segundo linhas e colunas de maneira sistemática. Quantidade Título:

Estatística Descritiva

Conceito de Estatística

Distribuição de frequências:

meninos =34

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA

Adilson Cunha Rusteiko

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

[Ano] CÁLCULOS ESTATÍSTICOS PARA ANÁLISE E TOMADA DE DECISÃO. Universidade Cruzeiro do Sul

ESTATÍSTICA. Profa. Ms. Francini Mandolesi. Setembro/ Telefone: (011)

INTRODUÇÃO A ESTATISTICA PROF. RANILDO LOPES

ESTATÍSTICA- I 3- POPULAÇÃO E AMOSTRA Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:

Capítulo 1 Estatística Descritiva. Prof. Fabrício Maciel Gomes

Professora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo

PROBABILIDADE E ESTATISTICA. Unidade III Medidas de Posição

Medidas de Tendência Central

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Tutorial para o desenvolvimento das Oficinas

CURSO DE ESTATÍSTICA STICA DESCRITIVA Adriano Mendonça Souza Departamento de Estatística - UFSM -

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

PARTE 1- INTRODUÇÃO VERSÃO: JANEIRO DE 2017

Prof. Dr. Engenharia Ambiental, UNESP

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Profa. Lidia Rodella UFPE-CAA

Medidas Estatísticas de Posição

ESTATÍSTICA DESCRITIVA

8/20/2010 MEDIDAS DE POSIÇÃO

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

Professora Ana Hermínia Andrade. Período

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Estatística Descritiva

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

7/26/2011 MEDIDAS DE POSIÇÃO

Métodos Estatísticos Básicos

Introdução à Estatística Estatística Descritiva 22

Estatística Descritiva

Probabilidade e Estatística. Medidas de Tendência Central. Cláudio Henrique Albuquerque Rodrigues, M. Sc.

Estatística descritiva básica: Tabelas e Gráficos

Unidade MEDIDAS E POSIÇÕES. Unidade I:

Métodos Quantitativos

Medidas de Dispersão. Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação

Amostragem Aleatória e Descrição de Dados - parte I

Engenharia da Qualidade. Profa. Luciana Rosa Leite

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza

Coeficiente de Assimetria

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

INTRODUÇÃO À ESTATÍSTICA RANILDO LOPES

Bioestatística. October 28, UFOP October 28, / 57

Estatística Descritiva

Prof. Francisco Crisóstomo

Estatística Descritiva

Introdução à estatística

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

Medidas de Dispersão ou variabilidade

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).

Unidade III ESTATÍSTICA. Prof. Fernando Rodrigues

Estatística Aplicada

É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores).


Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

PARTE 2- MEDIDAS DE TENDÊNCIA CENTRAL VERSÃO: JANEIRO DE 2017

Medidas de Posição ou Tendência Central

INTRODUÇÃO À ESTATÍSTICA

ESTATÍSTICA Medidas de Síntese

Estatística Computacional Profª Karine Sato da Silva

MEDIDAS DE TENDÊNCIA CENTRAL

AT = Maior valor Menor valor

1 Estatística Descritiva

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

- 1 - EDITAL ANTERIOR PRF 2013 Matemática Noções de estatística. MÉDIA ARITMÉTICA (x )

rofessor oaquim cel.: ou

TRATAMENTO DA INFORMAÇÃO

Estatística: Conceitos e Organização de Dados

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

Estatística Descritiva

Instituto Federal Catarinense Campus Avançado Sombrio

Negócios II - Estatística -- Séries Estatísticas Slide 1 de 34


Cálculo das Probabilidades e Estatística I

Estatística. O que é Estatística? Estatística pode ser: Estatística Descritiva. Ivonete Melo de Carvalho. Conteúdo

aula DISTRIBUIÇÃO NORMAL - PARTE I META OBJETIVOS PRÉ-REQUISITOS Apresentar o conteúdo de distribuição normal

Mapas e Estatística. Professores Ligia Vizeu Barrozo Reinaldo Paul Pérez Machado

Transcrição:

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 1 ESTATÍSTICA BÁSICA (Profª Mônica Barradas)

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 2 ÍNDICE 1. Introdução Geral à Compreensão Estatística...3 2. Distribuição de Freqüência...10 3. Medidas de Centralidade ou de Tendência Central...14 4. Medidas de Assimetria e Curtose...23 5. Principais Tipos de Representação Gráfica...25 6. Medidas de Dispersão ou de Variabilidade...28 7. Correlação e Regressão...32 8. Introdução à Amostragem...47 9. Probabilidade...53 10. Variáveis Aleatórias Discretas...56 11. Distribuições de Variáveis Aleatórias Discretas...60 12. Distribuições de Variáveis Aleatórias Contínuas...62

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 3 CAPÍTULO 1 INTRODUÇÃO A ESTATISTICA 1. Objeto da Estatística Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão. A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados mesmo antes de se recolher à amostra, isto é, deve-se planejar a experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo de informação relevante para o problema em estudo, ou seja, para a população de onde os dados provêm. Quando de posse dos dados, procura-se agrupa-los e reduzi-los, sob forma de amostra, deixando de lado a aleatoriedade presente. Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. 2. Ferramentas Estatísticas 2.1 - O que é Estatística? Segundo JURAN: 1. É a ciência da tomada de decisão perante incertezas; 2. Coleta, análise e interpretação de dados; 3. É um kit de ferramentas que ajuda a resolver problemas; 4. Base para a maior parte das decisões tomadas quanto ao controle da qualidade, assim como em quase todas as outras áreas da atividade humana moderna. Vista dessa forma, a Estatística não deve ser confundida como uma disciplina isolada, e sim, compreendida como uma ferramenta ou um conjunto de ferramentas, disponível para a solução de problemas em diversas áreas do conhecimento. Segundo FEIGENBAUM: Precisão significativamente aumentada em produção de itens e produtos tem sido acompanhada pela necessidade de métodos aperfeiçoados para medição, especificação e registro dela. A estatística, denominada ciência das medições, representa uma das técnicas mais valiosas utilizadas nas quatro tarefas, e isso tem ficado cada vez mais evidente.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 4 2.2 Onde se aplica a Estatística na Engenharia? As aplicações concentram-se fundamentalmente em dois campos de ação: o Controle Estatístico do Processo e o Controle Estatístico da Qualidade. Definições segundo JURAN: 1. Processo: é qualquer combinação específica de máquinas, ferramentas, métodos, materiais e/ou pessoas empregadas para atingir qualidades específicas num produto ou serviço. Estas qualidades são chamadas de características de qualidade, que podem ser uma dimensão, propriedade do material, aparência, etc. 2. Controle: é um ciclo de feedback (realimentação) através da qual medimos o desempenho real, comparando-o com o padrão, e agimos sobre a diferença. 3. Controle Estatístico do Processo (CEP): aplicação de técnicas estatísticas para medir e analisar a variação nos processos. 4. Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de diagnóstico, planos de amostragem e outras técnicas estatísticas. Segundo FEIGENBAUM, provavelmente, mais importante do que os próprios métodos estatísticos têm sido o impacto causado sobre o pensamento industrial pela filosofia que representam. O ponto de vista estatístico resume-se essencialmente nisto: a variabilidade na qualidade do produto deve ser constantemente estudada: 1. Dentro de lotes de produto; 2. Em equipamentos de processo; 3. Entre lotes diferentes de um mesmo produto; 4. Em características críticas e em padrões; 5. Em produção piloto, no caso de novos produtos. Esse ponto de vista, que enfatiza o estudo da variação, exerce efeito significativo sobre certas atividades no controle da qualidade. Ainda segundo FEIGENBAUM, cinco ferramentas estatísticas tornaram-se amplamente utilizadas nas tarefas de controle da qualidade: 1. Distribuição de freqüências; 2. Gráficos de controle; 3. Aceitação por amostragem; 4. Métodos especiais; 5. Confiabilidade. Na abordagem do papel dos métodos estatísticos no gerenciamento de processos de produção, KUME também faz referência à variabilidade. Diz que, (...) independentemente dos tipos de produtos ou de métodos de produção usados, as causas de produtos defeituosos são universais. Variação, esta é a causa., Variações nos materiais, na condição dos equipamentos, no método de trabalho e na inspeção são as causas dos defeitos. Ainda segundo KUME, (...) os métodos estatísticos são ferramentas eficazes para a melhoria do processo produtivo e redução de seus defeitos. O primeiro passo na busca da verdadeira causa de um defeito é a cuidadosa observação do fenômeno do defeito. Após tal observação cuidadosa, a verdadeira causa torna-se evidente.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 5 As ferramentas estatísticas, diz KUME, conferem objetividade e exatidão à observação. As máximas da forma estatística de pensar são: 1. Dar maior importância aos fatos do que os conceitos abstratos; 2. Não expressar fatos em termos de intuição ou idéias. Usar evidências obtidas a partir de resultados específicos da observação; 3. Os resultados da observação, sujeitos como são a erros e variações, são partes de um todo obscuro. A principal meta da observação é descobrir esse todo obscuro; 4. Aceitar o padrão regular que aparece em grande parte dos resultados observados como uma informação confiável. 5. O conhecimento dominado ato o presente momento não é nada mais que um embasamento para hipóteses futuras. Uma vez que isso tenha sido compreendido, a forma de pensar mencionada pode ser aproveitada para aprofundar a compreensão do processo produtivo e dos meios para melhorá-lo. 2.3 Definições Básicas da Estatística 1) FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja possível da aplicação do método estatístico. São divididos em três grupos: Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos. Fenômenos individuais: são aqueles que irão compor os fenômenos de massa. Fenômenos de multidão: quando as características observadas para a massa não se verificam para o particular. 2) DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. 3) POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. 4) AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. 5) PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la.para definirmos um parâmetro devemos examinar toda a população. 6) ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra. 7) ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. 8) VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Variável Qualitativa: Quando seus valores são expressos por atributos Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numérica, trata-se, portanto da estatística de variável e se dividem em: Variável Discreta ou Descontínua: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 6 Variável Contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo. 2.4 Planejamento para Coleta e Análise de Dados As ferramentas devem ser utilizadas de maneira eficiente para alcançar o sucesso. Para tanto, o processo deve incluir: 1. planejamento cuidadoso da coleta de dados; 2. análise de dados para tirar conclusões estatísticas e 3. transição para a resposta ao problema técnico original. Segundo JURAN, alguns passos-chave são: 1. Coletar informações anteriores suficientes para traduzir o problema de engenharia em problema específico que possa ser avaliado por métodos estatísticos; 2. Planejar a coleta de dados: a. Determinar o tipo de dados necessários quantitativos (mais custo, mais útil) e qualitativos; b. Determinar se quaisquer dados prévios estão disponíveis e são aplicáveis ao presente problema; c. Se o problema exigir uma avaliação de várias decisões alternativas, obter informações sobre as conseqüências econômicas de uma decisão errada. d. Se o problema exigir a estimação de um parâmetro, definir a precisão necessária para a estimativa; e. Determinar se o erro de medição é grande o suficiente para influenciar o tamanho calculado da amostra ou o método da análise de dados; f. Definir as suposições necessárias para calcular o tamanho da amostra exigido; g. Calcular o tamanho da amostra necessário considerando a precisão desejada do resultado, erro amostral, variabilidade dos dados, erros de medição e outros fatores; h. Definir quaisquer requisitos para preservar a ordem das medições quando o tempo for um parâmetro chave; i.determinar quaisquer requisitos para coletar dados em grupos definidos diferentes condições a serem avaliadas; j. Definir o método de análise de dados e quaisquer hipóteses necessárias; k.definir os requisitos para quaisquer programas de computador que venham a ser necessários. 3. Coletar dados: a. Usar métodos para assegurar que a amostra é selecionada de forma aleatória; b. Registrar os dados e também as condições presentes no momento de cada observação; c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente para se fazer previsões válidas para o futuro. 4. Analisar os dados: a. Selecionar os dados; b. Avaliar as hipóteses previamente estabelecidas. Se necessário, tomar atitudes corretivas (novas observações); c. Aplicar técnicas estatísticas para avaliar o problema original; d. Determinar se dados e análises adicionais são necessários;

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 7 e. Realizar análises de sensibilidade variando estimativas amostrais importantes e outros fatores na análise e observando o efeito sobre as conclusões finais. 5. Rever as conclusões da análise de dados para determinar se o problema técnico original foi avaliado ou se foi modificado para se enquadrar nos métodos estatísticos. 6. Apresentar os resultados: a. Estabelecer as conclusões de forma significativa, enfatizando os resultados nos termos do problema original, e não na forma dos índices estatísticos usados na análise; b. Apresentar graficamente os resultados quando apropriado. Usar métodos estatísticos simples no corpo do relatório e colocar as análises complexas em um apêndice. 7. Determinar se as conclusões do problema específico são aplicáveis a outros problemas ou se os dados e cálculos poderiam ser úteis para outros problemas. 3. ESTATÍSTICA DESCRITIVA Viu-se anteriormente um roteiro para coleta e análise de dados. As séries de dados, basicamente, são provenientes de duas fontes: os dados históricos e os dados de experimentos planejados. Os dados históricos são séries de dados existentes e, em geral, analisar estatisticamente esses dados é mais econômico (tempo e despesas) se comparado com dados obtidos a partir de experimentos planejados. Mesmo com uma análise estatística complexa, em geral, pouco sucesso se obtém com tais dados. No controle de um processo, algumas razões para esse insucesso ocorrer são: 1. As variáveis do processo podem estar altamente correlacionadas entre si, tornando impossível distinguir a origem de um determinado efeito. 2. As variáveis do processo podem ter sido manipuladas para controlar o resultado do processo. 3. As variáveis do processo têm abrangência pequena em relação ao intervalo de operação do processo. 4. Outras variáveis que afetam o resultado do processo podem não ter sido mantidas constantes, e serem as reais causadoras dos efeitos observados no processo. Por essas razões, recomenda-se a análise de séries de dados históricos apenas para a indicação de variáveis importantes a serem observadas em um experimento planejado. Os dados de experimentos planejados são coletados com o objetivo estudar e analisar um problema. São dados reunidos em diversas séries de variáveis com aparente importância em um processo, enquanto se mantém constantes (com valores registrados) todas as outras variáveis que possivelmente poderiam alterar o resultado. Aqui tratar-se-á de métodos práticos de organização de dados. Segundo SPIEGEL4: A parte da estatística que procura somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior, é chamada estatística descritiva ou dedutiva. Freqüentemente dois ou mais métodos de organização são utilizados para descrever com clareza dados coletados. Alguns desses métodos são: gráficos dos dados na ordem cronológica, distribuição e histogramas de freqüência, características amostrais, medidas de tendência central e medidas de dispersão.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 8 4. SÉRIES ESTATÍSTICAS TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar: um traço horizontal ( - ) quando o valor é zero; três pontos (... ) quando não temos os dados; zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogação (? ) quando temos dúvida quanto à exatidão de determinado valor. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que nestes documentos as tabelas não serão abertas devido a limitações do editor html". É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002. PERÍODO UNIDADES VENDIDAS * JAN/2002 2 0 FEV/2002 1 0 TOTAL 3 0 * Em mil unidades

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 9 b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 FILIAIS UNIDADES VENDIDAS * São Paulo 1 3 Rio de Janeiro 1 7 TOTAL 3 0 * Em mil unidades c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 MARCA UNIDADES VENDIDAS * FIAT 1 8 GM 1 2 TOTAL 3 0 * Em mil unidades Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográficatemporal. ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 2002 FILIAIS Janeiro/2002 Fevereiro/2002 São Paulo 1 0 3 Rio de Janeiro 1 2 5 TOTAL 2 2 8 * Em mil unidades Obs: as séries heterógradas serão estudas no capítulo 2 ( distribuição de frequências ).

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 10 CAPÍTULO 2 DISTRIBUIÇÃO DE FREQUÊNCIAS É uma ferramenta estatística apropriada para a apresentação de grandes massas de dados numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a freqüência relativa de ocorrência dos diferentes valores. Quando da análise de dados, é comum procurar conferir certa ordem aos números tornandoos visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe. É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: Tem-se um rol após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Para um tabela de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: Tabela 1 Dados Frequência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 11 Distribuição de frequência com intervalos de classe:quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Tabela 2 Classes Frequências 41 ------- 45 7 45 ------- 49 3 49 ------- 53 4 53 ------- 57 1 57 ------- 61 5 Total 20 2.1 Elementos de uma Distribuição de Freqüência com classes CLASSE: são os intervalos da variável simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 ------- 53 é a 3ª classe, onde i=3. Para a construção de uma tabela a partir de um dado bruto calcularemos o k através da Regra de Sturges" k=1+3,3logn (para n<25) ou k= n (para n>25). LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número, limite superior de classe (Ls). Ex: em 49 --- 53 Li 3 = 49 e Ls 3 = 53. O símbolo --- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 não pertence à classe 3 e sim a classe 4 representada por 53 --- 57. AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e inferior da classe simbolizada por a = Ls - li. Ex: na tabela anterior a= 53-49 = 4. Obs: Na distribuição de frequência c/ classe o c será igual em todas as classes. Para a construção de uma tabela a partir de um dado bruto temos: a=ls-li/k AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o valor máximo e o valor mínimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At = 60-41 = 19. PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 ------- 53 o ponto médio x 3 = (53+49)/2 = 51, ou seja, x 3 =(Li+Ls)/2.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 12 Os dados brutos a seguir apresentam um conjunto de tempos para determinada operação. 5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2 6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7 6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2 7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8 7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,3 8,4 8,5 8,5 8,6 8,7 8,8 8,8 8,9 9 9,1 9,2 9,4 9,4 9,5 9,5 9,6 9,8 9,9 10 10,2 10,2 10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9 2.2 Regras para a elaboração de uma distribuição de freqüências com classes 1º Organize os dados brutos em um ROL. 2º Calcule a amplitude total At. No nosso exemplo: At =14,9 5,1 = 9,8 3º Calcule o número de classes (K), que será calculado usando K =. Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K é igual a 8,94, aproximadamente, 8. No nosso exemplo: n = 80 dados, então, k= n = 8,9. 4º Conhecido o número de classes define-se a amplitude de cada classe: No exemplo, a será igual a: 5º Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com frequência = 0 (zero). 6º Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23. Intervalo de Classe Freqüência Absoluta (fi) Freqüência Acumulada (Fi) Freqüência Relativa (fr) Freqüência Acumulada (Fr) 05,10 --- 06,33 13 13 16,25 16,25 06,34 --- 07,57 21 34 26,25 42,50 07,58 --- 08,81 22 56 27,50 70,00 08,82 --- 10,05 15 71 18,75 88,75 10,06 --- 11,29 4 75 5,00 93,75 11,30 --- 12,53 3 78 3,75 97,50 12,54 --- 13,77 1 79 1,25 98,75 13,78 --- 15,01 1 80 1,25 100 Total 80-100 -

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 13 Obs: Agrupar os dados em classes é uma importante ferramenta para resumir grandes massas de dados brutos, no entanto acarreta perda de alguns detalhes. Frequências simples ou absolutas (fi): são os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição. Frequências relativas (fr): são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %). Frequência simples acumulada de uma classe (Fi): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determida classe. Frequência relativa acumulada de um classe (Fr): é a frequência acumulada da classe, dividida pela frequência total da distribuição.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 14 CAPÍTULO 3 MEDIDAS DE CENTRALIDADE Há várias medidas de tendência central, entretanto nesta apostila, será abordado o estudo de apenas aquelas que são mais significativas. As mais importante medidas de tendência central são: a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda. 3. Medidas de Centralidade 3.1 Média Aritmética= Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados. A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero. A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média. Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida. É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores..dados não-agrupados:...onde xi são os valores da variável e n o número de valores. Quando desejamos conhecer a média dos dados não-agrupados em tabelas de frequências, determinamos a média aritmética simples. Exemplo: Os dados a seguir apresentam leituras de concentração de um processo químico feitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12, temos, uma concentração média de:.= (10+14+13+15+16+18+12) / 7 = 14 Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:.. di = Xi -

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 15 No exemplo anterior temos sete desvios:.d1 = 10-14 = - 4,.d2 = 14-14 = 0, d3 = 13-14 = - 1,.d4 = 15-14 = 1,.d5 = 16-14 = 2,..d6 = 18-14 = 4 e.d7 = 12-14 = - 2. Propriedades da média 1ª propriedade: A soma algébrica dos desvios em relação à média é nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos: Y = 12+16+15+17+18+20+14 / 7 = 16 ou Y =.+ 2 = 14 +2 = 16 3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos: Y = 30+42+39+45+48+54+36 / 7 = 42 ou Y = x 3 = 14 x 3 = 42. Dados agrupados: Sem intervalos de classe Consideremos a distribuição relativa de um canal de comunicação que está sendo monitorado pelo registro do nº de erros em um conjunto de caracteres (string) 1.000 bits. Dados para 34 desses conjuntos são vistos a seguir. Nº de erros frequência = fi 0 2 1 6 2 10 3 12 4 4 total 34

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 16 Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: Com intervalos de classe..xi...fi...xi.fi. 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 total 34 78 onde 78 / 34 = 2,3 erros Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:..onde Xi é o ponto médio da classe. Exemplo: Calcular o número de molas fora de conformidade, em cada batelada de produção, com um tamanho igual a 40 conforme a tabela abaixo. Nº de molas frequência = fi ponto médio = xi..xi.fi. 50 ---- 54 4 52 208 54 ---- 58 9 56 504 58 ---- 62 11 60 660 62 ---- 66 8 64 512 66 ---- 70 5 68 340 70 ---- 74 3 72 216 Total 40 2.440 Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 molas

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 17 MODA É o valor que ocorre com maior frequência em uma série de valores. Mo é o símbolo da moda. Desse modo, a força modal de remoção para um conector é a força mais comum, isto é, a força de remoção medida em um teste de laboratório para um conector.. A Moda quando os dados não estão agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série { 7, 8, 9, 10, 10, 10, 11, 12 } a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: { 3, 5, 8, 10, 12 } não apresenta moda. A série é amodal..em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: { 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A série é bimodal..a Moda quando os dados estão agrupados a) Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Exemplo: Qual a temperatura mais comum medida no mês abaixo: Temperaturas Frequência 0º C 3 1º C 9 2º C 12 3º C 6 Resp: 2º C é a temperatura modal, pois é a de maior frequência.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 18. b) Com intervalos de classe A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Mo = ( Li+ Ls) / 2 onde Li = limite inferior da classe modal e Ls= limite superior da classe modal. Exemplo: Calcule a resistência modal dos 33 resistores conforme a tabela abaixo. Resistencia (em ohms) Frequência 54 ---- 58 9 58 ---- 62 11 62 ---- 66 8 66 ---- 70 5 Resp: a classe modal é 58 --- 62, pois é a de maior frequência. Li=58 e Ls=62 Mo = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real da moda). Método mais elaborado pela fórmula de CZUBER: Mo = Li + ((f mo - f ant ) / ( 2f mo (f ant + f post ))) x c Li= limite inferior da classe modal f mo = frequência da classe modal f ant =frequência da classe anterior à da classe modal f post =frequência da classe posterior à da classe modal c = amplitude da classe modal Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de posição que possui a maior estabilidade.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 19 MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Símbolo da mediana: Md.A mediana em dados não-agrupados Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. Método prático para o cálculo da Mediana Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula : O elemento mediano será:..e Md = n + 1 / 2 Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana. A mediana será o 5º elemento, ou seja, Md = 2 Se a série dada tiver número par de termos: O elemento mediano será:..e Md = n / 2 Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a fórmula ficará: :..E Md = 10 / 2 = 5 Será na realidade (5º termo + 6º termo) / 2

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 20 A mediana será = (2+3) / 2, ou seja, Md = 2,5. A mediana no exemplo será a média aritmética do 5º e 6º termos da série. Notas: Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. Em um série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. A mediana, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10 Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma.. A mediana em dados agrupados a) Sem intervalos de classe Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Exemplo conforme tabela abaixo: Variável xi Frequência fi Frequência acumulada 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 Total 35 - Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado pela fórmula :.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 21 Como o somatório das frequências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3.. Quando o somatório das frequências for par o valor mediano será o termo de ordem dado pela fórmula :. Exemplo - Calcule Mediana da tabela abaixo: Variável xi Frequência fi Frequência acumulada 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Total 8 - Aplicando a fórmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe Devemos seguir os seguintes passos: 1º) Determinamos as frequências acumuladas ; 2º) Calculamos ; 3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à. Tal classe será a classe mediana; 4º) Calculamos a Mediana pela seguinte fórmula:..li + [(E Md - F ant ) x c] / f Md Li = é o limite inferior da classe mediana. F ant = é a frequência acumulada da classe anterior à classe mediana. f Md = é a frequência simples da classe mediana. c = é a amplitude do intervalo da classe mediana.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 22 Exemplo: classes frequência = fi Frequência acumulada 50 ---- 54 4 4 54 ---- 58 9 13 58 ---- 62 11 24 62 ---- 66 8 32 66 ---- 70 5 37 70 ---- 74 3 40 Total 40 - = 40 / 2 =.20..logo.a classe mediana será 58 ---- 62 Li = 58... F ant = 13... f Md = 11... c = 4 Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20-13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição. Emprego da Mediana Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. Quando há valores extremos que afetam de maneira acentuada a média aritmética.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 23 CAPÍTULO 4 - MEDIDAS DE ASSIMETRIA E CURTOSE Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva correspondente a uma distribuição teórica de probabilidade). Distribuições simétricas A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a uma classe média. Quando a distribuição é simétrica, a média e a mediana coincidem. Caso especial de uma distribuição simétrica Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de dados que se distribuem em forma de sino. Distribuições Assimétricas A distribuição das freqüências apresenta valores menores num dos lados:

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 24 Distribuições com "caudas" longas Observamos que nas extremidades há uma grande concentração de dados em relação aos concentrados na região central da distribuição. A partir do exposto, deduzimos que se a distribuição dos dados: 1.for aproximadamente simétrica, a média aproxima-se da mediana 2.for enviesada para a direita (alguns valores grandes como "outliers"), a média tende a ser maior que a mediana 3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a média tende a ser inferior à mediana. São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Têm como características principais, o uso de escalas, a existência de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua representação.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 25 CAPÍTULO 5 - REPRESENTAÇÃO GRÁFICA Os gráficos podem ser: 1. Gráficos de informação: gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes ou 2. Gráficos de análise: gráficos que prestam-se melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico. Mas o uso indevido de Gráficos pode trazer uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor, tratando-se, na realidade, de um problema de construção de escalas.. Os gráficos pode ser classificados em: Diagramas, Estereogramas, Pictogramas e Cartogramas.. 4.1 - Diagramas São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser : 1 - Gráficos em barras horizontais. 2 - Gráficos em barras verticais (colunas). Quando as legendas não são breves usa-se de preferência o gráfico em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. Fig 1. Gráfico de barras de harmônicos da rede elétrica em uma determinada região.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 26 3 - Gráficos em barras compostas. 4 - Gráficos em colunas superpostas. Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 5 - Gráficos em linhas ou lineares. São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desse fenômeno é denominada de área de excesso. 6 - Gráficos em setores. Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.. 4.2 - Estereogramas São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. 4.3 - Pictogramas São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo:

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 27 4.4 - Cartogramas São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Dados obtidos de uma amostra servem como base para uma decisão sobre a população. Quanto maior for o tamanho da amostra, mais informação obtemos sobre a população. Porém, um aumento do tamanho da amostra também implica um aumento da quantidade de dados e isso torna difícil compreender a população, mesmo quando estão organizados em tabelas. Em tal caso, precisa-se de um método que possibilite conhecer a população num rápido exame. Um histograma atende às necessidades, por meio da organização de muitos dados num histograma, pode-se conhecer a população de maneira objetiva. 4.5 - Gráficos dos Dados na Ordem Cronológica Representação gráfica do resultado Y versus a ordem cronológica de execução do experimento (diagrama do resultado Y versus tempo t). Nesse tipo de gráfico, alguns dos possíveis fenômenos que podem ser observados são: 1. Curva de aprendizagem dos experimentadores (pontos no início do experimento). 2. Tendências dentro de um determinado período (horas, turnos, dias, etc.), freqüentemente em função de aquecimento, fadiga, e outros fatores relacionados com o tempo. 3. Aumento ou diminuição da variabilidade dos dados com o tempo, podendo representar curva de aprendizagem ou características relativas ao material. 4.6 - Histogramas de Freqüência ou Distribuição de Freqüências É uma ferramenta estatística apropriada para a apresentação de grandes massas de dados numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a freqüência relativa de ocorrência dos diferentes valores.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 28 CAPÍTULO 6 - MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE No capítulo 3 vimos algumas medidas de localização do centro de uma distribuição de dados. Veremos agora como medir a variabilidade presente num conjunto de dados. Um aspecto importante no estudo descritivo de um conjunto de dados é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra. DESVIO PADRÃO ( S ) É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S. Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão. O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. A fórmula acima é empregada quando tratamos de uma população de dados nãoagrupados.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 29 Exemplo: Calcular o desvio padrão da população representada por - 4, -3, -2, 3, 5 Xi - 4-0,2-3,8 14,44-3 - 0,2-2,8 7,84-2 - 0,2-1,8 3,24 3-0,2 3,2 10,24 5-0,2 5,2 27,04 Total - - 62,8 Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 é o desvio padrão = 3,54 Quando os dados estão agrupados (temos a presença de frequências) a fórmula do desvio padrão ficará: Exemplo: Calcule o desvio padrão populacional da tabela abaixo: ou Xi f i Xi. f i. f i 0 2 0 2,1-2,1 4,41 8,82 1 6 6 2,1-1,1 1,21 7,26 2 12 24 2,1-0,1 0,01 0,12 3 7 21 2,1 0,9 0,81 5,67 4 3 12 2,1 1,9 3,61 10,83 Total 30 63 - - - 32,70 Sabemos que fi = 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 é o desvio padrão = 1,044 Se considerarmos os dados como sendo de uma amostra o desvio padrão seria a raiz quadrada de 32,7 / (30-1) = 1,062

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 30 Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior. VARIÂNCIA ( S 2 ) Define-se a variância, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um. S 2 = A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. MEDIDAS DE DISPERSÃO RELATIVA CVP: Coeficiente de Variação de Pearson Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de CVP: Coeficiente de Variação de Pearson (é a razão entre o desvio padrão e a média referente aos dados de uma mesma série). A fórmula do CVP = (S / ) x 100 (o resultado neste caso é expresso em percentual, entretanto pode ser expresso também através de um fator decimal, desprezando assim o valor 100 da fórmula).

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 31 Exemplo 1: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: Discriminação M É D I A DESVIO PADRÃO ESTATURAS 175 cm 5,0 cm PESOS 68 kg 2,0 kg Qual das medidas (Estatura ou Peso) possui maior homogeneidade? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor será o de maior homogeneidade (menor dispersão ou variabilidade). CVP estatura = ( 5 / 175 ) x 100 = 2,85 % CVP peso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos. Exemplo 2: O risco de uma ação de uma empresa pode ser devidamente avaliado através da variabilidade dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos, relativas a cada ação individual, possibilita a quem toma decisões perceber os diferentes graus de risco. Analise, abaixo, os dados estatísticos relativos aos retornos de 5 ações e diga qual é a menos arriscada? Discriminação Ação A Ação B Ação C Ação D Ação E Valor esperado 15 % 12 % 5 % 10 % 4 % Desvio padrão 6 % 6,6 % 2,5 % 3 % 2,6 % Coeficiente de variação 0,40 0,55 0,50 0,30 0,65

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 32 CAPÍTULO 7 CORRELAÇÃO E REGRESSÃO 7.1 DIAGRAMAS DE DISPERSÃO Na prática, é muitas vezes essencial estudar a relação entre duas variáveis associadas como, por exemplo, o grau a dimensão de uma peça de máquina irá variar em função da mudança da velocidade de um torno. Para estudar a relação entre duas variáveis, tais como dito acima, pode-se usar o chamado diagrama de dispersão. Diagrama de Dispersão é uma forma de gráfico onde simplesmente representa-se graficamente cada par de variáveis de uma série de dados em um sistema de eixos. Tomando como exemplo os dados da Tabela abaixo, pode-se construir um diagrama de dispersão: 7.1.1 COMO CONSTRUIR UM DIAGRAMA DE DISPERSÃO Um diagrama de dispersão é construído conforme as seguintes etapas: Etapa 1 Coletar dados em pares (X,Y) entre os quais deseja-se estudar as relações, e organize-os em uma tabela. É desejável que se tenha pelo menos 30 pares de dados. Etapa 2 Encontrar os valores máximo e mínimo, tanto para X como para Y. Defina as escalas dos eixos horizontal e vertical de forma que ambos os comprimentos sejam aproximadamente iguais; assim, o diagrama ficará mais fácil de interpretar. Determinar, para cada eixo, entre 3 e 10 divisões para as unidades da escala de graduação, e utilize números inteiros para torna-lo mais fácil de ler. Quando duas variáveis consistirem em um fator e uma característica da qualidade, use o eixo horizontal X para o fator e o eixo vertical Y para a característica da qualidade. Etapa 3 Marcar os dados num papel milimetrado. Quando os mesmos valores de dados forem obtidos a partir de diferentes observações, mostre estes pontos, desenhando círculos concêntricos ou marcando o segundo ponto rente ao primeiro.

Universidade de Pernambuco Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 33 Etapa 4 Inserir todos os itens necessários. Certificar de que os seguintes itens sejam incluídos para que qualquer pessoa, além do autor do diagrama, possa entende-lo num rápido exame: a. Título do diagrama; b. Período de tempo; c. Quantidade de pares de dados; d. Denominação e unidade de medida de cada eixo; Exemplo 1: Um fabricante de tanques plásticos, que os fabricava pelo processo de moldagem a sopro, encontrou problemas de tanques defeituosos com paredes finas. Suspeitou-se que a variação da pressão do ar, dia a dia, era a causa das paredes finas não-conformes. A Tabela a seguir mostra dados sobre a pressão de sopro e a percentagem defeituosa. Tabela 1 Dados da Pressão de Sopro e Percentagem Defeituosa de Tanques de Plástico Conforme visto na Tabela acima, existem 30 pares de dados. Etapa 2 Neste exemplo, indicamos a pressão de sopro por X (eixo horizontal) e a percentagem defeituosa por Y (eixo vertical). Assim: O valor máximo de x: xmáx = 9,4 (kgf/cm²) O valor mínimo de x: xmín = 8,2 (kgf/cm²) O valor máximo de y: ymáx = 0,928 (%) O valor mínimo de y: ymín = 0,864 (%) Marca-se divisões para graduação: no eixo horizontal em intervalos de 0,5(kgf/cm²) de 8,0 a 9,5(kgf/cm²) no eixo vertical em intervalos de 0,01(%) de 0,85 a 0,93(%)