Apresentação Caule e Folha. Exemplo



Documentos relacionados
Apresentação Caule e Folha. Exemplo. Ramo e Folha. Análise Exploratória de Dados

Prof. Lorí Viali, Dr.

MÉDIA ARITMÉTICA MÉDIA PONDERADA MODA MEDIANA

Estatística descritiva. Também designada Análise exploratória de dados ou Análise preliminar de dados

FERRAMENTAS DA QUALIDADE

Lista 2. Considere os dados abaixo sobre distribuição de salário (em reais) num grupo de 1000 individuos.

OUTLIERS Conceitos básicos

Lista de Exercícios 1 - Estatística Descritiva

"SISTEMAS DE COTAGEM"

Ferramentas da Qualidade. Professor: Fabrício Maciel Gomes

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini prof.andre.luis.belini@gmail.com /

AULAS 04 E 05 Estatísticas Descritivas

1ª Actividade Formativa

MÓDULO 4 DISTRIBUIÇÃO DE FREQÜÊNCIAS

DIAGRAMAS DE REDE TÉCNICAS DO CAMINHO CRÍTICO PERT / CPM

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

CAP5: Amostragem e Distribuição Amostral

Exemplo Considere novamente os dados sobre a dureza do alumínio. Fonte: Hoaglin, Mosteller e Tukey, 1983, apud Morettin & Bussab,

NOÇÕES BÁSICAS DE ESTATÍSTICA

Aula 4 Estatística Conceitos básicos

Estatística Básica. Introdução à Análise Exploratória de Dados. Renato Dourado Maia. Instituto de Ciências Agrárias

MÓDULO 1. I - Estatística Básica

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Especialização em Engenharia Clínica

BIOESTATÍSTICA ESTATÍSTICA DESCRITIVA: Representação Gráfica

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Controle de qualidade total. Profa Rejane Tubino

Ferramentas Básicas da Qualidade

4Distribuição de. freqüência

Apresentação de Dados em Tabelas e Gráficos

Estatística Descritiva I

Métodos Quantitativos. PROF. DR. Renato Vicente

Aula 11 Root Locus LGR (Lugar Geométrico das Raízes) parte I

Desenho de máquinas. Aula 3

Ferramentas da Qualidade. Professor: Leandro Zvirtes UDESC/CCT

MÉTODOS ESTATÍSTICOS I 3ª. AVALIAÇÃO PRESENCIAL 1º Semestre de 2010 Prof. Moisés Lima de Menezes (pode usar calculadora) Versão Tutor

Oitava Lista de Exercícios Assuntos: Estatística Descritiva

QUANTIFICADORES. Existem frases declarativas que não há como decidir se são verdadeiras ou falsas. Por exemplo: (a) Ele é um campeão da Fórmula 1.

APOSTILA TECNOLOGIA MECANICA

Eng Civil Washington Peres Núñez Dr. em Engenharia Civil pela Universidade Federal do Rio Grande do Sul

Exercícios 1. Determinar x de modo que a matriz

Anexo 1. Definição das variáveis de análise

Exemplo Regressão Linear Simples

Plano de aula. 5. Metodologia: Aula expositiva dialógica orientada pela interação: alunos professor conhecimento.

MD Sequências e Indução Matemática 1

Histórico. Controle Estatístico de Processo

Testedegeradoresde. Parte X. 38 Testes de Ajuste à Distribuição Teste Chi-Quadrado

Gráficos estatísticos: histograma. Série Software ferramenta

3.1 Definições Uma classe é a descrição de um tipo de objeto.

Sumário 1 Folhas de Cálculo Gráficos Funções... 61

Construção do Boxplot utilizando o Excel 2007

A otimização é o processo de

ECONOMIA MÓDULO 17. AS ELASTICIDADES DA DEMANDA (continuação)

Índice de Exercícios. Exercício 1.

Modelo Relacional. 2. Modelo Relacional (Lógico)

O teste de McNemar. A tabela 2x2. Depois

TECNOLOGIA MECÂNICA. Aula 04. Carregamento Axial Tensão Normal

Reconhecimento de Padrões Utilizando Filtros Casados

Manual das planilhas de Obras v2.5

AULA 03 Resumos e Gráficos de Dados

COMO CALCULAR O PRINCIPAL INDICADOR PARA MEDIR A EFICIÊNCIA FINANCEIRA DE UMA

Notas sobre a Fórmula de Taylor e o estudo de extremos

Métodos Estatísticos sticos Aplicados à Engenharia de Software Experimental

Notas de Cálculo Numérico

UML: Diagrama de Casos de Uso, Diagrama de Classes

Stela Adami Vayego - DEST/UFPR 1

INSTITUTO TECNOLÓGICO

CORRENTE CONTÍNUA E CORRENTE ALTERNADA

8 O Método de Alocação de Shapley

Revisão: Noções básicas de estatística aplicada a avaliações de imóveis

INSTRUMENTOS USADOS Lápis e lapiseiras Os lápis médios são os recomendados para uso em desenho técnico, a seleção depende sobretudo de cada usuário.

UNIVERSIDADE FEDERAL DO MATO GROSSO CAMPUS

A PILHA ELÉTRICA VOLTAGEM CORRENTE ELÉTRICA

Um jogo de preencher casas

O BANCO DO DESENVOLVIMENTO PROVA DISCURSIVA PROFISSIONAL BÁSICO - ADMINISTRAÇÃO LEIA ATENTAMENTE AS INSTRUÇÕES ABAIXO.

Curva ABC. Cada uma destas curvas nos retorna informações preciosas a respeito de nossos produtos

12-Função Horária da Posição do Movimento Uniforme

Introdução ao Estudo da Corrente Eléctrica

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 1 a LISTA DE EXERCÍCIOS Bioestatística Professor: Ednaldo Carvalho Guimarães

ASPECTOS CONCEITUAIS OBJETIVOS planejamento tomada de decisão

Estatística Descritiva II

OBJETIVO MATERIAL POPULAÇÃO APLICAÇÃO INSTRUÇÕES 31/08/2011

TEORIA DAS RESTRIÇÕES: PRINCIPAIS CONCEITOS E APLICAÇÃO PRÁTICA

Desenhando perspectiva isométrica

INTRODUÇÃO À ENGENHARIA

ActivALEA. active e actualize a sua literacia

Reduzindo o lead time no desenvolvimento de produtos através da padronização

RESOLUÇÃO DA PROVA DE MATEMÁTICA DA UNESP FASE 1. POR PROFA. MARIA ANTÔNIA CONCEICÃO GOUVEIA.

O planejamento do projeto. Tecnologia em Gestão Pública Desenvolvimento de Projetos Aula 8 Prof. Rafael Roesler

As Sete Ferramentas Básicas do Controle da Qualidade

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

Apostila de Física 39 Lentes Esféricas

Laboratório didático de Física

Lista de Exercícios - Potenciação

Direitos do Consumidor. Série Matemática na Escola

Exercícios Teóricos Resolvidos

Escalas. Antes de representar objetos, modelos, peças, A U L A. Nossa aula. O que é escala

Transcrição:

Análise Exploratória de Dados As técnicas de análise exploratória de dados consistem em gráficos simples de desenhar que podem ser utilizados para resumir rapidamente um conjunto de dados. Uma destas técnicas é uma forma de apresentação de dados conhecida como Caule e Folha. Apresentação Caule e Folha Para ilustrar esta forma de apresentação vamos supor que o conjunto a seguir é o resultado de um teste do tipo Psicotécnico de questões aplicados a candidatos a um emprego em uma grande organização industrial. Resultado de um teste do tipo Psicotécnico de questões aplicados a candidatos.

Ramo e Folha Girando a representação graus tem-se um diagrama semelhante a um histograma. Esta representação possui duas vantagens sobre o histograma: É mais fácil de construir; Apresenta os dados reais. Exercício Faça um representação utilizando a dezena como unidade de folha. BoxPlot Caixa e Bigode Outra forma de ter uma idéia do conjunto de dados é utilizar a regra dos cinco itens. Nem sempre a média e o desvio padrão são as melhores alternativas para resumir um conjunto de dados. A média e o desvio padrão podem sofrer forte influência de valores extremos e além disso não fornecem uma idéia da assimetria do conjunto de dados. Como alternativa as seguintes cinco medidas são sugeridas (Tukey, ): (i) A mediana; (ii) Os extremos (máximo e mínimo); (iii) Os quartis. Estas cinco medidas são denominadas de estatísticas de ordem e são resistentes de posição de uma distribuição.

Representação A informação fornecida por estes cinco números pode ser representada em um diagrama denominado de Diagrama Caixa e Bigode (BoxPlot). O desenho fornece uma idéia da posição, dispersão, assimetria e dados discrepantes do conjunto (outliers). Traçar um retângulo tendo como extremos os quartis e englobando a mediana. Calcular a distância interquartil, isto é: D Q = Q Q Determinar os limites dos pontos discrepantes: Q, D Q Q +, D Q BoxPlot Qualquer valor abaixo de Q, DQ ou acima de Q +, DQ será considerado um valor discrepante (outlier). Para obter o diagrama caixa e bigode (boxplot) traçar duas linhas a partir do centro do retângulo e em lados opostos até o último ponto do conjunto que não seja um ponto discrepante. x x Q -,D Q D Q Q Q Q Q +,D Q x Obtenha o diagrama Caixa e Bigode para o número de paradas semanais para manutenção de uma máquina. Os cinco valores são: Mínimo Quartil um Mediana Quartil três Máximo Os demais são: D = Q -,D -, Q +,D, Outlier

BoxPlot Wilfredo Pareto -,=Q -,D Q D Q = Q = Q = = Q Q +,D Q =, O Diagrama de Pareto é uma homenagem ao engenheiro, filósofo, sociólogo e economista italiano Vilfredo Frederico Samaso Pareto ( - ). Pareto foi um dos pioneiros na aplicação de análises matemáticas ao estudo dos fenômenos sócio-econômicos. Diagrama Wilfredo enunciou, em, o que passou a ser conhecido como Principio de Pareto que afirma: % das dificuldades tem origem em % dos problemas. Este principio poderia ser colocado como existem muitos itens triviais mas poucos vitais. O Diagrama de Pareto é um gráfico de colunas simples, onde a variável está em ordem de importância freqüência de ocorrência ou custo) dos problemas ou defeitos. Normalmente o diagrama envolve a freqüência simples combinada com a freqüência acumulada em um único Número de erros Vitais Triviais % % % gráfico. É, também, comum a colocação % de um sistemas de eixos X Y auxiliares. E B C F D A H I Tipo de erro %

Exercício Considerando os dados sobre o Número de defeitos numa linha de produção de azulejos, construa o Diagrama de Pareto para a distribuição dada. Defeitos Desenho Esmalte Lascado Maior Menor Torto Trincado Total Número de Azulejos Solução Ordenando as freqüências, tem-se: Ordenando as freqüências dadas e calculando as freqüências relativas e relativas acumuladas, tem-se: Defeitos Lascado Esmalte Menor Desenho Maior Torto Trincado Total Número de Azulejos Calculando as demais freqüências: Diagrama de Pareto Defeitos Lascado Esmalte Menor Desenho Maior Torto Trincado Total % de azulejos,,,,,,, Freq. acumulada,,,,,,, ---- % % Lascado Esmalte Menor Desenho Maior Torto Trincado

Posições Relativas O escore z A média e o desvio padrão são as duas principais medidas utilizadas para descrever um conjunto de dados. Elas, também, podem ser utilizadas para comparações, isto é, para fornecer a posição relativa de um valor em relação ao conjunto como um todo. Seja (x, x,..., x n ) uma amostra de n observações. Sejam e s a média e o desvio padrão da amostra. Então o escore z i é o valor que fornece a posição relativa de cada x i da amostra, tendo como ponto de referência a média e como medida de afastamento o desvio padrão. x O escore z xi - x zi= s O escore z fornece o número de desvios padrão que cada valor está acima ou abaixo da média. O escore,, significa que este valor está um desvio e meio abaixo da média. O escore Z é também uma variável, que é obtida pela transformação da amostra original. Ela apresenta média igual a zero e desvio padrão igual a um. Considere o seguinte amostra: Assimetria =, Curtose= -,

Calcular os escores z para cada valor da amostra. Representar os valores da amostras e os escores em diagramas para verificar se houve alteração no formato da distribuição dos dados. Solução: A média e o desvio padrão da amostra são: e,. Então os escores padronizados serão:,, -, -, -, -, -, -,,,, -,, -,,,, -,, -, -, -, -, -,,,, -,,,, -,, -,,, -,, -,, -, -,,,, -,, -,,, Propriedades Assimetria=, Curtose= -, -, -, -,,,,,, A média do escore padronizado é zero; O desvio padrão do escore padronizado é um. A forma da distribuição do escore padronizado é a mesma dos dados originais. Escalas O escore Z não é utilizado normalmente da forma como é calculado. É comum a utilização de uma escala linear de transformação. As duas mais utilizadas são: Escalas A escala T que é obtida através da seguinte transformação T =.Z + A escala A que é utilizada nos vestibulares é obtida por: A =.Z +

Teorema de Chebyshev O teorema de Chebyshev permite verificar qual é o percentual mínimo de valores de um conjunto de dados que deve estar um certo número de desvios em torno da média. Em qualquer conjunto de dados com desvio padrão s, pelo menos ( /z ) dos valores do conjunto devem estar entre z desvios em torno da média, onde z é um valor tal que z >. s: Graficamente: Assim pelo menos: % dos valores estão dentro de z = desvios a partir da média; % dos valores estão dentro de z = desvios a contar da média; X - X < S % dos valores estão dentro de z = desvios a contar da média. - / = %.