Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 2 a Aula Prática Coleta, organização e apresentação de dados

Documentos relacionados
X = j=1 X j n. X j. Número de abortos Local TOTAL Rio Vermelho Costa da Lagoa TOTAL

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Distribuição de Frequência de Variáveis Quantitativas Contínuas (Tabelas e Gráficos)

1 Estatística Descritiva

Estatística Descritiva

Probabilidade e Estatística

Módulo IV Sumarização dos Dados ESTATÍSTICA

Estatística Aplicada à Educação

Prof.Letícia Garcia Polac. 28 de agosto de 2017

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

Distribuiçã o de Freque nciã

Distribuição de Frequência de Variáveis Quantitativas Contínuas (Tabelas e Gráficos)

Bioestatística Aula 2

Aula 2: Resumo de Dados

Sintetizando dados qualitativos e quantitativos

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Conceito de Estatística

Inferência Estatística. Medidas de Tendência Central Medidas de Variação Medidas de Posição

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.

Dados de identificação do Acadêmico: Nome: Login: CA: Cidade: UF Assinatura: CARTÃO RESPOSTA

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Unidade II Estatística descritiva

A função do 2º grau. Na aula anterior, estudamos a função do. Nossa aula

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).

GRÁFICOS ESTATÍSTICOS 1

3ª aula Cálculo : fi. 360º / n ou fr. 360º. Exemplo: Preferência por tipo de carro. Tipo de carro fi fr graus.

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Estatística Aplicada

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

Capítulo 2 Resumindo Dados e Gráficos. Seção 2-1 Visão Geral. Visão Geral Características Importantes dos Dados

Capítulo 1. Análise Exploratória de Dados

Estatística Descritiva: organização dos dados. 1 - Distribuição de frequências

Título Cabeçalho. Corpo. Rodapé

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

Estatística Descritiva: organização dos dados. 1 - Distribuição de frequências

MAE Introdução à Probabilidade e Estatística I 2 o semestre de 2017 Gabarito da Lista de Exercícios 2 - Estatística Descritiva II - CASA

Estatística descritiva básica: Medidas de tendência central

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Estatística Descritiva

Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Interpolação Polinomial

Análise Descritiva de Dados

Métodos Quantitativos II

Estatística Descritiva: organização dos dados 1 SÉRIES ESTATÍSTICAS

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

Determinação de medidas de posição a partir de dados agrupados

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana Análise de Assimetria Separatrizes

Distribuição de Frequências

Cap. 5 Dados quantitativos

ª Fase. 16 pontos

Estatística Descritiva

Estatística Descritiva

Valor total (em US$)

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO

SINTETIZANDO DADOS QUALITATIVOS E QUANTITATIVOS

Unidade I ESTATÍSTICA DESCRITIVA. Profa. Isabel Espinosa

Estatística Descritiva

Medidas de Posição. Tendência Central. É um valor que representa uma entrada típica, ou central, de um conjunto de dados. média. mediana.

Processos Hidrológicos CST 318 / SER 456. Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016

Resumo de Dados. Tipos de Variáveis

ÁREA DE REGIÕES ATRAVÉS DO GOOGLE MAPS UTILIZANDO POLINÔMIO DE NEWTON E CÁLCULO INTEGRAL

meninos =34

y ds, onde ds é uma quantidade infinitesimal (muito pequena) da curva C. A curva C é chamada o

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

CONTINUIDADE DE FUNÇÕES REAIS DE UMA VARIÁVEL

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

Análise Descritiva de Dados

MAE0219 Introdução à Probabilidade e Estatística I

20 Sidia M. Callegari-Jacques

Universidade Federal de Lavras

AGRUPAMENTO de ESCOLAS Nº1 de SANTIAGO do CACÉM Ano Letivo 2013/2014 PLANIFICAÇÃO ANUAL

Introdução à probabilidade e estatística I

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

ESTATÍSTICA. Aula 2 Distribuição de Frequência e Histograma. Fernando Arbache

PLANO CURRICULAR DISCIPLINAR. MATEMÁTICA 7º Ano

Estatística Descritiva

Exercícios Propostos

Unidade II Estatística descritiva

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

1ª Lista de Estatística Básica. Professor: Alessandro Monteiro

Planificação Anual. Matemática Dinâmica 7º ano Luísa Faria; Luís Guerreiro Porto Editora. 1 Números inteiros. 10 Sequências e Regularidades

UAlg esght MEDIDAS DE LOCALIZAÇÃO E DISPERSÃO. Paulo Batista Basílio ( )

Fernando de Pol Mayer

Agrupamento de Escolas de Águeda Escola Básica Fernando Caldeira

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

3. Análise Descritiva (ou Análise Exploratória)

CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano

AGRUPAMENTO de ESCOLAS de SANTIAGO do CACÉM Ano Letivo 2016/2017

ENGENHARIA DA QUALIDADE A ENG AULA 2 REVISÃO DE ESTATÍSTICA

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Aula 3 Distribuição de Frequências.

SINTETIZANDO DADOS QUALITATIVOS E QUANTITATIVOS

Princípios de Bioestatística

Laboratório de Física III

Estatística Descritiva

AT = Maior valor Menor valor

Probabilidade e Estatística

Transcrição:

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira a Aula Prática Coleta, organização e apresentação de dados 1) Os dados apresentados a seguir referem-se ao tempo que uma bateria levou para apresentar uma falha grave, em anos, ou seja, para descarregar completamente. A amostra de tamanho n = foi obtida com objetivo de caracterizar a robustez das baterias e é dada por: 8,5 4,19,5 1,91 8,78 5,91 1,86 1,4,6 1,89 5,63 6,36 5,7 3,3 1,83 1,84 1,58,3 1,8 1,95 a) Agrupar os dados do tempo até a falha das baterias em uma distribuição de frequências, determinando o número de classes pelo critério k = n. Dado: A = X (n) X (1) (amplitude total), c = A/(k 1) (amplitude de classe), LI 1 = X (1) c/, LS 1 = LI 1 + c, LI = LS 1, etc.; computar as frequências a partir dos dados originais (de preferência dos dados elaborados, ordenados). b) Obter o histograma (classes na abscissa e frequências na ordenada) e o polígono de frequência (linha poligonal unindo os centros dos retângulos) em um mesmo gráfico. c) Construir as distribuições de frequências acumuladas: utilizar os limites de classes, calcular as frequências acumuladas abaio e acima destes limites e construir a tabela correspondente. d) Traçar as ogivas no mesmo plano cartesiano. As ogivas são os gráficos correspondentes às frequências acumuladas abaio e acima (ordenada) dos limites de classes (abscissa). e) Qual é a porcentagem de baterias com tempo até falhar superior a 3 anos? Utilizar as ogivas (leitura gráfica) e a interpolação algébrica na distribuição de frequência para responder a esta pergunta. Comparar e discutir os resultados obtidos com a proporção obtida diretamente na amostra. f) Acima de qual valor em anos estão 5% das baterias? g) Qual a porcentagem de baterias com tempo até falhar inferior a 8 anos? h) Obter o tempo em que % das baterias falham antes deste valor? Determinar, também, o tempo em que, além dele, apenas % das baterias falham. Obs. Utilize nos casos 1f, 1g e 1h a distribuição de frequência para realizar os cálculos. ) Os dados a seguir referem-se ao número de empresas/ano que decretaram falência observadas em n = 85 anos na cidade de Lavras, MG. Empresas Frequências 36 1 19 16 3 7 4 4 5 6 1 a) Obter o gráfico da ocorrência de empresas falidas. b) É possível, em sua opinião, encontrar um ano em que mais de seis empresas venham a falir? Justificar sua resposta. c) Qual é a natureza da distribuição de frequências? (simétrica, assimétrica à direita ou à esquerda) d) Eiste diferença entre a variável apresentada neste eercício e a do eercício 1? Se afirmativo, qual é a diferença?

Resolução 1) Antes de realizar-se qualquer análise, ordena-se o conjunto de dados, obtendo: 1,8 1,83 1,84 1,86 1,89 1,91 1,95,3,5,6 3,3 4,19 5,7 5,63 5,91 6,36 8,5 8,78 1,4 1,58 a) Para agrupar os dados deve-se obter: O número de classe é dado por k = n = 4 e amplitude total por A = () (1) = 1,58 1,8 = 1,78. Assim, a amplitude de classe é dada por c = A/(k 1) = 1,78/3 3,59 e o limite inferior da primeira classe por LI 1 = (1) c/ = 1,8 3,59/ =,. Os demais limites de classe são obtidos somando-se c = 3,59 aos limites anteriormente obtidos. A distribuição de frequências obtida desta forma é: Classes dos tempos Xi F i F r i F p i (%), 3,59 1,8 11,55 55 3,59 7,18 5,39 5,5 5 7,18 1,77 8,98,1 1 1,77 14,36 1,57,1 1 b) O histograma e o polígono de frequências foram plotados em um mesmo gráfico, obtendo: F i 11 5 1,8 1,8 5,39 8,98 1,57 16,16 Obs. Esse é um caso típico em que a variável não assume valores negativos e o histograma iniciouse em zero (limite inferior da primeira classe), portanto, a rigor, o polígono de frequências no seu lado esquerdo não deve tocar na abscissa, caracterizando uma distribuição assimétrica à direita no seu caso mais etremo, ficando assim:

3 F i 11 5 1,8 5,39 8,98 1,57 16,16 c) A distribuição de frequência acumuladas abaio de e acima de é Limites F C(X < X i ) F C(X X i ), 3,59 11 9 7,18 16 4 1,77 18 14,36 d) As ogivas são: F c 18 16 14 1 1 8 6 4 F c F c, 3,59 7,18 1,77 14,36 e) Acima de 3 anos, pela ogiva, estão aproimadamente 1,75 baterias. Se baterias correspondem a 1%, então 1,75 correspondem a 1,75 1/% = 53,75%.

4 F c F c 18 16 14 1 1,75 1 8 6 4, 3, 3,59 7,18 1,77 F c 14,36 Utilizando a interpolação na distribuição de frequências, tem-se: as três últimas classes possuem tempos de falhas superiores a 3. Se as suas frequências forem somadas, têm-se 9 baterias, certamente com tempo de falha superior a 3 anos. Assim, a primeira classe possui 11 baterias com valores entre e 3,59. É necessário quantificar quantas das 11 são superiores a 3 anos, ou seja, quantas possuem tempo de falha entre 3 e 3,59. Para isso faz-se a suposição que a distribuição dos dados em cada classe é uniforme e estima-se a frequência de baterias que superam o tempo de 3 anos na classe em questão. A variação na classe toda é de 3,59, que corresponde a uma frequência de 11 baterias. A variação entre 3 a 3,59 corresponde a variação de tempo de falhas das baterias que possuem valores superiores a 3 anos, sendo 3,59 3 =,59. Assim, 3,59 11,59 Logo, = (11,59)/3,59 = 1,81. Portanto, têm-se 1,81 + 9 = 1,81 baterias com tempo de falha superior a 3 anos, o que corresponde a 1,81 1/% = 54,5%. Finalmente, pode-se obter a contagem direta na amostra original. O número de baterias com tempo de falha superior a 3 anos é 1, correspondendo a 1 1/% = 5,%. Os três métodos apresentaram resultados parecidos. A contagem direta na amostra é a mais precisa, mas pode-se observar que a utilização da tabela de frequências e o gráfico das ogivas são, relativamente, eficientes, pois a diferença em pontos percentuais não ultrapassou 5%. É natural que, ao se simplificar a informação por meio de tabelas e gráficos, haja uma perda de precisão, mas espera-se que ainda seja confiável utilizar os dados sumariados para etrair informações úteis a respeito do que se está estudando.

5 f) A percentagem de 5% corresponde a 1 baterias. Se for utilizado o seguinte raciocínio: acima de 1,77 estão apenas baterias; acima de 7,18, estão 4 baterias, as duas da classe e as duas da classe posterior; acima de 3,59, estão 9 baterias; e acima de, estão baterias, as 11 da classe e as 9 das classes posteriores. Assim, pode-se concluir que o tempo de falha que deia 1 baterias acima dele está entre e 3,59. Se este número for denominado de y, concluí-se que entre y e 3,59 tem de haver 1 bateria, pois acima de y, sem limite superior, tem de haver 1 baterias e acima de 3,59 há precisamente 9. Logo, basta realizar uma regra de três simples. Se a variação entre y e 3,59 for denominada de, o valor de y poderá ser calculado por y = 3,59. Entre, e 3,59 há uma variação de 3,59 (amplitude de classe) e corresponde a 11 baterias e entre y e 3,59 há uma variação de, correspondendo a 1 bateria. Logo, 3,59 11 1 Logo, = (1 3,59)/11 =,33. Portanto, têm-se y = 3,59,33 = 3,6 anos. Portanto 5% das baterias possuem tempo de falha superior a 3,6 anos. g) A porcentagem de baterias com tempo de falha inferior a 8 anos pode ser computada da seguinte forma. O valor 8 anos pertence a terceira classe e todas as baterias das duas primeiras classes, 16, possuem tempos de falha inferiores a 8. É necessário determinar na terceira classe, quantas das duas baterias possuem tempos de falhas inferiores a 8 anos. Assim, realiza-se a seguinte regra de três: 3,59 8 7,18 =,8 Logo, = (,8)/3,59 =,46 baterias possuem tempo de falha entre 7,18 e 8 anos. Portanto, tem-se 16 +,46 = 16,46 baterias com tempo de falha inferior a 8 anos, totalizando 1 16,46/ = 8,3% das baterias. h) Para se determinar tempo de falha que deia % das baterias, 4 baterias, abaio dele, tem-se que aplicar uma regra de três semelhante às anteriores. Verifica-se que abaio de 3,49 anos tem-se 11 baterias, indicando que o tempo de falha almejado está na primeira classe. Assim, 3,59 11 4 Logo, = (4 3,59)/11 = 1,31 representa a variação em tempo de falha das baterias entre, e y anos. Portanto, tem-se % das baterias com tempo de falha inferior a y = + 1,31 = 1,31 anos. Para se determinar tempo de falha que deia % das baterias, 4, acima dele, verifica-se que além dos 7,18 anos eistem 4 baterias, indicando que o tempo de falha almejado é eatamente este limite. Assim, tem-se que % das baterias possuem tempo de falha superior a 7,18 anos. ) A variável número de empresas falidas por ano foi analisada da seguinte forma: a) O gráfico da ocorrência de empresas falidas/ano é dado por:

6 F i 36 19 16 7 4 1 3 4 5 6 b) É possível encontrar tal ano, mesmo em uma região (município) que tem baia incidência de falências de empresas como esse. Para isso é necessário apenas aumentar o tamanho da amostra, pois anos com tal número de falência, pelo que indica os dados e o gráfico anterior, são potencialmente pouco prováveis na população amostrada. Usa-se o padrão de resposta do passado para inferir sobre o futuro. c) A natureza da distribuição é assimétrica à direita. d) Sim, elas são diferentes. A variável do eercício 1 é quantitativa contínua e a variável do eercício atual é quantitativa discreta.