NOTAS DE AULA ESTATÍSTICA BÁSICA



Documentos relacionados
Centro de Ciências e Tecnologia Agroalimentar - Campus Pombal Disciplina: Estatística Básica Aula 1 Professor: Carlos Sérgio

Centro de Ciências e Tecnologia Agroalimentar - Campus Pombal Disciplina: Estatística Básica Professor: Carlos Sérgio

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

Distribuição de frequências:

Estatística Descritiva

Bioestatística. October 28, UFOP October 28, / 57

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

Conceito de Estatística

Estatística. O que é Estatística? Estatística pode ser: Estatística Descritiva. Ivonete Melo de Carvalho. Conteúdo

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Química e Estatística

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

CURSO DE ESTATÍSTICA STICA DESCRITIVA Adriano Mendonça Souza Departamento de Estatística - UFSM -

Tutorial para o desenvolvimento das Oficinas

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Unidade I ESTATÍSTICA DESCRITIVA. Profa. Isabel Espinosa

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Métodos Quantitativos

Teoria de probabilidade - objetiva descrever e prever as características de populações infinitas

Prof.Letícia Garcia Polac. 28 de agosto de 2017

GRÁFICOS ESTATÍSTICOS

Bioestatística. Parte I. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

ESTATÍSTICA Medidas de Síntese

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

INTRODUÇÃO À ESTATÍSTICA

Cálculo das Probabilidades e Estatística I

INTRODUÇÃO A ESTATISTICA PROF. RANILDO LOPES

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

ESTATÍSTICA ECONÔMICA A 6EMA

Métodos Quantitativos Aplicados a Gestão

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

NOÇÕES DE ESTATÍSTICA

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

ESTATÍSTICA ECONÔMICA A 6EMA

Estatística Descritiva

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Unidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Estatística Descritiva

Sumário. Estatistica.indb 11 16/08/ :47:41

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Título Cabeçalho. Corpo. Rodapé

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

Introdução. Quem nunca ouviu a palavra estatística referindo-se a um número ou conjunto de números?

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

CE Estatística I

Probabilidade e Estatística. Medidas de Tendência Central. Cláudio Henrique Albuquerque Rodrigues, M. Sc.

SS714 - Bioestatística

As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.

Estatística: Conceitos e Organização de Dados


Estatística e Probabilidade Curso: Tecnólogo em Gestão Ambiental Semestre 2012/2

PROBABILIDADE E ESTATISTICA. Unidade III Medidas de Posição

Estatítica Descritiva e Exploratória

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

MAE116 Farmácia Estatística Descritiva (I)

Unidade III Medidas Descritivas

Organização de dados

ESTATÍSTICA COMPUTACIONAL AULA 1 RESUMO DE DADOS

Estatística Descritiva: organização dos dados 1 SÉRIES ESTATÍSTICAS

Medidas Estatísticas de Posição

1 Definição Clássica de Probabilidade

Estatística Básica. Profa. Andreza Palma

Unidade I. Profa. Ana Carolina Bueno

Professora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo

Adilson Cunha Rusteiko

12/06/14. Estatística Descritiva. Estatística Descritiva. Estatística Descritiva. Estatística Analítica (Inferência estatística/estatística indutiva)

Estatística Descritiva

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA

A Estatística é aplicada como auxílio nas tomadas de decisão diante de incertezas para justificar cientificamente as decisões

Análise Exploratória e Estimação PARA COMPUTAÇÃO

Aula 2 MEDIDAS DE TENDÊNCIA CENTRAL E MEDIDAS DE POSIÇÃO

Probabilidades. Wagner H. Bonat Elias T. Krainski Fernando P. Mayer


Medidas de Tendência Central

Análise Descritiva de Dados

Distribuição de Frequências

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Medidas de Posição ou Tendência Central

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

Unidade I ESTATÍSTICA. Prof. Fernando Rodrigues

Estatística Descritiva (I)

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Introdução à análise exploratória de dados

Estatística Descritiva

Introdução à análise exploratória de dados

Introdução à Estatística Estatística Descritiva 22

Estatística Descritiva (I)

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

b) 5 6 d) 1 6 e) 7 6

Transcrição:

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIÊNCIAS E TECNOLOGIA AGROALIMENTAR - CAMPUS POMBAL DISCIPLINA: ESTATÍSTICA BÁSICA NOTAS DE AULA ESTATÍSTICA BÁSICA Prof. MSc. Carlos Sérgio Araújo dos Santos POMBAL - PB NOVEMBRO de 2013

Sumário 1 Introdução Geral p. 9 1.1 A Estatística.................................. p. 9 1.2 Estatística Descritiva............................. p. 10 1.3 A Natureza da Estatística (Classificação das variáveis........... p. 10 1.4 Fases do Método Estatístico......................... p. 11 1.5 Pesquisas e Dados.............................. p. 13 1.6 Conceitos básicos............................... p. 13 1.7 Tabelas Estatísticas.............................. p. 14 1.8 Elementos de uma Tabela.......................... p. 14 1.9 Representação esquemática......................... p. 15 1.10 Distribuição de Frequências......................... p. 15 1.10.1 Conceitos............................... p. 15 1.10.2 Distribuição de frequência sem intervalos de classe........ p. 16 1.10.3 Distribuição de frequência com intervalos de classe........ p. 16 1.10.4 Elementos de uma Distribuição de Frequência........... p. 17 1.10.5 Método Prático para construção de uma distribuição de frequências com classe............................... p. 18 1.10.6 Tipos de Frequências......................... p. 18 1.11 Representação Gráfica............................ p. 19 1.12 Gráficos utilizados para a análise de uma distribuição de freqüência... p. 20

1.12.1 Histograma.............................. p. 20 1.12.2 Polígono de Freqüências....................... p. 20 1.12.3 Ogivas................................. p. 21 1.12.4 Gráfico por linha............................ p. 21 1.12.5 Gráfico por colunas.......................... p. 22 1.12.6 Diagrama por Superfície em Setores................. p. 22 2 Análise Exploratória de Dados p. 24 2.1 Medidas de Posição.............................. p. 24 2.1.1 Média................................. p. 24 2.1.2 Moda.................................. p. 26 2.1.3 Mediana................................ p. 28 2.2 Quartis, Decis e Percentis (ou Centis).................... p. 31 2.3 Quartis..................................... p. 31 2.3.1 Primeiro Quartil: Q 1.......................... p. 31 2.3.2 Segundo Quartil: Q 2 ou Md..................... p. 32 2.3.3 Terceiro Quartil: Q 3.......................... p. 32 2.4 Decis D i.................................... p. 33 2.4.1 Primeiro Decil: D 1........................... p. 33 2.4.2 Segundo Decil: D 2.......................... p. 33 2.5 Percentis ou Centis C i............................ p. 34 2.5.1 Vigésimo Centil: C 20......................... p. 34 2.6 Medidas de Dispersão............................ p. 35 2.6.1 Desvio - Padrão............................ p. 36 2.6.2 Variância................................ p. 37

2.6.3 Coeficiente de Variação........................ p. 39 2.7 Exercícios................................... p. 40 3 Probabilidade: Espaço amostral e eventos p. 45 3.1 Experimentos Aleatórios........................... p. 45 3.1.1 Tipos de fenômenos.......................... p. 45 3.2 Espaço Amostral............................... p. 45 3.3 Eventos.................................... p. 46 3.4 Classe dos eventos aleatórios........................ p. 46 3.5 Operações com eventos Aleatórios..................... p. 47 3.6 Propriedades das operações......................... p. 49 3.7 Partição de um Espaço Amostral....................... p. 50 3.8 Eventos Mutuamente Exclusivos ou Disjuntos................ p. 51 3.9 Exercícios................................... p. 52 4 Probabilidade: Definições p. 53 4.1 Definição Clássica de Probabilidade..................... p. 53 4.2 Definição Axiomática de Probabilidade................... p. 53 4.2.1 Propriedades............................. p. 54 4.3 Eventos Independentes............................ p. 55 4.4 Probabilidade Condicional.......................... p. 55 4.5 Probabilidade Total.............................. p. 56 4.6 Teorema de Bayes.............................. p. 57 4.7 Exercícios................................... p. 59 5 Variáveis Aleatórias discretas p. 62 5.1 Variáveis Aleatórias.............................. p. 62

5.2 Esperança de uma Variável Aleatória Discreta................ p. 64 5.3 Variância de uma Variável Aleatória Discreta................ p. 65 5.4 Função de Distribuição Acumulada...................... p. 66 5.5 Exercícios................................... p. 68 6 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Discretas p. 70 6.1 Distribuição de Bernoulli........................... p. 70 6.2 Distribuição Binomial............................. p. 71 6.2.1 Média e Variância de uma v.a. com Distribuição Binomial................................ p. 72 6.3 Distribuição de Poisson............................ p. 73 6.4 Exercícios................................... p. 76 7 Variáveis Aleatórias contínuas p. 78 7.1 Definições................................... p. 78 7.2 Função de Distribuição Acumulada...................... p. 79 7.3 Esperança de uma Variável Aleatória Contínua............... p. 80 7.4 Variancia de uma Variável Aleatória Contínua................ p. 80 7.5 Exercícios................................... p. 81 8 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Contínuas p. 83 8.1 Distribuição Uniforme............................. p. 83 8.2 Distribuição Normal.............................. p. 84 8.2.1 Média................................. p. 85 8.2.2 Distribuição Normal Padrão...................... p. 85 8.3 Exercícios................................... p. 88

9 Teoria da Amostragem p. 90 9.1 Introdução................................... p. 90 9.2 Parâmetros e Estatísticas........................... p. 90 9.3 Técnicas de amostragem........................... p. 91 9.4 Conceitos Iniciais............................... p. 91 9.5 Amostragem.................................. p. 92 9.5.1 As Amostras Probabilísticas..................... p. 92 9.5.2 Amostragem Aleatória Simples.................... p. 93 9.5.3 Amostragem Aleatória Estratificada................. p. 93 9.5.4 Amostragem por Conglomerados................... p. 94 9.5.5 Amostragem Sistemática....................... p. 94 9.6 Amostragem Não-probabilística....................... p. 94 9.7 Erros no processo de amostragem...................... p. 94 9.8 Distribuição Amostral da Média........................ p. 95 9.9 Distribuição Amostral das Proporções.................... p. 96 9.10 Exercícios................................... p. 98 10 Teoria da Estimação p. 100 10.1 Introdução................................... p. 100 10.2 Estimação Pontual.............................. p. 100 10.3 Propriedades dos estimadores........................ p. 101 10.3.1 Justeza e não-tedenciosidade.................... p. 101 10.3.2 Consistência.............................. p. 101 10.3.3 Eficiência............................... p. 102 10.3.4 Suficiência............................... p. 103

10.4 Estimação Intervalar............................. p. 103 10.4.1 Intervalo de Confiança para Média com variância (populacional) conhecida............................... p. 103 10.4.2 Intervalo de Confiança para Média com variância (populacional) desconhecida............................. p. 105 10.4.3 Intervalo de Confiança para proporção populacional........ p. 106 10.4.4 Intervalo de Confiança para Variância................ p. 107 10.5 Intervalo de Confiança para a diferença de médias de duas Populações. p. 108 10.5.1 As variâncias σ 2 1 e σ2 2 (populacionais) são conhecidas....... p. 108 10.5.2 As variâncias σ 2 1 e σ2 2 são desconhecidas mas σ2 1 = σ 2 2....... p. 109 10.6 Intervalo de Confiança para Diferença de Proporções........... p. 110 10.7 Exercícios................................... p. 112 11 Testes de Hipóteses p. 118 11.1 Hipótese Nula e Hipótese Alternativa..................... p. 118 11.2 Região Crítica do teste............................ p. 118 11.3 Erros do Tipo I e erros do Tipo II....................... p. 119 11.4 Teste da hipótese para média populacional µ................ p. 120 11.4.1 σ conhecido.............................. p. 120 11.4.2 σ desconhecido............................ p. 120 11.5 Teste para Proporção............................. p. 121 11.6 Teste de hipótese para variância....................... p. 122 11.7 Teste da hipótese da igualdade de duas médias.............. p. 123 11.7.1 σ 2 1 e σ2 2 11.7.2 σ 2 1 e σ2 2 conhecidas.......................... p. 124 desconhecidas........................ p. 124 11.8 Teste de hipótese da diferença entre proporções.............. p. 125

11.9 Teste da razão de variâncias......................... p. 125 11.10Exercícios................................... p. 128 12 Correlação e Regressão Linear Simples p. 134 12.1 Correlação Linear Simples.......................... p. 134 12.1.1 Relação entre variáveis........................ p. 134 12.1.2 Medida de Correlação......................... p. 134 12.2 Regressão Linear............................... p. 136 12.2.1 Pressuposições............................ p. 137 12.2.2 Método de estimação dos parâmetros α e β............. p. 138 12.3 Decomposição da variância total....................... p. 140 12.4 Análise de Variância da Regressão..................... p. 141 12.5 Coeficiente de determinação......................... p. 143 12.6 Exercícios................................... p. 144 Referências p. 145

9 1 Introdução Geral 1.1 A Estatística Para algumas pessoas, a Estatística não é senão um quadro de colunas mais ou menos longas de números que dizem respeito à população, à indústria ou ao comércio, como se vê frequentemente em revistas; para outras, ela dá gráficos mostrando a variação no tempo de um fato econômico ou social, a produção ou os números relativos aos negócios de uma empresa, assim como se encontra nos escritórios de empresas privadas. A utilização da Estatística é cada vez mais acentuada em qualquer atividade profissional da vida moderna. Nos mais diversificados ramos de atuação, as pessoas estão frequentemente expostas à Estatística, utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método estatístico proporciona àqueles que dele necessita. A razão pela qual consideramos a Estatística uma ferramenta importante para tomada de decisões está no fato de que ela não deve ser considerada como um fim em si própria, mas como um instrumento fornecedor de informações que subsidiarão, em consequência, a tomada de melhores decisões, baseadas em fatos e dados. Podemos considerar a Estatística como a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação dos dados experimentais, ou oriundos de estudos observacionais visando a tomada de decisões. Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basicamente em duas partes: A Estatística Descritiva, que se preocupa com a organização e descrição dos dados experimentais, e a Estatística Indutiva, que cuida da sua análise e interpretação.

10 1.2 Estatística Descritiva Principalmente em pesquisa social, o analista defronta-se amiúde com a situação de dispor de tantos dados que se torna difícil absorver completamente a informação que está procurando investigar. É extremamente difícil captar intuitivamente todas as informações que os dados contêm. É necessário, portanto, que as informações sejam reduzidas até o ponto em que se possa interpretá-las mais claramente. Em outras palavras, é indispensável resumí-las, através do uso de certas medidas-sínteses, mais comumentes conhecidas como estatística descritiva ou simplesmente estatísticas. Por conseguinte, a estatística descritiva é um número que sozinho descreve uma característica de um conjunto de dados. Trata-se, portanto, de um número-resumo que possibilita reduzir os dados a proporções mais facilmente interpretáveis. Em um sentido mais amplo, a Estatística Descritiva pode ser interpretada como uma função cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados numéricos referentes a esses fenômenos, a organização e a classificação desses dados observados e a sua apresentação através de gráficos e tabelas, além do cálculo de coeficientes (estatísticas) que permitem descrever resumidadamente os fenômenos. 1.3 A Natureza da Estatística (Classificação das variáveis Variável é uma característica de uma unidade que será medida a partir daquela unidade da amostra. Podemos descrever dois tipos de variáveis para estudo: Variáveis Qualitativas: Podem ser separados em diferentes categorias, atributos, que se distinguem por alguma característica não numérica. como nos seguintes exemplos: a) População: alunos de uma universidade Variável: sexo (masculino ou feminino). b) População: moradores de uma cidade Variável: tipo de habitação (casa, apartamento, barraco, etc.). c) População: peças produzidas por uma máquina Variável: qualidade (perfeita ou defeituosa). d) População Brasileira Variável: cor da pele (branca, preta, amarela, vermelha, parda).

11 Variáveis Quantitativas: Quando suas medidas consistem em números que representam contagens ou medidas. Pode ser subdivida em: 1 - quantitativa discreta: pode assumir apenas valores pertences a um conjunto enumerável; 2 - quantitativa contínua: pode assumir qualquer valor em um certo intervalo de variação. Alguns exemplos de variáveis quantitativas discretas são: a) População: habitações de uma cidade. Variável: número de banheiros. b) População: casais residentes em uma cidade. Variável: número de filhos. c) População: aparelhos produzidos em uma linha de montagem. Variável: número de defeitos por unidade. d) População: Bolsa de valores de São Paulo. Variável: número de ações negociadas. 1.4 Fases do Método Estatístico O método estatístico abrange as seguintes fases: a) Definição do Problema Consiste na: - formulação correta do problema; - examinar outros levantamentos realizados no mesmo campo (revisão da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) b) Planejamento Determinar o procedimento necessário para resolver o problema:

12 - Como levantar informações; - Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). - Cronograma, Custos, etc. c) Coleta ou levantamento dos dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta - diretamente da fonte; Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). d) Apuração dos dados ou sumarização Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de coordenação e de tabulação. Apuração: manual, mecânica e eletrônica. e) Apresentação dos dados É a fase em que vamos mostrar os resultados obtidos na coleta e na organização. Esta apresentação pode ser: Tabular (apresentação numérica) Gráfica (apresentação geométrica) f) Análise e interpretação dos dados É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o pesquisador a resolver seu problema.

13 1.5 Pesquisas e Dados Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferramenta a ser utilizada. Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem. Dados Estatísticos: Dados são observações documentadas ou resultados da medição. Os dados podem ser obtidos pela percepção através dos sentidos (por exemplo observação) ou pela execução de um processo de medição. Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferramenta a ser utilizada. Dados primários: são aqueles que não foram antes coletados, estando ainda em posse dos pesquisados, e que são coletados com o propósito de atender às necessidades específicas da pesquisa em andamento. As fontes básicas de dados primários são: pesquisado, pessoas que tenham informações sobre o pesquisado e situações similares. Dados secundários: são aqueles que já foram coletados, tabulados, ordenados e, às vezes, até analisados e que estão catalogados à disposição dos interessados. As fontes básicas de dados secundários são: a própria empresa, publicações, governos, Instituições não governamentais e serviços padronizados de informações de marketing. 1.6 Conceitos básicos População: Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo ser finita ou infinita. Amostra: É um subconjunto da população e deverá ser considerada finita, a amostra

14 deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. Amostragem: É o processo de retirada de informações dos "n"elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). Censo: é a coleção de dados relativos a todos elementos da população. Estatística: é uma medida numérica que descreve uma característica da amostra. Parâmetro: é a medida numérica que descreve uma característica da população. Estatística Descritiva: envolve a organização e sumarização dos dados através de metodologias simples. Estatística Inferencial: é a parte da estatística que envolve a análise e interpretação da amostra. 1.7 Tabelas Estatísticas Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas. Tabela: é uma maneira de apresentar de forma resumida um conjunto de dados 1.8 Elementos de uma Tabela 1) Título: O título deve responder as seguintes questões: - O que? (Assunto a ser representado (Fato)); - Onde? (O lugar onde ocorreu o fenômeno (local)); - Quando? (A época em que se verificou o fenômeno (tempo)). 2) Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna.

15 3) Corpo: parte da tabela composta por linhas e colunas. 4) Linhas: parte do corpo que contém uma seqüência horizontal de informações. 5) Colunas: parte do corpo que contém uma seqüência vertical de informações. 6) Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos pelas colunas numéricas. 7) Casa ou Célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. 8) Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chamadas). 9) Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. 10) Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral; chamada - esclarecer minúcias em relação a uma célula). 1.9 Representação esquemática 1.10 Distribuição de Frequências 1.10.1 Conceitos Dados Brutos: é a relação de elementos que não foram numericamente organizados.

16 Ex : 45, 41, 42, 41, 42, 43, 44, 41,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Rol: é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou decrescente. Ex : 41, 41, 41, 42, 42, 43, 44, 45,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Tabela de Frequências: são representações nas quais os valores se apresentam em correspondência com suas repetições. 1.10.2 Distribuição de frequência sem intervalos de classe É a simples condensação dos dados conforme as repetições de seu valores. Exemplo: Tabela 1: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 13 Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 i=1 f i (f i ) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 A soma das frequências é sempre igual ao número total de valores observados. k f i = n i=1 1.10.3 Distribuição de frequência com intervalos de classe Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Exemplo:

17 Tabela 2: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i 1 41 45 7 2 45 49 3 3 49 53 4 4 53 57 1 5 57 61 5 Total 5 i=1 f i 20 1.10.4 Elementos de uma Distribuição de Frequência Frequência Simples Absoluta: é o número de observações correspondentes a uma classe ou valor individual. É simbolizada por f i. Amplitude Total A t : É a diferença entre o maior e o menor valor observado da variável em estudo. Ex: na tabela anterior A t = 60 41 = 19. Classe: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 53 é a terceira classe, em que i = 3. Limites de Classe: são os extremos de cada classe. O menor número é o limite inferior de classe (l i ) e o maior número, limite superior de classe(l i ). Ex: em 49 53, l 3 = 49 e L 3 = 53. O símbolo representa um intervalo fechado à esquerda e aberto à direita. Amplitude do Intervalo de Classe: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por h i = L i l i. Ex: na tabela anterior h i = 53 49 = 4. Ponto Médio de Classe x i : é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 53 o ponto médio x 3 = (53 + 49)/2 = 51, ou seja x 3 = (L 3 + l 3 )/2.

18 1.10.5 Método Prático para construção de uma distribuição de frequências com classe 1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude total A t. 3 - Calcule o número de classes através da "Regra de Sturges". k = 1 + 3, 3 log n em que k é o número de classes e n é o número total de observações 4 - Calcule a amplitude do intervalo de classe h = At k. No nosso exemplo: A t = 19 e k = 5, logo h = 3, 8. Utilizaremos então h = 4 1.10.6 Tipos de Frequências Frequência Simples Absoluta f i : é o número de repetições de um valor individual ou de uma classe de valores da variável. Frequência Simples Relativa fr i : representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações. fr i = f i k i=1 f i = f i n Em termos percentuais tem-se Exemplo: fr i = f i n 100 Frequência Absoluta Acumulada "Abaixo de"f i : é a soma da frequência simples

19 Tabela 3: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i fr i Frequências relativas percentuais 1 41 45 7 0,35 35% 2 45 49 3 0,15 15% 3 49 53 4 0,20 20% 4 53 57 1 0,05 5% 5 57 61 5 0,25 25% Total 5 i=1 f i 20 1,00 100% absoluta dessa classe ou desse valor com as frequências simples absolutas das classes ou dos valores anteriores. Exemplo: Tabela 4: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i F i 1 41 45 7 7 2 45 49 3 7 + 3 = 10 3 49 53 4 7 + 3 + 4 = 14 4 53 57 1 7 + 3 + 4 + 1 = 15 5 57 61 5 7 + 3 + 4 + 1 + 5 = 20 Total 5 i=1 f i 20 Frequência Absoluta Acumulada "Acima de"f i : é a soma da frequência simples absoluta dessa classe ou desse valor com as frequências simples absolutas das classes ou dos valores posteriores. Exemplo: 1.11 Representação Gráfica Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende da variável em questão.

20 Tabela 5: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i F i 1 41 45 7 5 + 1 + 4 + 3 + 7 = 20 2 45 49 3 5 + 1 + 4 + 3 = 13 3 49 53 4 5 + 1 + 4 = 10 4 53 57 1 5 + 1 = 6 5 57 61 5 5 Total 5 i=1 f i 20 1.12 Gráficos utilizados para a análise de uma distribuição de freqüência 1.12.1 Histograma São os gráficos mais importantes na estatística inferencial. Quando os dados são valores de uma variável medida numa escala intervalar/proporcional, uma tabela de frequências para cada uma das classes mostra a distribuição de valores dessa variável. Esta distribuição pode ser representada graficamente num histograma. 1.12.2 Polígono de Freqüências Unindo por linhas retas os pontos médios das bases superiores dos retângulos do histograma, obtém-se outra representação dos dados, denominada Polígono de Frequências.

21 1.12.3 Ogivas A Ogiva tem por finalidade a representação gráfica das tabelas de frequências acumuladas. 1.12.4 Gráfico por linha É a representação gráfica de uma série estatística por meio de uma linha poligonal. é um dos mais importantes gráficos; representa observações feitas ao longo do tempo, em intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries históricas ou séries temporais. Traduzem o comportamento de um fenômeno em certo intervalo de tempo.

22 1.12.5 Gráfico por colunas É a representação de uma série estatística por intermédio de retângulos em posições verticais. Este tipo de gráficos proporciona comparar grandezas. 1.12.6 Diagrama por Superfície em Setores É a representaçao gráfica de uma série estatística por intermédio de superfícies setoriais. É utilizado quando se pretende comparar os valores de uma série com a sua soma total. A representaçao é feita tomando como figura básica um círculo que é dividido em se-

23 tores. O quociente entre a soma dos valores da série e a área do círculo deve ser o mesmo que entre cada valor da variável dependente e a respectiva área do setor representativo. Porém em virtude da proporcionalidade das áreas dos setores de um círculo com seus ângulos centrais, podem-se dividir os valores considerados na série proporcionalmente a estes ângulos.

24 2 Análise Exploratória de Dados 2.1 Medidas de Posição As medidas de posição, também chamada de medidas de tendência central, possuem três formas diferentes para três situações distintas: MÉDIA MODA MEDIANA 2.1.1 Média Existem dois tipos de média: POPULACIONAL, representada pela letra grega µ. AMOSTRAL, representada por x. 1 - Média: (Dados não agrupados) Sejam os elementos x 1, x 2,..., x n de uma amostra, portanto "n"valores da variável X. A média aritmética da variável aleatória X é definida por, x = x 1 + x 2 +... + x n n = n i=1 x i n

25 Exemplo: Suponha o conjunto de dados que representa o peso ao nascer de bezerros da raça Nelore: 51, 40, 46, 48, 54, 56, 44, 43, 55 e 57. Determinar a média aritmética simples deste conjunto de dados. x = 51 + 40 + 46 + 48 + 54 + 56 + 44 + 43 + 55 + 57 10 = 494 10 = 49, 4 2 - Média: (Dados agrupados em uma distribuição de frequência por valores simples) Usa-se a média aritmética dos valores x 1, x 2,..., x n ponderados pelas respectivas frequências absolutas: f 1, f 2,..., f n. Assim x = x 1f 1 + x 2 f 2 +... + x n f n n = n i=1 x if i n Exemplo: Tabela 6: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 13 Dados (x i ) 41 42 43 44 45 46 50 51 52 54 57 58 60 i=1 f i (f i ) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 x i f i 123 84 43 44 45 92 100 51 52 54 57 116 120 981 Portanto: x = 981 20 = 49, 05 3 - Média: (Dados agrupados em uma distribuição de frequência por classes) Usaremos a média aritmética dos pontos médios x 1, x 2,..., x n de cada classe, ponderados pelas respectivas frequências absolutas: f 1, f 2,..., f n. Assim x = x 1f 1 + x 2 f 2 +... + x n f n n = n i=1 x if i n Exemplo:

26 Tabela 7: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i x i x i f i 1 41 45 7 43 301 2 45 49 3 47 141 3 49 53 4 51 204 4 53 57 1 55 55 5 57 61 5 59 295 Total 5 i=1 f i 20 996 Portanto: x = 996 20 = 49, 80 2.1.2 Moda É o valor mais frequente da distribuição. 1 - Moda (Mo): (Dados não agrupados) Sejam os elementos x 1, x 2,..., x n de uma amostra, o valor da moda para este tipo de conjunto de dados é simplesmente o valor com maior frequência. Exemplo: Obter a moda dos seguintes conjuntos de valores: X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}, Moda de X: Mo = 6. Y = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6}, Moda de Y : Mo 1 = 2 e Mo 2 = 5. W = {1, 2, 3, 4, 5} Moda de W : amodal 2 - Moda (Mo): (Dados agrupados em uma distribuição de frequência por valores simples) Para este tipo de distribuição, a identificação da moda é facilitada pela simples observação do elemento que apresenta maior frequência.

27 Tabela 8: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 13 Dados (x i ) 41 42 43 44 45 46 50 51 52 54 57 58 60 i=1 f i (f i ) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 Exemplo: Portanto, se a maior frequência é f i = 3, logo Mo = 41. 3 - Moda (M o): (Dados agrupados em uma distribuição de frequência por classes) Para dados agrupados em classes, temos diversos métodos para o cálculo da moda. Utilizaremos aqui o Método de Czuber denotado a seguir: Método de Czuber Procedimento: Identifica-se a classe modal (aquela que possuir maior frequência) CLASSE (Mo). Utiliza-se a fórmula: em que: 1 Mo = l i + h 2 + 1 l i = Limite inferior da classe modal. 1 = f mo f ant (frequência modal frequência anterior) 2 = f mo f post (frequência modal frequência posterior) h = amplitude da classe modal Exemplo: Determinar a moda, pelo método de Czuber, usando os dados do exemplo tem-se que: Classe (Mo): 41 45 l i = 41

28 Tabela 9: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i 1 41 45 7 2 45 49 3 3 49 53 4 4 53 57 1 5 57 61 5 Total 5 i=1 f i 20 h = 4 1 = f mo f ant = 7 0 = 7 2 = f mo f post = 7 3 = 4 2.1.3 Mediana Mo = 41 + 4 7 7 + 4 = 43, 54 Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou seja, é o elemento que divide a distribuição em 50% de cada lado. 1 - Mediana (Md): (Dados não agrupados) Sejam os elementos x 1, x 2,..., x n de uma amostra, portanto "n"valores da variável X. A mediana da variável aleatória X é definida através do Elemento Mediano E Md, O número de observações é ímpar, então o valor da mediana será o valor localizado na posição E Md = n+1 2 ; O número de observações é par, então o valor da mediana será a média entre o valor da posição E Md = n 2 e o seu valor consecutivo. Exemplo 1: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a mediana deste conjunto de dados.

29 Como n = 5, então o valor da mediana estará localizado na posição E Md = 5+1 2 = 3. Portanto, Md = 8 Exemplo 2: Suponha o conjunto de tempo de serviço de seis funcionários: 3, 7, 8, 10, 11 e 13. Determinar a mediana deste conjunto de dados. Como n = 6, então o valor da mediana estará localizado na posição E Md = 6 = 3 2 e na posição consecutiva obtendo uma média aritmética desses valores. Portanto, Md = 8 + 10 2 = 9 2 - Mediana (M d): (Dados agrupados em uma distribuição de frequência por valores simples) Quando os valores da variável estiverem já tabulados, o procedimento a ser adotado será praticamente idêntico ao anterior. Deve-se verificar se o número de observações é ímpar ou par, para o cálculo do elemento mediano. Em seguida acrescenta-se uma coluna à tabela de frequências original, onde serão determinadas as frequências acumuladas. Exemplo: Tabela 10: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 13 Dados (x i ) 41 42 43 44 45 46 50 51 52 54 57 58 60 i=1 f i (f i ) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 (F i ) 3 5 6 7 8 10 12 13 14 15 16 18 20 - Portanto: E Md = 20 2 = 10, logo, Md = 46+50 2 = 48 3 - Mediana (M d): (Dados agrupados em uma distribuição de frequência por classes) Procedimento: Calcula-se o elemento mediano E Md

30 Pela F i identifica-se a classe que contém o valor da mediana - CLASSE(Md) Utiliza-se a fórmula: em que: Md = l i + h EMd F ant f Md l i = Limite inferior da classe mediana; F ant = Frequência acumulada anterior à classe mediana; h = Amplitude da classe mediana; f Md = Frequência absoluta simples da classe mediana. Exemplo: Tabela 11: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i F i 1 41 45 7 7 2 45 49 3 10 3 49 53 4 14 4 53 57 1 15 5 57 61 5 20 Total 5 i=1 f i 20 Portanto: E Md = 20 2 = 10 CLASSE(Md) = 45 49 Md = 45 + 4 10 7 3 = 45 + 4 = 49

31 2.2 Quartis, Decis e Percentis (ou Centis) Há uma série de medidas de posição semelhantes na sua concepção à mediana, embora não sejam medidas de tendência central. Como se sabe, a mediana divide a distribuição em duas partes iguais quanto ao número de elementos de cada parte. Já os quartis permitem dividir a distribuição em quatro partes iguais quanto ao número de elementos cada uma; os decis em dez partes e os centis em cem partes iguais. Para simbolizar cada uma dessas medidas separatrizes, faremos: Q i = quartis i = 1, 2, 3 D i = decis i = 1, 2, 3,..., 9 C i = centis i = 1, 2, 3,..., 99 Assim, para dividir uma série ordenada de valores em quatro partes iguais, precisamos de três separatrizes (quartis); para dividi-la em dez, iremos recorrer a nove separatrizes (decis); em cem, recorremos a noventa e nove separatrizes (centis). O gráfico a seguir ilustra melhor o que foi dito em relação aos quartis e decis: 2.3 Quartis 2.3.1 Primeiro Quartil: Q 1 Definição: Dado um conjunto ordenado (ordem crescente) de valores, o primeiro quartil, Q 1, é o valor que divide o conjunto em duas partes tais que um quarto ou

32 vinte e cinco por cento dos valores sejam menores d que ele e três quartos ou setenta e cinco por cento dos restantes sejam maiores. O elemento que indica a ordem ou posição do primeiro quartil é determinado, para dados agrupados em classes, pela seguinte expressão: E Q1 = n 4 em que n é o número de valores do conjunto, ou número de observações. 2.3.2 Segundo Quartil: Q 2 ou Md Definição: Dado um conjunto ordenado de valores, o segundo quartil ou mediana é o valor que divide em duas partes iguais quanto ao número de elementos, isto é, cinquenta por cento ou dois quartos dos valores do conjunto são menores, e os dois quartos restantes sao maiores do que ele. O elemento mediano é calculado, como veremos, através da seguinte expressão: E Q2 = 2n 4 = n 2 2.3.3 Terceiro Quartil: Q 3 Definição: Dado um conjunto ordenado (ordem crescente) de valores, o terceiro quartil é o valor que divide o conjunto em duas partes tais que setenta e cinco por cento ou tres quartos dos valores sejam menores e vinte e cinco por cento ou um quarto sejam maiores do que ele. O elemento que indica a ordem em que n encontra o terceiro quartil é calculado, para dados tabulados, como segue: E Q3 = 3n 4 Genericamente, para determinar a ordem ou posição do quartil a ser calculado, usaremos a seguinte expressão:

33 E Qi = in 4 em que i indica o número do quartil a ser calculado e n o número de elementos ou observações da amostra. 2.4 Decis D i A definição dos decis obedece ao mesmo princípio da dos quartis, com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretenda clacular. Assim, por exemplo: 2.4.1 Primeiro Decil: D 1 O primeiro decil de um conjunto ordenado (ordem crescente) de valores é o valor que divide um conjunto em duas partes tais que dez por cento ou um décimo dos valores sejam menores e nove décimos ou noventa por cento sejam maiores do que ele. O elemento que indica a posição do segundo decil é calculado pela seguinte expressão: E D1 = n 10 2.4.2 Segundo Decil: D 2 Trata-se do valor que divide o conjunto em duas partes, tais que vinte por cento ou dois décimos dos valores sejam menores e oitenta por cento ou oito décimos dos valores sejam maiores; para saber a ordem do segundo decil, usamos a expressão: E D2 = 2n 10 De especial interesse é o quinto decil, que divide o conjunto em duas partes, tais que cinco décimos ou cinquenta por cento dos valores sejam menores e cinco décimos ou cinquenta por cento dos valores restantes maiores do que ele. Assim sendo, o quinto

34 decil é igual ao segundo quartil, que por sua vez é igual à mediana. O elemento que indica a ordem do quinto decil é igual ao elemento mediano, ou seja: Podemos, então, afirmar que E D5 = 5n 10 = n 2 = 2n 4 Md = D 5 = Q 2 De uma forma geral, para calcular os decis, recorreremos à seguinte expressão que define a ordem em que o decil se encontra: E Di = in 10 em que n indica o número de valores observados e i o número que identifica o decil a ser calculado. 2.5 Percentis ou Centis C i Neste caso, cada parte em que foram subdivididos os valores do conjunto, através dos noventa e nove centis, contará com um centésimo ou um por cento dos valores do conjunto. O elemento que definirá a ordem do centil, em uma distribuição de frequências de valores tabulados agrupados em classes, será encontrado pelo emprego da expressão: E Ci = in 100 em que i é o número indicador do centil e n é o número total de observações. É oportuno lembrar que os centis englobam todos os decis e quartis. Assim, por exemplo: 2.5.1 Vigésimo Centil: C 20 O vigésimo centil é igual ao segundo decil, por que

35 A fórmula de cálculo dos centis será: E C20 = 20n 100 = 0, 2n = E D 2 = 2n 10 = 0, 2n C i = l + h E C i F ant f Ci Exemplo:Na Tabela abaixo figuram os dados correspondentes ao consumo de eletricidade de 80 usuários. Calcular as seguintes medidas: Tabela 12: Distribuição do consumo de eletricidade i Classes f i 1 5 25 4 2 25 45 6 3 45 65 14 4 65 85 26 5 85 105 14 6 105 125 8 7 125 145 6 8 145 165 2 Total 13 i=1 f i 80 a) Trigésimo centil: C 30 b) Décimo quinto centil: C 15 c) Nono Decil: D 9 d) Septuagésimo quinto centil: C 75 e) Primeiro quartil: Q 1 2.6 Medidas de Dispersão As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. Consideraremos três medidas de dispersão:

36 DESVIO-PADRÃO VARIÂNCIA COEFICIENTE DE VARIAÇÃO 2.6.1 Desvio - Padrão Mede o grau de dispersão dos dados numéricos em torno de um valor médio. 1 - Desvio - padrão S: (Dados Brutos) Seja o seguinte conjunto de números x 1, x 2,..., x n. O desvio-padrão ou média quadrática dos desvios ou afastamentos em relação à média desse conjunto será definido por: S = n i=1 (x i x) 2 n 1 Exemplo: Calcular o desvio-padrão do conjunto 10, 12, 13, 20, 25, 34, 45. sabe-se que x = 22, 714 S = 1 7 1 7 (x i 22, 714) 2 = i=1 1 6 [(10 22, 714)2 +... + (45 22, 714) 2 ] S = 1 1007, 43 = 12, 958 6 2 - Desvio - padrão S: (Dados Tabulados) Quando os valores vierem dispostos em uma tabela de frequências, o cálculo do desvio-padrão se fará através da seguinte fórmula:

37 n S = i=1 (x i x) 2 f i n 1 Exemplo: Tabela 13: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i x i (x i x) (x i x) 2 (x i x) 2 f i 1 41 45 7 43-6,8 46,24 323,68 2 45 49 3 47-2,8 7,84 23,52 3 49 53 4 51 1,2 1,44 5,76 4 53 57 1 55 5,2 27,04 27,04 5 57 61 5 59 9,2 84,64 423,20 Total 5 i=1 f i 20 803,20 como x = 49, 80, portanto: S = 803, 20 20 1 = 42, 27 = 6, 5 2.6.2 Variância A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores a contar da média. A fórmula da variância poderá ser calculada de duas formas: POPULACIONAL, representada letra grega σ 2 AMOSTRAL, representada por S 2 1- Variância: (Dados não agrupados) σ 2 = n i=1 (x i µ) 2 N ou S 2 = n i=1 (x i x) 2 n 1

38 Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a variância deste conjunto de dados. como x = 7, 8 S 2 = (3 7, 8)2 + (7 7, 8) 2 + (8 7, 8) 2 + (10 7, 8) 2 + (11 7, 8) 2 5 1 = S 2 = 38, 4 4 = 9, 7 2 - Variância: (Dados Tabulados) Quando os valores vierem dispostos em uma tabela de frequências, o cálculo da variância se fará através da seguinte fórmula: σ 2 = n i=1 (x i µ) 2 f i N ou S 2 = n i=1 (x i x) 2 f i n 1 Exemplo: Tabela 14: Distribuição do número de alunos em 20 turmas da UFCG i Classes f i x i (x i x) (x i x) 2 (x i x) 2 f i 1 41 45 7 43-6,8 46,24 323,68 2 45 49 3 47-2,8 7,84 23,52 3 49 53 4 51 1,2 1,44 5,76 4 53 57 1 55 5,2 27,04 27,04 5 57 61 5 59 9,2 84,64 423,20 Total 5 i=1 f i 20 803,20

39 como x = 49, 80 e S = 6, 5, portanto S 2 = 803, 20 19 = 42, 27 2.6.3 Coeficiente de Variação Trata-se de uma média relativa à dispersão, útil para a comparação e observação em termos relativos do grau de concentração em torno da média de séries distintas.é dado por: CV = S x 100 Classificação da distribuição quanto à dispersão: Dispersão Baixa: CV 15% Dispersão Média: 15% < CV < 30% Dispersão Alta: CV 30% Exemplo:1 Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então: Sexo Masculino: CV = 1.500 100 = 37, 5% 4.000 Sexo Feminino: CV = 1.200 100 = 40% 3.000

40 2.7 Exercícios 1. Classifique as seguintes variáveis como Qualitativas ou Quantitativas (discretas ou contínuas). a) Número de computadores em um laboratório de informática b) Renda familiar c) Volume de Petróleo extraído por hora de uma jazida d) Grupo Sanguíneo e) Qualidade de uma peça produzida f) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de "nao sei") g) Precipitação pluviométrica h) Magnitude de um sismo, na escala Richter i) Tipo de grão de híbrido de milho j) Número de vargens por planta 2. Os dados abaixo referem-se a resistência à ferrugem de 32 híbridos de milho recomendados para a região de Chapecó, SC, safra 1987/88 Tabela 15: Distribuição de frequências da resistência à ferrugem de 32 híbridos de milho recomendados para a região de Chapecó, SC, safra 1987/88 Resistência à f i ferrugem r 10 mr 6 ms 9 s 7 Obtenha as frequências relativas f ri e construa um gráfico de barras para representar esses dados. 3. As fases principais do método estatístico são: a) Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica e definição dos problemas. b) Amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento.

41 c)definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados. 4. Os dados abaixo referem-se a 12 áreas plantadas de soja na safra de verão em milhões de hectares. 9,7 11,5 13,2 10,7 13,2 9,7 11,6 9,8 13,0 10,4 11,3 13,2 Determine: a) a média, a moda e a mediana das áreas plantadas de soja. b) O desvio padrão, a variância e o coeficiente de variação. 5. Dada a tabela abaixo Tabela 16: Produção agrícola na Paraíba em milhões de Reais, 2004-2009 Ano Produção em milhões de R$ 2004 4,5 2005 5,3 2006 4,9 2007 5,1 2008 6,8 2009 7,1 Construa um gráfico mais apropriado para os dados da tabela. 6. Os dados abaixo relacionados representam o número de focos de incêndios detectados por satélite entre os Estados da Paraíba e Pernambuco nos primeiros 16 dias de Novembro de 2010. 13 18 9 10 6 11 10 14 10 11 15 12 14 8 13 7 Calcular a Média, a Moda, a Mediana, o Desvio padrão, a variância e coeficiente de variação de forma direta (sem construir tabela) dos dados acima. 7. Os dados abaixo referem-se ao consumo de água, em m 3, de 40 famílias de baixa renda de uma determinada cidade no mês de Julho de 2011.

42 f ri Faixa de consumo 10 15 0,10 15 20 0,15 20 25 0,30 25 30 0,25 30 35 0,15 35 40 0,05 a) Obtenha as frequências simples absolutas e construa o histograma. b) Calcule a média, a variância e o desvio padrão. c) Calcule a mediana e a moda d) Qual o percentual de famílias que consumiram pelo menos 25 m 3 de água? 8. Um estudo foi realizado por um professor em três turmas, obtendo a média e o desvio padrão das notas de sua disciplina, conforme abaixo. Qual a turma com menor variabilidade? Justifique adequadamente. Turma A B C Média 6,5 8,0 8,0 Desvio Padrao 2,2 1,7 2,0 9. Quarenta alunos da UFCG foram questionados quanto ao número de livros lidos no ano anterior. Foram registrados os seguintes valores: 4 2 1 0 3 1 2 0 2 1 0 2 1 1 0 4 3 2 3 5 8 0 1 6 5 3 2 1 6 4 3 4 3 2 1 0 2 1 0 3 a) Organize os dados em uma tabela adequada. b) Qual o percentual de alunos que leram menos do que 3 livros. c) Qual o percentual de alunos que leram 4 ou mais livros. d) Calcule a média, a moda e a mediana e) Calcule o desvio padrão, a variância e o coeficiente de variação. 10. (UFPB - 2011)A tabela a seguir apresenta a quantidade exportada de certo produto, em milhares de toneladas, no período de 2000 a 2009.

43 Considerando os dados apresentados na tabela, identifique as afirmativas corretas: I. A quantidade exportada, de 2006 a 2008, foi crescente. II. A média da quantidade exportada, de 2003 a 2006, foi de 53 mil toneladas. III. A moda da quantidade exportada, de 2000 a 2009, foi de 52 mil toneladas. IV. A média da quantidade exportada, de 2000 a 2004, foi maior que a média de 2005 a 2008. V. A mediana da quantidade exportada, de 2000 a 2009, foi de 51 mil toneladas. 11. (UFPB - 2002) O gráfico ao lado mostra a porcentagem de acertos nas questões de um concurso onde havia 12000 inscritos. Com base nos dados apresentados, determine a quantidade de candidatos que acertou pelo menos duas questões. 12. Complete a tabela e indique a mediana da amostra.

44 x i f i F i f ri 1 2 0,025 2 12 3 58 4 0,2 5 13. De um exame final de Estatística, aplicado a 50 alunos da UFCG em 2011 resultaram as seguintes notas: 4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2 5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9 8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3 9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,8 9,9 Construa uma tabela de distribuição de frequências com intervalo de classe por meio da regra de Sturges. Calcule a média, a moda, a mediana, o desvio padrão e o coeficiente de variação das notas após os dados estarem tabulados por classe.

45 3 Probabilidade: Espaço amostral e eventos 3.1 Experimentos Aleatórios 3.1.1 Tipos de fenômenos Fenômenos determinísticos: são aqueles em que os resultados são sempre os mesmos, qualquer que seja o número de ocorrências verificadas. Fenômenos aleatórios: são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Exemplos: Lançamento de uma moeda honesta; Lançamento de um dado; Retirada de uma carta de um baralho completo com 52 cartas; Determinação da vida útil de um componente eletrônico. 3.2 Espaço Amostral Define-se espaço amostral (Ω) ao conjunto de todos os resultados possíveis de um experimento. Nos exemplos citados anteriormente, os espaços amostrais são:

46 Ω = {c, r} ; Ω = {1, 2, 3, 4, 5, 6} ; Ω = {A o,..., K o, A p,..., K p, A c,..., K c, A e,..., K e } ; Ω = {t R/t 0}. 3.3 Eventos Chamamos de evento (E) a qualquer subconjunto do espaço amostral Ω de um experimento aleatório. Qualquer que seja o evento E, se E Ω, então E é um evento de Ω. Se E = Ω, E é chamado evento certo Se E Ω e E é um conjunto unitário, E é chamado evento elementar. Se E = φ, E é chamado evento impossível. 3.4 Classe dos eventos aleatórios Definição: é o conjunto formado de todos os eventos (subconjuntos) do espaço amostral. Para efeito de exemplo, consideremos o espaço amostral finito: Ω = {e 1, e 2, e 3, e 4 }. A classe dos eventos aleatórios é: φ {e 1 }, {e 2 }, {e 3 }, {e 4 } F (Ω) = {e 1, e 2 }, {e 1, e 3 }, {e 1, e 4 }, {e 2, e 3 }, {e 2, e 4 }, {e 3, e 4 } {e 1, e 2, e 3 }, {e 1, e 2, e 4 }, {e 1, e 3, e 4 }, {e 2, e 3, e 4 } {e 1, e 2, e 3, e 4 }

47 Genericamente, se o número de pontos amostrais de um espaço amostral é n, então o número de eventos de F é 2 n. 3.5 Operações com eventos Aleatórios Considere um espaço amostral finito Ω = {e 1, e 2,..., e n }. Sejam A e B dois eventos de F (Ω). As seguintes operações são definidas. União Definição: A B = {e i Ω/e i A ou e i B}, i = 1,..., n. Portanto, o evento união é formado pelos pontos amostrais que pertençam a pelo menos um dos conjuntos. Figura 1: A B Observações: 1) A B = B A 2) A A = A 3) A φ = A 4) Se A B A B = B (em particular A Ω = Ω)

48 Intersecção Definição: A B = {e i Ω/e i A e e i B}, i = 1,..., n. Portanto, o evento intersecção é formado pelos pontos amostrais que pertença simultâneamente aos eventos A e B. Figura 2: A B Observações: 1) A B = B A 2) A A = A 3) A φ = φ 4) Se A B A B = A (em particular A Ω = A) 5) (A B) C = A (B C) Complementação Definição: Ω A = Ā = Ac = {e i Ω/e i / A}, i = 1,..., n. O complemento de um evento A é, portanto, o evento contendo todos os resultados no espaço amostral Ω que não pertençam a A. Observações: 1) (A c ) c = A 2) A A c = Ω 3) φ c = Ω 4) A A c = φ

49 Figura 3: Ā = A c 5) Ω c = φ Exemplo: Lançam-se duas moedas. Sejam A: saída de faces iguais e B: saída de cara na primeira moeda. Determinar os eventos: A B, A B, A c, B c, (A B) c, (A B) c, A c B c, A c B c, B A, A B, A c B e B c A. 3.6 Propriedades das operações Sejam A, B e C eventos associados a um espaço amostral Ω. As seguintes propriedades são válidas: a) IDEMPOTENTES A A = A A A = A b) COMUTATIVAS A B = B A A B = B A c) ASSOCIATIVAS A (B C) = (A B) C A (B C) = (A B) C

50 d) DISTRIBUTIVAS A (B C) = (A B) (A C) A (B C) = (A B) (A C) e) ABSORÇÕES A (A B) = A A (A B) = A f) IDENTIDADES A Ω = A A Ω = Ω A φ = φ A φ = A g) COMPLEMENTARES Ω c = φ φ c = Ω A A c = φ A A c = Ω (A c ) c = A h) "LEIS DAS DUALIDADES"ou "LEIS DE MORGAN" (A B) c = A c B c (A B) c = A c B c 3.7 Partição de um Espaço Amostral Definição: Dizemos que os eventos A 1, A 2,..., A n formam uma partição do espaço amostral Ω se: a) A i φ, i = 1,..., n

51 Figura 4: Partição de um Espaço Amostral. b) A i A j = φ para i j c) n i=1a i = Ω 3.8 Eventos Mutuamente Exclusivos ou Disjuntos Definição: Dois eventos ditos mutuamente exclusivos ou disjuntos se A e B não puderem ocorrer juntos, ou seja, a realização de um exclui a realização do outro. Segue que A e B são disjuntos se A B = φ. Figura 5: Eventos Mutuamente Exclusivos ou Disjuntos.

52 3.9 Exercícios 1. Quais das seguintes relações são verdadeiras? (a)(a B) (A C) = A (B C). (b) (A B) = (A B) B. (c) A B = A B. (d) (A B) C = A B C. (e) (A B) (B C) = φ. 2. Lançam-se três moedas. Enumerar o espaço amostral e os eventos: (a) faces iguais; (b) cara na primeira moeda; (c) coroa na segunda e terceira moedas.

53 4 Probabilidade: Definições 4.1 Definição Clássica de Probabilidade Dado um experimento aleatório, sendo Ω o seu espaço amostral, vamos admitir que todos os elementos de Ω tenham a mesma chance de acontecer, ou seja, que Ω é um conjunto equiprovável. Define-se probabilidade de um evento A (A Ω) ao número real P (A), tal que: P (A) = número de resultados favoráveis a A número de resultados possíveis = n(a) n(ω) 4.2 Definição Axiomática de Probabilidade Para um dado experimento, é necessário atribuir para cada evento A no espaço amostral Ω um número P (A) que indica a probabilidade de A ocorrer. Para satisfazer a definição matemática de probabilidade, este número P (A) deve satisfazer três axiomas específicos: Axioma 1: Para qualquer evento A, P (A) 0. Axioma 2: P (Ω) = 1. Axioma 3: Para qualquer sequência finita de eventos disjuntos A 1, A 2,..., A n ( n ) P A i = i=1 n P (A i ) i=1

54 4.2.1 Propriedades P.1 - P (φ) = 0 P.2 - Para qualquer sequência infinita de eventos disjuntos A 1, A 2,... ( ) P A i = i=1 P (A i ) i=1 P.3 - Para qualquer evento A, P (A c ) = 1 P (A) P.4 - Para qualquer evento A, 0 P (A) 1. P.5 - Se A B, então P (A) P (B). P.6 - Para qualquer evento dois eventos A e B P (A B) = P (A) + P (B) P (A B) P.7 - Se os eventos A 1, A 2,..., A n formam uma partição do espaço amostral, então: n P (A i ) = 1 i=1 Exemplo 1: Considere o lançamento de dois dados, sendo os eventos A = {soma dos números igual a 9}, B = {número do primeiro dado maior ou igual a 4} e C = {soma dos números menor ou igual a 4}. Enumere os elementos de A, B, C, A B e A C. Obtenha P (A B) e P (A C)

55 4.3 Eventos Independentes Suponha que dois eventos A e B ocorram independentes um do outro no sentido que a ocorrência ou não de um deles tenha nenhuma relação e nenhuma influência na ocorrência ou na não ocorrencia do outro. Nessas condições P (A B) = P (A) P (B) Definição: Dois eventos são independentes se P (A B) = P (A) P (B). Problema Sejam A e B eventos tais que P (A) = 0, 2, P (B) = P, P (A B) = 0, 6. Calcular P considerando A e B: a) Mutuamente exclusivos; b) independentes. Resolução a) P (A B) = 0 como P (A B) = P (A) + P (B) P (A B) vem 0, 6 = 0, 2 + p 0 P = 0, 4 b) P (A B) = P (A) P (B) = 0, 2 P como P (A B) = P (A) + P (B) P (A B) vem 0, 6 = 0, 2 + P 0, 2P 0, 4 = 0, 8P logo, P = 0, 5 4.4 Probabilidade Condicional Se A e B são dois eventos, a probabilidade de A ocorrer, depois B ter acontecido, é representada por P (A/B) (Probabilidade de A dado B) e é denominada probabilidade condicional de A, depois de B ter ocorrido. É portanto natural definir-se a probabilidade condicional P (A/B) como a proporção

56 da probabilidade total P (B) que é representada pela probabilidade P (A B). Portanto, tem-se a seguinte definição P (A/B) = P (A B), dado P (B) > 0 P (B) Se P (B) = 0 a P (A/B) não é definida ou, equivalentemente P (B/A) = P (A B), dado P (A) > 0 P (A) Se P (A) = 0 a P (B/A) não é definida. Tiramos da definição da probabilidade condicional o chamado TEOREMA DO PRO- DUTO: Sejam A Ω e B Ω. Então, P (A B) = P (B) P (A/B) ou P (A B) = P (A) P (B/A). Exemplo: Um grupo de 86 pessoas está assim formado: Escolhendo-se, ao acaso, uma pessoa do grupo, qual a probabilidade de que seja: a) Uma mulher que fez o curso de medicina? b) Uma pessoa que fez o curso de medicina? c) Um engenheiro dado que seja homem? d) Não ser médico dado que não seja homem? 4.5 Probabilidade Total Seja Ω o espaço amostral de um experimento, e considere K eventos A 1, A 2,..., A k em Ω tal que A 1, A 2,..., A k sejam disjuntos e k i=1 A i = Ω. Diz-se, então, que estes