ESTATÍSTICA DESCRITIVA



Documentos relacionados
CAPÍTULO 5 - INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE li

O erro da pesquisa é de 3% - o que significa isto? A Matemática das pesquisas eleitorais

Séries de Potências AULA LIVRO

Capitulo 6 Resolução de Exercícios

CAPÍTULO 8 - Noções de técnicas de amostragem

1.4- Técnicas de Amostragem

Introdução ao Estudo de Sistemas Lineares

ActivALEA. ative e atualize a sua literacia

CAP. I ERROS EM CÁLCULO NUMÉRICO

Módulo 4 Matemática Financeira

Carteiras de Mínimo VAR ( Value at Risk ) no Brasil

Faculdade de Engenharia Investigação Operacional. Prof. Doutor Engº Jorge Nhambiu

Lista 9 - Introdução à Probabilidade e Estatística

Jackknife, Bootstrap e outros métodos de reamostragem

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ...

AMOSTRAGEM. metodologia de estudar as populações por meio de amostras. Amostragem ou Censo?

Os juros compostos são conhecidos, popularmente, como juros sobre juros.

VII Equações Diferenciais Ordinárias de Primeira Ordem

PRESTAÇÃO = JUROS + AMORTIZAÇÃO

Capítulo 2 Análise Descritiva e Exploratória de Dados

A seguir, uma demonstração do livro. Para adquirir a versão completa em papel, acesse:

Prof. Eugênio Carlos Stieler

Sistema Computacional para Medidas de Posição - FATEST

Curso MIX. Matemática Financeira. Juros compostos com testes resolvidos. 1.1 Conceito. 1.2 Período de Capitalização

PROBABILIDADES E ESTATÍSTICA

PG Progressão Geométrica

Conceito 31/10/2015. Módulo VI Séries ou Fluxos de Caixas Uniformes. SÉRIES OU FLUXOS DE CAIXAS UNIFORMES Fluxo de Caixa

Profa. Regina Maria Sigolo Bernardinelli. Estatística. Gestão Financeira / Gestão de Recursos Humanos / Logística / Marketing

DISTRIBUIÇÃO AMOSTRAL DA MÉDIA E PROPORÇÃO ESTATISTICA AVANÇADA

INTRODUÇÃO A TEORIA DE CONJUNTOS

Capitulo 9 Resolução de Exercícios

Juros Simples e Compostos

Analise de Investimentos e Custos Prof. Adilson C. Bassan adilsonbassan@adilsonbassan.com

Universidade Federal do Maranhão Centro de Ciências Exatas e Tecnologia Coordenação do Programa de Pós-Graduação em Física

Problema de Fluxo de Custo Mínimo

Matemática. Resolução das atividades complementares. M10 Progressões. 1 (UFBA) A soma dos 3 o e 4 o termos da seqüência abaixo é:

Estatística stica para Metrologia

somente um valor da variável y para cada valor de variável x.

Guia do Professor. Matemática e Saúde. Experimentos

Resposta: L π 4 L π 8

Tabela Price - verdades que incomodam Por Edson Rovina

Fundamentos de Bancos de Dados 3 a Prova

Lista de Exercícios #4. in Noções de Probabilidade e Estatística (Marcos N. Magalhães et al, 4ª. edição), Capítulo 4, seção 4.4, páginas

Análise de Projectos ESAPL / IPVC. Critérios de Valorização e Selecção de Investimentos. Métodos Estáticos

APOSTILA MATEMÁTICA FINANCEIRA PARA AVALIAÇÃO DE PROJETOS

Computação Científica - Departamento de Informática Folha Prática 1

Matemática Financeira Aplicada

5. A nota final será a soma dos pontos (negativos e positivos) de todas as questões

CURTOSE. Teremos, portanto, no tocante às situações de Curtose de um conjunto, as seguintes possibilidades:

A TORRE DE HANÓI Carlos Yuzo Shine - Colégio Etapa

CAPÍTULO 5 CIRCUITOS SEQUENCIAIS III: CONTADORES SÍNCRONOS

M = 4320 CERTO. O montante será

Prova 3 Matemática ... GABARITO 1 NOME DO CANDIDATO:

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE TRANSPORTES E GESTÃO TERRITORIAL PPGTG DEPARTAMENTO DE ENGENHARIA CIVIL ECV

PARECER SOBRE A PROVA DE MATEMATICA FINANCEIRA CAGE SEFAZ RS

defi departamento de física

SUMÁRIO 1. AMOSTRAGEM Conceitos básicos 4

JUROS COMPOSTOS. Questão 01 A aplicação de R$ 5.000, 00 à taxa de juros compostos de 20% a.m irá gerar após 4 meses, um montante de: letra b

Faculdade Campo Limpo Paulista Mestrado em Ciência da Computação Complexidade de Algoritmos Avaliação 2

UFRGS MATEMÁTICA

Portanto, os juros podem induzir o adiamento do consumo, permitindo a formação de uma poupança.

MATEMÁTICA FINANCEIRA

5- CÁLCULO APROXIMADO DE INTEGRAIS 5.1- INTEGRAÇÃO NUMÉRICA

a taxa de juros i está expressa na forma unitária; o período de tempo n e a taxa de juros i devem estar na mesma unidade de tempo.

APONTAMENTOS DE ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA

Demonstrações especiais

Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais

A soma dos perímetros dos triângulos dessa sequência infinita é a) 9 b) 12 c) 15 d) 18 e) 21

Neste capítulo, pretendemos ajustar retas ou polinômios a um conjunto de pontos experimentais.

1.5 Aritmética de Ponto Flutuante

O oscilador harmônico

2.1 Dê exemplo de uma seqüência fa n g ; não constante, para ilustrar cada situação abaixo: (a) limitada e estritamente crescente;

M = C (1 + i) n. Comparando o cálculo composto (exponencial) com o cálculo simples (linear), vemos no cálculo simples:

ANDRÉ REIS MATEMÁTICA. 1ª Edição NOV 2013

Projetos Agropecuários - Módulo 4 ANÁLISE FINANCEIRA DE INVESTIMENTO

Otimização e complexidade de algoritmos: problematizando o cálculo do mínimo múltiplo comum

Fundamentos de Bancos de Dados 3 a Prova

Aula 7. Em outras palavras, x é equivalente a y se, ao aplicarmos x até a data n, o montante obtido for igual a y.

CPV seu Pé Direito no INSPER

INTERPOLAÇÃO. Interpolação

EQUAÇÕES DIFERENCIAIS LINEARES DE ORDEM N

Aplicação de geomarketing em uma cidade de médio porte

Instituto de Engenharia de Produção & Gestão

Questão 11. Questão 13. Questão 12. Questão 14. alternativa B. alternativa E. alternativa A

MATEMÁTICA APLICADA À GESTÃO I

Probabilidades. José Viegas

Lista 2 - Introdução à Probabilidade e Estatística

Matemática Alexander dos Santos Dutra Ingrid Regina Pellini Valenço

Matemática Ficha de Trabalho

MATEMÁTICA FINANCEIRA

1.1 Comecemos por determinar a distribuição de representantes por aplicação do método de Hondt:

Fundamentos de Bancos de Dados 3 a Prova

Exercícios de Matemática Polinômios

O poço de potencial infinito

37ª OLIMPÍADA BRASILEIRA DE MATEMÁTICA PRIMEIRA FASE NÍVEL 3 (Ensino Médio) GABARITO

INE ESTATÍSTICA APLICADA I - TURMA GABARITO LISTA DE EXERCÍCIOS SOBRE AMOSTRAGEM E PLANEJAMENTO DA PESQUISA

COLÉGIO ANCHIETA-BA. ELABORAÇÃO: PROF. ADRIANO CARIBÉ e WALTER PORTO. RESOLUÇÃO: PROFA, MARIA ANTÔNIA C. GOUVEIA

FACULDADE DE ADMINISTRAÇÃO E NEGÓCIOS DE SERGIPE

Transcrição:

COORDENADORIA DE MATEMÁTICA ESTATÍSTICA DESCRITIVA Vitória - ES

CAPÍTULO I 1-UM BREVE HISTÓRICO Pesquisas arqueológicas idicam que há 3000 aos A.C. já se faziam cesos a Babilôia, Chia e Egito. Até mesmo o 4º livro do Velho Testameto faz referêcia a uma istrução dada a Moisés, para que fizesse um levatameto dos homes de Israel que estivessem aptos para guerrear. Outro registro bíblico, iforma que o Imperador César Augusto, ordeou que se fizesse o Ceso de todo o Império Romao. Usualmete, estas iformações eram utilizadas para a taxação de impostos ou para o alistameto militar. Cotudo, mesmo que a prática de coletar dados sobre colheitas, composição da população humaa ou de aimais, impostos, etc., fosse cohecida pelos egípcios, hebreus, caldeus e gregos, e se atribuam a Aristóteles ceto e oiteta descrições de Estados, apeas o século XVII a Estatística passou a ser cosiderada disciplia autôoma, tedo como objetivo básico a descrição dos BENS do Estado. As palavras ceso e estatística, que são comumete usadas o trato das aalises de dados estatísticos, tem origem o lati. Ceso, que é derivado da palavra cesere, sigifica taxar, e estatística, derivada de status, sigifica estado. Um fato histórico relevate do uso da estatística foi atribuído a Florece Nightigale (1801910), cohecida por muitos como a fudadora da profissão de efermeiro. Ela salvou milhares de vidas utilizado a estatística. Ao ecotrar um hospital em más codições saitárias e sem suprimetos, tratou de melhorar estas codições e passou a utilizar a estatística para covecer as autoridades da ecessidade de uma reforma médica mais ampla. Ela elaborou gráficos para mostrar que durate a guerra da Criméia, morreram mais soldados em coseqüêcia das más codições saitárias do que em combate. Florece Nightigale é cosiderada uma das pioeiras a estatística social e as técicas de utilização de gráficos estatísticos. JÁ o Brasil, só se pode falar realmete sobre estatística a partir do império,quado foi realizado o primeiro ceso, em 187, e mais precisamete com a fudação do IBGE em 1936 em que os levatametos estatísticos gaharam regularidade e mais apoio do estado. Ates disto, o período coloial, a determiava Coroa os Portuguesa levatametos era quem populacioais,

realizados precariamete, com o objetivo maior de "cohecer a população livre e adulta apta a ser usada a defesa do território". Atualmete, a estatística está cosolidada com um poderoso istrumeto da pesquisa cietifica através do desevolvimeto técicas de coleta, orgaização e aalise de dados, que estão se torado cada vez mais sofisticadas com surgimeto de poderosos softwares de tratameto de dados. APLICAÇÕES Você já parou para pesar o quato a Estatística está presete em vários aspectos de osso cotidiao? Nas pesquisas que medem a popularidade dos políticos, a apuração de resultados de pesquisas e cesos, a medição da audiêcia de um programa de televisão ou a aálise dos idicadores ecoômicos. Em todas essas situações, a Estatística é ecessária. Já os estudos acadêmicos ela tem importâcia capital para validar as pesquisas as diversas áreas do cohecimeto, o que tora o seu estudo multidiscipliar: a mesma aálise estatística de dados de um físico poderia também ser usado por um ecoomista, agrôomo, químico, geólogo, matemático, biólogo, sociólogo psicólogo e cietista político. Mesmo que as iterpretações dessas aálises sejam diferetes devido as difereças etre as áreas do cohecimeto, os coceitos empregados, as limitações das técicas e as coseqüêcias dessas iterpretações são essecialmete as mesmas. 3- RAMOS DA ESTATÍSITICA De forma geral o estudo da Estatística se divide em três ramos: a, que icluem técicas que dizem respeito à sítese e a descrição de dados; a probabilidade, que icluem técicas que aalisam situações que evolvem o acaso e a iferêcia que icluem técicas que dizem respeito a aalise e a iterpretação de dados amostrais. 4- A PESQUISA E A ESTATÍSTICA São iúmeros os coceitos sobre pesquisa. Vários estudiosos, os diferetes campos do cohecimeto humao estabelecem o sigificado desta palavra de acordo com o objetivo de seu estudo. Segudo o dicioário Aurélio, o coceito geral é: a ivestigação e estudo, miudetes e sistemáticos, com o fim de descobrir ou estabelecer fatos ou pricípios relativos a um campo qualquer do cohecimeto. 3

4.1. TIPOS DE PESQUISA Os critérios para a classificação dos tipos de pesquisa variam de acordo com o efoque dado pelo autor, pois esta divisão obedece a iteresses, codições, campos, metodologia, situações, objetivos e objetos de estudo. Neste trabalho vamos defiir os seguites tipos de pesquisa: 1) Pesquisa pura ou fudametal. É aquela que procura o progresso cietífico, ampliação de cohecimetos teóricos, sem a preocupação de utilizá-los a prática. Tem por meta o cohecimeto pelo cohecimeto. ) Pesquisa aplicada. Como o próprio ome idica, caracteriza-se por seu iteresse prático, isto é, que os resultados sejam aplicados ou utilizados, imediatamete, a solução de problemas que ocorrem a realidade. 4.. CARACTERÍSTICAS DE UMA PESQUISA Para que uma pesquisa seja bem plaejada e chegue a resultados satisfatórios é importate que obedeça algumas características básicas: - O procedimeto deve ser sistematizado. - Explorações deve ser técica, sistemática e exata. - Exploração deve ser lógica e objetiva. - Orgaização quatitativa dos dados. - Relato e registro meticuloso e detalhado da pesquisa. 4.3. FASES DA PESQUISA 1) Escolha do tema. Na escolha de um tema a ser pesquisado deve se levar em cota algus aspectos: cosoâcia com as aptidões do pesquisador, mereça ser ivestigado cietificamete e que teha codições de ser formulado e delimitado em fução da pesquisa. ) Levatameto dos dados. Devem ser utilizados três procedimetos básicos: pesquisa documetal, pesquisa bibliográfica e cotatos diretos. 3) Formulação do problema. Defiir um problema sigifica especificá-lo em detalhes precisos e exatos. Na formulação do problema deve haver clareza, cocisão e objetividade. 4) Defiição dos termos. Devem ser claros, compreesivos, objetivos e adequados. 5) Costrução de hipóteses. A hipótese é uma proposição que se faz a tetativa de verificar a validade de resposta existete para um problema. A sua fução a pesquisa cietífica é propor explicações para certos fatos e ao mesmo tempo orietar a busca de outras iformações. 4

6) Idicações de variáveis. Ao se colocar o problema e a hipótese, deve ser feita também a idicação das variáveis, que devem ser defiidas com clareza e objetividade e de forma operacioal. As variáveis (dados) estatísticas podem ser divididos me dois grupos: a) Qualitativos: que se distiguem por características ão uméricas, tais com sexo, marca de um determiado produto, etc. b) Quatitativos: cosistem em úmeros que represetam cotages ou medidas. Estes úmeros podem ser divididos em dois grupos: os dados discretos, que resultam de um cojuto fiito de valores, ou um cojuto eumerável destes valores, e os dados cotíuos que resultam de um úmero ifiito de valores possíveis, que podem ser associados a potos em uma escala cotiua de tal maeira que ão haja lacuas ou iterrupções. Para facilitar o etedimeto destes dois grupos de dados e só levar em cosideração que os dados que represetam cotagem são discretos, e os que represetam medida são cotíuos. Assim, o úmero de aluos de uma determiada faculdade costituem dados discretos, já o peso destes aluos costituem um dado cotíuo. 7) Delimitação da pesquisa. Após a escolha do assuto, o pesquisador pode decidir ou pelo estudo de todo o uiverso da pesquisa ou sobre uma amostra. Aqui vamos falar um pouco mais do que costitui um uiverso e uma amostra. Uma população estatística ou uiverso estatístico é a deomiação que se da a todos os etes portadores de pelo meos uma característica comum. Assim, os estudates, por exemplo, costituem uma população, pois apresetam pelo meos uma característica comum: são todos que estudam. Como em qualquer estudo estatístico temos em mete pesquisar uma ou mais características dos elemetos de uma população, esta característica deve estar perfeitamete defiida. E isto se dá quado: cosiderado um elemeto qualquer, podemos afirmar, sem ambigüidades, se esse elemeto pertece ou ão à população. É ecessário, portato, existir um critério de costituição da população, válido para qualquer pessoa, o tempo ou o espaço. Na maioria das vezes, por impossibilidade ou iviabilidade ecoômica ou temporal, limitamos as observações referetes a uma determiada pesquisa a apeas uma parte da população. A essa parte proveiete da população em estudo deomiamos amostra. Assim uma amostra é um subcojuto fiito de uma população. A estatística Idutiva tem por objetivos tirar coclusões sobre as populações, com base em resultados verificados em amostras retiradas dessa população. Mas, para as iferêcias serem corretas, é ecessário garatir que a amostra seja represetativa da população, ou seja, ela deve possuir a mesma característica básica da população, o que diz respeito ao feômeo que desejamos pesquisar. É preciso, pois, que a amostra ou as amostras que vão ser usadas sejam obtidas por processos adequados. 5

Na coleta de uma amostra, o pesquisador deve ficar ateto para as técicas de amostragem, que garata quato possível, o acaso a escolha. Desta forma, cada elemeto da população passa a ter a mesma chace de ser escolhido, o que garate à amostra o caráter de represetatividade, pois ossas coclusões relativas à população vão ser baseadas os resultados obtidos as amostras dessa população. A seguir vamos descrever os pricipais tipos de amostrages; a) Amostragem casual ou aleatória simples Este tipo de amostragem é equivalete a um sorteio lotérico. Na prática, a amostragem casual ou aleatória simples, pode ser realizada umerado-se a população de um até e sorteado-se, a seguir, por meio de um dispositivo aleatório qualquer k úmeros dessa seqüêcia, os quais correspoderão aos elemetos pertecetes à amostra. b) Amostragem proporcioal estratificada Muitas vezes a população se divide em sub-populações estratos. Como é provável que a variável em estudo apresete, de estrato em estrato, um comportameto heterogêeo e, detro de cada estrato, um comportameto homogêeo, covém que o sorteio de elemetos da amostra leve em cosideração tais estratos. Assim, quado empregamos a amostragem proporcioal estratificada, cosideramos a existêcia dos estratos e obtemos os elemetos da amostra proporcioal ao úmero de elemetos dos mesmos. Exemplo: Supoha que oveta aluos de uma turma, 54 sejam meios e 36 sejam meias. E desejamos estudar a variável estatura dos aluos dessa turma. Como a estatura é difereciada para cada sexo, vamos etão obter uma amostra proporcioal estratificada, colhedo uma amostra de 10% da população. Sexo M População 54 F 36 Total 90 10% 10 x54 = 5,4 100 10 x36 = 3,6 100 10 x90 = 9,0 100 amostra 5 4 9 Tomado as iformações da tabela acima, sorteiam-se aleatoriamete 5 aluos do sexo masculio e 4 aluos do sexo femiio, formado assim uma amostra proporcioal estratificada de 10% da população. 6

c) Amostra sistemática Quado os elemetos da população já estão ordeados ão há ecessidade de costruir o sistema de referêcia. São exemplos: os protuários médicos de um hospital, os prédios de uma rua, as lihas de produção etc. Nesses casos, a seleção dos elemetos que costituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem deomiamos sistemática. Exemplo: Supohamos uma rua cotedo ovecetos prédios, dos quais desejamos obter uma amostra formada de ciqüeta prédios. Podemos, este caso, usar o seguite procedimeto: como 900 = 18, escolhemos por sorteio casual um úmero de 1 a 18 50 (iclusive), que idicaria o primeiro elemeto sorteado para a amostra; os demais elemetos seriam periodicamete cosiderados de 18 em 18. Assim, se o úmero sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 40 prédio, o 0, o 400 etc., até voltarmos ao iício da rua pelo lado esquerdo. 8) Seleção métodos e técicas. Os métodos e as técicas a serem empregados em uma pesquisa cietifica podem ser selecioados desde a proposição do problema, da formulação das hipóteses de delimitação do uiverso ou amostra. A seleção istrumetal metodológica está, portato, diretamete relacioada com o problema a ser estudado, e a escolha depederá dos fatores relacioados com a pesquisa. Tato os métodos quato as técicas devem adequar-se ao problema ser estudado, e uma ivestigação em geral uca se utiliza apeas um método e uma técica, mas sim todos aqueles que forem ecessários ou apropriados para um determiado caso. 9) Orgaização istrumetal da pesquisa. a orgaização do material de pesquisa, dois aspectos tem que ser levados em cosideração: Orgaização do material para a ivestigação e a orgaização de fatos e documetos que o ivestigador vem acumulado o trascurso de seus estudos. 10) Teste de istrumetos e procedimetos. Numa pesquisa, em sempre é possível prever todas as dificuldades e problemas que ocorreram e que evolva a coletas de dados, muitas vezes questioários, procedimetos ou istrumetos utilizados podem ão fucioar bem, assim, a aplicação de um pré-teste poderá evideciar possíveis erros e possibilitar a reformulação de falhas a elaboração da pesquisa. 7

4.4. EXECUÇÃO DA PESQUISA São as seguites as fases de execução de uma pesquisa: 1) Coleta de dados. Etapa da pesquisa em que se iicia a aplicação dos istrumetos elaborados e das técicas selecioadas, a fim de se efetuar a coleta dos dados previstos. ) Elaboração (tratameto) dos dados. Após a coleta os dados são elaborados e classificados de forma sistemática, e devem seguir os seguites passos: a) Seleção: Um exame miucioso dos dados a fim de detectar falhas ou erros, evitado iformações cofusas, distorcidas ou icompletas que podem prejudicar o resultado da pesquisa. b) Codificação: Técica operacioal utilizada para categorizar os dados que se relacioam mediate a uma codificação para trasformá-los em símbolos para poderem ser tabelados e cotados. c) Tabulação: Dispor os dados em tabelas, possibilitado maior facilidade a verificação das iter-relações etre eles. 3) Aalise e iterpretação dos dados. A aalise de dados é uma tetativa de evideciar as relações existetes etre o feômeo estudado e outros fatores, já a iterpretação é uma atividade itelectual que procura dar um sigificado mais amplo às respostas, viculadoas a outros cohecimetos. 4) Apresetação dos dados. A apresetação dos dados se da por meio de tabelas, quadros, gráficos, etc. 5) Coclusões. É a última fase do plaejameto e orgaização de uma pesquisa, que explica os resultados fiais cosiderados relevates. As coclusões devem ser viculadas à hipótese de ivestigação, cujo coteúdo foi comprovado ou refutado. A exposição geral da pesquisa, desde o plaejameto às coclusões, icluido os processos metodológicos empregados, devem ser apresetados em um relatório fial. 5-COMO ORGANIZAR OS DADOS ESTATÍSTICOS DE UMA PESQUISA Uma das formas de sitetizar os valores que uma ou mais variáveis podem assumir, para que tehamos uma visão global da variação dessa ou dessas variáveis, é apresetar esses valores em tabelas ou gráficos. 8

5.1- TABELAS COMPOSIÇÃO DE UMA TABELA De acordo com a Resolução 886 da Fudação IBGE, as células deve colocar: Um traço horizotal ( ) quado o valor é zero, ão só quato a atureza das coisas, como quato ao resultado do iquérito; Três potos ( ) quado ão temos dados; Um poto de iterrogação (?) quado temos dúvida quato à exatidão de determiado valor; Zero ( 0 ) quado o valor é muito pequeo para ser expresso pela uidade utilizada. Se os valores são expressos em umerais decimais, precisamos acrescetar à parte decimal um úmero correspodete de zeros ( 0,0; 0,00; 0,000;...). Algus Exemplos de Tabela 5.5.1-TABELA DE DUPLA ENTRADA Excesso de tempo aual em cogestioameto severo Computado as vias trasversais (passageiro x h) CIDADE AUTOMÓVEL Belo Horizote 6.063.141 Brasília 498.84 Campias 3.507.658 Curitiba.819.055 FONTE: Revista dos Trasportes Públicos ÔNIBUS 40.536.34.407.701.45.50.366.449 9

5.5.-DISTRIBUIÇÃO DE FREQUÊNCIA Número de horas extras de 0 motoristas de uma Empresa o período de 30 dias HORAS EXTRAS 0 ---------- 10 10 ---------- 0 0 ---------- 30 30 ---------- 40 40 ---------- 50 Total FONTE: Dados Fictícios NÚMERO DE MOTORISTAS 1 5 8 4 0 Orietações básicas para a costrução de uma tabela de distribuição de freqüêcia quado os dados são cotíuos 1) Determiar o itervalo dos dados ) Determiar o úmero K de classes, k úmero de observações,em geral, tomar o valor de k etre 5 e 15. 3) Calcular a amplitude de classe dividido o itervalo por k (itervalo/k), fazedo o arredodameto coveiete. 4) Certificar-se de que k vezes a amplitude é maior do que o itervalo, para evitar que valores extremos sejam excluídos. 5) Estabelecer limites de classe, rever os limites, que devem tocar-se, mas ão se iterceptar. 6) Distribuir os dados, determiado com que freqüêcia, eles aparecem detro de cada classe. 7) Rever a distribuição de forma a evitar que uma determiada classe teha freqüêcia zero. Exemplo: Os dados a seguir correspodem a estatura, em cm, de uma amostra de 40 aluos de uma determiada escola: 150 154 155 157 160 161 16 164 166 169 151 155 156 158 160 161 16 164 167 170 15 155 156 158 160 161 163 164 168 17 153 155 156 160 160 161 163 165 168 173 Costruido uma tabela de distribuição de freqüêcia para estes dados temos: 10

1) Determiar o itervalo de dados, amplitude total: AT=173 150 = 3 ) determiar o úmero de classe k= 40, cosidere o valor de k= 6 pois é o iteiro mais próximo. 3) Determiar a amplitude de classe h= AT 3 =, cosidere h = 4 que é o iteiro mais próximo k 6 4) Verificar se todos os dados estão icluídos k.h AT, ou seja 6.4 3 5) Costruir a tabela i ESTATURAS FREQÜENCIA FREQUÊNCIA 1 3 4 5 6 (cm) 150 ------154 154 ------158 158 ------16 16 ------166 166 ------170 170 ------174 Total 4 9 11 8 5 3 40 RELATIVA 0,100 0,5 0,75 0,00 0,15 0,075 1,000 5.- GRÁFICO É uma forma de apresetação de dados cujo objetivo é o de produzir o ivestigador ou o publico em geral, uma impressão mais rápida e viva do feômeo em estudo, já que os gráficos falam mais rápido à compreesão que as séries. Algus exemplos; 11

5..1-GRÁFICO DE LINHAS Fote: Folha de São Paulo 5..-GRÁFICO EM COLUNAS 1

5..3- GRÁFICO EM BARRAS MULTIPLAS 5..3-GRÁFICO DE SETORES 13

5.3.4-GRAFICO POLAR PRECIPITAÇÃO PLUVIOM ÉTRICA(mm) EM RECIFE -1993 jaeiro dezembro ovembro outubro 30 70 0 170 10 70 0 fevereiro março abril setembro maio agosto juho julho 5.3.5-PICTOGRAMA 14

5.3.6-HISTOGRAMA, POLIGONO DE FREQÜÊNCIA E CURVA DE FREQÜÊNCIA. Quado os dados estatísticos estão distribuídos em classe podemos utilizar três tipos de gráficos para represetar os dados: 1) HISTOGRAMA É um gráfico de coluas que retrata a distribuição de freqüêcia. Ele relacioa as classes com as suas respectivas freqüêcias. i ESTATURAS FREQUÊNCIA Poto médio de (cm) 1 3 4 5 6 classe (xi) 150 ------154 154 ------158 158 ------16 16 ------166 166 ------170 170 ------174 Total 4 9 11 8 5 3 40 15 156 160 164 168 17 11 freqüêcia 9 8 5 4 3 150 154 158 16 166 170 174 15 Estatura Freqüêcia calculada( 4,5 8,5 9,75 8 5,5,75 fci )

) POLIGONO DE FREQÜÊNCIA É um gráfico que relacioa os potos médio classe com as freqüêcias. freqüêcia 11 9 8 5 4 3 15 156 160 164 168 17 Estatura 3) CURVA DE FREQÜÊNCIA A curva de freqüêcia é uma curva suavizada do polígoo de freqüêcia. Para elimiar os bicos do polígoo de freqüêcia fazemos o cálculo de uma outra freqüêcia, chamada freqüêcia calculada, que leva em cosideração a ifluêcia das classes vizihas, através do cálculo da média poderada. fci = f at + f i + f post 4 Freqüêcia calculada 9,75 8,5 8 5,5 4,5,75 15 156 160 164168 17 16 Estatura

Obs: O polígoo de freqüêcia os iforma a situação real do feômeo estudado, equato a curva de freqüêcia iforma a tedêcia do feômeo. 6- MEDIDAS RELACIONADAS COM AS VARIÁVEIS QUANTITATIVAS 6.1.SOMATÓRIO Cosideremos a seguite soma idicada : 0 + + 4 + 6 + 8 + 10 + 1 + 14 +... + 100. Podemos observar que cada parcela é um úmero par e portato pode ser represetada pela forma, este caso, com variado de 0 a 50. Esta soma pode ser represetada 50 abreviadamete por:, que se lê: somatório de com variado de 0 a 50. A letra = 0 grega, que é o esse maiúsculo grego (sigma), é o sial de somatório e é usada para idicar uma soma de várias parcelas. Seja {a1, a, a3,, a } um cojuto de úmeros reais, o símbolo represeta a sua soma, isto é i= 1 Em i= 1 i= 1 a1 a1 = a1 + a + + a a1 a letra i é deomiada ídice do somatório (em seu lugar, pode figurar qualquer outra letra) e os valores 1 e, este caso, são deomiados, respectivamete, limites iferior e superior. 6.1.1-Número de parcelas de um somatório 17

6.1.-Propriedades de um somatório 1) Somatório de uma costate ) Somatório do produto de uma costate por uma variável 3) Somatório de uma soma algébrica 4) Separação do último termo 5) Separação do primeiro termo 18

6) Avaço dos limites 6. PRODUTÓRIO X i= X 1. X. X 3... X i=1 6..1 Propriedades do produtório 1) b=b.b.b...b=b NT, sedo NT o úmero de termos do produtório i=1 ) i=1 i=1 cx i=cx 1. cx. cx 3... cx =c X i 3) X i Y i = X 1 Y 1. X Y. X 3 Y 3... X y = X 1. X. X 3... X N Y 1. Y. Y 3...Y N = X i Y i i=1 i=1 4) i=1..3...=! i=1 5) log X i=log X 1. X. X 3... X =log X 1 logx log X 3... log X = logx i i=1 i=1 X i 0 19 i =1

6.3- MEDIDAS DE POSIÇÃO As medidas de posição, também chamadas de tedêcia cetral, costituem um procedimeto para a redução de dados estatísticos expressados por valores que se ecotram situados etre os extremos de uma série ou distribuição. Normalmete estas medidas tedem a se aproximar do cetro da distribuição. As três medidas mais comus são: a média, a mediaa e a moda. 6.3.1-A MÉDIA A média é a medida estatística mais popular e, portato, mais usada a iterpretação de dados. A média tem certas propriedades matemáticas iteressates e úteis, o que explica a sua maior importâcia como medida de tedêcia cetral. Na figura a seguir ilustramos a média, em um histograma, como o cetro de cojuto de dados, o setido de que é o poto de equilíbrio dos mesmos. Média Os tipos de média mais utilizada são: a média aritmética, a média geométrica e a média harmôica. Cada uma com especificidade para determiado tipo de dado. 1) Média aritmética Dos tipos de média a aritmética é a mais utilizada, em todo o resto deste texto será chamada simplesmete de média. A média de um cojuto de valores é o valor obtido somado-se todos eles e dividido-se o total pelo úmero de valores. X = xi, ode xi represeta o valor da variável i, e é o úmero de vezes que ela aparece. Exemplo: Calcular a média dos seguites dados: 0, 80, 40, 60, 50 X = 0 + 80 + 40 + 50 + 60 = 50 5 0

Quado os dados estão tabulados, calcula-se a média utilizado a fórmula X = fx f i i, fi é freqüêcia da variável xi. i Criam-se as coluas, xi que represeta o poto médio de cada classe, que é o represetate de todos os valores detro da classe, e f i xi produto da freqüêcia pelo poto médio de classe. Exemplo: A tabela abaixo correspode a estatura de 40 aluos de uma determiada escola. Calcular a estatura média destes aluos. i ESTATURAS (cm) 150 ------154 154 ------158 158 ------16 16 ------166 166 ------170 170 ------174 Total 1 3 4 5 6 x= fx f i i i = FREQUÊNCIA xi f i xi 4 9 11 8 5 3 40 15 156 160 164 168 17 608 1404 1760 131 840 516 6440 6440 = 161cm 40 Média Poderada: Quado as observações têm importâcias diferetes. x= i= 1 wi xi i= 1 ; ode wi é o peso da variável x i wi Exemplo: Um professor divide os 100 potos da avaliação semestral de sua disciplia usado o seguite critério: uma avaliação idividual valedo 40 potos, um trabalho em grupo valedo 0 potos, um semiário valedo 5 potos e um trabalho idividual valedo 15 potos. Qual a média fial de um aluo que recebeu as seguites otas: avaliação idividual 85, trabalho em grupo 75, semiário 70 e trabalho idividual 65. x= 85 40 + 75 0 + 70 5 + 65 15 = 76,5 100 1

Propriedades da média aritmética a) A média de um cojuto de úmeros pode sempre ser calculada. b) Para um cojuto de dados a média é úica. c) A média é sesível a todos os valores do cojuto. Assim, se um valor se modifica a média também se modifica. d) Somado-se ou subtraido-se uma costate a cada valor de um cojuto de dados, a média ficará aumetada ou subtraída desse valor. i=1 i=1 X i±k X i ± K X i K i=1 = = i =1 ± K = X ±K ± i=1 = X e) Multiplicado-se ou dividido-se uma costate a cada valor de um cojuto de dados, a média fica multiplica ou dividida por essa costate. KX i i=1 Xi i=1 =K =K X f) A soma algébrica dos desvios em relação a média é ula d i = X i X i=1 i=1 i=1 i=1 d i= X i X = X i X = X X =0 g) A soma do quadro dos desvios em relação à media é miima, isto é é SQD= X i X i =1 míimo seja f c = X i c = X c X i c =c X i c X i i=1 i=1 i i =1 i =1 i=1 i=1 f(c) é uma fução do segudo grau a variável c e com cocavidade voltada para cima pois >0. Etão essa fução passa por um míimo e a abscissa desse míimo é: c mi = X i i=1 Xi = i =1 =X como essa fução está o seu poto míimo quado temos que é um míimo. SQD= X i X i =1 c= X

) Média Geométrica A média geométrica deve ser usada para o cálculo da média de séries cujos elemetos se apesetam segudo uma progressão geométrica ( como exemplo a média de populações, lidices de custo de vida, juros compostos etc.) ou que revelem elemetos muito grade comparativos com os demais, como por exemplo 18, 0, 4 e 850, ode a média geométrica é aproximadamete igual a 43,8, resultado que ão foi tão iflueciado pelo valor 850. A pricipal icoveiêcia da média geométrica, cosiste o fato de ela ser grademete iflueciada pelos elemetos pequeos de uma série. XG = i= 1 Xi Quado os dados estão distribuídos em freqüêcia X G = fi i=1 i=1 fi Xi Exemplo: Determie o fator de crescimeto médio para uma aplicação, composta à taxas auais de juros de 10%, 8%, 9%, 1% e 7%. O fator de crescimeto para cada ao será: 1,10; 1,08; 1,09; 1,1 e 1,07 Fator de crescimeto médio= 5 1,10 1,08 1,09 1,1 1,07 = 1,09 3) Média Harmôica A média harmôica é particularmete recomedada para calcular a média de um cojuto de dados que costituem uma série de valores que são iversamete proporcioais. Obtém-se a média harmôica dividido-se o úmero de valores pela soma dos iversos de todos os valores. XH = 1 xi 3

Exemplo: Um carro, o trajeto em etre Vitória e Cachoeiro, faz a viagem de ida com uma velocidade média de 60Km/h e a volta com a velocidade média de 80Km/h. Determiar a velocidade média para a viagem de ida e volta. velocidade média = X H = 1 1 + 60 80 = 68,57 km / h 6.3. Mediaa A mediaa é o valor cetral de um cojuto ordeado de dados, ela divide o cojuto em dois grupos iguais, 50% dos valores meores ou igual mediaa e 50% dos valores maiores ou iguais à mediaa Processo para calcular a mediaa 1) Para dados ão agrupados Iicialmete ordeam-se os dados em ordem crescete ou decrescete Para um úmero impar de valores a mediaa é o valor: Me = x + 1, ode é o úmero de dados. b) Para um úmero par de valores, a mediaa é a média dos valores do meio. x + x Me = +1, ode é o úmero de dados. Exemplo: Calcular a mediaa do seguite cojuto de dados: 0 50 40 30 60 65 80 45 90 70 Valores ordeados: 0 30 40 45 50 60 65 70 80 90 x + x Me = +1 = 50 + 60 = 55 ) Quado os dados estão distribuídos em classe (agrupados) calcula-se a mediaa usado os seguites procedimetos. 4

Exemplo: Determiar a mediaa dos dados correspodetes a 40 aluos de uma determiada escola. i 1 3 4 5 6 Classe da mediaa 1) Cria-se uma colua Fi chamada ESTATURAS (cm) 150 ------154 154 ------158 158 ------16 16 ------166 166 ------170 170 ------174 Total FREQUÊNCIA Fi 4 9 11 8 5 3 40 4 13 4 3 37 40 freqüêcia acumula, esta freqüêcia determia o posicioameto dos valores detro da distribuição. Na tabela observamos que existem 3 estaturas etre 150cm e 166cm, 13 estaturas etre 150cm e 158cm, e assim por diate. Uma observação importate é que a tabela de distribuição de freqüêcia os dados já estão ordeados ) Determia-se em que classe a mediaa está. Na tabela temos fi = 40 = 0. A mediaa ocupa a 0ª posição, estado, portato, a 3ª classe. 3) Numa tabela de freqüêcia há uma perda de iformação a respeito dos dados origiais, sabemos que a mediaa é um valor que está etre 158cm e 16cm. Para recuperamos um valor para a mediaa vamos estimar que existem 11 variáveis a 3ª classe eqüidistates um da outra. 13ª posição 0ª posição 16 158 4 11 M e = 158 + 7 Mediaa 4 = 160,54cm 11 Usado o mesmo raciocíio podemos desevolver a seguite mediaa 5 fórmula para o cálculo da

fi F( at ) h Me = *i + * fi l i* - Limite iferior da classe mediaa. f i * - Freqüêcia simples da classe mediaa. F(at) freqüêcia acumulada da classe aterior a classe mediaa. h amplitude da classe mediaa. Aplicado a fórmula vem: * Me = l i + fi F (at ) h = 158 + 0 13 4 = 158 +,54 = 160,54 cm * fi 11 6.3.3- Moda A moda é a medida estatística que aparece com maior freqüêcia. Exemplo: Determia a moda dos dados a seguir: 0 30 50 40 40 60 40 90 80 80 Mo = 40 Obs: A moda, ão ecessariamete é úica. Um cojuto de dados pode ter duas, três, quatro,... ou até ehuma moda. Quado os dados estão distribuídos em classe, pode-se atribuir o valor da moda como sedo o poto médio da classe de maior freqüêcia. No exemplo aterior a moda seria etão 160cm. No etato este tipo de moda ão leva em cosideração a istabilidade as froteiras das classes, ode estão as variáveis que com pequeas modificações da amplitude do itervalo, tedem a migrar para as classes vizihas. Foi pesado esta istabilidade que se desevolveu uma fórmula para o cálculo da moda, levado em cosideração as freqüêcias das classes vizihas. A figura a seguir represeta uma parte do histograma de uma distribuição, em que são represetadas: a classe de maior freqüêcia (que cotém a moda) e as classes vizihas. 6

freqüêcia Q D1 x S T h-x R P i D Mo Classes Os triâgulos PQT e RST são semelhates, etão: D1 D1 x = x= h D h x D1 + D Como M o = i + x, temos: Mo = i + Mo = l i* + D1 h D1 + D D1.h D1 + D D1 = f i* f at D = f i* f post Exemplo: Determiar a moda dos dados represetados a tabela aterior. Primeiro determia-se o classe em que a moda está, ou seja a classe de maior freqüêcia, e sem seguida aplica-se a fórmula Mo = l i* + D1 11 9.h = 158 + 4 = 158 + 1,6 = 159,6 cm D1 + D (11 9) + (11 8) 7

Neste caso a moda foi um pouco meor que o poto médio de classe. Esta difereça se deve ao fato da classe aterior à classe modal ter uma freqüêcia maior que a da classe superior, arrastado a média para um valor um pouco abaixo do cetro da classe. 6.3.4- Separatrizes Medida estatística que separam os dados em grupos que apresetam o mesmo úmero de valores. Exemplo: Mediaa: Separa os dados em dois grupos que apresetam o mesmo úmero de valores. Quartis: separa os dados em quatro grupos que apresetam o mesmo úmero de valores. Decis: separa os dados em dez grupos que apresetam o mesmo úmero de valores. Percetis: separa os dados em cem grupos que apresetam o mesmo úmero de valores. Para calcular as separatrizes podemos adaptar a fórmula da mediaa geeralizado para o cálculo de um percetil k qualquer. k fi F( at ) h 100 Pk = *i + * fi (100-K)% K% Pk Observação: Para calcular o quartil 3 temos: Q3 = P75 Exemplo: Calcular o P0 dos dados da tabela aterior. Primeiro é preciso determiar a classe ode está o P0 0 x 40 = 8, ocupa a 8ª posição ou seja está a classe. 100 8 4 P0 = 154 + 4 = 154 + 1,78 = 155,78 cm 9 8

A iterpretação do percetil é a seguite: 0% das estaturas estão abaixo de 155,78cm equato que 80% estão acima. 6.4-MEDIDAS DE DISPERSÃO OU VARIABILIDADE Nas aálises de dados, alem da iformação quato ao meio de um cojuto de dados, é coveiete dispor também de uma medida para avaliar a dispersão, ou seja, se os valores estão relativamete próximos us aos outros. Imagie uma pesquisa em três residêcias a respeito do cosumo de água durate o período de 5 dias e os resultados estão apresetados a tabela a seguir: CONSUMO RESIDÊNCIA A RESIDÊNCIA B RESIDÊNCIA C (1000 LITROS) 1,0,0 1,5,5 0,5 3,0 4,0 1,5 1,0,0 0,3,7 TOTAL 3,0 1,0 4,0 10,0 10,0 10,0 Observe que o cosumo médio das três residêcias foi o mesmo, x= 10000 = 000 / dia, o 5 etato, uma observação rápida e visual idica que a residêcia C teve um cosumo mais difereciado a cada dia se comparada às outras, ou seja um cosumo meos estável. É exatamete este tipo de iformação que as medidas de dispersão forecem uma aálise de dados. As pricipais medidas de dispersão serão estudadas a seguir. 6.4.1- Itervalo ou amplitude Difereça etre o maior e o meor valor em um grupo de dados Exemplo: Determiar o itervalo do cojuto de dados: 1, 0, 3,, 15, 17. AT = 0 = 18 No exemplo das residêcias temos: Amplitude relativa ao cosumo de água da residêcia A é.000 litros, o da residêcia B é 3500 litros e o da residêcia C é 3700 litros. Obs. A amplitude ão é cosiderada uma boa medida de dispersão pois só leva em cosideração os extremos do itervalo, ão sedo sesível a todo dados. 9 cojuto de

6.4.-Desvio Médio Absoluto DMA = xi x No cojuto de dados 1, 0, 3,, 15, 17, temos 1 é 0,5, ou seja x= 69 = 11,50. O desvio relativo ao valor 6 d1 = 1 11,5 = 0,5. A iterpretação deste valor é que 1 esta a 0,5 potos acima da média. Já o desvio relativo ao valor é d 4 = 11,50 = 9,5, o que sigifica que está a 9,5 potos abaixo da média. Como a média dos desvios sempre será zero, uma forma de captar a dispersão dos dados é calcular a média dos valores absolutos dos desvios. Exemplo: Calcular o desvio médio absoluto dos dados 1, 0, 3,, 15, 17. DMA = 1 11,5 + 0 11,5 + 3 11,5 + 11,5 + 15 11,5 + 17 11,5 6 DMA = 0,5 + 8,5 + 8,5 + 9,5 + 3,5 + 5,5 0,5 + 8,5 + 8,5 + 9,5 + 3,5 + 5,5 = 6 6 DMA = 36 = 6,0 6 Como sugestão, calcule o desvio médio absoluto relativo ao cosumo de água as três residêcias apresetadas a tabela aterior e compare os resultados. 6.4.3- Variâcia A variâcia é também uma medida que capta a variabilidade de um cojuto de dados, e é defiida como a soma dos quadros dos desvios dividido pelo úmero de observações meos um. Para represetar a variâcia usaremos a letra s = (x i x ) s. 1 Exemplo: Calcular a variâcia do cojuto de dados: 1, 0, 3,, 15, 17. 30

s = (1 11,5) + (0 11,5) + (3 11,5) + ( 11,5) + (15 11,5) + (17 11,5) 5 (0,5) + (8,5) + ( 8,5) + ( 9,5) + (3,5) + (5,5) = 5 0,5 + 7,5 + 7,5 + 90,5 + 1,5 + 30,5 = 55,50 5 s = Quado os dados estão associados a alguma uidade de medida o valor da variâcia será a uidade de medida ao quadrado. No caso do cosumo de água de uma residêcia, se os dados estão em litros à variâcia estará em litros ao quadrado, o que em muitos casos dificulta a iterpretação. Para facilitar os cálculos e evitar que sejam feitas muitas aproximações dos desvios apresetamos uma outra fórmula para o cálculo da variâcia. Temos que ( xi x) = x x x + ( x) equação(1) temos que x x = ( x) equação() [ xi + xi x + ( x) ] = como x i x = x x i e x i = x, como ( x) = ( x) equação(3) 1 i i Substituido em (1) os valores de () e (3) vem: (x i x) = x ( x ) + ( x ) = x ( x) = i x x i = 1 i s = s = ( xi x) = 1 xi ( x ) i i x ( x) x i xi i 1 i 1 Quado os dados estão tabelados e são apresetados em associação com a freqüêcia em que eles aparecem, podemos adaptar a fórmula aterior para: s = f i xi ( x ) f i i fi 1 31

6.4.4- Desvio Padrão A medida de dispersão mais usada as aalises de dados é o desvio padrão,e o seu cálculo e feito extraido a raiz quadrada da variâcia. s= s= (x i x ) ou aida 1 xi ( x ) i 1 Da mesma forma que a variâcia podemos adaptar a fórmula quado os dados estão associados a uma freqüêcia s= f i x i ( x ) f 1 1 fi 1 Exemplo: Calcular o desvio do cojuto de dados: 1, 0, 3,, 15, 17. Como já calculamos ateriormete a variâcia como s= s = 55,50 o desvio padrão será: 55,50 = 7,45 Como sugestão calcule o desvio padrão do cosumo de água das três residêcias a tabela aterior e compare os resultados. Em muitas situações praticas é ecessário fazer uma estimativa para ao desvio padrão e uma sugestão de algus autores especializados é estimar o desvio padrão como sedo um quarto da amplitude. s= amplitude 4 O ideal mesmo é calcular o desvio padrão, pois como sabemos, a amplitude só leva em cosideração os extremos de um cojuto de dados. Exemplo: Calcular o desvio padrão, correspodete as estaturas de um grupo de 40 aluos de uma determiada escola, apresetados a tabela a seguir Calcular o desvio padrão dos dados a seguir: 3

i ESTATURAS (cm) FREQUÊNCIA ( fi ) xi f i xi f i xi 1 3 4 5 6 150 ------154 154 ------158 158 ------16 16 ------166 166 ------170 170 ------174 Total 4 9 11 8 5 3 40 15 156 160 164 168 17 608 1404 1760 131 840 516 6440 9416 1904 81600 15168 14110 8875 1038080 Observem que a tabela foi acrescetada a colua f i xi para ajudar os cálculos e utilizar a fórmula associada com as freqüêcias que os dados são apresetados 1038080 s= 39 6440 40 = 595 591 = 31,80 = 5,64 cm 6.4.5- Coeficiete de variação C.V. %= s 100 X Note que coeficiete de variação é expresso em porcetagem, ele é útil para comparar a variabilidade de diferetes cojutos de valores. Exemplo: Desejamos aalisar a variabilidade das otas de matemática de duas turmas, a turma A e a Turma B. Foram calculadas a média e o desvio podrão de cada turma: s A =1,6 e X A=7,5, X B =7,9 e s B =,3. Qual das duas turmas apresetou maior variabilidade as otas? C.V. A= 1,6,3 100=1,33 % e C.V. B= 100=9,11 % 7,5 7,9 Cocluímos que a turma B tem uma maior variabilidade as otas pois o seu coeficiete de variação é maior. 33

6.5- INTERPRETAÇÃO A RESPEITO DA MÉDIA E DO DESVIO PADRÃO Quado a distribuição de um cojuto de dados se aproxima de uma distribuição ormal, ou seja, a curva de freqüêcia tem o formato de um sio, valem as seguites regras empíricas para estes dados. Cerca de 68% destes dados estão a meos de 1 desvio padrão a cotar da média. Cerca de 95% destes dados estão a meos de desvio padrão a cotar da média. Cerca de 99,7% destes dados estão a meos de 3 desvio padrão da média. OBS: As medidas estatísticas apresetadas esse capítulo estão calculadas tedo como referecia uma amostra, que tem como orma a represetação pelas letras do osso alfabeto. No caso das medidas calculadas tedo como referecia uma população, a represetação será com letras do alfabeto Grego. Além disso, a variâcia populacioal, a SQD será divido por. σ = (x i x ) e µ = xi 7- BOXPLOTS O Boxplot é um resumo esquemático usado para descrever as características mais proemietes de um cojuto de dados que icluem: cetro, dispersão, extesão e a atureza de qualquer desvio em relação à simetria e a idetificação de outliers, observações que ormalmete esta distates da maior parte dos dados. Como apeas um outlier pode afetar drasticamete os valores da média e do desvio-padrão um boxplot é baseado em medidas resistetes à preseça de algus outliers. Para traçar um boxplot precisamos calcular o valores máximo e míimo de um cojuto de dados, assim como mediaa, primeiro quartil e terceiro quartil. Exemplo: Cosidere o seguite cojuto de dados: 40 5 55 60 70 75 85 90 90 9 94 94 95 98 100 115 15 15 34

O resumo dos cico medidas segue: Mi xi =40 Max x i=15 Q1=7,5 Q3=96,5 Me=90 O boxplot é esquematizado a a seguir: 7.1- Outliers Para detectar a preseça de outliers, são usados os seguites critérios: 1) O valor de uma variável xi é cosiderada um outliers moderado se: Q1 3,0 f x i Q1 1,5 f ou Q3 1,5 f xi Q3 3,0 f, sedo f =Q3 Q1 ) O valor de uma variável x i é cosiderada um outliers extremo se: x i Q 1 3,0 f ou x i Q 3 3,0 f, sedo f =Q3 Q1 Exemplo: Idetificar a existêcia ou ão de outliers e traçar o boxplot dos dados a seguir 5,3 94,9 8, 95,5 13,8 95,8 74,1 95,9 85,3 96,6 88,0 96,7 90, 98,1 91,5 99,0 9,4 9,9 93,6 94,3 94,8 101,4 103,,7 106,0 113,5 Os idica relevates são: Mi xi =5,3 Q1=90, Me=94,8 1,5 f =9,75 Max x i=113,5 Q3=96,7 f =96,7 90,=6,50 3,0 f =19,50 Dessa foram, qualquer observação meor que 90,-9,75=80,45 ou maior que 96,75+9,75=106,5 é um outlier. Há um outlier extremidade superior da amostra e quatro a extremidade iferior. Como 90,-19,5=70,7, as três observações 5,3; 8, e 13,8 são outliers 35

extremos, equato 74,1 e 113,5 são outliers moderado.7. Boxplots comparativos Um boxplot comparativo ou lado a lado é uma forma muito eficiete de revelar semelhaças e difereças etre dois ou mais cojuto de dados costituido de observações da mesma variável. Exemplo: Os dados a seguir correspodem as otas de estatística de duas turmas: Turma A: 6,0 7,0 8,0 9,0 5,0 6,5 7,5 8,7 5,5 6,0 5,5 Turma B:,0 3,0 9,0 5,0 10,0 7,0 8,0 4,0 9,5 3,5,0 A seguir está esquematizado o boxplot comparativo da varável ota de estatística a duas turma A e B. Observe que a turma B apresetou um dispersão maior que a a turma A, pois a distâcia etre os quartis 1 e 3 é maior. 36

8 -REGRESSÃO E CORRELAÇÃO A regressão e a correlação são duas técicas estritamete relacioadas que evolvem uma forma de estimação. Mais especificamete, a aalise de correlação e regressão compreede a aálise de dados amostrais para saber se e como duas ou mais variáveis estão relacioadas uma com a outra uma população. O osso objetivo será o estudo de situações que evolve duas variáveis. O coeficiete de correlação é um úmero que resume o grau de relacioameto etre duas variáveis. A aalise de regressão tem como resultado uma equação matemática que descreve o relacioameto etre as variáveis. Esta equação pode ser usada para estimar valores futuros de uma variável quado se cohecem ou supõem cohecidos valores da outra variável. Uma regressão liear, costitui uma tetativa de estabelecer uma equação matemática liear que descreve o relacioameto etre duas variáveis. Duas importates características da equação liear são: o coeficiete agular a e o coeficiete liear b da reta. Uma equação liear tem a forma y = ax + b e a seguite represetação gráfica: y y a= y x x b x O processo mais simples para verificar se duas variáveis se relacioa em situações que aproximam de um modelo liear, cosiste em plotar estas variáveis e verificar se uma relação liear parece razoável. 37

8.1. Coeficiete de correlação liear O istrumeto empregado para medir a correlação liear é o coeficiete de correlação. Esse coeficiete deve idicar o grau de itesidade da correlação etre duas variáveis x e y, e, aida, o setido dessa correlação (positivo ou egativo). O coeficiete de correlação que usaremos é o coeficiete de correlação de Pearso, que é dado por: r = [ x ( x )( y ) ( x ) ][ y ( y ) xy ] ode é o úmero de observações. Assim para tirarmos algumas coclusões sigificativas sobre o comportameto simultâeo das variáveis aalisadas temos as seguites situações: Se r = 1, a correlação etre duas variáveis é perfeita e etão positiva Se r=-1, a correlação etre duas variáveis é perfeita e etão egativa Se r=0, ão correlação etre as variáveis. Se 0,6 r 1, há uma correlação sigificate etre as variáveis. Se Se 0,3 r 0,6, há uma correlação relativamete fraca etre as variáveis. 0 < r < 0,3, a correlação é muito fraca e praticamete, ada podemos cocluir sobre a relação etre as duas variáveis em estudo. 38

8..Regressão O método mais usado para ajustar uma liha reta a um cojuto de potos é cohecido como o técica dos quadrados míimos. Os valores de a e b para a reta y = ax + b que miimiza a soma dos quadrados míimos são as soluções das chamadas equações ormais: y = a ( x ) + b xy = a ( x ) + b( x ) a= ( xy ) ( x)( y ) b= ode é o úmero de observações. dode tiramos que: ( x ) ( x ) y a x = y ax Exercícios A tabela abaixo relacioa o úmero de moradores por residêcia e o cosumo mesal de água em uma amostra de dez residêcias de uma determiada cidade. Nº 01 0 03 04 05 06 07 08 09 10 Número de moradores Xi 3 4 5 6 3 4 5 6 Cosumo (1000 litros) Yi 0 30 35 5 35 35 0 15 30 40 1) Completar a tabela. ) Determiar o coeficiete de correlação: 39 XiYi Xi Y i

r= [ XY X X Y ( X ) ][ Y ( Y ) ] = 3)Classificar a correlação 4) Costruir o diagrama de dispersão Y X Fazer a aalise de regressão liear é descrever, através de um modelo matemático da forma y=ax+b, a relação etre as duas variáveis. 5) Determiar o valor de a: a= XY X X Y ( X ) = 6) Determiar o valor de b: b = Y ax = Escrever a equação de regressão: Y= ax +b =... Traçar o diagrama de dispersão do item 4 o gráfico da equação de regressão Estime qual deverá ser o cosumo de água de uma residêcia que tem 3 moradores. 40

9-EXERCÍCIOS 1. Uma loja vede cico produtos básicos A, B, C, E. O lucro por uidade comercializada destes produtos vale respectivamete $00,00; $300,00 $500,00 $1.000,00; $5.000,00. A loja vedeu em determiado m6es 0, 30, 0, 10 e 5 uidades respectivamete. Qual foi o lucro médio por uidade comercializada por esta loja?. O desvio padrão pode ser zero? Explique. 3. Calcule a média e a variâcia e desvio padrão para os seguite cojuto de dados, supodo que eles represetem: 83, 9, 100, 57, 85, 88, 84, 8, 94, 93, 91, 95 4. Qual seria o efeito sobre a média de um cojuto de úmeros se adicioasse 10: a) a um dos úmeros. b) a cada um dos úmeros 5. Para duas emissões de ações ordiária de um idustria eletrôica, o preço médio diário, o fechameto dos egócios, durate um período de um mês, para as ações A, foi de R$150,00 com desvio padrão de R$5,00. Para as ações B, o preço médio foi de R$50,00 com desvio padrão de R$3,00. Nessas codições qual ação teve o seu preço mais estável esse período? 6. Os dados a seguir correspodem a vida útil em horas de duas marcas diferetes de ferrametas de corte em um processo idustrial Marca A: 13 10 100 5 50 70 100 5 60 47 Marca B: 70 90 85 90 80 8 90 70 85 88 a) Determie a vida útil média, mediaa e o desvio padrão de cada uma das diferetes marcas. b) Se você fosse comprar ferrametas, qual das duas marcas você compraria? Porque? 41

7. Uma população ecotra-se dividida em três estratos, com tamaho, respectivamete 1=40, =100 e 3=60. Sabedo que, ao ser realizada uma amostragem estratificada proporcioal, ove elemetos da amostra foram retirados do 3º estrato, determie o úmero total de elemetos da amostra. 8. Um baco selecioou ao acaso 5 cotas de pessoas físicas em uma agêcia, em um determiado dia, obtedo os seguites saldos em dolares: 5.500,00 18.300,00 35.700,00 43.800,00.150,00 6.830,00 3.50,00 17.603,00 35.600,00 7.800,00 16.33,00 4.130,00 7.606,00 18.350,00 1.51,00 5.300,00 31.45,00 39.610,00.450,00 7.380,00 8.800,00 1.000,00 14.751,00 39.51,00 17.319,00 Agrupe, por freqüêcia, estes dados. A tabela abaixo correspode a otas de estatística atribuídas a 44 aluos da turma A de uma determiada Faculdade. CLASSES 1 3 4 5 otas fi Fi 0 4 6 8 ----- ----- 4 ----- 6 ----- 8 ----- 10 TOTAL fci 5 13 7 30 44 Xi fi.xi fixi 5 4 70 16 46 Complete a tabela acima e: a) Costrua o Histograma. b) Costrua e a curva de freqüêcia. c) Determie o percetual de aluos que coseguiram otas etre e 6. d) Determie a média das otas. e) Calcular a ota modal. f) O professor determiou que os aluos que coseguiram ota iferior a mediaa, farão uma prova de recuperação. Qual é a ota mediaa? g) O professor determiou que o grupo formado pelos aluos que obtiveram as 10% melhores otas irão ajudar a recuperação do grupo aluos que obtiveram as 15% piores otas. Determiar a ota míima que estabelece as 10% melhores otas e a ota máxima que estabelece as 15% piores otas. 4

h) Calcular o quartil 3. i) Calcular a variâcia e o desvio padrão. j) Se o professor errou a ota de três aluos, tedo que acrescetar 0,5 potos a cada ota, qual será a ova média da turma? k) Se um aluo tirou uma ota,5, esta ota poderá ser cosiderada ormal esse cotexto? l) Qual o percetual de aluos que tiraram otas superiores a 5,5? 10.Um grupo de 85 moças tem estatura média de 160,6 cm com desvio padrão igual a 5,79cm. Outro grupo de 15 moças tem uma estatura média de 161,9 cm sedo o desvio padrão igual à 6,01 cm. Qual o coeficiete de variação de cada um dos grupos? Qual o grupo mais homogêeo? 11.Um produtor mediu o tempo (em miutos) de uso diário da Iteret por seus assiates. Com os dados obtidos costruí-se o seguite histograma: a) Que porcetagem do total de assiates fica etre meia hora e uma hora e meia a rede b) Qual a média, a mediaa e a moda do tempo de uso da iteret? c) Costrua a curva de freqüêcia d) Calcular o desvio-padrão de tempo de usa da iteret. e) Calcular Q1 e P 70 f) Calcular o percetual de assiates que usam mais de 130 miutos de iteret diariamete. 1.Observado os dados da tabela abaixo: 43

a) Agrupe os dados relativos à telefoia fixa em classes de amplitude 6, a partir de 6. Em seguida, calcule a média e o desvio padrão dos dados agrupados. b) Agrupe os dados relativos à telefoia móvel em classes de amplitude 6 a partir de 3. Em seguida, calcule a média e os desvio padrão dos dados agrupados. c) Supoha que, um levatameto posterior, cada valor da tabela relativo à telefoia fixa teha aumetado 15% e, para a telefoia móvel, esse aumeto teha sido de 10%. Admita, aida, que os limitates de cada itervalo dos ites ateriores teham aumetado a mesma proporção. Quais serão, etão, a ova média e a ova variâcia das variáveis em questão? 13.Os dados a seguir represetam o úmero de passageiros que viajaram sem o pagameto de passagem, em uma determiada liha de ôibus urbao, um período de 40 dias, etre as 8 e 9 horas da mahã. 0 1 0 3 0 0 1 3 5 5 0 1 1 3 5 5 1 1 Pede-se: 1 1 5 0 0 0 1 0 3 5 5 5 1 Costruir uma tabela de distribuição de freqüêcia. 44

a) Traçar o histograma. b) Calcular a Média. c) Calcular a Moda. d) Calcular a Mediaa. e) Quartil 1 f) Calcular o desvio padrão. g) Se em um determiado dia 7 passageiros ão pagaram passagem, este resultado poderá ser cosiderado ormal este cotexto? 14.Numa classe com 0 aluos as otas do exame fial podiam variar de 0 a 100 e a ota míima para aprovação era 70. realizado o exame, verificou-se que oito aluos foram reprovados. A média aritmética das otas desses oitos aluos foi 65, equato a média dos aprovados foi 77. Após a divulgação dos resultados, o professor verificou que uma questão havia sido mal formulada e decidiu atribuir 5 potos a mais para todos os aluos. Com essa decisão, a média dos aprovados passou a ser 80 e a dos reprovados 68,8. a)calcule a média aritmética das otas das otas da classe toda ates da atribuição dos cico potos extras. b)com a atribuição dos cico potos extras, quatos aluos, iicialmete reprovados, atigiram ota para aprovação? 15.Certa empresa, estudado a variação de demada de seu produto em relação à variação de preço de veda, obteve a tabela: Preço (X) Demada (Y) 38 4 50 56 59 63 70 80 95 110 350 35 97 70 56 46 38 3 15 08 )(yi)o coeficiete de correlação. Determie a) Estabeleça a equação da reta ajustada. b) Estime Y para X =60 e X=10 A tabela abaixo represeta a produção de uma idustria: ANOS QUANTIDA 1980 34 1981 36 198 36 1983 38 1984 41 1985 4 1986 1987 43 44 1988 46 DE (t) Calcule: a) O coeficiete de correlação; Sugestão: par simplificar os cálculos, use para o tempo um variável auxiliar, por exemplo X = X 1984 b) A resta ajustada; c) A produção estimada para 1989 45

CAPÍTULO Estatística com OpeOffice 1.Plailhas Eletrôicas Plailhas eletrôicas são Softwares cocebidos prioritariamete para se efetuarem cálculos que evolvam variáveis. Com elas podem-se utilizar várias fuções matemáticas, com destaque para aquelas relacioadas com cálculos e represetações de fuções, Estatística e Matemática Fiaceira. Hoje, são várias as possibilidades de escolha de plailhas eletrôicas, desde as pagas, como o Excel da Microsoft, até as de uso livre, como o OpeOffice. Apesar do primeiro ser, sem dúvida, o mais cohecido e utilizado, seja em aplicações domésticas ou em empresas, o segudo destaca-se pela sua eficiete qualidade, pela similaridade com o Excel e, pricipalmete, por ser gratuito e, por esse fato, foi o escolhido para ser utilizado este trabalho..trabalhado com o OpeOffice O OpeOffice é um programa de plailha eletrôica, desevolvido pela Su Microsystems Ic. e aperfeiçoado por usuários de várias comuidades espalhadas pelo mudo que roda em várias plataformas, Widows e Liux etre outras. Nos últimos aos, assim como todas as aplicações iformáticas, tem passado por aperfeiçoametos e ajustes visado maior usabilidade e aproveitameto do desevolvimeto dos computadores. Neste material utilizaremos o BrOffice.org.0, desevolvido por FILHOCFFILHOCF com base o OpeOffice.org.. Não há, este trabalho, a pretesão de oferecer um curso de OpeOffice, somete serão mostrados recursos básicos que possam auxiliar as aplicações de Estatística básica. Assim, serão mostradas, sempre em forma de aplicações, estratégias para o trabalho com: costrução de tabelas com dados simples e agrupados por classes, costrução de gráficos de coluas e de setores, costrução de histogramas, costrução de box-plot e regressão liear. 46

O ambiete de trabalho Figura 1. A área de trabalho do Microsoft OpeOffice.. As fuções o OpeOffice São várias as formas de iserção de fuções (operações matemáticas) o OpeOffice, etre elas: a) Utilizado os meus ou submeus selecioados a Barra de meus, clicado com o mouse, ou recorredo a teclas de atalho. 47

Figura. Criação de fução pelo meu Iserir b) Clicado o ícoe correspodete da liha de etrada. Figura 3. Criação de fução pelo ícoe c) Simplesmete digitado = detro da célula selecioada e escolhedo uma fução etre a lista que será apresetada. Figura 4. Criação de fução pela caixa de ome 48

Nos dois primeiros casos será aberto o quadro Assistete de Fuções que apreseta uma série de fuções para serem escolhidas. As fuções estão classificadas por categoria coforme mostrado a seguir: Figura 5. A caixa assistete de fução Para cada categoria escolhida, o meu apreseta as diferetes fuções, bem como uma breve descrição da fução escolhida e da sua sitaxe. Após a seleção da fução desejada, você poderá digitar a fórmula o quadro Fórmula ou clicar em Próximo para que os argumetos ecessários sejam iseridos. Após a iserção, basta clicar em OK. Figura 6. Argumetos da fução 49

Cabe lembrar que, a partir do mometo que a forma de escrita e posicioameto dos diversos elemetos estiverem icorporadas pelo usuário, estes comados poderão ser digitados diretamete a célula, o poupado, assim, de ter que passar por todas estas etapas. Bastará, etão, digitar o sial de igualdade (=) para que o OpeOffice eteda que é uma fução e, em seguida, iserir os comados. Esta iserção poderá ocorrer tado diretamete a célula quato a liha de etrada. Figura 7. Iserção de fução diretamete a célula 3.Costrução de tabelas Para compreedermos o processo de costrução de tabelas de dados com o auxílio do OpeOffice é ecessário que separemos as variáveis em dois grupos: 1º grupo as variáveis qualitativas e as quatitativas discretas e º grupo as quatitativas cotíuas. Vamos realizar os estudos a partir de exemplos práticos. 3.1 Grupo (variáveis qualitativas e variáveis quatitativas discretas) As variáveis tratadas esse grupo são aquelas que ão exigem agrupametos de dados. Vamos observar como seria costruída uma tabela para represetar os seguites resultados de uma pesquisa: 50

3.1.1.Freqüêcia absoluta CONT.SE A freqüêcia absoluta é calculada com o auxílio da fução CONT.SE. Esta fução calcula a quatidade de células, detro de um itervalo, que coteham um parâmetro desejado. Este parâmetro pode ser um úmero, expressão, etc. uma palavra, uma Retora o úmero de elemetos que atedem a determiados critérios detro de um itervalo de célula. Sitaxe CONT.SE(itervalo;critérios) Itervalo é o itervalo ao qual os critérios deverão ser aplicados. Critérios idica os critérios a forma de um úmero, uma expressão ou uma seqüêcia de caracteres. Esses critérios determiam quais células serão cotadas. Você também pode iserir um texto de pesquisa a forma de uma expressão regular, por exemplo, "b.*" para todas as palavras que começam com b. Também é possível idicar um itervalo de células que cotém o critério de pesquisa. Se você quiser pesquisar um texto literal, coloque o texto etre aspas duplas. 51

Acompahe as istruções a seguir: 3.1..Freqüêcia relativa SOMA Para se calcular a freqüêcia relativa há a ecessidade de itroduzir a fução SOMA. Esta fução valores úmeros soma uma uméricos ou isolados. Será seqüêcia uma série utilizada totalizar as freqüêcias absolutas. de de para Adicioa todos os úmeros em um itervalo de células. Sitaxe SOMA(úmero1; úmero ;...; úmero 30) O parâmetro Número de 1 a 30 represeta até 30 argumetos cuja soma deverá ser calculada. Exemplo Se você iserir os úmeros, 3 e 4 as caixas de texto Número 1, Número e Número 3, 9 será retorado como resultado. SOMA(A1;A3;B5) calcula a soma das três células. SOMA (A1:E10) calcula a soma de todas as células do itervalo de A1 a E10. 5

Acompahe as istruções a seguir: O Cálculo das freqüêcias relativas é feito com uma simples divisão, observe: As freqüêcias relativas podem ser somadas utilizado o procedimeto. Lembre-se que esse total deve dar 1 (um), que equivale a 100%. Perceba que os valores obtidos aparecem com duas casas decimais. Caso deseje utilizar meos ou mais casas decimais poderá coseguir isto selecioado as células que deseja modificar e clicado o botão (adicioar casa decimal) ou (excluir casa decimal) até obter a quatidade de casas decimais desejada. Caso queira exprimir as freqüêcias relativas a forma percetual basta selecioar as células desejadas e clicar o botão tabela poderá ficar assim: 53 (porcetagem). Sua

Figura 8. Tabela de distribuição de freqüêcias do estado civil A grade vatagem de se ter uma tabela o OpeOffice é o diamismo em sua operação. Experimete alterar os resultados da pesquisa, trocado, por exemplo, solteiro por casado e verifique o que ocorre com a tabela. Isso os dá praticidade a hora de alterar algum valor que teha sido itroduzido de forma equivocada. 3.. Grupo (variáveis quatitativas cotíuas) As variáveis tratadas esse grupo são aquelas que exigem agrupametos de dados. Vamos observar como seria costruída uma tabela para represetar os seguites resultados de uma pesquisa: 54

3..1 Itervalos de Classes Para defiir os itervalos de MAIOR classes precisaremos ecotrar os valores máximo e míimo, utilizado as fuções MAIOR e Retora o maior valor a posição_c de um cojuto de dados. MENOR, respectivamete. Sitaxe MAIOR(Dados; Posição_c) Dados é a matriz de dados da amostra aleatória. Posição_c é a posição do valor. Exe mplo =MAIOR(A1:C50; ) retorará o segudo maior valor do itervalo de células A1:C50. MENOR etora o meor valor a posição_c de um cojuto de dados. Sitaxe MENOR(Dados; Posição_c) Dados é a matriz de dados da amostra aleatória. Posição_c é a posição do valor. Exe mplo =MENOR(A1:C50; ) retorará o segudo meor valor do itervalo de células A1:C50. Acompahe as istruções a seguir: Para determiar o Número de classes, a Amplitude de classe calculada, a Amplitude classe adotada, o Limite iferior e o Limite superior, utilizaremos fórmulas matemáticas simples 55

utilizado apeas as quatro operações fudametais (adição, subtração, multiplicação e divisão) Acompahe as istruções a seguir: 3.. Freqüêcia absoluta Para calcular a freqüêcia absoluta ovamete utilizaremos a fução CONT.SE para calcular a quatidade de células, detro de um itervalo, que coteham o parâmetro desejado. O parâmetro, desta vez, ser uma desigualdade, já que precisaremos estabelecer uma série de valores que atedam a certo itervalo. Acompahe as istruções a seguir: 56

3..3 Freqüêcia relativa A freqüêcia relativa é calculada utilizado-se a fução SOMA. E operações de divisão.. Acompahe as istruções a seguir: 57

O Cálculo das freqüêcias relativas é feito com uma simples divisão, observe: As freqüêcias relativas podem ser somadas utilizado o procedimeto 4. Lembre-se que esse total deve dar 1 (um), que equivale a 100%. Perceba que os valores obtidos aparecem com duas casas decimais. Caso deseje utilizar meos ou mais casas decimais poderá coseguir isto selecioado as células que deseja modificar e clicado o botão (adicioar casa decimal) ou (excluir casa decimal) até obter a quatidade de casas decimais desejada. Caso queira exprimir as freqüêcias relativas a forma percetual basta selecioar as células desejadas e clicar o botão (porcetagem). Sua tabela poderá ficar assim: Figura 9. Tabela de distribuição de freqüêcias das idades A grade vatagem de se ter uma tabela o OpeOffice é o diamismo em sua operação. Experimete alterar os resultados da pesquisa, trocado, por exemplo, uma ou mais idades e verifique o que ocorre com a tabela. Isso os dá praticidade a hora de alterar algum valor que teha sido itroduzido de forma equivocada. 58

EXERCÍCIO DE APLICAÇÃO Seja a tabela de dados brutos abaixo relativa aos salários dos operários da Empresa X : Operário 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 Salário hora 11,60 14, 15,55 15,87 10,33 7,48 6,04 13,57 1,67 16,46 17,7 19,91 10,88 6,83 15,75 8,70 1,73 13,93 1,69 18,70 Operário 1 3 4 5 6 7 8 9 30 31 3 33 34 35 36 37 38 39 40 Salário hora 1,66 18,1 7,80 1,33 17,80 0,89 19,08 0,5 15,1 6,05 9,18 0,31 10,90 6,61 6,73 15,50 9,1 9,83 9,9 15,0 Operário 41 4 43 44 45 46 47 48 49 50 51 5 53 54 55 56 57 58 59 60 Salário hora 15,86 16,89 14,4 16,4 16,34 1,76 0,8 9,38 9,13 17,68 9,89 8,06 1,06 19,81 11,36 18,08 16,6 0,58 10,87 6,57 Operário 61 6 63 64 65 66 67 68 69 70 71 7 73 74 75 76 77 78 79 80 Salário hora 16,41 10,14 1,07 10,41 0,47 10,46 1,68 15,34 17,85 15,69 15,66 14,51 11,91 10,99 16,37 6,98 11,05 10,74 1,33 8,53 Operário 81 8 83 84 85 86 87 88 89 90 91 9 93 94 95 96 97 98 99 100 Salário hora 14,03 16,0 9,91 11,46 0,7 9,48 18,6 13,73 10,59 1,06 15,44 6,09 15,43 0,55 14,64 1,54 0,90 8,04 10,64 7,68 Operário 101 10 103 104 105 106 107 108 109 110 111 11 113 114 115 116 117 118 119 10 Salário hora 15,38 11,6 1,45 10,60 16,55 14,64 1,03 14,51 10,7 11,95 0,33 1,87 16,6 15,01 16,4 6,44 7,05 16,95 8,13 19,65 Operário 11 1 13 14 15 16 17 18 19 130 131 13 133 134 135 136 137 138 139 140 Salário hora 6,69 10,47 7,39 18,97 15,79 14,74 13,55 18,65 9,7 1,08 14,35 19,31 1,47 6,71 19,45 13,06 0,97 10,1 10,07 16,41 Costruir uma tabela de distribuição de freqüêcias o seguite modelo: Remueração dos operários da Empresa X julho de 000 Salários-hora (R$) Freqüêcia i Freqüêcia Freqüêcia Acumulada Relativa Ni fi 06 08 08 10 10 1 1 14 14 16 16 18 18 0 0 Total Fote: Departameto Pessoal 59 Freq. Relativa Acumulada Fi

4.Costrução de gráficos Assim como foi feito para o processo de costrução de tabelas de dados também estudaremos os gráficos separadamete por grupos. Nos limitaremos, este trabalho, a estudar três tipos de gráficos: Gráfico de coluas, Gráfico de setores (pizza) e Histograma. Vamos realizar os estudos a partir das tabelas costruídas o item 3. 4.1.Gráficos de coluas Os gráficos de coluas são muito utilizados para represetação de pesquisas divulgadas a impresa em geral. São aplicados, pricipalmete, para represetação de dados qualitativos e quatitativos discretos. Vamos observar como seria costruído um gráfico para represetar os seguites resultados de uma pesquisa: Figura 10. Tabela de distribuição de freqüêcias do estado civil Após a obteção da tabela de freqüêcias pode-se obter com facilidade o diagrama de coluas, através do Assistete de Gráficos. Acompahe as istruções a seguir: Marque um trecho da plailha, ode será iserido o gráfico. O quadro seguite surgirá a tela: 60

Clique em Próximo >> e surgirá: Selecioe o tipo de gráfico desejado (o caso, coluas) e marque Mostrar elemetos do texto a visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e surgirá: Selecioe Eixo Y, caso deseje visualizar lihas horizotais e escolha como quer o seu gráfico. Ao fazer uma ova escolha o seu gráfico será mostrado o quadro à esquerda, assim poderá escolher o estilo que mais lhe iteressar. Clique em Próximo >> e surgirá: 61

Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a legeda apareça ou ão. Clique em Criar e o seu gráfico estará proto. Com um clique duplo o gráfico você etrará o modo de edição do gráfico. Clicado o botão direito do mouse sobre o gráfico será dispoibilizado um Meu que permitirá algumas modificações a formação, você poderá modificar cores e outros elemetos do gráfico. Por exemplo, ele poderá assumir a seguite forma: Experimete modificar algum dado da tabela, você perceberá que o gráfico se alterará automaticamete. 6

4..Gráficos de setores (tipo Pizza) Os gráficos de setores, assim como os de coluas, são aplicados, pricipalmete, para represetação de dados qualitativos e quatitativos discretos. Utilizaremos a mesma pesquisa utilizada para costruir o gráfico de coluas: Marque um trecho da plailha, ode será iserido o gráfico. O quadro seguite surgirá a tela: Clique em Próximo >> e surgirá: 63

Selecioe o tipo de gráfico desejado (o caso, setores) e marque Mostrar elemetos do texto a visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e surgirá: Ao fazer uma ova escolha o seu gráfico será mostrado o quadro à esquerda, assim poderá escolher o estilo que mais lhe iteressar. Clique em Próximo >> e surgirá: Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a legeda apareça ou ão. Clique em Criar e o seu gráfico estará proto. Dê um clique duplo sobre o gráfico, e ovamete sobre cada uma das fatias. Escolha a aba Rótulo de dados e marque em Mostrar valor com porcetagem e será exibido o valor percetual de cada uma das fatias. 64

Com um clique duplo o gráfico você etrará o modo de edição do gráfico. Clicado o botão direito do mouse sobre o gráfico será dispoibilizado um Meu que permitirá algumas modificações a formação, você poderá modificar cores e outros elemetos do gráfico. Por exemplo, ele poderá assumir a seguite forma: Experimete modificar algum dado da tabela, você perceberá que o gráfico se alterará automaticamete. 4.3.Histograma Os histogramas são aplicados, pricipalmete, para represetação de dados quatitativos cotíuos. Vamos observar como seria costruído um gráfico para represetar os seguites resultados de uma pesquisa: 65

Figura 11. Tabela de distribuição de freqüêcias das idades Após a obteção da tabela de freqüêcias pode-se obter com facilidade o histograma, através do Assistete de Gráficos. Acompahe as istruções a seguir: Marque um trecho da plailha, ode será iserido o gráfico. O quadro seguite surgirá a tela: Clique em Próximo >> e surgirá: 66

Selecioe o tipo de gráfico desejado (o caso, coluas) e marque Mostrar elemetos do texto a visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e surgirá: Selecioe Eixo Y, caso deseje visualizar lihas horizotais e escolha como quer o seu gráfico. Ao fazer uma ova escolha o seu gráfico será mostrado o quadro à esquerda, assim poderá escolher o estilo que mais lhe iteressar. Clique em Próximo >> e surgirá: Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a legeda apareça ou ão. Clique em Criar e o seu gráfico estará proto. 67

Perceba que há certas limitações quato ao histograma o formato do gráfico, as classes ão aparecem o eixo x e sim a legeda, o que matém um bom ível de clareza os dados. Mudaças a formatação também podem ser feitas caso se preteda. 5. Medidas estatísticas Vamos agora calcular as pricipais medidas estatísticas das variáveis quatitativas. Para ilustrar os cálculos, vamos cosiderar os dados correspodetes à idade dos moradores do Bairro Vila da Sabedoria. Defiimos a as medidas estatísticas a serem calculadas. Digite a Célula E4 o título: Estatística da Pesquisa. Na células E6, E7, E8, e assim por diate, escrevemos as pricipais medidas que serão calculadas: Média, Mediaa, Moda, Variâcia, Desviopadrão, Quartil -1, Quartil -3, Porcetil -10 e Porcetil-90 68

5. 1. Cálculo da média Posicioe o cursor a célula E7 e clique o ícoe Assistetes de Fução do OpeOfice. No Assistete de fuções escolha a categoria Estatística 69

Na categoria Estatística escolha a fução MÉDIA e clique em Próximo>> e abrirá um espaço para a escolha do itervalo de dados para o qual será calculado a média. Pode-se escolher o itervalo de dados de duas formas: clicado o ícoe a direito do primeiro úmero a seqüêcia, abrido o Assistete da Fução Média. Em seguida selecioe o itervalo de dados para calcular a média usado o cursor do mouse 70

Clique o ícoe à direita o Assistete de Fuções MÉDIA e o resultado da média será apresetado o Assistete de Fuções Clique em OK e o valor da média será trasportado para a posição do cursor a plailha. 71

Outra forma de selecioar o itervalo de dados a ser calculado a média, é diretamete o Assistete de Fução, a caixa ode aparece a Fórmula da fução media, digitado como argumeto o itervalo de células ode se ecotram os dados que se deseja calcular a média. =MÉDEIA(B1:B31). 5.. Cálculo das outras medidas No cálculo da Mediaa, Moda, Variâcia e Desvio-padrão o procedimeto é o mesmo do Cálculo da média,difereciado apeas as fuções estatísticas. 5..1. Mediaa MED(B:B31) 5... Moda MODO(B:B31) 7

5..3. Variâcia VAR(B:B31) variâcia de uma amostra 5..4. Desvio-padrão DESVPAD(B:B31)- desvio-padrão de uma amostra No calculo da variâcia e do desvio-padrão também podem se usadas as fuções VARP() e DESPADP, quado se deseja calcular as medidas de uma população. 5..5. Quartil QUARTIL(B:B31;1 ) No caso especifico do quartil, a fução exige mais um argumeto, o tipo do quartil: (0-MIN; 1-5%; - 50% ; 3-75% ; 4-MAX) 73

5..6. Percetil PERCENTIL( B:B31 ; 0,1) Assim como os quartil, o percetil também exige outro argumeto alem do itervalo de dados, a taxa de porcetagem etre 0 e 1 74

A seguir é apresetada estatística da pesquisa, calculada seguido os procedimetos estabelecidos. Obs: No caso especifico da moda, apareceu o símbolo #VALOR!, pois ão houve a repetição de ehum valor os dados da pesquisa. Se substituíssemos o valor 1 a liha 15,por 3,75. o valor da moda seria 3,75. 75

6.Diagrama de extremos e quartis (Boxplot) Para a costrução do diagrama de extremos Box Plot e quartis, são ecessárias cico estatísticas: a mediaa, os 1º e 3º Quartis, o máximo e o míimo. Os valores máximos e míimos já foram tratados o item 3..1. Os demais dados serão trabalhados os capítulos seguites. No mometo vamos cosiderar esses valores como dados para que seja É um tipo de represetação gráfica, em que se realçam algumas características da amostra. O cojuto dos valores da amostra compreedidos etre o 1º e o 3º quartis é represetado por um retâgulo (caixa) com a mediaa idicada por uma barra. Cosideram-se em seguida duas lihas que uem os lados dos retâgulos com os valores máximo e míimo, respectivamete. possível a costrução do Box-plot. Após a digitação da tabela pode-se obter com facilidade o diagrama de extremos e quartis, através do Assistete de Gráficos. 76

Marque um trecho da plailha, ode será iserido o gráfico. O quadro seguite surgirá a tela: Clique em Próximo >> e surgirá: Selecioe o tipo de gráfico desejado (o caso, lihas) e marque Mostrar elemetos do texto a visualização para visualizar como ficará seu gráfico. Escolha a série de dados em Lihas e clique em Próximo >>, surgirá: Selecioe Eixo Y, caso deseje visualizar lihas horizotais e escolha como quer o seu gráfico. Escolha o gráfico Empilhado com símbolos como mostrados o deseho. Clique em Próximo >> e surgirá: 77

Nessa tela você poderá escolher um título para o seu gráfico. Clique em Criar e o seu gráfico estará proto. Algumas modificações terão que ser feitas para que tehamos o Box-plot com sua cofiguração fial. Comece dado um clique duplo sobre o gráfico costruído. Em seguida dê um clique duplo sobre uma das lihas. Surgirá a caixa: 78

Clique em selecioar e escolha símbolo quadrado em Símbolos. Em seguida modifique o tamaho para as medidas a seguir, escolhedo a cor preta para todos eles: Escolha ivisível para o estilo da liha e apague a caixa de legeda clicado sobre ela e digitado a tecla delete. O seu gráfico ficará assim: 79

Algumas mudaças as cofigurações poderão deixar o gráfico assim: 7. Regressão Liear e Correlação Até o mometo, vimos técicas estatísticas em que se estuda uma variável de cada vez, estabelecedo-se sua distribuição de freqüêcia, média, desvio padrão etc. Porém, muitas vezes é ecessário estudar duas ou mais variáveis ao mesmo tempo. Por exemplo, pode-se obter mais iformações estudado peso e altura jutos do que estudado cada um separadamete; ou aida, reda mesal juto com gastos com livros. Em geral, estuda-se duas variáveis ao mesmo tempo com o objetivo de determiar se há alguma relação etre elas e, se houver, qual o tipo de relação. Pode-se, por exemplo, pesquisar uma relação etre idade e tempo de sobrevida em casos de cirurgia, ou procurar saber que tipo de relação (liear, expoecial ou outra) existe etre tempo de permaêcia de um paciete um programa de atedimeto domiciliar e os custos do atedimeto. Outras vezes estudam-se duas variáveis cojutamete a expectativa de poder usar uma delas para 80

prever a outra. Isto é o que será tratado este capítulo, formas de se relacioar duas variáveis e como represetá-la o OpeOffice. 7.1. Dados Bivariados Deomiaremos Dados Bivariados o par de valores correspodete a um dado idivíduo ou resultado experimetal. Para ilustrar o estudo vamos utilizar um exemplo que ilustra uma pesquisa feita com 10 aluos a qual foram obtidos o peso (kg) e a altura (cm) de cada um deles. Vamos observar a costrução da tabela: 7.. Diagrama de dispersão A técica mais simples e provavelmete mais útil para estudar a relação etre duas variáveis é o diagrama de dispersão. Em um diagrama de dispersão, cada um dos pares de observações (Xi,Yi), i = 1,...,, é represetado graficamete como um úico poto. Os Xs são colocados o eixo horizotal (abscissa) e os Ys são colocados o eixo vertical (ordeada). Olhado para o arrajo dos potos o gráfico, pode-se discerir um padrão idicador da forma fucioal subjacete aos dados. Após a digitação da tabela pode-se obter com facilidade o diagrama de dispersão, através do Assistete de Gráficos. Acompahe as istruções a seguir: 81

Marque um trecho da plailha, ode será iserido o gráfico. O quadro seguite surgirá a tela: Clique em Próximo >> e surgirá: Selecioe o tipo de gráfico desejado (o caso, Gráfico XY) e marque Mostrar elemetos do texto a visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e surgirá: 8

Desmarque Eixo Y para ão visualizar lihas horizotais. Ao fazer uma ova escolha o seu gráfico será mostrado o quadro à esquerda. Clique em Próximo >> e surgirá: Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a legeda apareça ou ão. Opte pelas opções mostradas o deseho. Clique em Criar e o seu gráfico estará proto. Caso apareça a mesagem: Clique em ão. 83

7.3. Regressão Liear Simples Olhado para os dados da pesquisa, vemos que alguma relação existe etre eles: quato maior o peso, maior a altura. Estes dados podem ser visualizados o diagrama de dispersão acima. Observe que em todos os potos caem exatamete sobre uma liha reta, mas a tedêcia é que os valores de Y cresçam de uma maeira aproximadamete liear à medida que os valores de X cresçam. Isto idica que a relação etre Y e X pode ser liear e pode ser descrita por uma liha reta. Vamos tetar determiar uma equação para essa reta. 7.3.1. A equação da reta Qualquer liha reta tem a forma geral: y=ax b, ode a dá a icliação da liha e b é o poto ode a liha cruza o eixo Y. Para quaisquer dois potos, é fácil determiar a liha reta que os ue; porém, para três ou mais potos, como o caso em questão, é em geral impossível ecotrar uma liha reta que passe por todos os potos. Neste caso, o que se teta fazer é ecotrar a liha reta que melhor represete a cofiguração dos potos. Para ecotrar a equação da reta precisamos ecotrar os valores de a e b e, para isso, utilizaremos as fuções INCLINAÇÃO e INTERCEPÇÃO. 84

O valor de a (coeficiete agular da reta) é calculada com o auxílio da fução INCLINAÇÃO. O valor de b (coeficiete liear da reta) é calculada com o auxílio da fução INTERCEPÇÃO. Acompahe as istruções a seguir: 85

7.3.. O gráfico da reta Vamos exemplificar logo em seguida a obteção da reta de regressão com o OpeOffice. Comece por resgatar o diagrama de dispersão costruído. Dê um clique duplo sobre o gráfico e, em seguido, um clique duplo sobre um dos potos. Surgirá o seguite quadro: Escolha a guia Estatísticas 86

Em seguida selecioe Regressão Liear em Curva de regressão. e clique em OK. Seu gráfico deverá ficar assim: 87

7.4. Coeficiete de Correlação Em geral, a aálise estatística, procura-se determiar a força de uma relação etre duas variáveis. A medida mais comumete usada para o grau de associação liear etre Y e X é o chamado coeficiete de correlação. O coeficiete de correlação pode ser calculado com o auxílio da fução CORREL. Em alguma célula dispoível digite =CORREL(A:A11;B:B11). Algumas mudaças as cofigurações poderão deixar seus dados assim: 88

8-BIBLIOGRAFIA 1. TRIOLA, Mario F. Itrodução a Estatística. 7ª ed Rio de jaeiro: LTC, 1999.. STEVENSON, William J. Estatística aplicada à admiistração. São Paulo: Editora Harbra LTDA, 1988. 3. CRESPO, Atôio Armot. Estatística fácil. São Paulo: Editora Saraiva, 1996. 4. SILVA, Medeiros da Silva, SILVA, Elio Medeiros, GONÇALVES, Valter, MUROLO, Atôio Carlos. Estatística Para os Cursos de Ecoomia, Admiistração e Ciêcias Cotábeis. a ed, Vol 1 e. São Paulo: Editora Atlas S.A, 1997. 5. DEVORE, Jay L. Probabilidade e Estatística para Egeharia e Ciêcias. 6ª Edição, São Paulo: Pieira Thomso Learig, 006. 89