ESTATÍSTICA APLICADA Profª Simone Della Torre Atualizada em 016 1
ESTATÍSTICA APLICADA A Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Estatística é dividida em duas áreas: Estatística Descritiva: Coleta de dados estatísticos, organização dos dados, redução dos dados, representação dos dados, obtenção de algumas informações que auxiliam a descrição do fenômeno observado. Estatística Indutiva: Tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo da probabilidade, possibilitando assim, propostas de soluções e decisões. CÁLCULO DE PROBABILIDADES ESPAÇO AMOSTRAL (S) : É o conjunto de todos os possíveis resultados de um experimento. Exemplo: Se consideramos o lançamento de um dado, teremos: S = {1,,3,4,5,6} e n(s) = 6 EVENTO (E): È qualquer subconjunto do espaço amostral. Exemplo: Se observarmos no lançamento de um dado a face superior tendo como resultado um número par, teremos: E = {,4,6} e n(e) = 3 PROBABILIDADE CLÁSSICA: P(E) = n(e) n(s) Exemplo: Qual a probabilidade de observarmos um número par no lançamento de um dado? S = {1,,3,4,5,6} e n(s) = 6 E = {,4,6} e n(e) = 3 P(E) = n(e) = 3 = 1 = 0,5 = 50% n(s) 6 EVENTOS COMPLEMENTARES: Sabemos que um evento pode ou não ocorrer. Sendo p a probabilidade que ele ocorra, (sucesso) e q a probabilidade de que ele não ocorra, (insucesso), para um mesmo evento existe sempre a relação: p + q = 1 Exemplo: Se p = ¼, então q = ¾
EVENTOS INDEPENDENTES: Dizemos que dois eventos são independentes quando a realização ou não de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Exemplo: Quando lançamos dois dados o resultado de um deles independe do resultado do outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é: P = p1 x p Exemplo: lançamos dois dados. A probabilidade de obtermos 3 no primeiro dado é 1/6. A probabilidade de obtermos 5 no segundo dado é 1/6. Logo, a probabilidade de obtermos SIMULTANEAMENTE 3 no primeiro dado e 5 no segundo dado é 1/6 x 1/6 = 1/36. EVENTOS MUTUAMENTE EXCLUSIVOS: Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um evento exclui a realização de(os) outro(os). Exemplo: No lançamento de uma moeda, o evento tirar cara e o evento tirar coroa são mutuamente exclusivos, já que ao realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que UM OU OUTRO ocorra é igual a soma das probabilidades da realização de cada um deles: P = p1 + p Exemplo: Lançamos um dado. A probabilidade se lermos o 3 ou o 5 na face superior é P = 1 + 1 = = 0,3333 = 33,33% 6 6 6 1ª lista de Exercícios 01) Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 5 cartas? 0) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 5 cartas? 03) Em um lote de 1 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a) A probabilidade de essa peça ser defeituosa b) A probabilidade de essa peça não ser defeituosa 04) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. 3
05) Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 5 cartas? 06) No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5? 07) Dois dados são lançados simultaneamente. Determine a probabilidade de lermos os resultados e obtermos a soma maior ou igual a 10. 08) Determine a probabilidade de cada evento: Um número ímpar aparece na face de um dado. Uma figura aparece ao se extrair uma carta de um baralho de 5 cartas. Uma carta de ouros aparece ao se extrair uma carta de um baralho de 5 cartas Uma só coroa aparece no lançamento de 3 moedas 09) O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto de 50 deputados presentes em uma reunião: Estado civil/sexo Homem Mulher Casado 10 8 Solteiro 5 3 Desquitado 7 5 Divorciado 8 4 Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos: Ser um homem; Ser uma mulher; Ser uma pessoa casada; Ser uma pessoa solteira; Ser uma pessoa desquitada; Ser uma pessoa divorciada. 4
10) O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o estado civil e a cor dos cabelos: Cor dos cabelos / Estado Civil Loira Morena Ruiva Casada 5 8 3 Solteira 4 1 Viúva 0 1 1 Divorciada 3 1 1 Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos: Ser casada; Não ser loira; Não ser morena nem ruiva; Ser viúva; Ser solteira ou casada; Ser morena e solteira; Ser viúva e ruiva. 11) De dois baralhos de 5 cartas, retiram-se simultaneamente uma carta do primeiro baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser um 5 de paus? 1) Uma urna A contém: 3 bolas brancas, 4 pretas e verdes Uma urna B contém: 5 bolas brancas, pretas e 1 verde Uma urna C contém: bolas brancas, 3 pretas e 4 verdes. Qual a probabilidade das 3 bolas retiradas das urnas A,B e C serem respectivamente: BRANCA, PRETA E VERDE? 13) De um baralho de 5 cartas retiram-se ao acaso cartas sem reposição. Qual a probabilidade da primeira carta ser o ás de paus e a segunda ser o rei de paus? 14) São dados dois baralhos de 5 cartas. Retiramos ao mesmo tempo uma carta do primeiro baralho e uma carta do segundo baralho. Qual a probabilidade de retirarmos uma dama e um rei não necessariamente nesta ordem? 15) Em um lote de 0 peças, 5 são defeituosas. Sendo retiradas aleatoriamente duas peças, calcule: A probabilidade de ambas serem defeituosas. 5
A probabilidade de ao menos uma ser defeituosa. 16) Uma loja dispões de 18 geladeiras do mesmo tipo das quais 6 apresentam defeitos. Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma defeituosa? Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar duas defeituosas? Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar pelo menos uma defeituosa? 17) Um lote é formado por 10 peças boas, 4 com defeitos e 3 com defeitos graves. Uma peça é escolhida ao acaso. Determine a probabilidade de que: Ela não tenha defeitos graves. Ela não tenha defeitos. DIAGRAMA DE VENN Diagramas de Venn são os diagramas usados em matemática para simbolizar graficamente propriedades, axiomas e problemas relativos aos conjuntos e sua teoria. Os respectivos diagramas consistem de círculos simples desenhados sobre um plano, de forma a simbolizar os conjuntos e permitir a representação das relações de pertença entre conjuntos e seus elementos Também pode ser utilizado no estudo da Estatística, a fim de organizar e analisar dados colhidos em pesquisas de opinião. Diagrama de Venn mostrando todas as interseções possíveis entre os conjuntos A e B e entre os conjuntos A, B e C. Exemplo 01) Representação de conjunto único N = (1,, 3, 4, 5, 6) 6
Exemplo 0) Representação de dois conjuntos: A e B A = (1,, 3, 4, 5, 6) B = (5, 6, 7, 8, 9, 10) Símbolos U = união = intersecção A U B = (1,, 3, 4, 5, 6, 7, 8, 9, 10) A B = (5, 6) A U B = (1,, 3, 4, 5, 6, 7, 8, 9, 10) A B = (5, 6) Exemplo 03) Relação entre três conjuntos: A, B e C. A = (3, 4, 5, 6, 7, 8) B = (4, 6, 8, 10, 1) C = (1,, 3, 4, 6, 10) A U B = (3, 4, 5, 6, 7, 8, 10, 1) A U C = (1,, 3, 4, 5, 6, 7, 8, 10) B U C = (1,, 3, 4, 6, 8, 10, 1) A B = (4, 6, 8) A C = (3, 4, 6) C B = (4, 6, 10) A B C = (4, 6,) 7
Exemplo 04) Uma prova classificatória foi composta por apenas duas questões. Sabese que: 100 pessoas acertaram as duas questões 170 pessoas acertaram a primeira questão 100 pessoas acertaram apenas uma das questões 95 pessoas erraram as duas questões Qual o número de pessoas que participaram da prova? 1º O número de alunos que acertaram as duas questões será representado pela intersecção dos conjuntos A e B, isto é, A B = 100 º O conjunto A tem 170 elementos, mas A B possui 100 elementos, dessa forma, somente 70 pessoas acertaram a questão A. 3º 100 pessoas acertaram apenas uma das questões e 70 pessoas acertaram a questão A, então 30 pessoas acertaram a questão B. 8
4º - Para finalizar, 95 pessoas que não acertaram nenhuma das questões. Participaram: 70+100+30+95 = 95 pessoas ª lista de Exercícios 01) Uma empresa fabricante de achocolatados pretende lançar um novo produto no mercado. Para isso encomendou uma pesquisa sobre as preferências dos consumidores entre duas embalagens A e B. Foram consultadas 40 pessoas, e o resultado foi precisamente: 150 pessoas gostaram somente da embalagem A; 40 pessoas gostaram das embalagens B; 60 pessoas gostaram das duas embalagens. Quantas pessoas não gostaram de nenhuma das duas embalagens, sabendo que todas as 40 pessoas opinaram? 0) Numa classe, 40 alunos tem noções de inglês, 45 de francês, sendo que 16 tem noções das duas línguas. Se dois disseram não ter conhecimento algum de línguas estrangeiras, pergunta-se: quantos alunos tem a classe? 03) Uma empresa entrevistou 300 dos seus funcionários a respeito de 3 embalagens : A, B e C para o lançamento de um novo produto. O resultado foi o seguinte: EMBALAGENS: Nº DE PESSOAS : A 160 B 10 C 90 A e B 30 A e C 40 B e C 50 A, B e C 10 9
a) Dos funcionários entrevistados, quantos não tinham preferência por nenhuma das 3 embalagens? b) Quantos não indicaram a embalagem C? 04) Numa pesquisa sobre preferências de detergentes realizada numa população de 100 pessoas, constatou-se que 6 consomem Minerval, 47 consomem Limpola e 10 pessoas nem Minerval nem Limpola. Quantas pessoas dessa população consomem tanto Minerval quanto Limpola? 05) Uma empresa automobilística colocou no mercado um automóvel em duas cores diferentes: Uma ousada, verde limão metálico e outra clássica, prata. Depois de algum tempo, entrevistou 00 pessoas sobre a preferência pelas cores desse automóvel. Dos entrevistados, 10 declararam preferir o verde, 14 o prata e 30 declararam desconhecer o automóvel. Quantas pessoas gostariam de encontrar o automóvel nas duas cores disponíveis? 06) De um grupo de auxiliares técnicos de produção, 44 leem o jornal A, 4 o jornal B e 18 leem ambos os jornais. Sabendo que todo auxiliar deste grupo é leitor de pelo menos um dos jornais, qual o número de auxiliares? Qual a probabilidade de selecionarmos ao acaso uma pessoa que lê somente o jornal A? 07) Realizou-se uma pesquisa e verificou-se que, das pessoas consultadas, 00 ouviam a rádio A, 300 ouviam a rádio B, 0 ouviam as duas rádios e 0 não ouviam nenhuma das duas rádios. Quantas pessoas foram consultadas? Qual a probabilidade de selecionarmos ao acaso uma pessoa que não ouve nenhuma das duas rádios? 08) Em uma escola foi realizada uma pesquisa sobre o gosto musical dos alunos. Os resultados foram os seguintes: 458 alunos disseram que gostam de Rock 11 alunos optaram por Pop 36 alunos gostam de MPB 6 alunos gostam de Rock e Pop Determine quantos alunos foram entrevistados. 10
ESTATÍSTICA DESCRITIVA Estatística Descritiva: Coleta de dados estatísticos, organização dos dados, redução dos dados, representação dos dados, obtenção de algumas informações que auxiliam a descrição do fenômeno observado. POPULAÇÃO E AMOSTRA População: Conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo. Exemplo: A idade de todos os alunos de uma faculdade. Amostra: Qualquer subconjunto (não vazio) de uma população. Exemplo: a idade dos alunos de uma classe de uma faculdade. Amostragem: A obtenção da amostra é feita através das seguintes técnicas: Amostragem casual ou aleatória simples. (sorteio) Amostragem proporcional estratificada. (proporção) Amostragem sistemática. (elaboração de um sistema a partir dos dados ordenados) Amostragem casual simples: No processo de amostragem casual simples, todos os elementos da população têm igual probabilidade de serem selecionados para constituir a amostra. Como exemplo, imagine que o gerente de uma indústria pretenda obter uma amostra dos empregados. Para isso, o gerente pode conferir um número a cada empregado e sortear aqueles que irão constituir a amostra, através de uma urna contendo todos os números. Amostragem proporcional estratificada: Usa-se o processo de amostragem estratificada quando a população se apresenta dividida em estratos, isto é, quando a população está dividida em grupos distintos. Como exemplo, imagine que o diretor de uma faculdade quer obter uma amostra da comunidade acadêmica. O diretor precisa considerar que a faculdade é constituída por três grupos distintos de pessoas, isto é, professores, funcionários e alunos. Então, para obter uma amostra mais representativa da comunidade acadêmica, o diretor deve selecionar uma amostra dentro de cada estrato, isto é, uma amostra dos professores, uma amostra dos funcionários e uma amostra dos alunos e depois reunir essas três amostras em uma só, constituindo então uma amostra estratificada. 11
Amostragem sistemática: No processo de amostragem sistemática, os elementos são selecionados para a amostra por um sistema preestabelecido. Assim, por exemplo, imagine que um gerente de vendas quer obter uma amostra dos clientes cadastrados de sua firma. Se as fichas dos clientes estiverem organizadas por ordem alfabética, o gerente obterá uma amostra sistemática se escolher a quinta de cada cinco fichas, ou a décima, de cada dez, etc. Apresentação dos dados: SÉRIES ESTATÍSTICAS: Dados Brutos: Seqüência de valores numéricos não organizados. Rol: Seqüência ordenada dos dados brutos. (pode ser crescente ou decrescente). A variável (objeto de estudo: altura, peso, idade, salário,etc.) pode ser qualitativa ou quantitativa. CLASSIFICAÇÃO DAS VARIÁVEIS: Vamos considerar dois tipos de variáveis: numéricas e não numéricas. As não numéricas serão consideras qualitativas e as numéricas quantitativas. A variável é qualitativa quando os possíveis valores que assumem representam atributos ou qualidades. Se tais variáveis têm uma ordenação natural, indicando intensidades crescentes de realização, então serão classificadas como qualitativas ordinais (tamanho: pequeno, médio, grande; classe social: baixa, média, alta). Caso contrário, quando não é possível estabelecer uma ordem natural entre seus valores, elas serão classificadas como qualitativas nominais ( sexo: feminino, masculino; candidato: A ou B; se fuma: sim ou não) A variável é quantitativa quando sua natureza é numérica, (idade, peso, salário, etc) e podem ser divididas em discretas e contínuas. Variáveis quantitativas discretas podem ser vistas como resultantes de contagens, assumindo em geral, valores inteiros (número de irmãos: 0,1,...; número de defeitos: 0,1,,3... ) Variáveis quantitativas contínuas assumem valores em intervalos dos números reais e, geralmente, são provenientes de uma mensuração (peso, altura). VARIÁVEL Qualitativa Quantitativa Nominal Ordinal Discreta Contínua 1
1ª Lista de Exercícios 01) Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa (discreta ou contínua): a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou não são possíveis respostas para esta variável). b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de não sei). c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos. d) Intensidade da perda de peso de maratonistas na corrida de São Silvestre (leve, moderada, forte). 0) Qual a diferença entre população e amostra? Exemplifique 03) Numa escola com 500 alunos, 300 são homens e 00 são mulheres. Obtenha uma amostra de 10% da população, utilizando a amostragem proporcional estratificada.. 04) Numa empresa, um equipamento funciona em 4 turnos cuja produção/turno é indicada na tabela abaixo. Serão coletadas, para análise, 160 peças durante o processo de produção. Determinar o total de peças que serão coletadas de cada turno (amostragem proporcional estratificada). TURNO PRODUÇÃO/TURNO AMOSTRA 0 h às 6:00 h 300 6:00 h às 1:00 h 400 1:00 h às 18:00 h 500 18:00 h às 4:00 h 400 Total 1.600 TABELAS E GRÁFICOS Tabelas : As informações obtidas podem ser apresentadas através de tabelas, contendo todas as informações necessárias para uma boa leitura e interpretação dos dados. Uma empresa fez o levantamento do salário de seus 50 funcionários, conforme mostra a tabela: Salário dos 50 funcionários da Empresa XYZ em dez/016 Salário Mínimo Nº e funcionários 18 3 1 4 10 5 6 6 4 13
Salário Mínimo (quantidade) Nº de funcionários Nº de Funcionários Gráficos: As informações obtidas podem ser apresentadas através de gráficos, contendo todas as informações necessárias para uma boa leitura e interpretação dos dados. As apresentações gráficas são variadas. A escolha do tipo de gráfico fica a critério do analista. Vamos ressaltar alguns modelos mais utilizados: Gráfico de colunas: Salários (S.M.) dos funcionários da empresa 0 15 10 5 0 1 3 4 5 Quantidade de Salário Mínimo Gráfico de barras: Salário de 50 funcionários da Empresa XYZ em dez/000 6 5 4 3 1 0 5 10 15 0 Salário Mínimo (quantidade) Gráfico de Linhas (curva) Salário de 50 funcionários da Empresa XYZ em dez/000 0 15 10 5 0 1 3 4 5 6 7 Nº de funcionários Gráfico de Setores (Pizza) Esporte Preferido dos alunos do 1º ano da Faculdade WW de Administração/período matutino Futebol Voley Natação Basquete 14
DISTRIBUIÇÃO DE FREQUÊNCIAS A variável é o objeto de estudo e é indicado pela letra x Tabulamos o conjunto de freqüências em ordem crescente na primeira coluna (variável x) e na segunda coluna colocamos os valores das freqüências simples, (quando o número de elementos distintos da série for pequeno). Exemplo: Notas de prova de 30 alunos : 3 4 -,5 4-4,5 6 5-5,5-6,5 7 7,5-3,5 5-5,5 8-8,5 7,5-9 - 9,5 5-5,5-4,5 4-7,5-6,5 5-6 - 6,5-6 Notas (xi) nº de alunos (fi),0 1,5 1 3,0 1 3,5 1 4,0 3 4,5 5,0 4 5,5 3 6,0 3 6,5 3 7,0 1 7,5 3 8,0 1 8,5 1 9,0 1 9,5 1 Agrupamos os dados por faixa de valores na primeira coluna e na segunda colocamos os valores das freqüências relativas aos agrupamentos. Classe Intervalo de classe fi 1 ---- 4 4 4 ---- 6 1 3 6 ---- 8 10 4 8 ----10 4 Intervalos de classe: Note que as notas do exemplo anterior foram agrupadas em intervalos de classe: O intervalo da 1ª classe é: ---- 4, que compreende as notas maiores ou iguais a e menores que 4. O intervalo da ª classe é 4 ---- 6, que compreende notas maiores ou iguais a 4 e menores que 6, e assim por diante. Faremos agora, algumas observações: 15
Dado um intervalo de classe, o limite inferior é dado por l e o limite superior é dado por L. No caso da 1ª classe do exemplo: ---- 4, o limite inferior é igual a e o limite superior é igual a 4. Assim temos l = e L = 4. A diferença entre os limites superior e inferior, denominamos de amplitude do intervalo de classe h = L - l Amplitude Total da Série: É a diferença entre o maior e menor elemento de uma seqüência de dados. At = Xmáx Xmín Número de classes (K) : O número de classes depende muito do pesquisador e de sua experiência. Existem diferentes critérios para determinarmos o número de classes. Vamos adotar o critério da RAIZ: Critério da raiz: K = n, onde n = número de elementos e K o número (inteiro) de classes No exemplo dado anteriormente, n = 30 (30 notas de alunos) onde K = 30 = 5,477. Vamos ajustar o valor, pois K é necessariamente um número inteiro: 4, 5 ou 6 At 10 8 h e aplicando a fórmula, temos: h k 4 4 Portanto, temos que a amplitude do intervalo de é igual a. Assim, O primeiro intervalo começa com a menor nota () e vai até 4, ou seja (+). O segundo intervalo de classe começa com 4 e vai até 6 (4+), o terceiro intervalo começa com 6 e vai a té 8 (6+) e finalmente o quarto e último intervalo começa com 8 e vai até 10 (8+). Exemplo: Um teste para aferir o quociente de inteligência (QI) em determinada classe de alunos de uma faculdade, deu origem a seqüência de valores : 60 70 7 75 78 79 80 8 83 84 87 88 90 91 9 93 94 95 96 97 98 99 100 101 10 103 104 105 106 107 108 108 109 109 110 111 11 11 11 113 113 114 114 115 115 115 116 116 116 115 117 118 119 119 11 1 1 13 13 14 14 15 15 15 17 18 18 18 130 138 Observe que fica inviável a tabela de freqüência através da variável discreta. Portanto, vamos elaborar a tabela de freqüências através da variável contínua: 1º Passo: Verificamos que a seqüência possui 70 elementos. n = 70 º Passo: Pelo critério da Raiz, temos K = n, então K = 70 8, 37 3º Passo: Temos a opção de construir a variável contínua com 7, 8 ou 9 classes. 4º Passo: Determinar a amplitude total da série: At = Xmáx Xmín At = 140 60 = 80 Observe que 80 é divisível por 8. Então, K = 8 (vamos construir uma tabela com 8 classes.) At 5º Passo: Cálculo da amplitude do intervalo de classe: h k 16
80 h 10 (cada classe contém um intervalo igual a 10) 8 Computando as freqüências simples de cada classe, temos: Classe Intervalo de classe Freqüência Simples (fi) 1 60 ---- 70 1 70 ---- 80 5 3 80 ---- 90 6 4 90 ---- 100 10 5 100 ---- 110 1 6 110 ---- 10 19 7 10 ---- 130 14 8 130 ---- 140 3 Total n = 70 HISTOGRAMA Representação gráfica variável contínua (intervalos de classe) Notas dos alunos de uma Faculdade) 0 15 10 5 0 60 70 80 90 100 110 10 130 140 Histograma Na estatística, um histograma é uma representação gráfica da distribuição de frequências de uma massa de medições, normalmente um gráfico de barras verticais. É uma das Sete Ferramentas da Qualidade. O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. Tabela de Freqüências: Freqüência simples ou absoluta (fi): é o número de vezes que o elemento aparece na série de dados Freqüência relativa (fr): representa a participação percentual de cada freqüência fi simples ou absoluta da série de dados. fr. 100 n Freqüência simples acumulada (Fi) : é a soma das freqüências simples deste elemento com as freqüências simples dos elementos que o antecedem. 17
Freqüência acumulada relativa de um elemento da série (Fr): é a divisão da Fi freqüência acumulada deste elemento pelo total de elementos da série. Fr n Exemplo: Suponha o resultado das notas de 5 alunos de uma faculdade: Tabela de Freqüência Variável Discreta Nota (xi) Freq. simples (fi) Freq. relativa (fr) % Freq. Simples Acumulada (Fi) Freq. Relativa acumulada (Fr) % 3 (3/5).100= 1 3 ( 3/5).100= 1 3 7 (7/5).100= 8 10 (10/5).100= 40 4 8 (8/5).100= 3 18 (18/5).100= 7 6 6 (6/5).100= 4 4 (4/5).100= 96 7 1 (1/5).100= 4 5 (5/5).100= 100 Total n = 5 100 Exemplo: Suponha o resultado das notas de 40 alunos de uma faculdade: Classe Intervalo de classe Freq. simples (fi) Freq. relativa simples (%) Freq. Simples Acumulada (Fi) Freq. Relativa acumulada (Fr) % 1 --- 4 6 15% 6 15% 4 --- 6 18 45% 4 60% 3 6 --- 8 10 5% 34 85% 4 8 --- 10 6 15% 40 100% Total n = 40 100 % 01) O que são dados brutos? ª Lista de Exercícios 0) O que é Rol? 03) Por que os estatísticos estudam amostras e não populações? 04) Para cada uma das séries seguintes, determine o Rol, o número total da série e a amplitude total: a) Pesquisa A: - 4-8 - 7-1 - 15-1 - 0 At = n = 18
b) Pesquisa B: 8-7 - 8-7 - 8-7 - 9 At = n = 05) Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metrô e trem, o número de diferentes meios de transportes utilizados foi o seguinte: 3 1 1 1 3 1 1 1 3 1 1 1 1 1 1 1 1 3 a) Construa a tabela de freqüência. b) Represente graficamente os dados obtidos (gráfico de Colunas) c) Admitindo que essa amostra represente bem o comportamento do usuário paulistano, você acha que a porcentagem dos paulistanos que utilizam mais de um tipo de transporte é grande? Justifique. Meios de Transporte xi 1 3 total nº usuários fi porcentagem fr Freq acumul Fi Freq Acumul (%) Fr 06) A idade dos 0 ingressantes num certo ano no curso de pós-graduação em jornalismo de uma universidade foi o seguinte: 3 3 4 4 4 4 5 5 6 6 6 6 7 8 35 40 a) Determine a amplitude total da série. b) Represente os dados em uma tabela de freqüência (sem intervalo de classe). 19
Idade xi nº ingressantes fi porcentagem fr Freq acumul Fi Freq Acumul (%) Fr c) Qual o percentual de alunos com menos de 5 anos de idade? d) Quantos alunos ingressaram com 5 anos ou mais? e) Represente graficamente (Faça o gráfico de colunas) Idade de Ingressantes no curso de Pós-Graduação nº ingressantes fi Idade xi 07) Um grupo de pedagogas estuda a influência na troca de escolas no desempenho dos alunos do ensino fundamental. Como parte do levantamento realizado, foi anotado o número de escolas cursadas pelos alunos participantes do estudo: 0
Escolas cursadas (xi) nº de alunos (fi) 1 46 57 3 1 4 15 5 4 a) Qual é a porcentagem dos alunos que cursaram uma escola? b) Qual é a porcentagem dos alunos que cursaram até duas escolas? c) Qual é a porcentagem dos alunos que cursaram mais de 3 escolas? 08) O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 6 medidas desse tempo (em minutos): 1,1 1, 1,7 1,5 0,9 1,3 1,4 1,6 1,7 1,6 1,0 0,8 1,5 1,3 1,7 1,6 1,4 1, 1, 1,0 0,9 1,8 1,7 1,5 1,3 1,5 a) Agrupe os dados em intervalos de classe com amplitude do intervalo de 0, começando com 0,8. b) Construa a tabela de freqüência. c) Qual a porcentagem de usuários com 1,6 minutos ou mais? d) Quantos usuários utilizam menos de 1,4 minutos? Tempo (min) xi 0,8 --- 1,0 1,0 --- 1, 1, --- 1,4 nº usuários fi porcentagem fr Freq acumul Fi Freq Aculum (%) Fr Total 1
Tempo de utilização de caixas eletrônicos (em minutos) Nº usuários fi xi Tempo em minutos 09) Uma empresa automobilística selecionou ao acaso uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores: 10 15 5 1 6 3 15 1 6 3 9 14 19 0 3 18 16 6 4 0 7 18 17 8 35 19 39 18 1 15 18 0 5 8 30 16 1 0 a) Construa a tabela de freqüência através da variável contínua, utilizando o método da Raiz.. b) Observando a tabela, qual a porcentagem de revendedores que adquiriram menos de 5 carros? Rol: 6 7 9 10) Observe o gráfico abaixo:
Nº de dias Vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial 10 8 6 4 0 10 11 1 13 14 15 16 17 Nº de aparelhos vendidos a) Construa a tabela de freqüência. Nº aparelhos (xi) Nº de dias (fi) fr % Fi Fr % b) Qual a amplitude total da série de dados? c) Qual a porcentagem registrada para as vendas de até 14 aparelhos diários? 11) A tabela abaixo apresenta a distribuição de freqüência de duração de 300 lâmpadas efetuadas num laboratório. Duração em horas (xi) Número de lâmpadas (fi) 300 --- 400 4 400 --- 500 56 500 --- 600 68 600 --- 700 86 700 --- 800 66 Total Determine: a) O limite inferior da ª classe. 3
b) O ponto médio (xi) da ª classe. c) A amplitude do intervalo da 3ª classe. d) A freqüência relativa das 3ª classe. e) A freqüência acumulada das ª classe. f) A porcentagem de lâmpadas com duração maior ou igual a 500 horas. MEDIDAS DE TENDÊNCIA CENTRAL (Média Mediana Moda) Ao estudarmos uma série estatística, é conveniente o cálculo de algumas medidas que a caracterizam. Essas medidas podem nos fornecer informações importantes em relação à série estatística. Dessa forma, podemos localizar a maior concentração de valores de uma distribuição. Média: X Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos estudos, iremos nos limitar a mais importante: a média aritmética: Média Aritmética é o quociente da divisão da soma dos valores da variável (x) pelo número deles. 1º Caso: Dados não agrupados: x X, onde n é o número de elementos da série: n Exemplo) Observe a nota de 5 alunos de uma turma: 5,0-6,0-7,0-8,0-9,0 x X n 50 6,0 7,0 8,0 9,0 = 7, 0 5 Interpretação: A média de notas da turma é de 7,0, (7,0 é o valor em torno do qual os elementos se concentram). xi. fi º caso: Dados agrupados variável discreta: X n Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma empresa, referente aos salários (em S.M.) Salário Mínimo nº e funcionários xi.fi 18.18 = 36 3 1 3.1 = 36 4 10 4.10 = 40 5 6 5. 6 = 30 6 4 6. 4 = 4. fi 166 4
xi. fi X n 166 = 3, 3 50 Interpretação: A média de salários (S.M.) dos funcionários da empresa é de 3,3, (3,3 é o valor em torno do qual os elementos da série se concentram). 3º caso: Dados agrupados variável contínua: xi. fi X n Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade: Intervalo freq. simples (fi) xi xi.fi --- 4 6 3 3. 6 = 18 4 --- 6 18 5 5.18 = 90 6 --- 8 10 7 7.10 = 70 8 --- 10 6 9 9. 6 = 54 n = 40 xi. fi 3 xi. fi 3 X = 5, 8 n 40 Interpretação: A média de notas dos alunos da faculdade é de 5,8, (5,8 é o valor em torno do qual os elementos da série se concentram) 3ª Lista de Exercícios 01) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com dois filhos foi: 170 180 190 185 190. Determine o consumo médio referente ao período citado. 0) Uma máquina produz peças que são embaladas em caixas. Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas segundo a tabela: nº de peças com defeito (xi) número de caixas (fi) 0 0 1 15 1 3 6 4 4 5 Determine a quantidade média de peças com defeito encontradas nas caixas. 5
03) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela: aumento de peso em Kg nº de animais (fi) 0 --- 1 5 1 --- 15 --- 3 5 3 --- 4 35 4 --- 5 0 Total a) Qual o aumento médio de peso por animal? b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de 3,1 Kg/animal, esta nova ração pode a princípio ser considerada mais eficiente? 04) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi observado: tempo de mão-de-obra (horas) xi nº de motores 0 --- 4 1 4 --- 8 5 8 --- 1 10 1 --- 16 1 16 --- 0 4 Total fi xi xi.fi a) Determine o tempo médio de mão-de-obra necessário para a revisão de cada motor. b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para a revisão de dez motores que aguardam revisão? c) Se a empresa dispõe no momento de dois homens trabalhando 1 horas por dia nestas revisões conseguirá provavelmente revisar estes dez motores em quatro dias? d) Construa o histograma. 6
Mediana: X ~ ou Md A mediana é um valor que ocupa a posição central em uma série, que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. 1º Caso: Dados não agrupados: se n é ímpar : o rol apresenta somente um termo central que ocupa a posição X ~ n 1 = º n se n é par: o rol apresenta dois termos centrai que ocupam as posições º e A mediana é calculada pela média das duas posições centrais. n 1 º. Exemplo) Observe a nota de 5 alunos de uma turma: 5,0-6,0-7,0-8,0-9,0 n = 5, portanto, a mediana ocupa a posição X ~ n 1 5 1 = º = 3ª posição, X ~ = 7,0 Interpretação: 50% dos valores do rol são valores menores ou iguais a 7 e 50% dos valores do rol são valores maiores ou iguais a 7,0 Exemplo) Observe a nota de 6 alunos de uma turma: 5,0-6,0-7,0-8,0-9,0 9,0 n n n = 6, portanto, a mediana ocupa a posição ª posição e 1 ª posição. n 6 n 6 = 3 ª posição e 1 = 1 3 1 4 ª posição, X ~ 7 8 = 7, 5 Interpretação: 50% dos valores do rol são valores menores ou iguais a 7,5 e 50% dos valores do rol são valores maiores ou iguais a 7,5 º caso: Dados agrupados variável discreta O processo do cálculo da mediana é o mesmo. Basta observar o número de elementos da série e seguir os critérios já estabelecidos, localizando o valor mediano na tabela de freqüência acumulada (Fi): Exemplo) Observe o resultado de um levantamento feito com 51 funcionários de uma empresa, referente aos salários (em S.M.) 7
Salário Mínimo nº de funcionários (fi) Freq. Acumulada (Fi) 18 18 3 1 30 4 10 40 5 6 46 6 5 51 Total n = 51 n = 51 (ímpar), a posição central é X ~ n 1 511 5 = = 6ª posição A mediana ocupa a 6ª posição e fazendo a localização através da freqüência acumulada, observamos que a mediana é 3. Interpretação: 50% dos funcionários recebem 3 salários mínimos ou menos e 50% dos funcionários recebem 3 salários mínimos ou mais. Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma empresa, referente aos salários (em S.M.) Salário Mínimo nº e funcionários (fi) Freq. Acumulada (Fi) 18 18 3 1 30 4 10 40 5 6 46 6 4 50 Total n = 50 N = 50 (par). Vamos determinar os dois termos centrais: n 50 n = 5 ª posição e 1 50 = 1 5 1 6ª posição 5ª posição = 3 e 6ª posição = 3 X ~ 3 3 6 = 3 Interpretação: 50% dos funcionários recebem 3 salários mínimos ou menos e 50% dos funcionários recebem 3 salários mínimos ou mais. 3º caso: Dados agrupados variável contínua: n Fac ~ X li fi ant classe h 8
Onde: li = limite inferior da classe da mediana n = número de elementos da série Fac ant = freqüência acumulada anterior à classe da mediana h = amplitude da classe da mediana fi classe = freqüência simples da classe da mediana Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade: Classe Intervalo freq. simples (fi) Freq Acumulada (Fi) 1 --- 4 6 6 Fac ant li 4 --- 6 18 fi 4 3 6 --- 8 10 34 4 8 --- 10 6 40 Total n = 40 n 40 1ºpasso: calcular 0ª posição, portanto, a mediana pertence à segunda classe de intervalos: 4 --- 6 º passo: identificamos: li = 4 h = (4-) = Fac ant = 6 e fi = 18 n 40 Fac ant h 6 ~ X li ~ 0 6 14 = X 4 4. 4. ficlasse 18 18 18 ~ X 4 0,77. 4 1,55 5,55 Interpretação: 50% dos alunos tem notas menores ou iguais a 5,55 e 50% dos alunos tem notas maiores ou iguais a 5,55. 4ª Lista de Exercícios 01) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com dois filhos, foi: 170 180 190 185 190. Determine o consumo mediano referente ao período citado e interprete o resultado. 0) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades. Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas segundo a tabela: 9
nº de peças com número de caixas (fi) defeito (xi) 0 0 1 15 1 3 6 4 4 5 Total Determine a quantidade mediana de peças com defeito encontradas nas caixas e interprete o resultado. 03) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela: aumento de peso em Kg nº de animais (fi) 0 --- 1 5 1 --- 15 --- 3 5 3 --- 4 35 4 --- 5 0 Total a) Qual o aumento mediano de peso por animal? b) Interprete o resultado. 04) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi observado: tempo de mão-de-obra (h) nº de motores 0 --- 4 1 4 --- 8 5 8 --- 1 10 1 --- 16 1 16 --- 0 8 a) Determine o número mediano de hora de mão-de-obra necessário para a revisão de cada motor. b) Interprete o resultado 30
05) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isso, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: Vendas (R$) nº de vendedores (fi) 0 --- 10.000 1 10.000 --- 0.000 1 0.000 --- 30.000 7 30.000 --- 40.000 31 40.000 --- 50.000 10 a) A partir de qual volume de vendas o vendedor será premiado? b) Qual a média de vendas? c) Interprete os resultados obtidos. Moda (Mo) A moda é o valor que aparece com maior freqüência em um conjunto de dados 1º Caso: Dados não agrupados: Exemplo) Observe a nota de 5 alunos de uma turma: 5,0-6,0-6,0-8,0-9,0 A moda é 6,0, pois aparece com maior freqüência. Exemplo) Observe a nota de 5 alunos de uma turma: 5,0-6,0-6,0-8,0-8,0 A moda é 6 e 8, pois aparecem com maior freqüência Observe a nota de 5 alunos de uma turma: 5,0-5,0-6,0-6,0-9,0 9,0 Note que não há um elemento que se destaque pela maior freqüência. Portanto, a série é amodal (não há moda) º caso: Dados agrupados variável discreta: Basta identificar o valor que aparece com maior freqüência. Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma empresa, referente aos salários (em S.M.) 31
Salário Mínimo nº de funcionários (fi) = moda 18 (maior freq) 3 1 4 10 5 6 6 5 Total n = 51 Tabela 10 A moda é igual a salários mínimos, pois apresenta a maior freqüência. 3º caso: Dados agrupados variável contínua: Neste caso, vamos utilizar a fórmula de Czuber: Mo l mo. f mo f mo ( f f ant ant f post h ) Onde: l mo = limite inferior da classe modal f mo = freqüência simples da classe modal f ant = freqüência simples da classe anterior à modal. f post = freqüência simples da classe posterior à classe modal h = amplitude do intervalo de classe. Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade: Classe Intervalo freq. simples (fi) 1 --- 4 6 f ant li 4 --- 6 18 f mo 3 6 --- 8 10 f post 4 8 --- 10 6 Total n = 40 Tabela 11 1º passo: Verificar a classe com a maior freqüência: classe com freqüência = 18 º passo: identificar: l mo = 4 f mo = 18 f ant = 6 f post = 10 h = (6-4) 18 6 Mo 4.18 (6 10) 3
1 Mo 4 36 16 1 Mo 4 0 Mo 4 0,6 Mo 4 1, Mo 5, Interpretação: A moda é nota igual a 5,. 5ª Lista de Exercícios 01) Calcule a moda das séries abaixo: a) x: 3 5 4 4 8 b) x: 4 3 5 9 1 4 3 c) x: 4 5 6 6 6 7 8 8 8 10 10 10 11 0) Calcule a moda da distribuição do número de acidentes diários, observados em um cruzamento, durante 40 dias: nº de acidentes (xi) nº de dias (fi) 0 30 1 5 3 3 1 4 1 03) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com dois filhos, foi: 170 180 190 185 190. Determine a moda de consumo referente ao período citado e interprete o resultado. 04) Uma máquina produz peças que são embaladas em caixas. Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas segundo a tabela: nº de peças com defeito (xi) número de caixas (fi) 0 0 1 15 1 3 6 4 4 5 Determine a moda de peças com defeito encontradas nas caixas e interprete o resultado. 33
05) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela: aumento de peso em Kg nº de animais (fi) 0 --- 1 5 1 --- 15 --- 3 5 3 --- 4 35 4 --- 5 0 a) Determine a moda de aumento de peso dos animais com a nova ração. b) Interprete o resultado. 06) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi observado: tempo de mão-de-obra (h) nº de motores 0 --- 4 1 4 --- 8 5 8 --- 1 10 1 --- 16 1 16 --- 0 4 Total a) Determine a moda de tempo de mão-de-obra b) Interprete o resultado 07) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isso, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela: Vendas (R$) nº de vendedores (fi) 0 --- 10.000 1 10.000 --- 0.000 1 0.000 --- 30.000 7 30.000 --- 40.000 31 40.000 --- 50.000 10 Total a) Determine a moda de vendas dos funcionários. b) Interprete o resultado. 34
MEDIDAS SEPARATRIZES Chamamos medidas separatrizes àquelas que separam a distribuição em partes iguais. As medidas separatrizes são: Quartis dividem a distribuição em 4 partes iguais Q1 Q Q3 0% 5% 50% 75% 100% Decis dividem a distribuição em 10 partes iguais: D1 D D3 D4 D5 D6 D7 D8 D9 0% 10% 0% 30% 40% 50% 60% 70% 80% 90% 100% Centis dividem a distribuição em 100 partes iguais P1 P P3 P4 P5 P6 P97 P98 P99 0% 1% % 3% 4% 5% 6%... 97% 98% 99% 100% 1º Caso: Dados não agrupados: Exemplo: X: 3 5 5 5 8 10 11 1 1 13 15 Q1 = 5% Calculamos 5% de 1 = 3 Este valor indica que o Q1 localiza-se na 3ª posição e é igual a 5 Interpretação: 5% dos valores da seqüência são menores ou iguais a 5 e 75% dos valores da seqüência são maiores ou iguais a 5 P1 = 10% Calculamos 10% de 1 = 1, Este valor não inteiro indica que o P1 é um valor situado entre o 1º e º elemento da seqüência. Calculamos a média correspondente: 35
1º valor = e º valor = 3 3 5 P1 =, 5 Interpretação: 10% dos valores da seqüência são menores ou iguais a,5 e 90% dos valores da seqüência são maiores ou iguais a,5. º Caso: Dados agrupados variável discreta. Exemplo: Observe a tabela: xi Fi Fi 3 3 4 5 8 5 8 16 7 6 10 4 Total n = 4 Tabela 1 D4 = 40% de 4 = 9,6 Esta posição não inteira significa que D4 é um valor compreendido entre o 9º e 10º elemento da série. Observando a tabela de freqüência acumulada, percebemos que o 9º elemento é igual a 5 e o 10º elemento também é 5. A média entre eles é igual a 5. Portanto, D4 = 5 Interpretação: 40% dos valores desta série são valores menores ou iguais a 5 e 60% dos valores desta série são maiores ou iguais a 5 3º Caso: Dados agrupados variável contínua i n Fac ant Pi li 100 h fi Onde: Pi = Percentil i (i = 1,,3,4,...99) li = limite inferior da classe que contém o percentil i n = número de elementos da série. Fac ant = freqüência acumulada da classe anterior a classe que contém o Pi fi = freqüência simples da classe que contém o percentil i h = amplitude do intervalo de classe. 36
Exemplo) Observe a tabela abaixo: Intervalo classe fi Fi 0 --- 10 16 16 10 --- 0 18 34 0 --- 30 4 58 Fac ant li 30 --- 40 35 fi 93 40 --- 50 1 105 Total n = 105 Tabela 13 Calcule o Q3 da série: Q3 = P75 = 75% 75% de 105 = 78,75, isto é, nos dá a posição de P75 na série A classe que contém o elemento que ocupa a posição 78,75 na série é a quarta classe. Esta é a classe que contém P75. i n Fac ant Pi li 100 h fi 78,75 58 P 75 30 10 35 P75 30 5,93 P75 35,93 Interpretação: 75% dos valores da série são menores ou iguais a 35,93 e 5% dos valores da série são maiores ou iguais a 35,93 6ª Lista de Exercícios 01) A distribuição de freqüência abaixo representa a idade de 50 alunos de uma classe. Idade (xi) nº de alunos (fi) 17 3 18 18 19 17 0 8 1 4 total a) Calcule Q1, D5, P95 e interprete o resultado 37
0) A tabela abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos: Consumo por notas (R$) fi 0 --- 50 10 50 --- 100 8 100 --- 150 1 150 --- 00 00 --- 50 1 50 --- 300 1 Total a) Calcule Q3 e interprete o resultado b) Calcule D3 e interprete o resultado c) Calcule P98 e interprete o resultado 03) Uma empresa estabelece o salário dos vendedores com base na produtividade. Uma amostra de salários mensais nesta empresa revelou o quadro abaixo: Salários US$ fi 70 --- 10 8 10 --- 170 8 170 --- 0 54 0 --- 70 3 70 --- 30 1 30 --- 370 6 Total a) A empresa colocou uma meta extra para 5% dos vendedores que pior desempenho tiveram. Até que valor de vendas o funcionário receberá a meta de vendas? b) Para premiar os melhores vendedores, a empresa resolveu conceder um abono para 3% dos funcionários que tiveram melhor desempenho. A partir de que salário o funcionário receberá o abono? 38
MEDIDAS DE DISPERSÃO: Observe as seqüências: 1 3 7 10 10 11 15 18 0 35, cuja média é 13 1 1 1 13 13 13 13 14 14 14, cuja média é 13 13 13 13 13 13 13 13 13 13 13 cuja média é 13 Analisando as três séries acima, podemos concluir que todas possuem a mesma média, no entanto, são completamente distintas do ponto de vista da variabilidade de dados. Uma breve reflexão sobre as medidas de tendência central não são suficientes para caracterizar totalmente uma seqüência numérica. As medidas de dispersão avaliam a representatividade da média. Amplitude Total: É a diferença entre o maior e o menor valor da seqüência. Desvio Padrão VARIÂNCIA E DESVIO PADRÃO Observamos no item anterior que a dificuldade em se operar o DMS se deve à presença do módulo, para que as diferenças xi - _ x possam ser interpretadas como distâncias. Outra forma de conseguir que as diferenças se tornem sempre positivas ou nulas é considerar o quadrado destas diferenças, isto é: (xi - _ x ). A variância é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e sua média. O desvio padrão é a raiz quadrada positiva da variância. Quando a seqüência de dados representa uma POPULAÇÃO, a variância está _ ( xi x). fi denotada por e o desvio padrão por n Quando a seqüência de dados representa uma AMOSTRA, a variância está ( xi x) fi denotada por s e o s n 1 ( xi x) n 1 fi Veremos os mesmos exemplos dados anteriormente, considerando-os amostra. Exemplo 1) Considere as notas de uma turma de 4 alunos: 3 4 6 7 39
_ 3 4 6 7 0 Vamos determinar a média: x 5 4 4 Vamos determinar as distâncias de cada nota para a média da série: (3 5) = 4.1 = 4 (4 5) = 1.1 = 1 (6 5) ( xi x) = 1.1 = 1 = 4 + 1 + 1 + 4 = 10 (7 5) = 4.1 = 4 ( xi x) fi 10 10 Variância = s = 3, 33 n 1 4 1 3 Desvio padrão = S = 3,33 1, 8 Interpretação: Há um desvio padrão de 1,8 pontos em relação à média 5. Exemplo ) Observe a tabela abaixo, que demonstra as notas de 10 alunos de uma turma: Notas(xi) nº de alunos(fi) xi.fi _ ( xi x). fi 5 10 (5 6,4). = 3,9 6 3 18 (6 6,4). 3 = 0,48 7 4 8 (7 6,4). 4 = 1,44 8 1 8 (8 6,4). 1 =,56 N = 10 xi.fi = 64 xi x. fi 8,40 Tabela 15 _ 64 Vamos determinar a média: x 6, 4 10 ( xi x) fi 8,4 8,4 Variância = s = 0, 933 n 1 10 1 9 Desvio padrão = S = 0,933 0, 96 Interpretação: Há um desvio padrão de 0,96 pontos em relação à média 6,4. 40
Exemplo 3) Observe a tabela abaixo, referente a notas de 0 alunos de uma turma: classe Notas Nº de alunos (fi) Notas (xi) xi.fi _ ( xi x). fi 1 --- 4 5 3 15 (3 5,1) 5 =,05 4 --- 6 10 5 50 (5 5,1) 10 = 0,1 3 6 --- 8 4 7 8 (7 5,1). 4 = 14,44 4 8 --- 10 1 9 9 (9 5,1) 1 = 15,1 n = 0 10 xi x. fi 51,8 Tabela 16 10 Cálculo da média: 5, 1 0 ( xi x) fi 51,8 51,8 Variância = s =, 73 n 1 0 1 19 Desvio padrão = S =,73 1, 65 Interpretação: Há um desvio padrão de 1,65 pontos em relação à média 5,1. Interpretação do desvio padrão: O desvio padrão é a mais importante das medidas de dispersão. È fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados da série. Quando uma curva de freqüência da série é perfeitamente simétrica, podemos afirmar: _ o intervalo [ x x ] contém aproximadamente 68% dos valores da série; _, o intervalo [ x, x ] contém aproximadamente 95% dos valores da série; o intervalo [ x 3, x 3 ] contém 99% dos valores da série. Obs: Quando a distribuição não é perfeitamente simétrica, esses percentuais apresentam pequenas variações para mais ou para menos, segundo caso. Exemplo: Quando uma série apresenta média = 100 e desvio padrão = 5, podemos interpretar esses valores das seguinte maneira: Os valores da série estão concentrados em torno de 100; O intervalo [95,105] contém aproximadamente 68% dos valores da série. O intervalo [90,100] contém aproximadamente 95% dos valores da série; O intervalo [85,115] contém aproximadamente 99% dos valores da série. É importante que se tenha observado que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contidos que queremos. 41
COEFICIENTE DE VARIAÇÃO É uma medida de dispersão relativa (%). Note que é uma divisão de elementos de mesma unidade, é um número puro. Portanto, pode ser expresso em percentual. CV = _x. 100 (população) ou CV = _x S. 100 (amostra) Nos exemplos dados anteriormente, temos: 1,8 Exemplo 1) Média = 5 e desvio padrão = 1,8, assim, CV =.100 36,4% 5 0,96 Exemplo ) Média = 6,4 e desvio padrão = 0,96, assim, CV =.100 15% 6,4 1,65 Exemplo 3) Média = 5,1 e desvio padrão = 1,65, assim, CV =.100 3,35% 5,1 7ª Lista de Exercícios 01) Observe a seqüência: 3 3 4 6. Determine o desvio padrão e o coeficiente de variação, considerando: a) amostra, b) população 0) Dada a tabela abaixo, determine o desvio padrão e o coeficiente de variação, considerando: a) amostra; b) população Escolas nº de alunos (fi) cursadas (xi) 1 46 57 3 1 4 15 5 4 total 4
03) Dada a tabela abaixo, determine o desvio padrão e o coeficiente de variação, considerando a pesquisa: a) amostra b) população Comprimento do peixe mm (xi) nº de peixes (fi) 100 --- 110 5 110 --- 10 10 10 --- 130 0 130 --- 140 15 04) Uma prova de Matemática foi realizada para duas turmas. Os resultados foram os seguintes: Turma A: média 5 e desvio-padrão,5 Turma B: média 4 e desvio-padrão Qual a turma com maior dispersão relativa? 05) Visando estudar a rotatividade de sua mão-de-obra, um grande magazine avaliou o número de empregos (nos últimos 5 anos) de seus operários especializados. Os dados obtidos foram: Número de Número de empregos funcionários 1 150 00 3 75 4 50 5 5 total 500 Pede-se: Fi fr% Fr% xi.fi variância a) A tabela de freqüência; b) O número médio de empregos dos funcionários nos últimos 5 anos; c) Qual o número mais freqüente de empregos dos funcionários nos últimos 5 anos? d) O número mediano de empregos dos funcionários nos últimos 5 anos; e) A variância f) O desvio padrão g) O coeficiente de variação h) Represente graficamente os dados da tabela. 43
Fórmulas de Estatística Medidas de Tendência Central: xi. fi Média: X n n Fac ant h ~ Mediana: X li fi classe f f Moda: Mo li mo ant h f mo f ant f. ( post) Medidas Separatrizes i n Fac ant Pi li 100 h fi Medidas de Dispersão: Amplitude Total (Xmáx X mín) Variância população: Desvio Padrão população: ( xi x) n _. fi Variância amostra: s ( xi x) n 1 fi Desvio Padrão amostra: s s Coeficiente de Variação - população: _x Coeficiente de Variação amostra: _x S 44