SINTETIZANDO DADOS QUALITATIVOS E QUANTITATIVOS Prof. Dr. Ivan Bezerra Allaman Universidade Estadual de Santa Cruz - UESC
Cronograma Dados qualitativos 1 Dados qualitativos 2 3
Para sintetizarmos as informações provenientes de dados qualitativos podem ser utilizados tanto métodos tabulares quanto métodos gráficos. Com relação ao método tabular utiliza-se a distribuição de frequência. Definição: Uma distribuição de frequência é um sumário tabular de dados que mostra o número (frequência) de itens em cada uma das diversas classes não sobrepostas.
A tabela de distribuição de frequências para dados qualitativos é composta basicamente pelos seguintes ítens: Categoria ou classe no qual se está estudando. Frequência absoluta: corresponde ao número de itens de cada categoria estudada. Frequência relativa: equivale a fração ou proporção dos itens pertencentes aquela classe. Frequência relativa= Frequência absoluta n Frequência percentual: é a frequência relativa multiplicada por 100.
Exemplo: Suponha que os dados da tabela abaixo mostrem o refrigerante selecionado em uma amostra de 50 compras de refrigerantes. Tabela 1: Dados de uma amostra de 50 compras de refrigerantes Coke Classic Sprite Pepsi Diet Coke Coke Classic Coke Classic Pepsi Diet Coke Coke Classic Diet Coke Coke Classic Coke Classic Coke Classic Diet Coke Pepsi Coke Classic Coke Classic Dr. Pepper Dr. Pepper Sprite Coke Classic Diet Coke Pepsi Diet Coke Pepsi Coke Classic Pepsi Pepsi Coke Classic Pepsi Coke Classic Coke Classic Pepsi Dr. Pepper Pepsi Pepsi Sprite Coke Classic Coke Classic Coke Classic Sprite Dr. Pepper Diet Coke Dr. Pepper Pepsi Coke Classic Pepsi Sprite Coke Classic Diet Coke
Podemos sintetizar as informações da tabela 1 em uma tabela de distribuição de frequências. Tabela 2: Distribuição de frequência das compras de refrigerantes Refrigerante Frequência absoluta Frequência relativa Coke Classic 19 0,38 38 Diet Coke 8 0,16 16 Dr. Pepper 5 0,10 10 Pepsi-Cola 13 0,26 26 Sprite 5 0,10 10 Total 50 1,00 100 Frequência percentual
Observação importante: Categorias com baixas frequências podem ser agrupadas e classificadas como outros. Exemplo: Tabela 3: Dados de uma amostra de 16 pacientes de uma cĺınica de fisioterapia da região sul do estado da Bahia - 2012 dor na coluna dor no joelho dor na coluna dor na coluna dor no punho dor no ombro dor na perna dor no braço Nota: Dados fictícios. dor no punho dor no joelho dor na coluna dor na coluna dor no joelho dor na coluna dor no joelho dor na coluna Distribuição de frequência: Tabela 4: Distruibuição de frequência do diagnóstico de dores de 16 pacientes Diagnóstico Frequência absoluta Dor na coluna 7 Dor no joelho 4 Outros 5 Total 16
Dentre os diversos tipos de gráficos existentes, será abordado apenas os mais utilizados que são: o gráfico em barras e em setores. Gráfico em barras verticais. Figura 1: Exemplo de gráfico em barras verticais.
Gráfico em barras horizontais. Figura 2: Exemplo de gráfico em barras horizontais.
Gráfico em setores (pizza). Figura 3: Exemplo de gráfico em setores.
Exemplo 1: O restaurante Sabor do Centro Oeste, em Ilhéus, usa um questionário para perguntar aos clientes como eles avaliam o atendimento dos garçons, a qualidade das refeições, os drinques, os preços e o ambiente do restaurante. Cada característica é avaliada de acordo com uma escala que varia de excelente (E), ótimo (O), bom (B), médio (M) a fraco (F). Utilize a estatística descritiva para sintetizar os seguintes dados coletados sobre a qualidade das refeições. Qual é a sua impressão a respeito das avaliações da qualidade das refeições no restaurante? Tabela 5: Roll de dados provenientes de uma amostra de 49 amostras do restaurante Sabor do Centro Oeste localizada na cidade de Ilhéus - BA, ano de 2012 B E O B M E O E O B E O M O E F M E B M E E E B E O O M B E O F O E E B E E E B M E O E E B O M B Nota: Dados adaptados do exercício 7 da pág. 27 do livro Estatística Aplicada a Administração e Economia. *
Exercício 1: Os dados apresentados a seguir referem-se a uma amostra de 55 integrantes do Hall da Fama do Beisebol, em Ilhéus, Bahia. Cada observação indica a posição principal em que os integrantes do Hall da Fama jogavam: arremessador (A), receptor (R), primeira base (1), segunda base (2), terceira base (3), interbase (I), campo externo esquerdo (E), campo externo central (C) e campo externo direito (D). Construa uma tabela de distribuição de frequências. Tabela 6: Roll de dados provenientes de uma amostra de 55 amostras de integrantes do Hall da fama do Beisebol na cidade de Ilhéus - BA, ano de 2012 E A C R 2 A D 1 I I 1 E A D A A A A D C I E D A C C A A D A 2 3 A R E A 1 C A A A I 1 E D D 1 2 R I 3 R 2 E A Nota: Dados adaptados do exercício 8 da pág. 27 do livro Estatística Aplicada a Administração e Economia. * A-arremessador, R-receptor, 1-primeira base, 2-segunda base, 3-terceira base, I-interbase, E-campo externo esquerdo, C-campo Allaman, externo I.B. central, Sint. D-campo dados qualitativos externo direito. e quantitativos
No caso de variáveis discretas, há duas possibilidades de apresentação tabular. Do mesmo modo de variáveis qualitativas, Utilizando a técnica para variáveis contínuas, Utilizando a técnica de variáveis qualitativas Vale destacar as seguintes situações: 1 Uma amostra com poucas categorias, Exemplo: Em uma amostra observou-se os seguintes valores quanto a variável número de filhos:0,1,2,3 e 4. 2 Uma amostra com várias categorias, Exemplo: Em uma amostra observou-se os seguintes valores quanto a variável número de homicídios:0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15.
No caso de variáveis contínuas são necessários alguns passos: 1 Ordenar os dados em ordem crescente. 2 Determinar o número de classes. k = 1 + 3, 22 log n Critério de Sturges Obs: existem outros critérios para escolha do número de classes. 3 Determinar a amplitude dos dados. A = X n X 1 4 Determinar o comprimento das classes. h = A k 5 Determinar o limite iferior da classe. L.inferior = X 1
Exemplo 2: O percentual de alunos reprovados no ensino fundamental público no ano de 2011 em Ilhéus segundo os locais de matrícula foram: 10,14 11,33 14,14 14,24 17,86 19,72 19,94 20,70 21,54 23,36 23,38 23,42 15,73 17,81 Resolução: 1 10, 14 11, 33 14, 14 14, 24 15, 73 17, 81 17, 86 19, 72 19, 94 20, 70 21, 54 23, 36 23, 38 23, 42 2 k = 1 + 3, 22 log 14 k = 4, 69 5 3 A = X (14) X (1) A = 23, 42 10, 14 = 13, 28 4 h = 13,28 4,69 h = 2, 83 5 L.inferior = 10, 14
A tabela de distribuição de frequências irá conter os seguintes ítens: Classes, Frequência absoluta (F.ab), Frequência relativa (F.r), Frequência percentual (F.p(%)), Frequência acumulada (F.ac) e Frequência acumulada percentual (F.ac.p(%)) Tabela 7: Distribuição de frequências da variável reprovados no ensino fundamento público de Ilhéus em 2011 Classes F.ab F.r F.p(%) F.ac F.ac.p(%) 10,14 12,97 2 0,143 14,3 2 14,3 12,97 15,80 3 0,214 21,4 5 35,7 15,80 18,63 2 0,143 14,3 7 50,0 18,63 21,46 3 0,214 21,4 10 71,4 21,46 24,29 4 0,286 28,6 14 100,0 Total 14 0,99 100,0 Fonte: http://nossailheu.dominiotemporario.com/indicadores/i0201.html.
Dentre os gráficos existentes para variáveis contínuas será apresentado os mais importantes que são o histograma e a ogiva. O histograma é um gráfico utilizado para plotar as frequências absolutas em função das classes provenientes de uma tabela de distribuição de frequências. Neste gráfico destaca-se: A forma da variável, ou seja, sua distribuição de probabilidade. O grau de simetria da variável, que pode ser classificada em simétrica, assimétrica à direita ou assimétrica à esquerda.
A ogiva é um gráfico utilizado para plotar as frequências acumuladas em função das classes provenientes de umam tabela de distribuição de frequências.
Quanto o gráfico de ogiva do exemplo tem-se:
Exercício 2: Uma característica importante da qualidade da água é a concentração de material sólido suspenso. A seguir, estão 20 medições de sólidos suspensos de um certo lago. Construa uma tabela de distribuição de frequências, um histograma e uma ogiva. 42,4 65,7 29,8 58,7 52,1 55,8 57,0 68,7 67,3 67,3 54,3 54,0 73,1 81,3 59,9 56,9 62,2 69,9 66,9 59,0
Introdução Entre variáveis qualitativas Entre variável qualitativa e quantitativa É um método utilizado para avaliar a relação entre duas variáveis qualitativas ou entre uma variável qualitativa e quantitativa. O cruzamento de informações só é possível quando as duas variáveis foram mensuradas na mesma unidade observacional (ou experimental).
Introdução Entre variáveis qualitativas Entre variável qualitativa e quantitativa Exemplo 3: Um estudo foi feito para avaliar a associação entre sexo (masculino ou feminino) e tabagismo (fumante ou não fumante) numa certa população. Foi observada uma amostra aleatória de 40 pessoas. Tabela 8: Distribuição de 40 pessoas, classificadas segundo o sexo e tabagismo. Sexo Tabagismo Sexo Tabagismo M nf M f M f M nf M nf M nf M f M f M nf F f M f F nf M f F nf M f F nf M nf F nf M nf F f M f F nf M f F f M nf F f M nf F f M f F nf M f F nf M nf F nf M nf F f M nf F f M nf F nf M - Masculino, F - Feminino, f - Fumante, nf - Não fumante.
Introdução Entre variáveis qualitativas Entre variável qualitativa e quantitativa Portanto, tem-se a seguinte tabulação cruzada: Tabela 9: entre as variáveis sexo e tabagismo avaliados em 40 pessoas. Tabagismo Sexo Masculino Feminino Total Fumante 11 7 18 Não Fumante 13 9 22 Total 24 16 40
Introdução Entre variáveis qualitativas Entre variável qualitativa e quantitativa Em termos de frequência absoluta, fica difícil avaliar qualquer relação entre as variáveis. Logo, aconselha-se elaborar outra tabela contendo as percentagens (fixando a linha ou coluna), ou, colocar as percentagens entre parênteses ao lado das frequências absolutas como no exemplo abaixo. Tabela 10: entre as variáveis sexo e tabagismo avaliados em 40 pessoas. Tabagismo Sexo Masculino Feminino Total Fumante (%) 11 (45,83%) 7 (43,75%) 18 (45%) Não Fumante (%) 13 (54,17%) 9 (56,25%) 22 (55%) Total 24 (100%) 16 (100%) 40 (100%)
Introdução Entre variáveis qualitativas Entre variável qualitativa e quantitativa Neste caso é necessário primeiro determinar as classes das variáveis quantitativas para elaborar a tabulação cruzada entre as variáveis. Exemplo 3: Foi feito um estudo para avaliar a qualidade do restaurante e o preço das refeições em uma amostra com 10 restaurantes localizados em Ilhéus-BA. Os dados foram: Tabela 11: Avaliação da qualidade e preço das refeições de 10 restaurantes de Ilhéus-BA. Restaurante Avaliação da Qualidade Preço das refeições (R$) 1 Bom 18 2 Otimo 22 3 Bom 28 4 Excelente 38 5 Excelente 33 6 Bom 28 7 Otimo 19 8 Otimo 11 9 Otimo 23 10 Bom 13
Introdução Entre variáveis qualitativas Entre variável qualitativa e quantitativa Para determinar o número de classes e quais são elas para a variável preço, basta utilizar os métodos já vistos anteriormente. Então tem-se:x 1 = 11; k = 4, 22; h = 8, 39 Logo, tem-se a seguinte tabulação cruzada: Tabela 12: entre as variáveis qualidade e preço das refeições avaliados em dez restaurantes. Qualidade da Preço R$ refeição [11; 19, 39) [19, 39; 27, 78) [27, 78; 36, 17) [36, 17; 44, 56) Total Bom 2 (50%) 0 2 (66,67%) 0 4 Ótimo 2 (50%) 2 (100%) 0 0 4 Excelente 0 0 1 (33,33%) 1 (100%) 2 Total 4 (100%) 2 (100%) 3 (100%) 1 (100%) 10