INE Procedimentos de Análise Exploratória de Dados utilizando o Excel 2007 Professor Marcelo Menezes Reis

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamanho: px
Começar a partir da página:

Download "INE 7001 - Procedimentos de Análise Exploratória de Dados utilizando o Excel 2007 Professor Marcelo Menezes Reis"

Transcrição

1 INE Procedimentos de Análise Exploratória de Dados utilizando o Excel 2007 Professor Marcelo Menezes Reis Índice Analítico 1. Filtragem Filtragem para identificação de células vazias Filtragem para correção de erros em variáveis qualitativas Filtragem para variáveis quantitativas Classificação dos Dados Recodificação dos dados Recodificação de Variáveis Qualitativas Recodificação de Variáveis Quantitativas Análise de dados de variáveis qualitativas com tabelas dinâmicas Uma variável qualitativa Duas variáveis qualitativas Três Variáveis Qualitativas Gráficos para variáveis qualitativas Gráficos para uma variável qualitativa Gráficos para duas variáveis qualitativas Análise de dados de variáveis quantitativas Procedimentos para variáveis quantitativas discretas tabelas dinâmicas Distribuição de freqüência acumulada Histograma para variáveis quantitativas discretas Procedimentos para variáveis quantitativas contínuas Histograma para variáveis quantitativas contínuas Medidas de síntese Medidas de síntese para uma variável quantitativa Medidas de síntese para uma variável quantitativa em função de uma qualitativa por classificação Medidas de síntese para uma variável quantitativa em função de uma qualitativa por tabela dinâmica...62 Índice de Figuras Figura 1 - Arquivo Celular01.xlsx... 4 Figura 2 - Seleção de variável para filtragem... 5 Figura 3 - Variável escolhida para filtragem pelo menu Dados... 5 Figura 4 - Variável escolhida para filtragem pelo menu Início... 5 Figura 5 - Valores da variável Tipo - obtidos por Filtragem... 6 Figura 6 -Valores desmarcados Figura 7 - Opção "Vazias" selecionada Figura 8 - Variável Tipo - Vazias... 6 Figura 9 - Filtro de texto: personalização... 7 Figura 10 Erros de Pós-pago Figura 11 - Células com erros em Pós-pago Figura 12 - Células corrigidas... 7 Figura 13 - Valores da variável Tipo - sem erros... 8 Figura 14 - Filtragem da variável Anos... 8 Figura 15 - Filtro de Renda - Menores Valores Figura 16 - Filtro de Renda - Maiores valores... 9 Figura 17 - Dados sobre o cliente com a maior renda... 9 Figura 18 - Filtragem de Renda - dados para 1,005 salários mínimos... 9 Figura 19 - Classificação pelo menu Dados...10 Figura 20 - Classificação pelo menu Início...10 Figura 21 - Opções de classificação...10 Figura 22 - Opção de classificação apenas por Tipo...11 Figura 23 - Arquivo de dados classificado em função da variável Tipo (parcial)...11 Figura 24 - Opção de classificação por Tipo e Opinião...11 Figura 25 - Arquivo de dados classificado em função das variáveis Tipo e Opinião (parcial)...12 Figura 26 - Criação da variável OpiniãoC...12 Figura 27 - Função SE para recodificação de Opinião...13 Figura 28 - Função SE para recodificar variável Opinião - considerando células vazias...14 Figura 29 - Recodificação da variável Opinião - correspondência das células vazias...14 Figura 30 - Função SE para transformar variável Renda - considerando células vazias...15 Figura 31 - Transformação da variável Renda...15 Figura 32 - Estrutura de recodificação da variável Renda...16 Figura 33 - Função de recodificação da variável Renda em RendaC

2 Figura 34 - Filtro da variável recodificada RendaC...17 Figura 35 - Variável ClienteAlvo: resultado da recodificação de OpiniãoC e RendaC...18 Figura 36 - Filtro da variável ClienteAlvo...18 Figura 37 Menu de inserção Figura 38 - Seleção de dados de tabela dinâmica...19 Figura 39 - Tela de seleção de intervalo de dados - minimizada...19 Figura 40 - Layout da Tabela Dinâmica...20 Figura 41 - Tabela dinâmica de Tipo - apenas freqüência...20 Figura 42 - Tabela dinâmica de Tipo...21 Figura 43 - Opções do campo Valor...21 Figura 44 - Configuração do Campo Valor: Resumir por Figura 45 - Configuração do Campo Valor: Mostrar valores como Figura 46 - Configuração do Campo Valor: Mostrar valores como % do total...22 Figura 47 - Tabela dinâmica de Tipo: freqüências absolutas e relativas 1ª versão...22 Figura 48 - Tabela dinâmica de Tipo: freqüências absolutas e relativas 2ª versão...23 Figura 49 - Opções de exibição da tabela de Tipo: com remoção das células vazias...23 Figura 50 - Célula de destino de uma tabela dinâmica...23 Figura 51 - Tabela dinâmica de Tipo x Opinião Layout inicial...24 Figura 52 - Tabela dinâmica de Tipo x Opinião Layout com freqüências absolutas e todos os % Figura 53 - Tabela dinâmica de Tipo x Opinião Layout com freqüências absolutas e todos os %, modificado...25 Figura 54 - % por linha, coluna e total...25 Figura 55 - Tabela dinâmica de Tipo x Opinião (sem células vazias)...25 Figura 56 - Tabela dinâmica Tipo x Opinião - opções de formatação...26 Figura 57 - Tabela dinâmica Tipo x Opinião - mudança de ordem de valores...26 Figura 58 - Tabela dinâmica de Tipo x Opinião...26 Figura 59 - Percentuais de Opinião por Tipo de serviço...27 Figura 60 - Célula de destino de uma tabela dinâmica...28 Figura 61 - Lista de campos de uma tabela dinâmica de 3 variáveis qualitativas...28 Figura 62 - Tabela dinâmica de Tipo por Opinião em função do Sexo dos clientes...29 Figura 63 - Opções de exibição da variável Sexo...29 Figura 64 - Tipo x Opinião para o sexo Feminino...29 Figura 65 - Tipo x Opinião para o sexo Masculino...29 Figura 66 - Percentuais de Opinião x Sexo Figura 67 - Percentuais de Opinião x Sexo Pós-pago...30 Figura 68 - Percentuais de Opinião x Sexo Pré-pago Figura 69 - Percentuais de Opinião x Tipo Feminino...30 Figura 70 - Percentuais de Opinião x Tipo Masculino...31 Figura 71 - Opções de gráficos...31 Figura 72 - Subtipos de gráficos de colunas...32 Figura 73 - Gráfico de colunas de Tipo - 1a versão...32 Figura 74 - Campos do gráfico dinâmico Figura 75 - Opções do campo %...33 Figura 76 - Gráfico de colunas de Tipo - 2a versão...33 Figura 77 - Opções de design de gráfico dinâmico de colunas...33 Figura 78 - Opções de layout de gráfico dinâmico de colunas...33 Figura 79 - Opções de legenda do gráfico dinãmico...34 Figura 80 - Opções de Título do Eixo Vertical Principal em Gráfico Dinâmico...34 Figura 81 - Gráfico de colunas de Tipo de serviço - Final...35 Figura 82 - Opções de formatação de gráfico e eixo...35 Figura 83 - Opções de Eixo Figura 84 - Mudança de escala no eixo vertical...36 Figura 85 - Gráfico de colunas de Tipo de serviço escala vertical modificada...36 Figura 86 - Subtipos de gráficos em Pizza...37 Figura 87 - Gráfico em pizza de Tipo de serviço - 1a versão...37 Figura 88 - Opções de design de gráfico dinâmico em Pizza...37 Figura 89 - Opções de layout de gráfico dinâmico em Pizza...37 Figura 90 - Opções de Rótulo de Dados para Gráfico em Pizza...38 Figura 91 - Mais opções de Rótulo de Dados Figura 92 - Gráfico em pizza de Tipo de Serviço - Final...38 Figura 93 - Tabela dinâmica detipo por Opinião - apenas freqüências absolutas...38 Figura 94 - Gráfico de colunas 2D agrupadas de Tipo por Opinião...39 Figura 95 - Gráfico de colunas 2D agrupadas de Tipo por Opinião Pouco relacionamento...39 Figura 96 - Alteração do tipo de gráfico...40 Figura 97 - Opções de alteração de tipo de gráfico...40 Figura 98 - Gráfico de colunas 2D 100% empilhadas de Tipo por Opinião...40 Figura 99 - Gráfico de colunas 2D 100% empilhadas de Tipo por Opinião Pouco relacionamento...41 Figura Layout da tabela dinâmica de Anos Figura Tabela dinâmica de Anos...42 Figura Cópia das células da Tabela dinâmica de Anos...42 Figura Inserção de células no Excel

3 Figura Inserção de células: deslocamento para baixo...43 Figura Células inseridas na Tabela de Anos Figura Tabela de freqüências de Anos...43 Figura Tabela de Anos: freqüências e percentuais...44 Figura CONT.SE: primeira freqüência acumulada da variável Ano...44 Figura Tabela de Anos: freqüências absolutas, acumuladas e %...45 Figura Histograma de Anos - 1a versão...45 Figura Opções de gráfico - histograma de Anos...46 Figura Seleção de fontes de dados - histograma de Anos...46 Figura Histograma de Anos - 2a versão...46 Figura Seleção de fontes de dados - histograma de Anos - modificações...47 Figura Histograma de Anos - 3a versão...47 Figura Opções de formatação de séries de dados - histograma Anos...47 Figura Opções de formatar séries de dados...48 Figura Histograma de Anos completos como cliente...48 Figura Mínimo e máximo para a variável Renda...49 Figura Intervalo para Renda...49 Figura Amplitude de classes de Renda...49 Figura 122 Cálculo dos limites inferior e do limite superior da primeira classe de Renda...50 Figura 123 Cálculo dos limites inferior e superior da segunda classe de Renda...50 Figura Classes de Renda...50 Figura Ponto médio da primeira classe de Renda...51 Figura Obtenção da freqüência da primeira classe de Renda...51 Figura Obtenção da freqüência da última classe de Renda...52 Figura Obtenção da freqüência acumulada da primeira classe de Renda...52 Figura Obtenção da freqüência acumulada da primeira classe de Renda...53 Figura Renda agrupada em classes: freqüências absolutas, percentuais, freqüências acumuladas e percentuais acumulados...53 Figura Seleção de dados para Histograma de Renda...54 Figura 132 Histograma da Renda dos clientes em salários mínimos com limites das classes...54 Figura Fórmulas no Excel Figura Fórmulas no Excel 2007 Mais funções...55 Figura Medidas de síntese de Renda - 1a parte...56 Figura Funções disponíveis no Excel...56 Figura Funções estatísticas no Excel - 1a abordagem...56 Figura Argumentos da função Média (para Renda) - 1a versão...57 Figura Argumentos das funções Mediana e Moda (Renda) - 1a versão...57 Figura Argumentos da função desvio padrão (Renda) - 1a versão...57 Figura Argumentos das funções Quartil Inferior e Superior (Renda) - 1a versão...58 Figura Argumentos das funções Mínimo e Máximo (Renda) - 1a versão...58 Figura Medidas de síntese de Renda...58 Figura Cálculo do CV%...58 Figura Cálculo das diferenças entre os quartis e a mediana...59 Figura Cálculo dos limites para valores discrepantes...59 Figura Medidas de síntese para Renda (completas)...59 Figura Breakdown de Renda por Tipo - a partir do arquivo classificado...61 Figura Diagrama em caixas de Renda por Tipo...62 Figura 150 Seleção de dados da tabela dinâmica Renda por Tipo...63 Figura Layout da tabela dinâmica Renda x Tipo 1a parte...63 Figura Layout da tabela dinâmica Renda x Tipo 2a parte...63 Figura 153 Formas de resumir os dados de Renda...64 Figura Layout da tabela dinâmica Renda x Tipo 3a parte...64 Figura Tabela dinâmica de Renda por Tipo...65 Figura Layout da tabela dinâmica Renda x Tipo x Sexo...65 Figura Tabela dinâmica de Renda x Tipo x Sexo (geral)...66 Figura Tabelas dinâmicas de Renda x Tipo x Sexo (Feminino e Masculino)

4 INE Procedimentos de Análise Exploratória de Dados utilizando o Excel 2007 Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos de Análise Exploratória de Dados, tal como apresentados em sala, mas utilizando a planilha eletrônica Excel. Os dados estão no arquivo Celular01.xlsx 1, disponível na páginas das disciplina: contém as informações sobre 5000 clientes da operadora de celular ATCHIM, totalizando 10 variáveis: 1) Tipo de serviço: se o cliente é usuário de celular pré-pago ou pós-pago. 2) Sexo do cliente: masculino ou feminino. 3) Opinião do cliente sobre a operadora ATCHIM: terrível, sofrível, mediana, confiável, excelente. 4) Outra operadora do cliente antes de ser cliente da ATCHIM: Cumbuca, Escuridão, Ferrocom, Mortinho ou Nenhuma (o cliente nunca foi cliente de outra operadora além da ATCHIM). 5) Razão declarada para ser cliente da ATCHIM (manter-se cliente ou ter mudado de operadora): maior cobertura, qualidade do sinal, tarifa mais baixa. 6) Modelo (marca) do aparelho celular: Ericsson, Gradiente, Motorola, Samsung ou Siemens. 7) Renda mensal declarada pelo cliente em número de salários mínimos. 8) Número de Anos completos em que é cliente da ATCHIM. 9) Gasto médio mensal do cliente em reais nos últimos 12 meses, ou no período em que é cliente se inferior a um ano (obtido da base de dados da própria ATCHIM). 10) Minutos locais médios do cliente nos últimos 12 meses, ou no período em que é cliente se inferior a um ano (obtido da base de dados da própria ATCHIM). 1. Filtragem 1.1 Filtragem para identificação de células vazias A filtragem é uma ferramenta extremamente útil para a análise de dados. Permite realizar a pré-análise dos dados, realizar buscas específicas por uma informação e corrigir eventuais erros. Vamos apresentar os procedimentos no Microsoft Excel para executar filtragem de variáveis qualitativas e quantitativas, permitindo a identificação de valores perdidos e erros de registro (e sua correção), valores discrepantes, entre outras informações. Acesse o arquivo Celular01.xlsx, que contém os dados dos clientes de uma fictícia operadora de telefonia celular, a ATCHIM. É possível ver parte do arquivo na figura 1 a seguir: Figura 1 - Arquivo Celular01.xlsx 1 Há também o Celular01.xls, para os procedimentos usando o Excel

5 Observe as variáveis nas colunas e os dados nas linhas. Imagine que queremos estudar a variável qualitativa Tipo, usando filtragem. O primeiro passo consiste em selecionar a variável, pondo o cursor sobre a coluna e pressionando o botão esquerdo do mouse, resultando na Figura 2. Figura 2 - Seleção de variável para filtragem Para realizar a filtragem no Excel 2007 temos dois caminhos: - tal como no Excel 2003 e anteriores, através do menu Dados, escolher Filtro (Figura 3) resultando em um botão com uma seta na coluna de Tipo; - ou no menu Início, opção Classificar e Filtrar, linha Filtro (Figura 4) 2, com o mesmo resultado. Figura 3 - Variável escolhida para filtragem pelo menu Dados Figura 4 - Variável escolhida para filtragem pelo menu Início 2 Aliás, se o cursor for posicionado em qualquer célula das colunas A a J todas as variáveis terão o botão de filtro adicionado. 5

6 Independente do caminho a variável estará com Auto-Filtro implementado. No Auto-Filtro o Excel automaticamente seleciona todos os valores possíveis para a variável, incluindo células vazias e erros. Se pressionarmos o botão com a seta ao lado do nome da variável vamos obter a Figura 5: Os valores corretos para a variável Tipo são Pré-pago e Pós-pago. Mas, há vários registros incorretos para ambos, em que houve truncamento de letras. É possível ver também as opções: Vazias, se selecionada permitirá avaliar a quantidade de dados perdidos. Se quisermos exibir apenas as células Vazias primeiramente devemos desmarcar a opção Selecionar Tudo, vista na Figura 5, resultando na Figura 6. Para mostrar apenas as células vazias, basta marcar Vazias, na Figura 7, obtendo o resultado na Figura 8. Figura 5 - Valores da variável Tipo - obtidos por Filtragem Figura 6 -Valores desmarcados Figura 7 - Opção "Vazias" selecionada Figura 8 - Variável Tipo - Vazias Os dados perdidos encontram-se nas células A52, A605, A1250, A2414, A2638, A4051 e A4192, totalizando 7 observações. Como são apenas 7 em 5000 registros, representando 0,14%, bem abaixo de 5%, podemos considerar uma quantidade aceitável. Porém, se possível, devemos investigar as causas deste sumiço de dados, e se possível, descobrir seu conteúdo (deve haver algum registro 6

7 do cliente 52 em algum lugar, que diga qual o seu tipo de serviço). Este procedimento precisa ser feito para todas as variáveis (qualitativas e quantitativas). Uma outra opção de filtragem possível é usar um Filtro de texto personalizado: fornecemos ao Excel as características procuradas para selecionar as células a exibir, selecionando Filtro de Texto na Figura 5 obtemos a Figura 9: Há várias possibilidades de personalização, permitindo escolher exibir as células que atendem a vários critérios: é igual a, é diferente de, começa com, termina com, contém, não contém, e ainda uma opção de Personalizar Filtro quer permite usar como referência células de qualquer planilha do Excel. Figura 9 - Filtro de texto: personalização Outro uso da Filtragem é a identificação de erros de registro (ver Figura 5), e a sua correção. 1.2 Filtragem para correção de erros em variáveis qualitativas Para corrigir os valores incorretamente registrados de Pós-pago devemos desmarcar a opção Selecionar tudo (ver Figura 6) e então selecionar todas as incorretas, como na Figura 10. O Excel apresentará apenas as células que contém os valores incorretos (Figura 11). São 17 células apenas. Não obstante, precisamos corrigi-las. Basta digitar o valor correto na primeira célula do intervalo (A19 na Figura 11). Em seguida, arrasta-se o valor correto até a última célula com o valor incorreto, e todos serão corrigidos, como mostrado na Figura 12. Figura 10 Erros de Pós-pago Figura 11 - Células com erros em Pós-pago Figura 12 - Células corrigidas 7

8 Embora pareça maçante, o procedimento descrito acima precisa ser realizado para todos os valores incorretos, e para todas as variáveis. Para o caso da variável Tipo, uma vez corrigidos todos os erros de registro, ao pressionar a seta do Filtro, surgirá a tela da Figura 13: Restam apenas os valores (corretos) Pós-pago e Pré-pago, e as opções de filtragem: Selecionar Tudo, e Vazias. Observe que com um procedimento simples é possível corrigir todos os erros de registro, avaliar a quantidade de dados perdidos e eventualmente (através da opção Filtro de Texto) realizar outras filtragens. Figura 13 - Valores da variável Tipo - sem erros Filtragem para variáveis quantitativas Para variáveis quantitativas a filtragem é extremamente útil para identificar os valores extremos do conjunto (eventuais valores discrepantes), além dos dados perdidos. Se selecionarmos a variável Anos, quantitativa discreta, e acionarmos Filtro (como para a variável Tipo, seja pelo menu Dados Figura 3, ou Início Figura 4), chegamos à tela mostrada na Figura 14. Os valores da variável Anos variam de 0 a 14 anos (há células vazias também). O valor 0 corresponde a pessoas que ainda não completaram um ano inteiro como clientes, e o valor 14 às pessoas que são clientes desde o início dos negócios da operadora. Apenas os valores que ocorrem nos dados são apresentados: o valor 13 é um dos valores possíveis para a variável Anos, mas como não há nenhum cliente registrado na amostra com este valor, ele não é apresentado. A filtragem é especialmente importante no caso de variáveis quantitativas contínuas. Se realizarmos o procedimento de filtragem com a variável Renda, quantitativa contínua, vamos observar a grande quantidade de valores possíveis entre o mínimo (1,003 salários mínimos), mostrado na Figura 15, e o máximo (43,878 salários mínimos), mostrado na Figura 16. Figura 14 - Filtragem da variável Anos 8

9 Figura 15 - Filtro de Renda - Menores Valores Figura 16 - Filtro de Renda - Maiores valores Se quisermos saber mais sobre o cliente com a maior renda basta desmarcar Selecionar Tudo e selecionar o valor 43,878 e teremos a tela da Figura 17, com todas as informações disponíveis sobre este cliente. Figura 17 - Dados sobre o cliente com a maior renda As informações estão armazenadas na linha 2242 da planilha. Trata-se de um cliente de serviço pós-pago, do sexo masculino, que optou por um modelo Samsung, não foi cliente de nenhuma operadora anteriormente. Ele declarou que a razão para estar na ATCHIM é a tarifa menor, é cliente há 6 anos, gasta em média R$ 68,4 mensais, falando 109 minutos em média por mês. Mas, não há resultado para a variável Opinião. Poderíamos repetir o procedimento para qualquer outro valor de Renda e conhecer melhor o perfil dos respectivos clientes. Por exemplo, poderíamos escolher o valor 1,005 salários mínimos, resultando na Figura 18. Figura 18 - Filtragem de Renda - dados para 1,005 salários mínimos As informações sobre os clientes que percebem 1,005 salários mínimos estão armazenadas nas linhas 793, 2359, 2418, 2836, 2924, 4137 e Eles preferem serviço pré-pago, e estão na ATCHIM pela maior cobertura. Todos são clientes com pelo menos 45 anos, e as demais variáveis têm diferentes valores. A filtragem para variáveis quantitativas é muito útil para identificar os extremos do conjunto, o que permitirá a construção de distribuições de freqüências, o que será visto posteriormente. 9

10 2. Classificação dos Dados Análise Exploratória de Dados utilizando o Microsoft Excel Em muitos casos há interesse em reordenar o conjunto de dados de maneira a facilitar a visualização dos valores específicos de uma ou mais variáveis. Isso será extremamente útil nas próximas aulas quando construirmos tabelas para os dados. É preciso que o cursor esteja em alguma das células dos dados. Para realizar a filtragem no Excel 2007 temos dois caminhos: - tal como no Excel 2003 e anteriores, através do menu Dados, escolher Classificar (Figura 19) resultando na Figura 21; - ou no menu Início, opção Classificar e Filtrar, linha Personalizar Classificação (Figura 20), com o mesmo resultado. Figura 19 - Classificação pelo menu Dados Figura 20 - Classificação pelo menu Início Figura 21 - Opções de classificação O padrão do Excel 2007 é a classificação por apenas uma variável. Mas, é permitido adicionar mais variáveis através do botão Adicionar Nível, o que torna possível ordenar os dados em função dos valores de várias variáveis (no Excel 2003 há a possibilidade de usar apenas 3 variáveis). Se desejássemos fazer a classificação apenas em função de Tipo bastaria escolhê-la na primeira opção da tela da Figura

11 Figura 22 - Opção de classificação apenas por Tipo É possível fazer a classificação pelos valores de Tipo (ou outro aspecto, como a cor da célula, por exemplo), e em ordem de A a Z ascendente (ou de Z-A descendente, ou de forma personalizada). Vamos manter a classificação pelos valores, de A a Z, o que resulta na Figura 23. Figura 23 - Arquivo de dados classificado em função da variável Tipo (parcial) Todo o arquivo foi reordenado em função dos valores da variável Tipo, começando pelas células vazias, depois por Pós-pago e finalmente por Pré-pago (o Excel classifica as variáveis qualitativas por ordem alfabética). O uso da classificação mantém a consistência do banco de dados, pois todos os dados (todas as linhas) são reorganizados mantendo a coerência. Por exemplo, a primeira informação de Pós-pago estava (ver Figura 20) na linha 2, com os valores Masculino para Sexo, Mediana para Opinião, Gradiente para Modelo, etc. Após a classificação as informações são deslocadas para a linha 9 (ver Figura 23), primeira linha do valor Pós-pago de Tipo, logo após a última linha com célula vazia para a variável, mas mantendo a consistência das informações. Se houvesse interesse em fazer a classificação em função de Tipo, e depois por Opinião, deveríamos repetir os procedimentos das Figuras 19 ou 20 e depois a 21, com a adição de um nível, mas agora escolhendo Opinião na segunda opção de classificação, tal como mostrado na Figura 24. Figura 24 - Opção de classificação por Tipo e Opinião 11

12 O arquivo classificado é mostrado na Figura 25. Análise Exploratória de Dados utilizando o Microsoft Excel Figura 25 - Arquivo de dados classificado em função das variáveis Tipo e Opinião (parcial) Observe que para as células vazias (primeiros valores de Tipo), os valores de Opinião são ordenados (também alfabeticamente): há um valor Confiável, um Excelente, dois valores Mediana, dois Sofrível e um Terrível. Em seguida, o próximo valor de Tipo, é Pós-pago, e a variável Opinião é ordenada de acordo, começando pelas células vazias e depois pelas células com Confiável. Todas as outras variáveis são reordenadas em função destas duas. 3. Recodificação dos dados Em muitas situações de análise de dados pode haver interesse em criar novas variáveis a partir das existentes: com a finalidade de agrupar valores de uma variável qualitativa ou quantitativa, ou transformar uma variável quantitativa em qualitativa. Com isso torna-se possível realizar novas análises dos dados, sem modificar os dados originais. 3.1 Recodificação de Variáveis Qualitativas Vamos recodificar a variável Opinião, agrupando as opiniões positivas (confiável e excelente) e as negativas (Mediana, Sofrível e Terrível), para nas próximas aulas conseguirmos construir tabelas desta variável. O primeiro passo é selecionar a célula K1, onde será colocado o nome da nova variável, OpiniãoC (opinião codificada), como mostrado na Figura 26. Figura 26 - Criação da variável OpiniãoC 12

13 Para fazer a recodificação da variável nós devemos construir uma fórmula que relaciona os valores da variável Opinião com os novos valores previstos para OpiniãoC. Para construir uma fórmula no Excel posicionamos o cursor na célula desejada, digitamos =, seguida da fórmula. Para o caso da recodificação nós queremos implementar a seguinte fórmula: SE Opinião = Confiável OU Excelente ENTÃO OpiniãoC = Positiva SENÃO OpiniãoC = Negativa. Geralmente a recodificação envolve alguma expressão lógica, como a descrita acima: SE os valores de Opinião forem Confiável, ou Excelente, ENTÃO OpiniãoC será Positiva; SENÃO (se os valores de Opinião forem Mediana, Sofrível ou Terrível), então OpiniãoC será Negativa. A colocação da fórmula correspondente na célula K2 possibilitaria recodificar a variável. A Figura 27 a seguir ilustra o procedimento que queremos fazer. Figura 27 - Função SE para recodificação de Opinião Observe que os valores de opinião estão entre aspas. No Excel, toda vez que realizamos operações com variáveis qualitativas precisamos pôr seus valores entre aspas, ou causará erro. Neste momento é importante uma pequena introdução sobre as funções lógicas do Microsoft Excel. Há várias disponíveis, sendo as principais, com a sua sintaxe: - SE(teste lógico; ação caso o teste lógico resulte verdadeiro; ação caso o teste lógico resulte falso). É possível aninhar até sete funções SE como argumentos valor_se_verdadeiro e valor_se_falso para construir testes mais elaborados. - E(teste lógico1; teste lógico2;...). Retornará VERDADEIRO se todos os testes lógicos resultarem verdadeiros; retornará FALSO se um ou mais testes lógicos resultarem falsos. Teste lógico1; teste lógico2;... são de 1 a 30 condições para testar e que podem ser VERDADEIRO ou FALSO. - OU(teste lógico1; teste lógico2;...). Retorna VERDADEIRO se pelo menos um dos testes lógicos resultar verdadeiro; retorna FALSO se todos os testes lógicos resultarem FALSOS. Teste lógico1; teste lógico2,... são de uma a 30 condições que você deseja testar e que podem resultar em VERDADEIRO ou FALSO. No caso da recodificação da variável Opinião vamos usar uma função SE e dentro dela, no teste lógico uma função OU: SE Opinião for Confiável OU Excelente, OpiniãoC será Positiva, SENÃO será Negativa. Mas, como há células vazias na variável Opinião, se realizarmos a recodificação tal como mostrada aqui criaremos informação: como as células vazias não contém as opiniões Confiável ou Excelente serão registradas em OpiniãoC como Negativas, o que não é admissível. Precisamos refinar a função SE para que ela leve em conta a existência das células vazias, o que será possível introduzindo mais uma função SE, da seguinte maneira. SE Opinião = ENTÃO OpiniãoC = SENÃO SE Opinião = Confiável OU Excelente ENTÃO OpiniãoC = Positiva SENÃO OpiniãoC = Negativa. 13

14 Ou, em termos da sintaxe do Excel: = SE(C2= ;C2;SE(OU(C2= Excelente ;C2= Confiável ); Positiva ; Negativa )). Observe cuidadosamente o posicionamento dos parênteses: o teste que vimos originalmente ficou embutido na ação a ser feita se o primeiro teste (se a célula de Opinião é vazia) resultar falso. Veja a implementação na Figura 28. Figura 28 - Função SE para recodificar variável Opinião - considerando células vazias Arrastando a fórmula até a célula K5001 a variável estará corretamente recodificada. Se repetirmos a filtragem na variável Opinião, escolhendo a exibição das células vazias, o resultado será a Figura 29. Figura 29 - Recodificação da variável Opinião - correspondência das células vazias Agora podemos passar para a recodificação de variáveis quantitativas. 3.2 Recodificação de Variáveis Quantitativas A recodificação de variáveis quantitativas pode ter duas finalidades: - transformá-la em outra variável quantitativa (quando se chama transformação, mediante alguma operação matemática); - transformá-la em uma variável qualitativa (quando se chama realmente recodificação, mediante a aplicação de operações lógicas, tal como as vistas para variáveis qualitativas). Em ambos os casos o objetivo é obter uma nova variável que facilite a análise dos dados, tornando-a mais resumida ou significativa. Por exemplo, vamos realizar duas recodificações da variável Renda, no arquivo Celular01.xls: 14

15 - transformá-la de Renda em salários mínimos para Renda em reais, simplesmente multiplicando seus valores pelo salário mínimo vigente (julho de 2010), 510 reais; - recodificá-la em uma variável qualitativa, criando faixas de valores que definirão clientes de renda baixa, média e alta. Tais ações facilitarão o estudo da Renda, posto que algumas pessoas têm dificuldade de raciocinar em termos de salários mínimos, e outras preferem uma visão categorizada das quantidades. Tal como nas variáveis qualitativas, é preciso tomar cuidado com as células vazias, pois vamos criar informações ao codificá-la em qualitativa, ou causar erro ao transformá-la. Precisamos modificar a transformação, incluindo uma função SE, para que a multiplicação por 510 seja feita apenas quando as células de Renda NÃO forem vazias, para que não haja erros e tampouco criação de informação. De forma análoga à utilizada no caso da variável Opinião: SE Renda = ENTÃO RendaR$ = SENÃO RendaR$ = Renda * 510 Ou, em termos da sintaxe do Excel: = SE(G2= ;G2;G2*510) A implementação no Excel pode ser vista na Figura 30. Figura 30 - Função SE para transformar variável Renda - considerando células vazias Arrastando a fórmula até a célula L5001 a variável estará corretamente transformada. Se repetirmos a filtragem na variável RendaR$, escolhendo a exibição das células vazias, o resultado será a Figura 31. Figura 31 - Transformação da variável Renda Podemos agora pensar na recodificação de Renda em uma variável qualitativa, que chamaremos RendaC, que ocupará a coluna M. Vamos criar três classes arbitrárias de renda: os clientes com Renda de até 4 salários mínimos serão chamados RendaC Baixa, os com Renda entre 4 e 12 serão chamados RendaC Média, e os com Renda acima de 12 salários mínimos serão RendaC 15

16 Alta. Trata-se de um caso que exige a utilização de funções SE: precisaremos de duas para a classificação da Renda, e mais uma para lidar com as células vazias. Veja a estrutura na Figura 32. Figura 32 - Estrutura de recodificação da variável Renda Vamos ver os passos: 1) Se a célula de Renda for vazia a célula de RendaC também será, para evitar a criação de informação. 2) Se a célula de Renda NÃO for vazia pode-se proceder fazer a recodificação propriamente dita. 3) Se a célula de Renda for menor ou igual a 4, a célula de RendaC será igual à Baixa (cliente com renda baixa). 4) Se a célula de Renda NÃO for menor ou igual a 4, faz-se novo teste. 5) Se a célula de Renda for menor ou igual a 12 (já se sabe pelo teste anterior que é maior do que 4 salários mínimos), a célula de RendaC será igual à Média (cliente com renda média). 6) Se a célula de Renda NÃO for menor ou igual a 12, já que o teste anterior verificou que é maior do 4 salários mínimos, só resta a possibilidade de ser maior do que 12. Então a célula de RendaC será igual à Alta (cliente com renda alta). Observe a implementação da recodificação da variável Renda no Excel (Figura 33). 16

17 Figura 33 - Função de recodificação da variável Renda em RendaC Ao arrastar a fórmula até a célula M5001 completamos a recodificação da variável. Se aplicarmos filtragem à RendaC observaremos apenas os valores esperados : células vazias, Baixa, Média e Alta, como na Figura 34. Figura 34 - Filtro da variável recodificada RendaC Podemos fazer a recodificação envolvendo mais de uma variável. Por exemplo, imagine que a operadora ATCHIM resolveu focar seus esforços promocionais nos clientes de baixa renda (tal como definidos em RendaC, até 4 salários mínimos) e que têm opiniões positivas sobre a empresa (Confiável e Excelente, definidas como Positiva em OpiniãoC). Tal cliente é considerado como Cliente alvo das ofertas de planos especiais, novos aparelhos e serviços. Podemos criar uma nova variável, ClienteAlvo, recodificando RendaC e OpiniãoC. Trata-se de mais um caso para uso da função SE, lembrando que devemos levar em conta as células vazias, mas com mais cuidado ainda: RendaC pode ter células vazias para alguns clientes, OpiniãoC também, ou, eventualmente ambas podem estar vazias para o mesmo cliente. Isso causará um impasse, pois não podemos criar recodificá-las em ClienteAlvo para as linhas em que pelo menos uma das variáveis apresentar células vazias. A solução é usar uma função OU: se OpiniãoC ou RendaC apresentarem células vazias, o valor correspondente de ClienteAlvo ficará vazia também. Se OpiniãoC for Positiva e RendaC for Baixa, ClienteAlvo será Sim, senão será Não. De forma análoga à utilizada no caso das variáveis OpiniãoC e RendaC: 17

18 SE OpiniãoC = OU RendaC = ENTÃO ClienteAlvo = SENÃO SE OpiniãoC = Positiva E RendaC = Baixa ENTÃO ClienteAlvo = Sim SENÃO ClienteAlvo = Não Ou, em termos da sintaxe do Excel: = SE(OU(K2= ;M2= ); ;SE(E(K2= Positiva ;M2= Baixa ); Sim ; Não )) A implementação no Excel pode ser vista na Figura 35. Figura 35 - Variável ClienteAlvo: resultado da recodificação de OpiniãoC e RendaC Arrastando a fórmula até a célula N5001 completa-se a criação da variável ClienteAlvo. Se aplicarmos filtragem à ClienteAlvo observaremos apenas os valores esperados : células vazias, Não e Sim, como na Figura 36. Figura 36 - Filtro da variável ClienteAlvo Com as operações de filtragem, classificação recodificação e transformação podemos identificar várias características interessantes dos dados, bem como agrupar valores das variáveis, o que facilitará a análise posterior das variáveis. 18

19 4. Análise de dados de variáveis qualitativas com tabelas dinâmicas Uma solução interessante para a análise de dados é o uso de tabelas dinâmicas, ferramenta incorporada ao Microsoft Excel que pode ser muito útil para extrair informações de um arquivo de dados. O uso da tabela dinâmica exige que os dados estejam com a formatação usual de um banco de dados: variáveis nas colunas e dados nas linhas, sendo que a primeira linha do arquivo deve conter os nomes das variáveis. 4.1 Uma variável qualitativa Independente se as variáveis de interesse são qualitativas ou quantitativas o procedimento para construção da tabela dinâmica é o mesmo. Posicione o cursor em algum ponto do conjunto de dados, e procure no menu Inserir por Tabela Dinâmica, como na Figura 37. Pressionando Tabela Dinâmica o Excel 2007 apresenta o resultado da Figura 38. Figura 37 Menu de inserção Figura 38 - Seleção de dados de tabela dinâmica Ao pôr o cursor em alguma parte do banco de dados o Excel 2007 selecione automaticamente todas as variáveis adjacentes: no presente caso todas as células compreendidas entre A1 e N5001: da variável Tipo até a ClienteAlvo. Pode-se escolher, eventualmente, uma fonte externa ou dados de outra planilha ou outro intervalo de dados na mesma planilha. Para fazer isso basta pressionar o botão com seta vermelha na linha Tabela/Intervalo da Figura 38, resultando na Figura 39: Figura 39 - Tela de seleção de intervalo de dados - minimizada Com a seleção neste formato você pode procurar o intervalo desejado e selecioná-lo utilizando o mouse. Para retornar à situação da Figura 38 basta pressionar a pequena seta vermelha novamente. Por conveniência, vamos pôr a tabela dinâmica em uma nova planilha. Então, pressionando OK, chega-se à Figura

20 Figura 40 - Layout da Tabela Dinâmica A versão 2007 do Excel automaticamente cria a tabela, vazia, com os campos disponíveis para adição à direita. Observe à direita os nomes das variáveis existentes no arquivo de dados, e que foram selecionadas na etapa anterior. Vamos imaginar que há interesse apenas na variável Tipo, devemos selecioná-la e arrastá-la até o campo "Rótulos de Linha", ou "Rótulos de Coluna". As outras variáveis não farão parte da tabela. Devemos também arrastar a variável Tipo para o campo "Valores". O resultado pode ser visto na Figura 41. Observe que a tabela contém apenas as freqüências absolutas de cada valor, além das células vazias. Mas, usualmente é imprescindível apresentar as freqüências relativas também, para que seja possível fazer comparações com outros conjuntos de dados. Para tanto devemos arrastar novamente Tipo para o campo Valores, o que nos levará à Figura 42: as freqüências absolutas dos valores serão apresentadas mais uma vez, e precisamos modificá-las para que a tabela contenha as freqüências absolutas E as relativas. Para fazer isso, devemos pressionar a seta do segundo botão do campo Valores, o que leva às opções da Figura 43. Figura 41 - Tabela dinâmica de Tipo - apenas freqüência 20

21 Figura 42 - Tabela dinâmica de Tipo Figura 43 - Opções do campo Valor Selecionando Configurações do Campo de Valor... é possível mudar o formato de apresentação dos dados, com as várias opções mostradas na Figura 44. Figura 44 - Configuração do Campo Valor: Resumir por... Pode-se mudar o tipo de cálculo que se deseja usar para resumir os dados do campo selecionado. Quando a variável é qualitativa a opção padrão é ContNúm, contagem. Mas, se a variável for quantitativa, pode-se escolher soma, média, Máx (máximo), Mínimo, Produto e outras funções não visíveis na Figura 44 (desvio padrão amostral e populacional, variância amostral e populacional). É possível ver também a aba Mostrar valores como, que uma vez selecionada resulta na Figura

22 A opção padrão é apresentar os valores como Normal, ou seja, no caso de contagem para variáveis qualitativas, as freqüências absolutas. Mas, pressionando a seta podemos observar as várias opções disponíveis na Figura 46: % de diferença de, soma acumulada, % da linha, % da coluna, % do total entre outras. Como se deseja apresentar as freqüências relativas dos valores da variável Tipo, podemos escolher % do total e pressionar OK, a tabela resultante pode ser analisada na Figura 47. Figura 45 - Configuração do Campo Valor: Mostrar valores como... Figura 46 - Configuração do Campo Valor: Mostrar valores como % do total Figura 47 - Tabela dinâmica de Tipo: freqüências absolutas e relativas 1ª versão As células vazias representam 0,14% do total, perfazendo apenas 7 clientes: é um percentual pequeno (aceita-se até 5%), mas que merece uma reflexão, pois é um dado imprescindível, a empresa precisa descobrir o Tipo de serviço destes clientes, até para fins de tarifação. Percebe-se a preponderância dos clientes do Tipo pré-pago, que representam 57,82% do total (2891 clientes). Observa-se também que a tabela apresenta algumas poluições, o que pode confundir sua interpretação por leigos: há uma linha para células vazias, Rótulos de Linha, Valores, Contar de Tipo, Contar de Tipo2. Todos estes podem ser modificados, os últimos simplesmente por digitação dos nomes de nosso interesse, resultando na Figura

23 Figura 48 - Tabela dinâmica de Tipo: freqüências absolutas e relativas 2ª versão A remoção da linha com as células vazias, porque sua influência é muito reduzida, pode ser feita pressionando a seta ao lado de Tipo, levando às opções da Figura 49. Figura 49 - Opções de exibição da tabela de Tipo: com remoção das células vazias Basta desmarcar a opção de exibição das células vazias, pressionar OK, e obtém-se a tabela final, com os valores percentuais já recalculados em relação ao novo total (4993). 4.2 Duas variáveis qualitativas É muito comum o estudo de duas variáveis qualitativas. Pode-se representar essa distribuição conjunta de freqüências através de uma tabela de contingências, para estudar a sua associação. Através de uma tabela dinâmica podemos rapidamente construí-la. O início do processo é semelhante ao visto na seção anterior: posicione o cursor em algum ponto do conjunto de dados, e procure no menu Inserir por Tabela Dinâmica, como na Figura 37. Mas, ao invés de pôr a tabela em uma nova planilha vamos escolher uma célula da mesma planilha onde está a tabela de Tipo, como mostrado na Figura 50. Figura 50 - Célula de destino de uma tabela dinâmica 23

24 Pressionando OK, chega-se à uma situação parecida a da Figura 40. Mas, agora vamos colocar duas variáveis na Tabela, Tipo na Linha, e Opinião na Coluna, e apenas uma delas (qualquer uma) em Valores. Como na Figura 51. Ao construir uma tabela de contingências usualmente não temos interesse apenas nas freqüências de cada cruzamento. Foi visto na seção 4.1 que a tabela dinâmica pode incluir percentuais também. Vamos aproveitar a oportunidade e incluir três tipos de percentuais: em relação aos totais das linhas, em relação aos totais das colunas, e em relação ao total geral dos dados. Basta arrastar a variável Opinião mais três vezes ao campo Valores, Figura 52. Posteriormente, podemos modificar as configurações do campo Valor, com as devidas adaptações, tal como nas Figuras 43 a 46. Ver Figura 54. A tabela final resultante está na Figura 55, já com as modificações apropriadas (incluindo a remoção das células vazias das duas variáveis). Figura 51 - Tabela dinâmica de Tipo x Opinião Layout inicial Figura 52 - Tabela dinâmica de Tipo x Opinião Layout com freqüências absolutas e todos os %. Da forma como está o layout da Figura 52 a tabela não ficará com um bom aspecto, dificultando a sua interpretação. Precisamos mover o botão Σ Valores do campo Rótulos de Coluna (ver Figura 52) para o campo Rótulos de Linha, resultando na Figura

25 Figura 53 - Tabela dinâmica de Tipo x Opinião Layout com freqüências absolutas e todos os %, modificado Figura 54 - % por linha, coluna e total Figura 55 - Tabela dinâmica de Tipo x Opinião (sem células vazias) Antes de analisar os resultados vamos fazer uma pequena modificação na tabela. Observe que o Excel ordena os valores das variáveis de maneira alfabética: Confiável, Excelente, Mediana, Sofrível, Terrível. Repare também que o ideal seria começar da melhor para a pior opinião (ou vice-versa). Para conseguir isso basta mudar a ordem dos valores. Vamos fazer isso para a variável Opinião, mudando a posição de Confiável para a direita: basta selecionar Confiável, e pressionar o botão direito do mouse, resultando na Figura

26 Figura 56 - Tabela dinâmica Tipo x Opinião - opções de formatação Observe a opção Mover na Figura 56, selecionando-a vamos à Figura 57. Figura 57 - Tabela dinâmica Tipo x Opinião - mudança de ordem de valores Há três opções possíveis: mover Opinião para Linhas (o que não queremos), mover Confiável para a direita ou mover para o fim. Como precisamos mudar apenas Confiável escolhemos mover para a direita, veja a Figura 58. Figura 58 - Tabela dinâmica de Tipo x Opinião 26

27 Podemos comparar as opiniões em função do tipo de serviço. Sempre devemos comparar os percentuais dos cruzamentos (por LINHA ou por COLUNA) com percentuais em relação aos totais de Tipo ou Opinião. No presente caso, imagine que quiséssemos avaliar se há diferença entre as opiniões dos clientes da operadora em função do tipo de serviço. Devemos, então, usar os percentuais por linha, comparando os resultados de pós-pago e pré-pago com o Total % por linha. Observe que: do total de clientes, 10,13% tem opinião Excelente, 15,39% Confiável, 29,28% Mediana, 20,09% Sofrível e 25,11% Terrível. Se houver diferença de opinião dependendo do tipo de serviço os percentuais por linha de cada tipo devem ser substancialmente diferentes (pelo menos 5%) desses valores. Na Figura 58 é possível constatar: - 6,53% dos clientes de Pós-pago consideram a qualidade do serviço Excelente, contra 12,76% do Pré-pago e 10,13% no total geral (observe que o percentual do Pré-pago é quase o dobro do Póspago); - 4,91% dos clientes de Pós-pago têm opinião Confiável, contra 23,02% do Pré-pago e 15,39% do Total (percentual do Pré-pago é mais de 4 vezes maior do que o Pós-pago, e ambos estão a mais de 5% do Total 3 ); - 23,69% dos clientes de Pós-pago têm opinião Mediana, contra 33,34% do Pré-pago e 29,28% do Total (percentuais do Pré-pago e Pós-pago estão a mais de 5% do Total); - 24,74% dos clientes de Pós-pago têm opinião Sofrível, contra 16,71% do Pré-pago e 20,09% do Total (houve uma inversão em relação às opiniões anteriores, os clientes do Pós-pago parecem mais insatisfeitos); - 40,13% dos clientes de Pós-pago têm opinião Terrível, contra apenas 14,18% do Pré-pago e 25,11% do Total (percentual do Pós-pago é mais de duas vezes maior do que o Pré-pago, e mais de 1,5 vezes maior do que o Total). Conclui-se, portanto, que os clientes do Pós-pago estão mais insatisfeitos do que os do Pré-pago. Além disso, temos os percentuais por coluna. Verifica-se que, do total de opiniões Excelente nada menos do que 72,87% são de clientes de Pré-pago, e 67,31% das opiniões Terrível são de Póspago (sendo que os de Pré-pago representam 57,90% do total de clientes e os de Pós-pago 42,10% 4 ), mostrando claramente que estes últimos estão mais insatisfeitos do que aqueles, corroborando as conclusões da análise dos percentuais por linhas. A Figura 59 resume o comportamento dos percentuais e mostra como eles mudam em relação ao total geral dependendo do Tipo de serviço: as linhas de Pós-pago e Pré-pago cruzam a do Total geral, indicando mudança de opinião dependendo do Tipo. 45,00% 40,00% 35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% Excelente Confiável Mediana Sofrível Terrível Total geral Total pós-pago Total pré-pago Figura Percentuais de Opinião por Tipo de serviço 3 Se não houvesse relação entre Tipo e Opinião os percentuais de Pós-pago e Pré-pago deveriam ser próximos de 15,39%. 4 Novamente, se não houvesse relação entre Tipo e Opinião os percentuais de Excelente de Pós-pago deveriam ser próximos de 42,10% e de Pré-pago 57,90%; a mesma coisa para os percentuais de Terrível. 5 Esta figura é um gráfico de linhas, que estudaremos posteriormente. 27

28 4.3 Três Variáveis Qualitativas Em tese poderíamos construir tabelas para cruzar qualquer número de variáveis qualitativas. Contudo, a interpretação dos resultados seria bastante difícil 6. Mas, para os casos em que há no máximo 3 variáveis é plenamente possível construir e interpretar uma tabela dinâmica no Excel Vamos supor que queremos avaliar se homens ou mulheres, dependendo do tipo de serviço, estão mais satisfeitos (apresentam mais opiniões Excelente e Confiável). São três variáveis qualitativas: Sexo, Tipo e Opinião. Já construímos uma tabela dinâmica relacionando Tipo (nas linhas) e Opinião (nas colunas). O ideal seria obter uma tabela semelhante para o sexo feminino e outra para o feminino, de maneira a poder comparar os percentuais por linha, por exemplo. Isso pode ser feito com facilidade no Excel 2007 seguindo os passos usuais de montagem de tabela dinâmica, conforme visto na seção 4.2, para duas variáveis qualitativas: - posicione o cursor em algum ponto do conjunto de dados; procure no menu Inserir por Tabela Dinâmica, como na Figura 37; ponha a tabela em uma célula da mesma planilha onde está a tabela de Tipo, e a tabela de Tipo por Opinião, como mostrado na Figura 60. Figura 60 - Célula de destino de uma tabela dinâmica Pressionando OK, chega-se à uma situação parecida a da Figura 40. Mas, agora vamos colocar três variáveis na Tabela, Tipo na Linha, Opinião na Coluna, tal como na seção 4.3, e Sexo no campo Filtro de Relatório: com isso a tabulação cruzada de Tipo e Opinião será construída em função dos valores de Sexo. Não podemos esquecer também do campo Valores: vamos pôr as freqüências absolutas e os percentuais por linha 7 (veja a seção 4.3), resultando na Figura 61. Figura 61 - Lista de campos de uma tabela dinâmica de 3 variáveis qualitativas 6 Nestes casos é recomendável usar análise estatística multivariada. 7 Vamos manter apenas estes para não sobrecarregar demais a tabela, mas nada impede de manter os percentuais por coluna e em relação ao total geral. 28

29 Note-se que o botão ΣValores já foi movido do campo Rótulos de Coluna (ver Figura 52) para o campo Rótulos de Linha. Após fazer as modificações necessárias (mudança de Contar de Tipo para Freqüências, Contar de Tipo2 para % por linha, mudança de ordem de Confiável, remoção das células vazias de Tipo e de Opinião) o resultado é a Figura 62. Figura 62 - Tabela dinâmica de Tipo por Opinião em função do Sexo dos clientes Trata-se de parte da tabela mostrada na Figura 58, porque na variável Sexo está selecionada a opção Tudo. Clicando sobre ao lado de Sexo, vemos as opções de exibição da Figura 63. Figura 63 - Opções de exibição da variável Sexo As possibilidades são: células vazias (-), Feminino e Masculino. Se selecionarmos Feminino, o resultado será a Figura 64. Ao escolhermos Masculino obtemos a Figura 65. Figura 64 - Tipo x Opinião para o sexo Feminino Figura 65 - Tipo x Opinião para o sexo Masculino 29

30 Repare que na Figura 64 o total geral vale 2241 (e não mais 4983 da Figura 62), pois são consideradas apenas as clientes. Na Figura 65, apenas os 2735 homens. A soma resulta 4976 (ao invés de 4983) porque as células vazias não foram selecionadas em Tipo, Opinião e Sexo. Podemos chegar a algumas conclusões: - lembre-se que os clientes do Pós-pago estão mais insatisfeitos; - mas os percentuais de insatisfação são maiores entre os homens, do que em relação ao geral na Figura 61 pode-se ver que Sofrível e Terrível são 20,09% e 25,11% do total, e os respectivos percentuais dos homens são maiores (21,76% e 28,67%) e os das mulheres menores (18,07% e 20,84%); - quando segmentamos em função do Tipo percebe-se o mesmo padrão anterior (Pós-pago mais insatisfeito), mas com menor variação entre homens e mulheres; # No total, em Pós-pago, há 24,74% de Sofrível e 40,13% de Terrível; # No Feminino, Pós-pago, há 23,98% de Sofrível e 37,52% de Terrível (ligeiramente abaixo do total de Pós-pago), já no Masculino há 25,14% de Sofrível e 41,62% de Terrível (ligeiramente acima do total de Pós-pago). # No total, em Pré-pago, há 16,71% de Sofrível e 14,78% de Terrível; # No Feminino, Pré-pago, há 15,34% de Sofrível e 13,12% de Terrível (ligeiramente abaixo do total de Pré-pago), já no Masculino há 18,28% de Sofrível e 15,40% de Terrível (ligeiramente acima do total de Pós-pago). Conclui-se, então que homens são em geral mais insatisfeitos com a operadora do que as mulheres, e homens que são clientes de pós-pago são os mais descontentes. Mas, a diferença entre homens e mulheres não é tão grande: não chega a 5% em nenhuma das comparações (veja as Figura 66 a 70) indicando que a relação entre Tipo e Opinião parece ser mais forte, com pouca influência do Sexo do cliente. 35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% Total geral Total feminino Total masculino 45,00% 40,00% 35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% Total pós-pago feminino pós-pago masculino pós-pago 0,00% ExcelenteConfiável Mediana Sofrível Terrível Figura 66 - Percentuais de Opinião x Sexo Figura 67 - Percentuais de Opinião x Sexo Pós-pago 40,00% 40,00% 35,00% 35,00% 30,00% 30,00% 25,00% 25,00% 20,00% 15,00% 10,00% 5,00% Total pré-pago feminino pré-pago masculino pré-pago 20,00% 15,00% 10,00% 5,00% Total feminino feminino pós-pago feminino pré-pago 0,00% 0,00% Figura 68 - Percentuais de Opinião x Sexo Pré-pago Figura 69 - Percentuais de Opinião x Tipo Feminino Quando segmentamos a opinião apenas por sexo (analisando o geral, apenas os clientes do pós-pago ou do pré-pago), as linhas (que representam os % para cada opinião) estão bem próximas (quase coincidentes em alguns casos), indicando comportamento similar: parece que o Sexo não é 30

31 uma variável que influencie muito a opinião dos clientes, embora os homens estejam ligeiramente mais insatisfeitos a linha dos percentuais dos homens está abaixo da do total para opiniões positivas e acima para as opiniões negativas (ver Figuras 66, 67 e 68). Mas, ao segmentar a opinião por tipo (analisando os resultados para o sexo feminino e masculino), observa-se um comportamento semelhante ao obtido na Figura 59, com a linha do pós-pago substancialmente abaixo do total para mulheres e homens para as opiniões positivas e acima para as opiniões negativas (17% acima na opinião Terrível Feminino, e 13% acima na opinião Terrível Masculino), embora eles estejam ligeiramente mais insatisfeitos do que elas (ver Figuras 69 e 70). 45,00% 40,00% 35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% Total masculino masculino pós-pago masculino pré-pago Figura 70 - Percentuais de Opinião x Tipo Masculino Conclui-se então que o Tipo de serviço parece ter relação mais forte com a Opinião do que o Sexo dos clientes. 4.4 Gráficos para variáveis qualitativas É bastante comum construir gráficos para representar distribuições de freqüências de variáveis qualitativas (uma ou mais). Os gráficos mais apropriados são os gráficos de barras (ou de colunas) e os gráficos em setores (circular ou em pizza) Gráficos para uma variável qualitativa Suponha que há interesse em construir um gráfico para a tabela da variável qualitativa Tipo, vista na seção 4.1, Figura 48. As opções possíveis são gráfico de barras (colunas no Excel) e em setores. Gráfico de barras (colunas) Ponha o cursor em algum ponto da tabela dinâmica de Tipo, e procure no menu Inserir por gráficos, como na Figura 71. Figura 71 - Opções de gráficos Clique no tipo de gráfico e, em seguida, clique no subtipo de gráfico que deseja usar. No nosso caso, queremos Colunas (barras verticais). Se pressionarmos a seta imediatamente abaixo de Colunas é possível ver todos os subtipos disponíveis (Figura 72). 31

32 Há opção de colunas 2D, 3D, cilindro, cone e pirâmide. Embora os gráficos 3D sejam mais atraentes, eles podem levar a interpretações equivocadas devido aos diferentes ângulos das colunas e eventuais sombras geradas. Assim, recomenda-se o uso de colunas 2D. O primeiro subtipo é o de colunas agrupadas, que utilizam as freqüências absolutas como alturas das colunas, para permitir a comparação dos valores. O segundo subtipo é o de colunas empilhadas, e o terceiro colunas empilhadas 100%: estes dois últimos são mais apropriados para o cruzamento de duas variáveis qualitativas, usando freqüências absolutas ou percentuais por linha ou coluna, diretamente. Para a tabela dinâmica de Tipo vamos escolher Colunas 2D, colunas agrupadas, resultando na Figura 73. Figura 72 - Subtipos de gráficos de colunas Figura 73 - Gráfico de colunas de Tipo - 1a versão A ação padrão do Excel 2007 é pôr o gráfico como objeto na planilha onde estão os dados. Observe que aparece no gráfico a legenda Absolutas e %, mas que estas últimas estão invisíveis, pois os percentuais são muito pequenos em relação às freqüências absolutas. Há também a caixa Painel Filtro da Tabela Dinâmica. Na parte superior de Painel Filtro da Tabela Dinâmica há Campos Ativos na Tabela Dinâmica : precisamos pressioná-lo para remover os % do gráfico, com a finalidade de torná-lo mais claro. Mas, ao fazer isso vamos removê-los da tabela dinâmica original também. Assim, se não quiser perdê-la, copie a tabela e cole-a como valores em algum outro ponto da planilha, e construa o gráfico a partir da cópia. Pressionando Campos Ativos na Tabela Dinâmica, chegamos à Figura 74: - selecionando % no campo Σ Valores, vamos obter a figura 75; - escolhendo Remover campo, desaparecerá % do gráfico e da tabela dinâmica original de Tipo, resultando na Figura

33 Figura 74 - Campos do gráfico dinâmico Figura 75 - Opções do campo % Figura 76 - Gráfico de colunas de Tipo - 2a versão Observe que o gráfico está com o título genérico Total, e apresenta uma legenda desnecessária. Também não há título no eixo vertical, para indicar que se trata de freqüências absolutas da variável Tipo. Para modificar título geral basta clicar sobre ele e reescrevê-lo: Tipo de serviço. Além disso, ao selecionar o gráfico com o mouse surge o conjunto de opções Ferramentas de Gráfico Dinâmico. As opções mais interessantes neste momento são Design (Figura 77) e Layout (Figura 78). Figura 77 - Opções de design de gráfico dinâmico de colunas Podemos alterar o tipo de gráfico, selecionar dados, mudar o estilo do gráfico e mesmo movê-lo para outro local, uma planilha específica, por exemplo, para permitir melhor visualização. Figura 78 - Opções de layout de gráfico dinâmico de colunas Nas opções de layout podemos modificar formato e posição dos títulos (do gráfico e dos eixos), a área de plotagem, adicionar Linha de Tendência e modificar a Legenda. No nosso caso, não queremos exibi-la, então, ao selecionar Legenda obtemos a Figura79. 33

34 Figura 79 - Opções de legenda do gráfico dinãmico Escolhendo Nenhum na Figura 79 a legenda desaparecerá. Mas, precisamos acrescentar um título ao eixo vertical, selecionando Título dos Eixos na Figura 78, e a opção Título do Eixo Vertical Principal chegamos à Figura 80. Figura 80 - Opções de Título do Eixo Vertical Principal em Gráfico Dinâmico Título Girado permitirá que o nome acompanhe o eixo, e com esta seleção o Excel 2007 cria automaticamente uma caixa de texto chamada Título o eixo, que pode ser modificada exatamente como o título do gráfico. O resultado final, após a remoção da legenda e acréscimo dos títulos estána Figura 81 34

35 Figura 81 - Gráfico de colunas de Tipo de serviço - Final A interpretação do gráfico é a mesma da tabela, feita na seção 4.1. A principal vantagem do gráfico é a rapidez na apreensão da informação: em uma simples olhada o leitor pode compreender o básico da distribuição de freqüências, o que muito útil em apresentações ou conferências, onde geralmente há pouco tempo disponível. Mas, a mesma rapidez de apreensão pode nos levar a erros de interpretação se o gráfico for modificado (com ou sem segundas intenções) para causar um determinado efeito. No gráfico da Figura 81 percebe-se uma diferença entre os dois tipos de serviço, com preponderância do Pré-pago (57%) sobre o Pós-pago (43%): não se trata de uma grande discrepância e o gráfico mostra isso porque a escala do eixo vertical começa no zero. Se não começasse no zero, as posições relativas das alturas das colunas seriam mudadas, o que poderia levar a interpretações equivocadas. Não obstante, pode ser necessário mudar a escala do gráfico. O primeiro passo é selecionar o eixo a mudar e pressionar o botão direito do mouse, levando à Figura 82. Figura 82 - Opções de formatação de gráfico e eixo Pressionando Formatar Eixo nos leva à Figura 83. Automaticamente o Excel 2007 escolhe a escala mais apropriada de acordo com os dados de origem (Opções de Eixo: Automático). Mas, podemos trocar os limites e as unidades da escala. Na Figura 84 trocamos o mínimo para Fixo, indicando que o eixo vertical começará em O gráfico resultante é mostrado na Figura

36 Figura 83 - Opções de Eixo Figura 84 - Mudança de escala no eixo vertical Figura 85 - Gráfico de colunas de Tipo de serviço escala vertical modificada Observe que a diferença entre os dois tipos de serviço parece um pouco mais acentuada agora. O leitor desatento pode achá-la maior do que é na realidade, pois seu olhar é atraído para as colunas, muito poucos prestarão atenção no valor inicial da escala vertical. Gráfico de setores O gráfico de setores pode ser construído da mesma forma que o gráfico em colunas, a partir da tabela dinâmica de uma variável qualitativa. A diferença é que ele apresentará automaticamente os percentuais de cada valor que ela pode assumir em relação ao total geral. Ponha o cursor em algum ponto da tabela dinâmica de Tipo, e procure no menu Inserir por gráficos, como na Figura 71, mostrada anteriormente. Clique no tipo de gráfico e, em seguida, clique no subtipo de gráfico que deseja usar. Agora, queremos Pizza. Se pressionarmos a seta imediatamente abaixo de Pizza é possível ver todos os subtipos disponíveis (Figura 86). 36

37 Há opção de Pizza 2D e 3D. A mesma recomendação sobre os gráficos 3D feitas nos gráficos de colunas permanecem válidas, além de puderem ser estendidas para os casos de gráficos em pizza com fatias explodidas (destacada, no Excel 2007). Assim, recomenda-se o uso de Pizza 2D simples. Um inconveniente do gráfico em pizza no Excel é a impossibilidade de usá-lo quando houver cruzamento de variáveis qualitativas. Para a tabela dinâmica de Tipo vamos escolher Pizza 2D resultando na Figura 87. Figura 86 - Subtipos de gráficos em Pizza Figura 87 - Gráfico em pizza de Tipo de serviço - 1a versão Como a tabela dinâmica já não tinha mais o campo %, o gráfico apresenta apenas as freqüências absolutas, convertidas em arcos do círculo (o total corresponde a 360º e as freqüências absolutas de Pós-pago e Prépago aos respectivos arcos. Precisamos mudar o Título do gráfico (basta clicar sobre Total e reescrever, e acrescentar os %, que não estão visíveis. Para acrescentar os percentuais é preciso selecionar o gráfico e observar novamente as Ferramentas do Gráfico Dinâmico. As opções de Design na Figura 88 (veja que são adaptadas ao gráfico de Pizza), e as opções de Layout na Figura 89, incluindo Rótulos de Dados. Figura 88 - Opções de design de gráfico dinâmico em Pizza Figura 89 - Opções de layout de gráfico dinâmico em Pizza Pressionando na seta ao lado de Rótulo de Dados chegamos à Figura

38 As opções se referem inicialmente à posição onde serão colocados os rótulos, destacando-se Centro e Melhor Ajuste. Mas, precisamos de mais opções de Rótulos de Dados para acrescentar os percentuais de interesse. Pressionando Mais Opções de Rótulos de Dados, o resultado é a Figura 91. Em Opções de Rótulo é possível marcar Porcentagem e escolher sua posição como Melhor Ajuste, finalmente obtendo o gráfico da Figura 92. Figura 90 - Opções de Rótulo de Dados para Gráfico em Pizza Figura 91 - Mais opções de Rótulo de Dados Figura 92 - Gráfico em pizza de Tipo de Serviço - Final Gráficos para duas variáveis qualitativas Suponha que há interesse em construir um gráfico para a tabela conjunta das variáveis qualitativas Tipo e Opinião, vista na seção 4.2, Figura 58. A opção é gráfico de barras (colunas no Excel), mas podendo usar vários subtipos. Antes, porém, vamos copiar a tabela dinâmica inteira para uma área livre na planilha e remover todos os percentuais, o que resultará na Figura 93. Figura 93 - Tabela dinâmica detipo por Opinião - apenas freqüências absolutas Ponha o cursor em algum ponto da tabela dinâmica de Tipo por Opinião, e procure no menu Inserir por gráficos, como na Figura 71. Clique no tipo de gráfico e, em seguida, clique no subtipo de gráfico que deseja usar. No nosso caso, queremos Colunas (barras verticais). Se pressionarmos a seta imediatamente abaixo de Colunas é possível ver todos os subtipos disponíveis (Figura 72). Neste momento vamos escolher Colunas 2D agrupadas, o que resulta no gráfico da Figura

39 Figura 94 - Gráfico de colunas 2D agrupadas de Tipo por Opinião Observe que não há problemas com os percentuais, nem com a escala que começa em zero. Percebe-se que as freqüências de Excelente e Confiável são maiores em Pré-pago do que em Pós-pago, e, as de Sofrível e Terrível são maiores neste último. Para interpretar este gráfico é preciso olhar para a altura e disposição das barras: quando elas são diferentes, como no caso acima, indicam relacionamento entre as variáveis (dependendo do Tipo de serviço a satisfação é maior). Mas, quando elas são semelhantes, isso significa que as variáveis apresentam pouco ou nenhum relacionamento. Imagine que a tabela dinâmica de Tipo por Opinião levasse ao gráfico da Figura 95: Excelente Confiável Mediana Sofrível Terrível Pós-pago Pré-pago Figura 95 - Gráfico de colunas 2D agrupadas de Tipo por Opinião Pouco relacionamento Os dois grupos de barras são muito semelhantes, embora a quantidade de clientes do Prépago seja maior, é possível perceber que o comportamento é bastante semelhante. O gráfico de colunas 2D agrupadas, no entanto, exige uma certa prática para sua correta interpretação, o que pode causar alguns problemas nos casos em que as diferenças entre as variáveis não forem grandes. Uma solução é usar outro subtipo de gráfico de colunas 2D: colunas 2D 100% empilhadas, onde serão apresentados os percentuais em relação às linhas ou colunas, o que permitirá uma análise mais acurada. Para o gráfico da Figura 94, basta selecionar o gráfico e pressionar o botão direito do mouse, o que faz surgir as opções da Figura

40 Figura 96 - Alteração do tipo de gráfico Figura 97 - Opções de alteração de tipo de gráfico Como o gráfico de origem era de coluna seus subtipos aparecem em destaque, mas poderíamos escolher qualquer um. Mas, desejamos os percentuais, então escolhemos Colunas 2D 100% empilhadas, resultando na Figura % 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Pós-pago Pré-pago Terrível Sofrível Mediana Confiável Excelente Figura 98 - Gráfico de colunas 2D 100% empilhadas de Tipo por Opinião 40

41 É possível perceber claramente que os clientes do Pós-pago apresentam percentuais de Terrível e Sofrível bem maiores do que os do Pré-pago, como havíamos concluído anteriormente ao analisar os percentuais por linha na Figura 58. Ao modificar o gráfico da Figura 95 chegamos à Figura 99: 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Pós-pago Pré-pago Terrível Sofrível Mediana Confiável Excelente Figura 99 - Gráfico de colunas 2D 100% empilhadas de Tipo por Opinião Pouco relacionamento Ao contrário do caso da Figura 98 as duas colunas são muito parecidas, com os percentuais para bastante próximos, o que indica pouco relacionamento entre as variáveis Tipo e Opinião. Para fazer um gráfico com três variáveis qualitativas, basta seguir os passos desta seção usando a tabela com 3 variáveis qualitativas mostrada na seção 4.3. É possível construir um gráfico para cada valor da variável Sexo: um para Feminino (Figura 64) e outro para Masculino (Figura 65), e compará-los Análise de dados de variáveis quantitativas Para variáveis quantitativas há uma maior variedade de procedimentos disponíveis. É preciso distinguir os procedimentos relativos à variáveis discretas e contínuas, bem como os casos em que queremos fazer uma análise de uma variável quantitativa em função de uma qualitativa (por exemplo, Renda por Tipo de Serviço). Vamos ver os procedimentos nos próximos itens Procedimentos para variáveis quantitativas discretas tabelas dinâmicas Se a variável for discreta, por exemplo, a variável Anos, no arquivo Celular01.xls, que representa o número de anos completos em que cada pessoa daquele arquivo é cliente da operadora de celular. Vamos construir uma tabela dinâmica para esta variável, repetindo os procedimentos vistos para uma variável qualitativa, Figuras 37 a 40, pondo os resultados em uma planilha existente ou não. Chegamos então ao layout da tabela dinâmica de Anos, mostrado na Figura 100: a variável 8 O ideal é copiar a tabela dinâmica com três variáveis, e construir os gráficos separadamente, para poder compará-los. 41

42 Anos vai para Rótulos de Linha e Valores (não incluiremos nenhum percentual ainda). Após a inserção dos dados, e com pequenas modificações (incluindo a remoção das células vazias), surge a tabela da Figura 101. Figura Layout da tabela dinâmica de Anos Figura Tabela dinâmica de Anos A tabela da Figura 101 não está correta do ponto de vista estatístico. Quando lidamos com uma variável quantitativa discreta, todos os valores entre os extremos precisam fazer parte da tabela, mesmo que não ele não ocorra no conjunto de dados (tenha freqüência zero). Precisamos então fazer mais modificações para obter a tabela correta. Para tornar a tabela correta podemos copiá-la 9 para células apropriadas em outra parte da planilha, incluindo as freqüências. Isso é mostrado na Figura 102. Figura Cópia das células da Tabela dinâmica de Anos O próximo passo é corrigir novamente a tabela, para incluir o valor 13, que exigirá a inserção de células entre as células referentes aos valores 12 e 14: selecionam-se as células onde queremos inserir as novas, no menu Início procuramos pela opção Inserir, e dentro desta escolhemos Inserir células como na Figura Ao fazer a colagem opte por Colar valores. 42

43 Figura Inserção de células no Excel 2007 Pressionando Inserir células o Excel apresentará a Figura 104. Basta escolher Deslocar células para baixo, resultando na Figura 105. Agora precisamos completar a tabela com o valor 13 e sua freqüência, que vale zero. Ao fazermos isso completamos a tabela de freqüências de Anos (Figura 106). Figura Inserção de células: deslocamento para baixo Figura Células inseridas na Tabela de Anos Figura Tabela de freqüências de Anos Podemos acrescentar percentuais à tabela, através de regra de três simples, tendo 4996 como 100%, trocando o formato das células para %, o que resulta na Figura

44 Figura Tabela de Anos: freqüências e percentuais Distribuição de freqüência acumulada Quando lidamos com variáveis quantitativas (discretas ou contínuas) torna-se interessante acrescentar à tabela as freqüências e percentuais acumulados, o que pode enriquecer a análise. Para tanto podemos acrescentar à tabela da Figura 107 uma coluna, e usar a função CONT.SE, que é préprogramada no Excel, e pode ser usada para qualquer tipo de variável. Esta função conta quantos valores em um determinado intervalo de dados atendem a um critério estabelecido. O estabelecimento do critério não permite, porém, que sejam incluídos dois limites, por exemplo, contar todos os valores que são maiores do que e menores do que Mas, é possível utilizar outras células da planilha ao definir o critério (por exemplo, contar todos os valores menores do que o conteúdo da célula L12). Esta função tem a seguinte sintaxe: CONT.SE(intervalo de células; critérios de contagem) Sabe-se que os dados da variável Anos encontram-se nas células H2 a H5001 da planilha de dados 10, este deverá ser o intervalo inserido na função CONT.SE. O critério deverá ser igual ao conteúdo da célula P2, que contém o primeiro valor da variável (Pós-pago). Vejam na Figura 108: Figura CONT.SE: primeira freqüência acumulada da variável Ano 10 No arquivo Celular01.xlsx é a Plan1. 44

45 Total geral Análise Exploratória de Dados utilizando o Microsoft Excel O critério precisa ser colocado entre aspas ( <= ), significando que todos os valores menores ou iguais à referência serão contabilizados naquela célula. A referência à célula AK2 (de Plan2) precisa ser precedida pelo caracter especial &, ou a função retornará uma mensagem de erro. Observe que o intervalo H2:H5001 tem alguns caracteres $. Isso é feito para que este intervalo torne-se uma referência absoluta, para quando arrastarmos a fórmula até o fim da tabela, a contagem seja feita sempre no mesmo intervalo. O resultado final está na Figura 109. Pode-se perceber uma concentração dos clientes nos valores centrais, em torno de 5 anos. Podemos constatar: - o valor 5 é o mais freqüente, 1011 pessoas são clientes há 5 anos completos; - a esmagadora maioria das pessoas é cliente da operadora entre 3 a 7 anos (78,72%); - clientes de longo prazo são relativamente poucos, pouco mais de 1% das pessoas está a 10 anos ou mais na operadora; - a empresa parece não estar conseguindo aumentar sua base de clientes nos últimos tempos, apenas 10,90% das pessoas tornaram-se clientes nos últimos 3 anos. Figura Tabela de Anos: freqüências absolutas, acumuladas e % Observe-se que 95,98% das pessoas são clientes a no máximo 8 anos da operadora. E que apenas 21,74% tornaram-se clientes nos últimos 3 anos, corroborando a análise feita acima. A avaliação cuidadosa das freqüências e percentuais acumulados permite obter muitas informações preciosas sobre os dados. A freqüência e o percentual acumulados também podem ser apresentados na direção oposta, dos maiores para os menores valores, se for do interesse do analista Histograma para variáveis quantitativas discretas O gráfico de colunas para uma variável quantitativa recebe o nome especial de histograma. Trata-se de um gráfico de colunas justapostas (com espaçamento nulo entre elas) em que as áreas das colunas são proporcionais às freqüências dos valores. Se pusermos o cursor em qualquer ponto da tabela da Figura 109 e selecionarmos Inserir, gráfico, colunas 2D, o resultado será a Figura Freqüências % Freq. Acumulada 0 Figura Histograma de Anos - 1a versão Observe que o gráfico tem várias séries que não nos interessam (%, freqüência acumulada, além do total geral). Todas estas precisam ser removidas: seleciona-se o gráfico e pressiona-se o botão direito do mouse, resultando na Figura

46 Figura Opções de gráfico - histograma de Anos Para remover os dados desnecessários pressiona-se Selecionar Dados, o que nos leva à Figura 112. Marca-se % e pressiona-se Remover, marca-se Freq. Acumulada e também se pressiona Remover. Além disso, os dados incluem até a linha 17, o total geral. Portanto, em Intervalo de dados do gráfico devemos trocar o 17 por 16: =Plan2!$AK$1:$AN$17 por =Plan2!$AK$1:$AN$16 Resultado na Figura 113. Figura Seleção de fontes de dados - histograma de Anos Anos Freqüências Figura Histograma de Anos - 2a versão Há um problema com o histograma da Figura 113: os dados dos Anos, que eram rótulos do eixo X moveram-se para o eixo Y, o que não está correto. Novamente, precisamos selecionar os dados, como na Figura 111, levando à Figura

47 A série Anos foi removida das Entradas de Legenda e no campo Rótulos do Eixo Horizontal, pressionamos Editar e selecionamos o intervalo Plan2!AK2:AK16 que contém os valores dos Anos descritos na tabela da Figura 109. Pressionando OK na Figura 114 chegamos ao histograma da Figura 115. Figura Seleção de fontes de dados - histograma de Anos - modificações 1200 Freqüências Freqüências Figura Histograma de Anos - 3a versão Podemos mudar o título, remover a legenda (já que há apenas uma série de dados), entre outras alterações cosméticas. Mas, foi mencionado que as colunas do histograma precisam ser justapostas. Portanto, precisamos reduzir o espaçamento entre elas a zero. Basta selecionar as colunas e pressionar o botão direito do mouse (Figura 116). Figura Opções de formatação de séries de dados - histograma Anos Escolhendo Formatar Série de Dados surge a Figura

48 Freqüências Análise Exploratória de Dados utilizando o Microsoft Excel Figura Opções de formatar séries de dados Reduzindo o campo Largura do espaçamento a Sem intervalo, além das mudanças nos títulos e legenda, o histograma correto é mostrado na Figura Anos como clientes Figura Histograma de Anos completos como cliente Percebe-se claramente que os anos estão concentrados em torno de 5 anos, diminuindo as freqüências progressivamente, à medida que se afastam de 5. 48

49 5.2 - Procedimentos para variáveis quantitativas contínuas Se a variável de interesse for quantitativa contínua, como Renda no arquivo Celular01.xlsx, será necessário construir uma tabela de freqüências agrupada em classes, ou seja agrupar os dados. Como os valores de uma variável contínua repetem-se pouco (ou não se repetem), teríamos uma tabela dinâmica imensa (com talvez centenas de linha no caso da variável Renda), se isso não fosse feito. Vamos observar os passos necessários: 1) Determinar o intervalo do conjunto Para tanto, temos que identificar os extremos do conjunto, seus valores máximo e mínimo. Vamos colocar o mínimo na célula AQ2 e o máximo na célula AQ3, todas na Plan2. Selecione esta célula com o cursor. Podemos inserir as funções ou escrevê-las diretamente nas células: = MÍNIMO(Plan1!G2:G5001) = MÁXIMO(Plan1!G2:G5001) Veja a Figura 119. Figura Mínimo e máximo para a variável Renda Para calcular o intervalo basta colocar a fórmula respectiva em uma célula, AR4 por exemplo. Veja a Figura 120. Figura Intervalo para Renda Observa-se, conforme anteriormente usando o Auto-filtro, que a Renda varia de 1,003 a 43,878 salários mínimos, resultando em um intervalo de 42,875 salários mínimos, que precisa ser dividido em um número conveniente de classes. 2) Dividir o intervalo em um número conveniente de classes. Usualmente definimos o número de classes calculando a raiz quadrada do tamanho do conjunto. Na variável Renda há 4996 observações, extraindo a raiz quadrada (a função RAIZ, na categoria "Matemática e trigonométrica" do Excel), obtemos 70,68. Poderíamos utilizar 71 classes, mas este valor seria elevado (criaríamos muitas categorias, o que talvez prejudicasse nosso objetivo de resumir o conjunto de dados). Por outro lado, usar poucas classes pode resumir demais o conjunto, forçando o agrupamento. Arbitrariamente usaremos 10 classes. Com isso a amplitude das classes seria igual a 42,875 (intervalo) dividido por 10, resultando que cada classe teria uma amplitude de 4,2875. Veja a Figura ) Estabelecer os limites das classes. Podemos arbitrar valores diferentes para a amplitude das classes e o valor inicial, desde que este seja menor do que 1,003 (1, por exemplo), e a amplitude garanta que o valor máximo será incluído no conjunto. Escolhendo uma amplitude de 4,2875, e um valor inicial igual ao mínimo do conjunto, com 10 classes, o resultado poderá ser calculado em células apropriadas, como mostrado a partir da Figura 122. Figura Amplitude de classes de Renda 49

50 Figura 122 Cálculo dos limites inferior e do limite superior da primeira classe de Renda O limite inferior da primeira classe será o conteúdo da célula AR2 (mínimo de Renda), e o limite superior será o limite inferior (célula A R10) mais o conteúdo da célula AR6 (amplitude das classes). A amplitude das classes é referência absoluta, para possibilitar arrastar a fórmula até o final da tabela. Precisamos também definir os limites da segunda classe da tabela, na Figura 123. Figura 123 Cálculo dos limites inferior e superior da segunda classe de Renda O limite inferior da segunda classe é o limite superior da primeira classe. E o limite superior é igual ao limite inferior mais amplitude das classes. Agora sim, podemos arrastar as células AQ11 e AR11 até o fim da tabela e completar as 10 classes. Veja a Figura 124. Figura Classes de Renda 4) Determinar as freqüências de cada classe é o passo mais difícil. Podemos resolver o problema se utilizarmos a função "CONT.SE". Esta função conta quantos valores em um determinado intervalo de dados atendem a um critério estabelecido. Podemos montar uma fórmula para obter a quantidade de observações entre o limite inferior e superior de uma classe. Apenas por conveniência, costuma-se supor que o limite superior apenas limita a classe: se, por exemplo, houver uma renda de 9,578 salários mínimos, ela será registrada na terceira classe e não na segunda. Apenas o limite superior da última classe, caso ele coincidir com o valor máximo da variável, será considerado como dentro da classe. Precisamos também definir os pontos médios das classes, que passarão a representá-las, como se as freqüências obtidas fossem deles. Esses procedimentos são mostrados nas Figuras 125 a

51 Figura Ponto médio da primeira classe de Renda Basta arrastar a fórmula da célula AS10 até a AS19 para obter os pontos médios das classes. Figura Obtenção da freqüência da primeira classe de Renda Observe que se contam as ocorrências menores do que o limite superior da classe, subtraídas da contagem das ocorrências menores do que o limite inferior, mantendo o intervalo G2 a G5001 (da Plan1- valores de Renda) como referência absoluta, para permitir arrastar a fórmula até a célula AT19. 51

52 Figura Obtenção da freqüência da última classe de Renda Observe que na obtenção da freqüência da última classe de Renda devemos usar o critério <= quando lidando com o limite superior da classe, pois ele coincide com o valor máximo do conjunto. Se não fizermos isso, a contagem desconsiderará este valor máximo, e a tabela ficará incorreta. Podemos também obter freqüências e percentuais acumulados para a tabela de Renda. Basta remover o segundo membro das fórmulas mostradas nas Figuras 126 e 127, tomando os mesmos cuidados com o limite superior da última classe, como mostrado nas Figuras 128 e 129. Figura Obtenção da freqüência acumulada da primeira classe de Renda 52

53 Figura Obtenção da freqüência acumulada da primeira classe de Renda Após todas as operações, incluindo a obtenção dos percentuais a tabela agrupada em classes da Renda resulta na Figura 130. Figura Renda agrupada em classes: freqüências absolutas, percentuais, freqüências acumuladas e percentuais acumulados 53

54 Freqüências Análise Exploratória de Dados utilizando o Microsoft Excel A maioria absoluta (na realidade, mais, pois são 59,23%) dos clientes tem renda de até 5,29 salários mínimos. Apenas 7% dos clientes têm renda acima de 13,86 salários mínimos, o que pode ser importante para a empresa direcionar seu marketing. O importante, também, é que a variável foi resumida em uma tabela que facilita sua análise Histograma para variáveis quantitativas contínuas De forma análoga ao caso das variáveis quantitativas discretas podemos construir um histograma para uma variável quantitativa contínua, desde que ela já esteja resumida em uma tabela agrupada em classes. Agora iremos usar um procedimento diferente de inserção de gráfico, para evitar a necessidade de tantas correções como no caso do histograma de Anos. Devemos pôr o cursor em uma célula vazia da planilha e no menu Inserir escolher Gráfico, Colunas 2D, colunas agrupadas. Surgirá um gráfico totalmente em branco. Selecionando este gráfico e pressionando o botão direito do mouse vamos obter as opções de gráfico vistas na Figura 111. Escolhendo Selecionar dados poderemos selecionar para Entradas de legenda as freqüências da tabela mostrada na Figura 130 (células AT10 a AT19 da Plan2), e para Rótulos do eixo horizontal as células que contém os limites inferiores e superiores das classes, como mostrado na Figura 131. Figura Seleção de dados para Histograma de Renda Pressionando OK o histograma resultante pode ser visto na Figura 132. Novamente, é preciso acrescentar título geral, títulos nos eixos, e reduzir o espaçamento entre as barras. Após todas essas operações o histograma correto está na Figura Renda em salários mínimos ,2905 9,578 13, ,153 22, ,728 31, ,303 39, ,878 1,003 5,2905 9,578 13, ,153 22, ,728 31, ,303 39,5905 Salários mínimos Figura 132 Histograma da Renda dos clientes em salários mínimos com limites das classes 54

55 Percebe-se que a maioria esmagadora dos clientes tem renda até 5,2905 salários mínimos, e que há muito poucos clientes com renda acima de 22,4405 salários mínimos. São as mesmas conclusões da tabela da Figura 130, mas a apreensão da informação é mais rápida através do gráfico. 5.3 Medidas de síntese Uma das maiores vantagens do Excel (seja qual versão for) é a facilidade de cálculo das medidas de síntese. Basta inserir a função, fornecer os argumentos apropriados e obter os resultados. É possível calcular as medidas de síntese para uma variável quantitativa individualmente, ou em função de uma ou mais variáveis qualitativas (através de uma tabela dinâmica ou não). Vamos começar com o cálculo individual. Para tanto, no arquivo Celular01.xlsx, devemos selecionar a planilha Plan1, onde estão os dados. Repare que estes dados já estão classificados em função da variável Tipo (ver seção 2), o que nos será útil em breve Medidas de síntese para uma variável quantitativa Imagine que queremos fazer uma descrição da variável Renda, calculando as seguintes medidas: média, mediana, moda, desvio padrão, quartil inferior, quartil superior, mínimo e máximo. Todas estas medidas têm funções pré-programadas no Excel, e podem ser inseridas de várias formas. Por exemplo, quando conhecemos a sintaxe da função podemos digitá-la diretamente, como fizemos com máximo e mínimo de Renda (Figura 119). Ou, podemos usar os menus do Excel 2007: basta selecionar Fórmulas e surge a Figura 133. Figura Fórmulas no Excel 2007 Na extrema esquerda da Figura 133 está a opção Inserir Função 11. Observe também as opções: Usadas Recentemente, Financeira, etc. E, ao final, Mais Funções. Se pressionarmos esta última chegamos à Figura 134. Figura Fórmulas no Excel 2007 Mais funções Dentre as opções vemos Estatística, que inclui as medidas de síntese que procuramos. Podemos inserir as medidas usando Inserir Função (Figura 133) ou pelo caminho da Figura 134. Mas, antes de tudo, devemos definir as células da Plan1 que armazenarão os resultados. Por conveniência os 11 Exatamente como nas versões anteriores do Excel. 55

56 resultados das medidas serão postos nas células P2 a P8, com os nomes das medidas nas células O2 a O8, tal como mostrado na Figura 135. Figura Medidas de síntese de Renda - 1a parte Medidas de síntese pelo botão Inserir Função Vamos começar com a média. Posicione o cursor na célula P2. Ao pressionar o botão Inserir Função surge a tela da Figura 136. Se soubermos algo da função podemos digitar parte do seu nome no campo Procure por uma função e o Excel apresentará uma lista de candidatas. Ou podemos selecionar uma categoria: a padrão é Mais recentemente usada. Se clicarmos sobre a seta ao lado, vamos ver várias categorias (Figura 137), entre elas a Estatística. Ao escolhermos esta todas as funções existentes desta categoria serão apresentadas, bastando percorrer a barra de rolagem para encontrar as que procuramos, como, por exemplo, a média. Figura Funções disponíveis no Excel Figura Funções estatísticas no Excel - 1a abordagem Para cada função o Excel apresenta a sua sintaxe (os argumentos necessários) e uma explicação sobre o que ela faz. Se pressionarmos OK passamos à tela da Figura

57 Figura Argumentos da função Média (para Renda) - 1a versão Os dados de Renda estão nas células G2 a G Então, ou selecionamos os dados diretamente (pressionando à seta vermelha ao lado dos campos Núm1 ou Núm2 e escolhendo as células com o mouse) ou escrevemos o intervalo G2:G5001. Os dois pontos indicam para o Excel que todas as células do intervalo precisam ser consideradas no cálculo, mas a função desconsidera células vazias. Antes mesmo de pressionar OK o Excel já apresenta o resultado: 5,796 salários mínimos (cerca de R$ 2956, em agosto de 2010). Se repetirmos o processo para as outras medidas, vamos completar os cálculos, os procedimentos estão nas Figuras 139 a 142. Figura Argumentos das funções Mediana e Moda (Renda) - 1a versão Figura Argumentos da função desvio padrão (Renda) - 1a versão É importante ressaltar que o arquivo Celular01.xlsx refere-se a uma AMOSTRA, então devemos calcular o desvio padrão amostral com n-1 no denominador da expressão. No Excel isso é feito através da função DESVPAD(). Se houver interesse no desvio padrão populacional, com n no denominador, deve-se usar a função DESVPADP. 12 A célula G1 é excluída por conter o nome da variável. 57

58 Figura Argumentos das funções Quartil Inferior e Superior (Renda) - 1a versão Quando se trata do quartil inferior o Excel exige que se escreva 1 no campo Quarto, e 3 para o quartil superior, como explicado na própria função. Figura Argumentos das funções Mínimo e Máximo (Renda) - 1a versão E os resultados completos podem ser vistos na Figura 143. Figura Medidas de síntese de Renda A descrição de uma variável quantitativa consiste em analisar basicamente quatro aspectos: tendência central, dispersão, assimetria e presença de valores discrepantes. Para a descrição ser completa precisamos calcular outras medidas de síntese, derivadas das obtidas na Figura 143: coeficiente de variação percentual, diferenças entre os quartis e a mediana, e os valores que definem os valores discrepantes. Nas Figuras 144 a 146 apresentamos as operações: O coeficiente de variação percentual é o resultado da divisão do desvio padrão pela média do conjunto de dados. Permite comparar a dispersão entre grupos com médias diferentes. Figura Cálculo do CV% 58

59 Figura Cálculo das diferenças entre os quartis e a mediana Se a diferença entre o Quartil superior (Qs) e a Mediana (Md) for bastante próxima da diferença entre a Mediana e o Quartil Inferior (Qi) o conjunto de dados referente a variável pode ser considerado simétrico em relação à tendência central (além disso, média e mediana devem ser próximas também). Figura Cálculo dos limites para valores discrepantes Valores discrepantes inferiores são todos aqueles abaixo do limite Qi 1,5 (Qs-Qi). E discrepantes superiores todos acima de Qs + 1,5 (Qs-Qi). Os resultados completos estão na Figura 147. Figura Medidas de síntese para Renda (completas) E a descrição da variável Renda será mostrada a seguir. Tendência Central: - o valor típico de Renda oscila entre 4,248 (mediana - 50% dos clientes abaixo e 50% acima deste valor) e 5,796 salários mínimos (média); - ou seja, entre R$2166,48 e R$2955,96 (valores de agosto de 2010); - usando dados do Brasil (IBGE PNAD 2008) que constatou uma renda média do brasileiro de R$ 1036,00 pode-se dizer que os clientes da operadora de celular tem um bom perfil econômico, pois sua tendência central é pelo menos duas vezes maior do que a média do Brasil a moda vale 6,108 salários mínimos, mas para variáveis quantitativas contínuas esta medida não tem muito significado, pois os valores se repetem pouco 14. Dispersão: - a variação total da renda é de 1,003 (mínimo) a 43,878 (máximo) salários mínimos (R$511,53 a R$22377,78 valores de agosto de 2010), a maior renda é 43 vezes maior do que a menor, indicando grande dispersão; 13 É FUNDAMENTAL ter algum padrão para comparação, o que foi possível neste caso. 14 Usando a função CONT.SE descobre-se que a moda ocorreu apenas 31 vezes em um total de 5000 observações. 59

60 - a grande dispersão é confirmada pelo alto valor do coeficiente de variação percentual, indicando que o desvio padrão representa 86,13% da média; - 25% dos clientes têm renda de até 2,046 (quartil inferior) salários mínimos (R$1043,56), e 25% têm renda acima de 7,758 (quartil superior) salários mínimos (R$3956,58) valores de agosto de 2010; - como conseqüência da afirmação anterior, 50% dos clientes têm renda entre 2,046 e 7,758 salários mínimos. Assimetria - média e mediana são diferentes, e como a média é maior do que a mediana a assimetria é à direita; - a conclusão acima é confirmada pela diferença entre quartil superior e mediana (3,51) que é maior do que a entre a mediana e o quartil inferior (2,202). Valores discrepantes - não há discrepantes inferiores, pois precisaria haver renda inferior -6,522 salários mínimos, o que é impossível; - há discrepantes superiores, pois há valores acima 15 de 16,326 salários mínimos (R$8326,26 em agosto de 2010) Medidas de síntese para uma variável quantitativa em função de uma qualitativa por classificação Uma das ferramentas mais úteis de análise exploratória de dados de variáveis quantitativas é o breakdown : consiste em calcular medidas de síntese de uma variável quantitativa em função dos valores de uma ou mais variáveis qualitativas (que podem ser chamadas de variáveis de agrupamento ou independentes). Com base nos resultados encontrados é possível avaliar se as variáveis apresentam algum relacionamento: - da mesma forma que para as variáveis qualitativas devem-se comparar os valores totais com os obtidos para cada valor das variáveis e agrupamento; - se houver diferenças significativas entre as medidas totais (com todos os dados) e as para cada grupo formado em função dos valores das variáveis de agrupamento há evidência de relacionamento entre as variáveis. Imagine que há interesse em avaliar se os clientes de Pós-pago e Pré-pago têm perfil de renda diferente. Neste caso há duas variáveis: Tipo, que será a independente (ou de agrupamento) e Renda, que será a dependente. Na seção calculamos as medidas de síntese de Renda, sem segmentação (as medidas totais). Agora precisamos calcular as mesmas medidas de síntese para os clientes de Pós-pago e Pré-pago. Isso exigirá a classificação dos dados em função da variável Tipo, o que já foi feito na seção 2 (ver Figuras 19 a 23). Se inspecionarmos o conjunto classificado vamos observar: - as células vazias de Tipo vão da célula A2 até a A8; - as células de clientes de Pós-pago vão da célula A9 até a A2110; - as células de clientes de Pré-pago vão da célula A2111 até a A5001. Não vamos calcular medidas para as células vazias de Tipo. Temos que repetir o procedimento da seção para as células G9 a G2110 (medidas de síntese de Renda para os clientes de Pós-pago) e das células G2111 a G5001 (medidas de síntese de Renda para os clientes de Pré-pago). Basta repetir os passos das Figuras 138 a 142 trocando o intervalo de células lá utilizado pelos mencionados acima, resultando na Figura 148: 15 Usando a função CONT.SE verifica-se que há 224 clientes com renda acima deste valor, sendo portanto valores discrepantes. 60

61 Figura Breakdown de Renda por Tipo - a partir do arquivo classificado Precisamos repetir a descrição da seção 5.3.1, mas comparando as medidas por Tipo e em relação às totais. Vamos analisar apenas por salários mínimos, deixando ao leitor a tarefa de conversão dos valores para reais. Tendência Central: - o valor típico geral de Renda oscila entre 4,248 (mediana) e 5,796 salários mínimos (média); - tanto a média quanto a mediana dos clientes do Pós-pago são maiores do que o geral, e também maiores do que as do Pré-pago 8,3839 e 6,9 contra 3,918 e 2,811 respectivamente; - conclui-se que os clientes de Pós-pago têm maior tendência central de Renda, com diferença de 4,46 salários mínimos na média e 4,089 na mediana, respectivamente, em relação ao Pré-pago; Dispersão: - a variação total da renda é de 1,003 (mínimo) a 43,878 (máximo), sendo que é mais acentuada no Pós-pago (1,032 a 43,878- diferença de 43 vezes) do que no Pré-pago (1,003 a 35,796 diferença de apenas 35 vezes), mas em ambos a dispersão é grande; - a grande dispersão é confirmada pelo alto valor do coeficiente de variação percentual, indicando que o desvio padrão representa 86,13% da média no total, mas é menor no Pós-pago (68,60%) do que no Pré-pago (83,16%); - no total, 25% dos clientes têm renda de até 2,046 (quartil inferior) salários mínimos, e 25% têm renda acima de 7,758 (quartil superior) salários mínimos; - como conseqüência da afirmação anterior, 50% do total de clientes têm renda entre 2,046 e 7,758 salários mínimos; - os quartis do Pós-pago são ambos maiores do os do Pré-pago (e do total de clientes), 4,332 e 11,097 salários mínimos contra 1,684 e 5,142 respectivamente apenas 25% dos clientes de Prépago têm renda acima de 5,142 salários mínimos (o quartil superior do Pré-pago nem sequer atinge a mediana do Pós-pago que vale 6,9); - 50% dos clientes do Pós-pago tem renda entre 4,332 e 11,097 salários mínimos, enquanto que no Pré-pago, 50% têm renda entre 1,684 e 5,142 salários mínimos; Assimetria - média e mediana são diferentes no total de clientes, e como a média é maior do que a mediana a assimetria é à direita; - a conclusão acima é confirmada pela diferença entre quartil superior e mediana (3,51) que é maior do que a entre a mediana e o quartil inferior (2,202). 61

62 - média e mediana também são diferentes nos dois Tipos, constatando-se também pelas diferenças entre quartis e mediana; Valores discrepantes - não há discrepantes inferiores, pois precisaria haver renda inferior -6,522 salários mínimos no total de clientes, inferior a -5,815 no Pré-pago e -3,503 no Pós-pago; - há discrepantes superiores, pois há valores acima de 16,326 salários mínimos no total de clientes, 21,4445 no Pós-pago e 10,329 no Pré-pago 16. As diferenças entre as Rendas dos clientes de Pós-pago e Pré-pago podem ser detectadas em um diagrama em caixas múltiplo (Figura 149): Renda (salários mínimos) Diagrama em caixas: Renda por Tipo Pós-pago Tipo Pré-pago Figura Diagrama em caixas de Renda por Tipo Mediana 25%-75% Amplitude sem discrepantes Discrepantes Discrepantes O valor típico (mediana) de Pós-pago é maior do que o do Pré-pago, e o quartil superior do Pré-pago é pouco maior do que o do Pós-pago: ou seja, cerca de 75% dos clientes de Pós-pago têm renda correspondente aos 25% mais abastados clientes de Pré-pago. Há assimetria em ambos, e a dispersão aparenta ser maior em Pós-pago (Qs-Qi) maior do que no Pré-pago. Há valores discrepantes superiores nos dois grupos. O procedimento poderia ser estendido para os casos em que mais de uma variável de agrupamento, por exemplo, poderíamos fazer um breakdown de Renda por Tipo e por Opinião Medidas de síntese para uma variável quantitativa em função de uma qualitativa por tabela dinâmica É possível realizar o breakdown descrito na seção usando tabelas dinâmicas, o que evita a necessidade de classificação prévia dos dados. Mas, nas tabelas dinâmicas não há todas as medidas disponíveis no repertório de funções estatísticas do Excel: há apenas contagem (e a possibilidade de apresentar os resultados como percentuais), mínimo, máximo, média, variância (amostral e populacional) e desvio padrão (amostral e populacional). O procedimento é semelhante ao caso de duas variáveis qualitativas, mas é preciso tomar alguns cuidados. O início do processo é semelhante ao visto na seção 4.1: posicionar o cursor em alguma célula do banco de dados, menu Inserir, opção Tabela Dinâmica. O Excel 2007 automaticamente selecionará todas as colunas adjacentes à posição do cursor: no nosso caso, na Plan1, células A1 a N5001 do arquivo Celular01.xlsx, como mostrado na Figura 38. Mas agora queremos pôr os resultados na mesma planilha onde estão os dados, como pode ser visto na Figura Usando a função CONT.SE verifica-se que há 224 clientes com renda acima de 16,326 salários mínimos no total, 78 com renda acima de 21,4445 no Pós-pago e 133 com renda acima de10,329 no Pré-pago. 62

63 Figura 150 Seleção de dados da tabela dinâmica Renda por Tipo Se pressionarmos OK na Figura 150 o Excel 2007 apresenta a Figura 151, com as várias opções de Layout: Figura Layout da tabela dinâmica Renda x Tipo 1a parte Vamos arrastar a variável Tipo para o campo Rótulos de Linha, e Renda para o campo Σ Valores, NÃO arraste nenhuma outra variável para o campo Rótulos de Coluna, resultando na Figura 152 Figura Layout da tabela dinâmica Renda x Tipo 2a parte 63

64 No caso da Figura 152 a tabela apenas contaria quantos clientes há em cada Tipo de serviço. Precisamos arrastar a variável Renda mais vezes até o campo Σ Valores e modificar a forma de resumir os resultados: basta selecionar o botão da variável, e escolher Configurações do campo de Valor, ver Figura 153. Figura 153 Formas de resumir os dados de Renda Usamos DesvPad porque os dados do arquivo Celular01.xls referem-se a uma amostra. O layout resultante é mostrado na Figura 154 Tela à esquerda. E tal como mostrado na Figura 52, precisamos mover o botão Σ Valores do campo Rótulos de Coluna para o campo Rótulos de Linha, resultando na tela à direita da Figura 154. Figura Layout da tabela dinâmica Renda x Tipo 3a parte Clicando sobre o X no canto superior direito da tela à direita da Figura 154 chegamos à Figura 155, já sem as células vazias e com modificações para tornar a tabela mais apresentável. 64

65 Figura Tabela dinâmica de Renda por Tipo Análise Exploratória de Dados utilizando o Microsoft Excel É possível calcular o coeficiente de variação percentual a partir dos dados da tabela, mas a descrição será mais pobre do que a feita na seção 5.3.2, devido à falta de medidas como mediana e quartis (e as derivadas dela). Tendência central: - a média de Renda dos clientes de Pós-pago é superior a dos de Pré-pago (mais de 2 vezes) e maior do que a média geral. Dispersão: - a variação total da renda é de 1,003 (mínimo) a 43,878 (máximo), sendo que é mais acentuada no Pós-pago (1,032 a 43,878- diferença de 43 vezes) do que no Pré-pago (1,003 a 35,796 diferença de apenas 35 vezes), mas em ambos a dispersão é grande; - a grande dispersão é confirmada pelo alto valor do coeficiente de variação percentual, indicando que o desvio padrão representa 86,13% da média no total, mas é menor no Pós-pago (68,60%) do que no Pré-pago (83,16%) os coeficientes são os mesmos mostrados na Figura 155; Assimetria: não há como avaliar a assimetria. Valores discrepantes: devido à grande diferença entre as médias e os máximos presume-se a existência de valores discrepantes superiores. Se quiséssemos acrescentar mais uma variável de agrupamento, Opinião, por exemplo, bastaria arrastá-la para o campo Filtro de Relatório na Figura 154, de forma semelhante ao caso da tabela dinâmica de três variáveis qualitativas (seção 4.3). As medidas seriam apresentadas em função de cada valor de Opinião e do total geral. Isso pode ser muito útil em estudos mais sofisticados. Nada impede a colocação de mais de uma variável no campo Filtro de Relatório, a não ser a crescente dificuldade em interpretar os resultados encontrados. Vamos ver um exemplo, usando a variável Sexo no campo Filtro de Relatório, o layout da tabela seria: Figura Layout da tabela dinâmica Renda x Tipo x Sexo 65

66 O resultado pode ser visto na Figura 157: Figura Tabela dinâmica de Renda x Tipo x Sexo (geral) Na Figura 157 a tabela é exatamente igual a da Figura 155, pois não acionamos o filtro da variável Sexo. Na Figura 158 são apresentadas as duas tabelas de Renda por Tipo para o sexo Feminino e Masculino. Figura Tabelas dinâmicas de Renda x Tipo x Sexo (Feminino e Masculino) Podemos calcular os coeficientes de variação percentual e resumi-los em uma tabela: Geral 86,13% Pós-pago 68,60% Feminino geral 83,54% Masculino geral 76% Pré-pago 83,16% Feminino Pós-pago 68,85% Masculino Pós-pago 63% Feminino Pré-pago 72,62% Masculino Pré-pago 77% Tendência central: - os homens apresentam maior tendência central de Renda, pois sua média vale 7,358 salários mínimos contra 3,8877 das mulheres; - quando se segmenta por Tipo e Sexo percebe-se que para os dois sexos os clientes de Pós-pago têm maiores médias (6,017 salários mínimos versus 2,906 no feminino, 9,59 versus 3,89 no masculino; 66

INE 7001 - Procedimentos de Análise Exploratória de Dados utilizando o Excel 2003 Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Exploratória de Dados utilizando o Excel 2003 Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Exploratória de Dados utilizando o Excel 2003 Professor Marcelo Menezes Reis Índice Analítico 1. Filtragem... 5 1.1 Filtragem para identificação de células vazias...

Leia mais

Procedimentos de Análise Exploratória de Dados utilizando o Br.Office Calc Professor Marcelo Menezes Reis

Procedimentos de Análise Exploratória de Dados utilizando o Br.Office Calc Professor Marcelo Menezes Reis Procedimentos de Análise Exploratória de Dados utilizando o Br.Office Calc Professor Marcelo Menezes Reis Análise Exploratória de Dados utilizando o Calc ÍNDICE ANALÍTICO 1) Procedimentos para variáveis

Leia mais

Estatística no EXCEL

Estatística no EXCEL Estatística no EXCEL Prof. Ms. Osorio Moreira Couto Junior 1. Ferramentas... 2 2. Planilha de dados... 3 2.1. Introdução... 3 2.2. Formatação de células... 4 2.3. Inserir ou Excluir Linhas e Colunas...

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

RESUMO DA AULA PRÁTICA DE EXCEL

RESUMO DA AULA PRÁTICA DE EXCEL PARA CONSTRUIR TABELAS: RESUMO DA AULA PRÁTICA DE EXCEL Vai em ; Em seguida irá abrir a janela: Na parte Selecione os dados ou somente a variável que deseja analisar, por exemplo: Em seguida marque a opção

Leia mais

Como gerar amostras aleatórias simples e estratificadas proporcionais com o Br.Office.org Calc

Como gerar amostras aleatórias simples e estratificadas proporcionais com o Br.Office.org Calc Como gerar amostras aleatórias simples e estratificadas proporcionais com o Br.Office.org Calc Neste texto mostraremos como usar o Br.Office.org Calc para gerar uma amostra aleatória simples e estratificada

Leia mais

Unidade III 1. APRESENTANDO PLANILHAS ELETRÔNICAS. 1.1) Conceito de Planilha Eletrônica. 1.2) Inicializando o Excel e o Calc

Unidade III 1. APRESENTANDO PLANILHAS ELETRÔNICAS. 1.1) Conceito de Planilha Eletrônica. 1.2) Inicializando o Excel e o Calc Unidade III 1. APRESENTANDO PLANILHAS ELETRÔNICAS 1.1) Conceito de Planilha Eletrônica Em certa época, a planilha era um pedaço de papel que os contadores e planejadores de empresas utilizavam para colocar

Leia mais

MICROSOFT EXCEL AVANÇADO

MICROSOFT EXCEL AVANÇADO MICROSOFT EXCEL AVANÇADO SE Retorna um valor se teste_lógico avaliar como VERDADEIRO e um outro valor se for avaliado como FALSO. Use SE para conduzir testes condicionais sobre valores e fórmulas e para

Leia mais

Questão - 01. Essência do Excel 2003...

Questão - 01. Essência do Excel 2003... Valdir Questão - 01 Como deve proceder o usuário do Microsoft para que sejam atualizados os cálculos das funções ou fórmulas utilizadas nas planilhas? a) Pressionar a tecla F9 no teclado b) Pressionar

Leia mais

CRUZAMENTO DE VARIÁVEIS, ANÁLISE BIVARIADA E GRÁFICOS

CRUZAMENTO DE VARIÁVEIS, ANÁLISE BIVARIADA E GRÁFICOS Sphinx APRENDIZ - p.201 8 ANÁLISES CRUZADAS E MÚLTIPLAS CRUZAMENTO DE VARIÁVEIS, ANÁLISE BIVARIADA E GRÁFICOS O sistema permite que sejam feitos cruzamentos dos mais diversos tipos de variáveis. Os cruzamentos,

Leia mais

Superintendência Regional de Ensino de Ubá - MG Núcleo de Tecnologia Educacional NTE/Ubá. LibreOffice Impress Editor de Apresentação

Superintendência Regional de Ensino de Ubá - MG Núcleo de Tecnologia Educacional NTE/Ubá. LibreOffice Impress Editor de Apresentação Superintendência Regional de Ensino de Ubá - MG Núcleo de Tecnologia Educacional NTE/Ubá LibreOffice Impress Editor de Apresentação Iniciando o Impress no Linux Educacional 4 1. Clique no botão 'LE' no

Leia mais

Basicão de Estatística no EXCEL

Basicão de Estatística no EXCEL Basicão de Estatística no EXCEL Bertolo, Luiz A. Agosto 2008 2 I. Introdução II. Ferramentas III. Planilha de dados 3.1 Introdução 3.2 Formatação de células 3.3 Inserir ou excluir linhas e colunas 3.4

Leia mais

Construção do Boxplot utilizando o Excel 2007

Construção do Boxplot utilizando o Excel 2007 1 Construção do Boxplot utilizando o Excel 2007 (1 Passo) Vamos digitar os dados na planilha. Para isso temos três banco de dados (Dados 1, Dados 2 e Dados 3), no qual irão gerar três Boxplot. Figura 1

Leia mais

Lista de valores de uma questão texto

Lista de valores de uma questão texto Sphinx APRENDIZ - p.160 7 ANÁLISE DE TEXTOS O software, ao apresentar o resultado de uma questão texto, exibe uma lista simples de todos os valores acrescentados. É de responsabilidade do pesquisador retirar

Leia mais

Estatística Usando EXCEL

Estatística Usando EXCEL Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Estatística Usando EXCEL Distribuição de alunos segundo idade e sexo > =23 60% 40% 21 ---23 67% 33% 19 ---21

Leia mais

MAIS CONTROLE SOFTWARE Controle Financeiro / Fluxo de Caixa (MCS Versão 2.01.99) Índice

MAIS CONTROLE SOFTWARE Controle Financeiro / Fluxo de Caixa (MCS Versão 2.01.99) Índice Item MAIS CONTROLE SOFTWARE Controle Financeiro / Fluxo de Caixa (MCS Versão 2.01.99) Índice Página 1.Apresentação... 4 2.Funcionamento Básico... 4 3.Instalando o MCS... 4, 5, 6 4.Utilizando o MCS Identificando

Leia mais

Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado.

Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado. , ()! $ Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado. Uma estratégia muito utilizada para organizar visualmente informações numéricas

Leia mais

Introdução ao OpenOffice.org Calc 2.0

Introdução ao OpenOffice.org Calc 2.0 Introdução ao OpenOffice.org Calc 2.0 http://www.openoffice.org.br/ 1- INTRODUÇÃO O OpenOffice.org Calc 2.0 para Windows/Linux e outras plataformas é uma poderosa planilha eletrônica, muito parecida com

Leia mais

Linguagem R R-Gui e R-Commander

Linguagem R R-Gui e R-Commander Linguagem R R-Gui e R-Commander 1 INSTALAÇÃO DO PROGRAMA BÁSICO E PACOTES O sistema é formado por um programa básico (R-Gui) e muitos pacotes com procedimentos adicionais. Tudo é gratuito e com código

Leia mais

Microsoft Excel. Formulários PARTE 8 SUMÁRIO

Microsoft Excel. Formulários PARTE 8 SUMÁRIO Microsoft Excel Formulários PARTE 8 SUMÁRIO 1-) Formulários Personalizados no Excel... 2 1.1-) Botão Caixa de combinação.... 4 1.2-) Botão Caixa de opção.... 8 1.3-) Caixa de Grupo.... 11 1-) Formulários

Leia mais

I- EMISSÕES DE CO 2 E O FUTURO DO MUNDO

I- EMISSÕES DE CO 2 E O FUTURO DO MUNDO I- EMISSÕES DE CO 2 E O FUTURO DO MUNDO Começa por abrir o ficheiro TOP 20 CO2_PIB. Para além de uma página introdutória, encontrarás na página 2.1 os valores de emissão de dióxido de carbono (CO 2 ),

Leia mais

Curso Capacitação da Ufms. Anexos Excel 2007

Curso Capacitação da Ufms. Anexos Excel 2007 Anexos Excel 2007 Anexo1 Subtotais Pode-se destacar duas formas de fazer subtotais, sem uso de tabelas dinâmicas. A Primeira, você vai fazer dois passos, classificar e depois o subtotal. Tomando a tabela

Leia mais

Noções de Informática

Noções de Informática Noções de Informática Caderno 2 CONTEÚDO MS-Excel 2010: estrutura básica das planilhas, conceitos de células, linhas, colunas, pastas e gráficos, elaboração de tabelas e gráficos, uso de fórmulas, funções

Leia mais

Mozart de Melo Alves Júnior

Mozart de Melo Alves Júnior 2000 Mozart de Melo Alves Júnior INTRODUÇÃO O Excel 7.0 é um aplicativo de planilha desenvolvido para ser usado dentro do ambiente Windows. As planilhas criadas a partir desta ferramenta poderão ser impressas,

Leia mais

Astra LX Registro de Pacientes e Médicos Guia para o acesso aos registros de Pacientes e Médicos e eliminação de dados duplicados no AstraLX

Astra LX Registro de Pacientes e Médicos Guia para o acesso aos registros de Pacientes e Médicos e eliminação de dados duplicados no AstraLX Astra LX Registro de Pacientes e Médicos Guia para o acesso aos registros de Pacientes e Médicos e eliminação de dados duplicados no AstraLX 2011 Equipe Documentação Astra AstraLab 27/10/2011 Sumário Registro

Leia mais

Figura 1 - Planilha para teste do recurso Auto Filtro

Figura 1 - Planilha para teste do recurso Auto Filtro Microsoft Excel Aula 5 Objetivos Apresentar o uso de filtros Trabalhar com validação de dados Apresentar o recurso Auditoria do Microsoft Excel Exercício 01 - AutoFiltro Construa uma planilha de acordo

Leia mais

Linguagem R R-Gui e R-Commander

Linguagem R R-Gui e R-Commander Linguagem R R-Gui e R-Commander 1 INSTALAÇÃO DO PROGRAMA BÁSICO E PACOTES O sistema é formado por um programa básico (R-Gui) e muitos pacotes com procedimentos adicionais. Tudo é gratuito e com código

Leia mais

Introdução ao Epi Info - Versão Windows

Introdução ao Epi Info - Versão Windows Universidade de São Paulo/Faculdade de Saúde Pública Curso de Saúde Pública Disciplina: HEP 147 - Informática Introdução ao Epi Info - Versão Windows Apresentação do Software Criar Ficha (Make View) Cria

Leia mais

Aula 01 Conceitos Iniciais sobre Excel 2010

Aula 01 Conceitos Iniciais sobre Excel 2010 Aula 01 Conceitos Iniciais sobre Excel 2010 Professor: Bruno Gomes Disciplina: Informática Básica Curso: Gestão de Turismo Sumário da aula: 1. Abrindo o Excel; 2. Conhecendo a Tela do Excel. 3. Inserindo

Leia mais

O Windows também é um programa de computador, mas ele faz parte de um grupo de programas especiais: os Sistemas Operacionais.

O Windows também é um programa de computador, mas ele faz parte de um grupo de programas especiais: os Sistemas Operacionais. MICROSOFT WINDOWS O Windows também é um programa de computador, mas ele faz parte de um grupo de programas especiais: os Sistemas Operacionais. Apresentaremos a seguir o Windows 7 (uma das versões do Windows)

Leia mais

APOSTILA DE EXCEL 2007

APOSTILA DE EXCEL 2007 APOSTILA DE EXCEL 2007 1. Introdução Quando você cria uma planilha nova, a tela do computador é dividida em linhas e colunas, formando uma grade. A interseção de uma linha e de uma coluna é chamada de

Leia mais

Workshop Excel. Felipe Pusanovsky de Barros

Workshop Excel. Felipe Pusanovsky de Barros Workshop Excel Felipe Pusanovsky de Barros P rezado aluno, bem vindo a esse workshop. Procurei dar ênfase à preparação de gráficos no Excel, pois é uma das principais alterações em relação às versões até

Leia mais

Prefeitura de Volta Redonda Secretaria Municipal de Educação Departamento Pedagógico Núcleo de Tecnologia Educacional Volta Redonda NTM

Prefeitura de Volta Redonda Secretaria Municipal de Educação Departamento Pedagógico Núcleo de Tecnologia Educacional Volta Redonda NTM Prefeitura de Volta Redonda Departamento Pedagógico NTM Planilha Eletrônica Prefeitura de Volta Redonda Departamento Pedagógico NTM Prefeitura de Volta Redonda Departamento Pedagógico NTM Coloque seus

Leia mais

0079 - Relatórios Protheus

0079 - Relatórios Protheus Relatórios Todos os direitos autorais reservados pela TOTVS S.A. Proibida a reprodução total ou parcial, bem como a armazenagem em sistema de recuperação e a transmissão, de qualquer modo ou por qualquer

Leia mais

Microsoft PowerPoint XP. Módulo I I

Microsoft PowerPoint XP. Módulo I I FUNCICI MG ESCOLA TÉCNICA DE FORMAÇÃO GERENCIAL DE CONTAGEM CURSO TÉCNICO AMBIENTAL E DE SEGURANÇA APOSTILA BÁSICA: Microsoft PowerPoint XP Módulo I I Elaborada por: Walter Santos 2007 2 S U M Á R I O

Leia mais

MICROSOFT OFFICE EXCEL 2007

MICROSOFT OFFICE EXCEL 2007 LEIAME Nenhuma informação da APOSTILA - MICROSOFT OFFICE EXCEL 2007 poderá ser copiada, movida ou modificada sem autorização prévia e escrita do autor. MICROSOFT OFFICE EXCEL 2007 Efetue cálculos, analise

Leia mais

Microsoft Excel Aula 7

Microsoft Excel Aula 7 Microsoft Excel Aula 7 Microsoft Excel Tema da aula: Função SE OPERADORES DE COMPARAÇÃO Você pode comparar dois valores com os operadores a seguir. Quando dois valores são comparados usando esses operadores,

Leia mais

Tecnologia da Informação Prof. Mário Henrique de Souza Pardo Resumo Aula 4

Tecnologia da Informação Prof. Mário Henrique de Souza Pardo Resumo Aula 4 Tecnologia da Informação Prof. Mário Henrique de Souza Pardo Resumo Aula 4 1 MS-Excel Aplicando funções às suas fórmulas de Excel (continuação) Serão vistas, nesta aula as funções de busca e referência

Leia mais

Ajuda On-line - Sistema de Relacionamento com o Cliente. Versão 1.1

Ajuda On-line - Sistema de Relacionamento com o Cliente. Versão 1.1 Ajuda On-line - Sistema de Relacionamento com o Cliente Versão 1.1 Sumário Sistema de Relacionamento com Cliente 3 1 Introdução... ao Ambiente do Sistema 4 Acessando... o Sistema 4 Sobre a Tela... do Sistema

Leia mais

ASSEMBLÉIA LEGISLATIVA DA BAHIA

ASSEMBLÉIA LEGISLATIVA DA BAHIA CALC para Windows OpenOffice.org 3.0: Manual do usuário A sua Planilha de Cálculos SUMÁRIO Introdução...3 Apresentando o OpenOffice.org Calc 3.0...4 Iniciando o Calc 3.0...4 Componentes Básicos da janela

Leia mais

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Unidade 2 Distribuições de Frequências e Representação Gráfica UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Ao finalizar esta Unidade, você deverá ser capaz de: Calcular

Leia mais

1 Revisão: Construção de fórmulas

1 Revisão: Construção de fórmulas 1 Revisão: Construção de fórmulas Vinicius A. de Souza va.vinicius@gmail.com São José dos Campos, 2011. 1 Sumário Tópicos em Microsoft Excel 2007 Introdução...3 Como efetuar uma operação...3 Construindo

Leia mais

2 Pesquisa de valores em uma lista de dados

2 Pesquisa de valores em uma lista de dados 2 Pesquisa de valores em uma lista de dados Vinicius A. de Souza va.vinicius@gmail.com São José dos Campos, 2011. 1 Sumário Tópicos em Microsoft Excel 2007 Introdução...3 Funções PROCV e PROCH...3 PROCV...3

Leia mais

MICROSOFT EXCEL - AULA NÚMERO 02

MICROSOFT EXCEL - AULA NÚMERO 02 MICROSOFT EXCEL - AULA NÚMERO 02 Escrevendo Fórmulas Você pode executar cálculos com seus dados usando fórmulas, que são formatadas por operadores de dados e quase sempre por funções. Você vai aprender

Leia mais

Noções Básicas de Excel página 1 de 19

Noções Básicas de Excel página 1 de 19 Noções Básicas de Excel página 1 de 19 Conhecendo a tela do Excel. A BARRA DE FÓRMULAS exibe o conteúdo de cada célula (local) da planilha. Nela podemos inserir e alterar nomes, datas, fórmulas, funções.

Leia mais

3 Resumo de dados com Tabelas e Gráficos dinâmicos

3 Resumo de dados com Tabelas e Gráficos dinâmicos 3 Resumo de dados com Tabelas e Gráficos dinâmicos Vinicius A. de Souza va.vinicius@gmail.com São José dos Campos, 2011. 1 Sumário Tópicos em Microsoft Excel 2007 Tabela dinâmica...3 Processo de construção...3

Leia mais

Tutorial do Iniciante. Excel Básico 2010

Tutorial do Iniciante. Excel Básico 2010 Tutorial do Iniciante Excel Básico 2010 O QUE HÁ DE NOVO O Microsoft Excel 2010 é um programa de edição de planilhas eletrônicas muito usado no mercado de trabalho para realizar diversas funções como;

Leia mais

MANUAL DA SECRETARIA

MANUAL DA SECRETARIA MANUAL DA SECRETARIA Conteúdo Tela de acesso... 2 Liberação de acesso ao sistema... 3 Funcionários... 3 Secretaria... 5 Tutores... 7 Autores... 8 Configuração dos cursos da Instituição de Ensino... 9 Novo

Leia mais

FEMA Fundação Educacional Machado de Assis INFORMÁTICA Técnico em Segurança do Trabalho P OW ERPOI NT. Escola Técnica Machado de Assis Imprensa

FEMA Fundação Educacional Machado de Assis INFORMÁTICA Técnico em Segurança do Trabalho P OW ERPOI NT. Escola Técnica Machado de Assis Imprensa P OW ERPOI NT 1 INTRODUÇÃO... 3 1. Iniciando o PowerPoint... 3 2. Assistente de AutoConteúdo... 4 3. Modelo... 5 4. Iniciar uma apresentação em branco... 6 5. Modo de Exibição... 6 6. Slide Mestre... 7

Leia mais

2. ENTRADA DE DADOS 2.1. TEXTOS

2. ENTRADA DE DADOS 2.1. TEXTOS 2. ENTRADA DE DADOS Os dados digitados em uma célula são divididos em duas categorias principais: constantes ou fórmulas. Um valor constante é um dado digitado diretamente na célula e que não é alterado.

Leia mais

ROBERTO OLIVEIRA CUNHA

ROBERTO OLIVEIRA CUNHA LEIAME APRESENTAÇÃO Nenhuma informação do TUTORIAL DO MICRO- SOFT OFFICE WORD 2003 poderá ser copiada, movida ou modificada sem autorização prévia e escrita do Programador Roberto Oliveira Cunha. Programador:

Leia mais

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word 2010. Sumário

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word 2010. Sumário CADERNO DE INFORMÁTICA FACITA Faculdade de Itápolis Aplicativos Editores de Texto WORD 2007/2010 Sumário Editor de texto... 3 Iniciando Microsoft Word... 4 Fichários:... 4 Atalhos... 5 Área de Trabalho:

Leia mais

SUGESTÃO DE PLANO DE APRENDIZAGEM. Curso de Formação Inicial e Continuada. EXCEL 2010 Avançado SAC 9411362-0

SUGESTÃO DE PLANO DE APRENDIZAGEM. Curso de Formação Inicial e Continuada. EXCEL 2010 Avançado SAC 9411362-0 SUGESTÃO DE PLANO DE APRENDIZAGEM Curso de Formação Inicial e Continuada EXCEL 2010 Avançado SAC 9411362-0 Área: Tecnologia da Informação Subárea: Aplicativos Duração: 39 horas Gerência de Desenvolvimento

Leia mais

PRONATEC IFPA. Cursos Mulheres Mil: Operador de Computador. Disciplina: Informática Avançada Parte III. Professore: Adil Daou

PRONATEC IFPA. Cursos Mulheres Mil: Operador de Computador. Disciplina: Informática Avançada Parte III. Professore: Adil Daou PRONATEC IFPA Cursos Mulheres Mil: Operador de Computador Disciplina: Informática Avançada Parte III Professore: Adil Daou Belém 2014 01 Algumas outras funções Vamos inicialmente montar a seguinte planilha

Leia mais

Aula 4 Estatística Conceitos básicos

Aula 4 Estatística Conceitos básicos Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a

Leia mais

Microsoft Excel 2010

Microsoft Excel 2010 Microsoft Excel 2010 Feito por Gustavo Stor com base na apostila desenvolvida por Marcos Paulo Furlan para o capacitação promovido pelo PET. 1 2 O Excel é uma das melhores planilhas existentes no mercado.

Leia mais

TODOS OS DIREITOS RESERVADOS. ESSE MATERIAL NÃO PODE SER DISTRIBUÍDO SEM A DEVIDA AUTORIZAÇÃO DO GAPE SOB PENA DE PAGAMENTO DE MULTA.

TODOS OS DIREITOS RESERVADOS. ESSE MATERIAL NÃO PODE SER DISTRIBUÍDO SEM A DEVIDA AUTORIZAÇÃO DO GAPE SOB PENA DE PAGAMENTO DE MULTA. EXCEL PARA TODOS 1 AULA 01 OPERAÇÕES BÁSICAS E RÉGUA DE FORMATAÇÃO 1. Operações Básicas Muitas dessas operações você já faz e utiliza normalmente, tanto nas suas tarefas diárias quanto com o uso do Excel.

Leia mais

Validação de dados. Determinamos qual tipo de informação será aceita e dentro de qual intervalo.

Validação de dados. Determinamos qual tipo de informação será aceita e dentro de qual intervalo. Validação de dados Por meio do recurso de validação, podemos definir que tipo de informação gostaríamos que fosse aceita em um intervalo de células ou uma mensagem de auxílio ao usuário indicando qual

Leia mais

Probabilidade e Estatística I Antonio Roque Aula 8. Introdução ao Excel

Probabilidade e Estatística I Antonio Roque Aula 8. Introdução ao Excel Introdução ao Excel Esta introdução visa apresentar apenas os elementos básicos do Microsoft Excel para que você possa refazer os exemplos dados em aula e fazer os projetos computacionais solicitados ao

Leia mais

Neste capítulo veremos como se trabalha com fórmulas e funções que são as ferramentas que mais nos ajudam nos cálculos repetitivos.

Neste capítulo veremos como se trabalha com fórmulas e funções que são as ferramentas que mais nos ajudam nos cálculos repetitivos. Fórmulas e Funções Neste capítulo veremos como se trabalha com fórmulas e funções que são as ferramentas que mais nos ajudam nos cálculos repetitivos. Operadores matemáticos O Excel usa algumas convenções

Leia mais

MICROSOFT EXCEL - AULA NÚMERO 01

MICROSOFT EXCEL - AULA NÚMERO 01 MICROSOFT EXCEL - AULA NÚMERO 01 Introduzindo Dados Com o Microsoft Excel é fácil introduzir informações numa planilha e mudar, excluir ou acrescentar dados. Você vai aprender a: - Abrir e salvar um arquivo

Leia mais

ÍNDICE... 3 INTRODUÇÃO... 4. A série... 4

ÍNDICE... 3 INTRODUÇÃO... 4. A série... 4 EXCEL 2007 e 2010 2 ÍNDICE ÍNDICE... 3 INTRODUÇÃO... 4 A série... 4 01 LISTA COM VALIDAÇÃO... 5 02 FUNÇÕES FINANCEIRAS... 7 03 FUNÇÃO DE BANCO DE DADOS... 12 04 RÓTULOS... 15 05 TABELA DINÂMICA... 18 06

Leia mais

TUTORIAL DO ACCESS PASSO A PASSO. I. Criar um Novo Banco de Dados. Passos: 1. Abrir o Access 2. Clicar em Criar um novo arquivo

TUTORIAL DO ACCESS PASSO A PASSO. I. Criar um Novo Banco de Dados. Passos: 1. Abrir o Access 2. Clicar em Criar um novo arquivo TUTORIAL DO ACCESS PASSO A PASSO I. Criar um Novo Banco de Dados Passos: 1. Abrir o Access 2. Clicar em Criar um novo arquivo 3. Clicar em Banco de Dados em Branco 4. Escrever um nome na caixa de diálogo

Leia mais

Microsoft Office Excel 2007

Microsoft Office Excel 2007 1 Microsoft Office Excel 2007 O Excel é um programa dedicado a criação de planilhas de cálculos, além de fornecer gráficos, função de banco de dados e outros. 1. Layout do Excel 2007 O Microsoft Excel

Leia mais

Associação Educacional Dom Bosco Curso de Engenharia 1º ano

Associação Educacional Dom Bosco Curso de Engenharia 1º ano Formatação condicional utilizando o valor da célula O que é? Algumas vezes é preciso destacar os valores, ou seja, como colocar em vermelho ou entre parênteses, os negativos, e de outra cor os positivos,

Leia mais

CAPÍTULO 1- OPERAÇÕES COM NÚMEROS INTEIROS Indicadores de aprendizagem Verifica se sabes: Identificar o conjunto dos números inteiros.

CAPÍTULO 1- OPERAÇÕES COM NÚMEROS INTEIROS Indicadores de aprendizagem Verifica se sabes: Identificar o conjunto dos números inteiros. CAPÍTULO 1- OPERAÇÕES COM NÚMEROS INTEIROS Identificar o conjunto dos números inteiros. Representar na recta numérica os números inteiros. Indicar o valor absoluto e o simétrico de um número. Comparar

Leia mais

SEI Superintendência de Estudos Econômicos e Sociais da Bahia Av Luiz Viana Filho, 435-4ª avenida, 2º andar CAB CEP 41.750-300 Salvador - Bahia Tel.

SEI Superintendência de Estudos Econômicos e Sociais da Bahia Av Luiz Viana Filho, 435-4ª avenida, 2º andar CAB CEP 41.750-300 Salvador - Bahia Tel. SIDE Sistema de Dados Estatísticos AJUDA SEI Superintendência de Estudos Econômicos e Sociais da Bahia Av Luiz Viana Filho, 435-4ª avenida, 2º andar CAB CEP 41.750-300 Salvador - Bahia O QUE O NOSSO BANCO

Leia mais

Capítulo 5 Representações gráficas para variáveis quantitativas

Capítulo 5 Representações gráficas para variáveis quantitativas Capítulo 5 Representações gráficas para variáveis quantitativas Introdução Até o capítulo passado, você aprendeu a sintetizar dados a partir de um conjunto desordenado de dados, identificando a quantidade

Leia mais

ÍNDICE. Página 2 de 20

ÍNDICE. Página 2 de 20 Página 1 de 20 ÍNDICE 1. OBJETIVO... 3 2. MENU RELATÓRIOS... 3 2.1. Introdução... 3 2.2. Relatório de Service Accuracy... 3 2.2.1. Tela do Relatório de Service Accuracy... 3 2.2.2. Interpretando o Relatório

Leia mais

Para o OpenOffice Impress, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides.

Para o OpenOffice Impress, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides. OPENOFFICE IMPRESS 1. O QUE É UMA APRESENTAÇÃO Para o OpenOffice Impress, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides. Em cada slide podemos ter vários elementos

Leia mais

Editor de Planilhas Calc

Editor de Planilhas Calc Editor de Planilhas Calc Realização www.idort.com.br www.telecentros.sp.gov.br Com a disseminação das redes de computadores e, principalmente, com o aparecimento da Internet, ficou claro o impacto social

Leia mais

1. Introdução a Microsoft Excel

1. Introdução a Microsoft Excel Introdução a Microsoft Excel 1. Introdução a Microsoft Excel 1.1. O que é Microsoft Excel Microsoft Excel é um software de planilha eletrônica produzido pela Microsoft Corporation, para o sistema operacional

Leia mais

Apostila de Uso do OpenOffice.org Calc 2.0. Projeto Libertas-BR http://www.libertasbr.org.br

Apostila de Uso do OpenOffice.org Calc 2.0. Projeto Libertas-BR http://www.libertasbr.org.br Apostila de Uso do OpenOffice.org Calc 2.0 Projeto Libertas-BR http://www.libertasbr.org.br 6 de dezembro de 2006 Sumário 1 Visão Geral do OpenOffice.org 4 2 Openoffice.org Calc 2.0 6 2.1 Primeiros passos.....................................

Leia mais

Sumário - Power Point

Sumário - Power Point Power Point Sumário - Power Point 1. INICIANDO O POWERPOINT... 116 2. APRESENTAÇÃO DA JANELA DO POWERPOINT... 117 3. CONCEITOS BÁSICOS DO POWERPOINT... 118 4. INICIANDO UMA APRESENTAÇÃO... 118 4.1 Autolayouts

Leia mais

Questões de Informática 2011 - Editores de Texto

Questões de Informática 2011 - Editores de Texto 1. Existe uma operação específica no Word que serve para destacar um texto selecionado colocando uma moldura colorida em sua volta, como uma caneta "destaque" (iluminadora). Trata-se de a) "Cor da borda".

Leia mais

PRINCÍPIOS DE INFORMÁTICA PRÁTICA 07 1. OBJETIVO 2. BASE TEÓRICA. 2.1 Definição de Planilha Eletrônica

PRINCÍPIOS DE INFORMÁTICA PRÁTICA 07 1. OBJETIVO 2. BASE TEÓRICA. 2.1 Definição de Planilha Eletrônica PRINCÍPIOS DE INFORMÁTICA PRÁTICA 07 1. OBJETIVO Apresentar a planilha eletrônica MS-Excel e algumas de suas operações básicas, incluindo inserção de fórmulas, utilização de funções da planilha e a criação

Leia mais

Práticas Empresariais em Excel. Professor: Pádua

Práticas Empresariais em Excel. Professor: Pádua Práticas Empresariais em Excel Professor: Pádua SUMÁRIO 1 FÓRMULAS... 4 2 FUNÇÕES... 5 2.1 Data e hora... 5 2.1.1 Hoje... 5 2.1.2 Dia, Mês e... 5 2.1.3 Agora... 5 2.1.4 Hora, Minuto e Segundo... 5 2.2

Leia mais

Disponibilizo a íntegra das 8 questões elaboradas para o Simulado, no qual foram aproveitadas 4 questões, com as respectivas resoluções comentadas.

Disponibilizo a íntegra das 8 questões elaboradas para o Simulado, no qual foram aproveitadas 4 questões, com as respectivas resoluções comentadas. Disponibilizo a íntegra das 8 questões elaboradas para o Simulado, no qual foram aproveitadas questões, com as respectivas resoluções comentadas. Amigos, para responder às questões deste Simulado, vamos

Leia mais

Microsoft Excel 2000. Alan Cleber Borim - alan.borim@poli.usp.br. http://www.pcs.usp.br/~alan

Microsoft Excel 2000. Alan Cleber Borim - alan.borim@poli.usp.br. http://www.pcs.usp.br/~alan Microsoft Excel 2000 Alan Cleber Borim - alan.borim@poli.usp.br http://www.pcs.usp.br/~alan Microsoft Índice 1.0 Microsoft Excel 2000 3 1.1 Acessando o Excel 3 1.2 Como sair do Excel 3 1.3 Elementos da

Leia mais

PLANILHA PARA GERENCIAR NOTAS DAS TURMAS

PLANILHA PARA GERENCIAR NOTAS DAS TURMAS PLANILHA PARA GERENCIAR NOTAS DAS TURMAS INTRODUÇÃO Faça download de um dos arquivos de acordo com o software de planilha eletrônica disponível em sua máquina: Excel 97-03 https://dl.dropboxusercontent.com/u/5308498/rem_planilhaexemplo.xls

Leia mais

Criação de Formulários através do Access. Como criar formulários no Access para uma tabela do Banco de Dados:

Criação de Formulários através do Access. Como criar formulários no Access para uma tabela do Banco de Dados: Criação de Formulários através do Access Como criar formulários no Access para uma tabela do Banco de Dados: 1. Inicie o Microsoft Access e abra o banco de dados o qual deseja efetuar a construção do formulário.

Leia mais

Guia de Utilização do Atlas do Desenvolvimento Humano no Brasil

Guia de Utilização do Atlas do Desenvolvimento Humano no Brasil GOVERNO DO ESTADO DE MATO GROSSO SECRETARIA DE PLANEJAMENTO E COORDENAÇÃO GERAL Guia de Utilização do Atlas do Desenvolvimento Humano no Brasil Base de Informações Para o Planejamento EDMAR AUGUSTO VIEIRA

Leia mais

Análise de Arredondamento em Ponto Flutuante

Análise de Arredondamento em Ponto Flutuante Capítulo 2 Análise de Arredondamento em Ponto Flutuante 2.1 Introdução Neste capítulo, chamamos atenção para o fato de que o conjunto dos números representáveis em qualquer máquina é finito, e portanto

Leia mais

ESTUDANDO ESTATÍSTICA DESCRITIVA COM AUXÍLIO DO SOFTWARE CALC

ESTUDANDO ESTATÍSTICA DESCRITIVA COM AUXÍLIO DO SOFTWARE CALC DIRETORIA DE PESQUISA E PÓS-GRADUAÇÃO/GERÊNCIA DE PESQUISA PROJETO: TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO NO PROCESSO DE ENSINO E APRENDIZAGEM DE MATEMÁTICA ESTUDANDO ESTATÍSTICA DESCRITIVA COM AUXÍLIO

Leia mais

Gerente de Tecnologia: Ricardo Alexandre F. de Oliveira Marta Cristiane Pires M. Medeiros Mônica Bossa dos Santos Schmid WORD 2007

Gerente de Tecnologia: Ricardo Alexandre F. de Oliveira Marta Cristiane Pires M. Medeiros Mônica Bossa dos Santos Schmid WORD 2007 WORD 2007 PREFEITURA DO MUNICÍPIO DE LONDRINA SECRETARIA MUNICIPAL DE EDUCAÇÃO GERÊNCIA DE TECNOLOGIA Gerente de Tecnologia: Ricardo Alexandre F. de Oliveira Marta Cristiane Pires M. Medeiros Mônica Bossa

Leia mais

Alguns truques do Excel. 1- Títulos com inclinação. 2- Preencha automaticamente células em branco

Alguns truques do Excel. 1- Títulos com inclinação. 2- Preencha automaticamente células em branco Alguns truques do Excel 1- Títulos com inclinação No Excel é possível colocar o conteúdo das células na vertical. Para além disto, pode-se escolher o grau de inclinação. Para isto, seleccione as células

Leia mais

Aula Número 01. Sumário

Aula Número 01. Sumário Aula Número 01 Sumário Conceitos Básicos:... 3 Movendo-se numa Planilha... 4 Selecionando Múltiplas Células... 4 Abrindo e Salvando um Arquivo... 6 Salvando um arquivo... 8 Introduzindo e Editando Dados...

Leia mais

NOÇÕES BÁSICAS DE ESTATÍSTICA

NOÇÕES BÁSICAS DE ESTATÍSTICA Curso de Capacitação em Epidemiologia Básica e Análise da Situação de Saúde Ministério da Saúde Secretaria de Vigilância em Saúde NOÇÕES BÁSICAS DE ESTATÍSTICA Gleice Margarete de Souza Conceição Airlane

Leia mais

Channel. Módulo Gerencial. Tutorial. Atualizado com a versão 4.02

Channel. Módulo Gerencial. Tutorial. Atualizado com a versão 4.02 Channel Módulo Gerencial Tutorial Atualizado com a versão 4.02 Copyright 2009 por JExperts Tecnologia Ltda. todos direitos reservados. É proibida a reprodução deste manual sem autorização prévia e por

Leia mais

OpenOffice Calc Aula 4

OpenOffice Calc Aula 4 OpenOffice Calc Aula 4 Objetivos: Apresentar a criação de um gráfico no CALC, a partir dos dados em uma planilha Apresentar os diversos tipos de gráficos e suas aplicações (gráfico de coluna, de linha,

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

6. Enumere de acordo com a primeira: A. Minimizar diminui o aplicativo, deixando-o na Barra de Tarefas.

6. Enumere de acordo com a primeira: A. Minimizar diminui o aplicativo, deixando-o na Barra de Tarefas. LINUX EDUCACIONAL -Assinale a alternativa correta. 1. Para criar uma pasta devemos: Clicar no menu Exibir-Modo de Exibição Clicar com o botão direito onde gostaríamos de criá-la e em seguida Criar Novo

Leia mais

Unidade 4: Planilhas eletrônicas

Unidade 4: Planilhas eletrônicas Unidade 4: Planilhas eletrônicas 4.3. Primeiros passos No programa BrOffice.org Calc as células podem assumir diferentes categorias (formatos). Para ilustrar melhor, recomendamos que o usuário selecione

Leia mais

Aula 8 POWER POINT. Patrícia Soares de Lima. META Aprender a utilizar o Power Point como ferramenta pedagógica nas aulas de Química.

Aula 8 POWER POINT. Patrícia Soares de Lima. META Aprender a utilizar o Power Point como ferramenta pedagógica nas aulas de Química. Aula 8 POWER POINT META Aprender a utilizar o Power Point como ferramenta pedagógica nas aulas de Química. OBJETIVOS Ao final desta aula, o aluno deverá: Discutir, de forma breve, a utilização deste software

Leia mais

WEBGIS Sistema Informativo Territorial

WEBGIS Sistema Informativo Territorial PREFEITURA MUNICIPAL DE PONTA GROSSA WEBGIS Sistema Informativo Territorial MANUAL DE UTILIZAÇÃO Autor: Rony Camargo de Brito Primeira edição: 20-06-2008 Atualizado: 08-10-2008 Todos os Direitos Reservados

Leia mais

Microsoft Excel XP. Módulo I I

Microsoft Excel XP. Módulo I I FUNCICI MG ESCOLA TÉCNICA DE FORMAÇÃO GERENCIAL DE CONTAGEM CURSO TÉCNICO AMBIENTAL E DE SEGURANÇA APOSTILA: Microsoft Excel XP Módulo I I Elaborada por: Walter Santos 2006 1 S U M Á R I O 1. Introdução:...

Leia mais

MANUAL DE GABINETES SAJ/SG5

MANUAL DE GABINETES SAJ/SG5 MANUAL DE GABINETES SAJ/SG5 Seção de Implantação de Sistemas Divisão de Sistemas Judiciais de Segundo Grau Diretoria de Tecnologia da Informação DTI/TJSC suporte: saj2grau@tjsc.jus.br Índice: Página 1.

Leia mais

Modulonet Web. 7.1 - Menu Despesas... 8. 7.2 - Menu Usuário... 9. 7.3 - Atalhos... 10. 7.4 - Informações pessoais... 11

Modulonet Web. 7.1 - Menu Despesas... 8. 7.2 - Menu Usuário... 9. 7.3 - Atalhos... 10. 7.4 - Informações pessoais... 11 Modulonet Web 1 - Modulonet, o que é?... 1 2 - Cadastro... 2 3 - Mensagens e emails... 3 4 - Recuperação da senha... 4 5 - Idiomas... 5 6 - Acesso... 6 7 - Painel... 7 7.1 - Menu Despesas... 8 7.2 - Menu

Leia mais

INFORMÁTICA BÁSICA. Word. Professor: Enir da Silva Fonseca

INFORMÁTICA BÁSICA. Word. Professor: Enir da Silva Fonseca INFORMÁTICA BÁSICA Word Professor: Enir da Silva Fonseca Índice Word... 03 Documento... 03 Iniciando o Word... 03 Teclas especiais... 04 Corrigindo Erros... 04 Localizando e Substituindo o Texto... 07

Leia mais

4Distribuição de. freqüência

4Distribuição de. freqüência 4Distribuição de freqüência O objetivo desta Unidade é partir dos dados brutos, isto é, desorganizados, para uma apresentação formal. Nesse percurso, seção 1, destacaremos a diferença entre tabela primitiva

Leia mais