Estatística e Probabilidade Curso: Tecnólogo em Gestão Ambiental Semestre 2012/2 Profª. Me. Valéria Espíndola Lessa E-mail: valeria-lessa@uergs.edu.com 1
Introdução Quem nunca ouviu a palavra estatística referindo-se a um número ou conjunto de números? A poluição da água potável no país aumentou em 25%. 90,6% dos municípios brasileira informaram a ocorrência frequente e impactante de alguma alteração ambiental (IBGE, 2008); Aumentou em 45% as políticas públicas ambientais no país. 2
Exemplo de organização dos dados de uma pesquisa: 3
A palavra Estatística possui um sentido mais amplo do que apenas números ou coleções de números; É uma ciência e não apenas um ramo da matemática, embora ferramentas da matemática sejam essenciais. (John Tukey) Estatística é a ciência que apresenta processos próprios para coletar, apresentar, analisar e interpretar conjuntos de dados, sejam eles numéricos ou não, com o objetivo de tomar melhores decisões. 4
Etapas de uma Pesquisa: 5
Perguntas a serem respondidas no levantamento dos dados: O quê pesquisar? Características a serem observadas Variáveis (Impactos Ambientais: queimadas, desmatamento, poluição da água,...) Quem pesquisar? Os elementos a serem pesquisados População (municípios e regiões) Como pesquisar? O instrumento de coleta de dados Questionário/ Entrevista 6
Principais Instituições de Pesquisas no Brasil Oficiais (Públicas): IBGE (http://www.ibge.gov.br/home/) IPEA (http://www.ipea.gov.br/portal/) FEE (http://www.fee.tche.br) Não públicas: Fundação Getúlio Vargas (http://portal.fgv.br/) IBOPE (http://www.ibope.com.br) Datafolha (http://datafolha.folha.uol.com.br/) Vox Populi (http://www.voxpopuli.com.br) Dieese (http://www.dieese.org.br/) 7
FEE Fundação de Economia e Estatística A FEE é responsável pela elaboração das séries estatísticas do Rio Grande do Sul, incluindo o Sistema de Contas Regionais, e pela realização de estudos e análises sobre a realidade socioeconômica gaúcha. 8
9
FEE Indicadores do Potencial Poluidor das Indústrias Exemplo de Tabela baixada: POTENCIAL POLUIDOR 10
A Estatística é uma ferramenta para o Gestor responder os porquês de problemas que podem ser explicados por uma análise de dados; 11
Divisão da Estatística Estatística Descritiva Descreve, organiza e apresenta os dados através de tabelas, gráficos e medidas. Inferencial Analisa os dados para a tomada de decisão. É alicerçada nos cálculos de probabilidade. Estabelece conclusões sobre um conjunto de elementos quando se observa somente uma parte deste. 12
O que vamos estudar em Estatística? 1º) Estatística Descritiva: Variáveis; Tabelas; Gráficos; Medidas: Tendência Central: Média, Moda e Mediana; Dispersão: Variância e Desvio padrão. 13
2º) Probabilidade: Espaço Amostral; Eventos; Probabilidade Condicional e Independente; Distribuição Normal e Binomial; 14
3º) Estatística Inferencial: Métodos e Cálculos de Amostragem; Distribuições Amostrais; Estimação; Teste de Hipóteses; Análise de Correlação e Regressão. 15
Noções Iniciais sobre Populações e Amostras População : conjunto de elementos para os quais deseja-se investigar uma ou mais características. Pode ser formada por pessoas, domicílios, peças de produção, cobaias, etc. Amostra: subconjunto da população. 16
Pesquisa com toda a população Censo ou Recenseamento Pesquisa com parte/subconjunto da população Pesquisa por Amostragem 17
Porque fazer Amostragem? Economia de tempo; Economia de recurso financeiro; População muito grande ou infinita; Testes destrutivos; Quando fazer censo? População menor; Quando se exige o resultado exato. Censo Demográfico 18
19
POPULAÇÃO: todos os possíveis consumidores amostragem Amostra: um subconjunto dos consumidores inferência 20
Situações da Estatística aplicada à Gestão Ambiental Pesquisas a respeito do tratamento de esgoto do município. Pesquisas a respeito do tratamento dos resíduos das empresas da região. Pesquisas sobre a qualidade da água potável. Pesquisas a respeito da qualidade do solo. E o estudo de riscos e impactos ambientais para a avaliação de novos empreendimentos ou ampliação de atividades produtivas. Exemplo de Pesquisa Fonte: SEBRAE http://www.sebrae-rs.com.br/produtos-servicos/publicacoes/pesquisa-gestao-ambiental-nasmpes/1400.aspx 21
Estatística Descritiva 22
Tipos de Variáveis 23
Variável Qualitativa Nominal: categorias nomeadas (listagem) Bairro que reside Centro, Progresso, Bela vista,... Transporte carro, ônibus, a pé,... Sexo feminino, masculino. Ordinal: Quando as categorias nomeadas são ordenadas: Exemplo: Qualidade do serviço da empresa (1) Excelente ; (2) Bom; (3) Fraco; (4) Muito fraco. 24
Variável Quantitativa Discreta: Dados numéricos que apresentam contagens (Número Naturais: 0,1,2,3,...) Número de pessoas; Número de Empresas ; Número de Lixeiras; Contínua: Dados numéricos que apresentam medidas (Números não inteiros) Alturas 1,85 metros Salários R$ 1.500,00 Horários 2h30min Áreas 15,6 hectares 25
Classificação das variáveis, exemplos: a) Universo: Alunos de uma classe Variável: Cor de cabelos Variável: Idade b) Universo: casais residentes em uma cidade Variável: Números de filhos Variável: Rua em que residem c) Universo: Empresa Variável: Número de peças produzidas por hora Variável: Diâmetro de cada peça Qualitativa Nominal Quantitativa Contínua Quantitativa Discreta Qualitativa Nominal Quantitativa Discreta Quantitativa Contínua Variável: Tratamento de resíduos: (1)sim ou (2)não Qualitativa Ordinal 26
Exemplo Essa pesquisa tem como objetivo geral realizar um levantamento socioeconômico, ambiental e cultural da comunidade que ocupa a bacia hidrográfica do rio do Braço, no município de Joinville (SC), com a finalidade de identificar as percepções ambientais por intermédio de atividades de educação ambiental direcionadas às necessidades identificadas pelos atores sociais em questão. Ver o artigo Fonte: http://periodicos.univille.br/index.php/rsa/article/viewfile/63/99 27
Organização das Variáveis Variáveis Qualitativas Variáveis Quantitativas Tabelas (freqüências ou percentuais) Gráficos Tabelas (freqüências ou percentuais) Gráficos Medidas de síntese: média, mediana, desvio padrão 28
Tabelas Estatísticas Cabeçalho; O que está representado? Onde ocorreu? Quando ocorreu? Corpo; (dados em forma de colunas e linhas) Rodapé; (fonte e explicações) 29
Após a realização da coleta de dados de uma pesquisa é necessário organizar estes dados. A primeira forma de organização dos dados é numa tabela de dados brutos. 30
Exemplo: Tabela de dados brutos de uma Variável (Idade): Rol: É o arranjo dos dados brutos em ordem de freqüências: 31
Exemplo: Um questionário foi aplicado aos alunos do 2º ano do curso de Estatística da Universidade Estadual de Maringá (UEM) matriculados na disciplina Inferência Estatística. As variáveis que compõem o questionário são: 1) Sexo: com categorias (1) se masculino e (2) se feminino 2)Id: idade em anos 3)Altura: altura em metros e centímetros 4)Peso: peso em quilos 5)Est.Civil: estado civil com categorias (1) se solteiro, (2) se casado e (3) se separado 6)Nºir.: número de irmãos 32
7) Transp.: meio de transporte mais utilizado com categorias (1) de coletivo e (2) se próprio 8) Procedência: município de procedência com categorias (1) se Maringá, (2) se outro município do Paraná e (3) se de outro Estado 9) Trabalho: relação do trabalho com o curso com categorias (1) não trabalho, (2) completamente relacionado, (3) parcialmente relacionado e (4) não relacionado 10) Inform: meio de informação mais utilizado com categorias (1) se TV, (2) jornal, (3) rádio, (4) revista e (5) internet 11) Disc.: número de disciplinas reprovadas no 1º ano da faculdade. 33
34
Tabela de Distribuição de Frequências - Uma Variável - É a forma de organizar certos dados para a melhor interpretação destes. A tabela simples a seguir organiza a frequência de ocorrência das 3 categorias de uma única variável: município de procedência : 35
A frequência de ocorrência de um dado pode ser representado de duas formas: Frequência Absoluta (F i ): é o número de vezes que um valor da variável aparece na pesquisa. Frequência Relativa (f i ): é representado por uma fração, número decimal ou percentual que indica a frequência absoluta em relação ao total da pesquisa. Frequência Acumulada (fac): é obtido pela soma das freqüências de todos os valores da variável, menores ou iguais ao valor considerado. 36
Exemplo: Município de Procedência Nº Alunos(Fi) Fac Percentual (fi) Fac(%) Maringá 12 12 55 55 Outro no Paraná Fora do Paraná 7 19 32 87 3 22 14 100 Total 22 100 37
Cálculo da Frequência Relativa Fórmula: f f i i % Fi N f i 100 onde fi frequênciarelativa F frequência absoluta i N total de elementosda amostra i número da linha Cálculo da tabela anterior: f f f 1 2 3 12 0,5454... 0,55 55% 22 7 0,31818... 0,32 32% 22 3 0,13636... 0,14 14% 22 38
Tabela de Distribuição de Frequências - Duas Variáveis - Tabulação cruzada de duas variáveis: meio de transporte e sexo. 39
Tabela de Distribuição de Frequências - Classes/Intervalos- Para a organização de certas variáveis que apresentam uma quantidade grande de valores diferentes ou quando a variação destes valores é baixa, sugere-se agrupá-los em classes (intervalos ou faixas). 40
Cálculo para a organização em classes 1) Escolher ou calcular o número de classes (K) necessárias: k n k 22 4,59 5 classes n = número total da amostra 2) Calcular a amplitude total (At) da variável: At (valor maior) (valor menor) At 37 18 19 41
3) Calcular a amplitude (h) de cada classe: h At k 4) Estabelecer os limites das classes: h At k 19 5 3,8 4 Tomar o número inteiro maior mais próximo 42
5) Montar a tabela: Idade F i f i % 18 --- 22 11 50 22 --- 26 6 27,27 26 --- 30 2 9,09 30 --- 34 1 4,55 34 --- 38 2 9,09 Total 22 100 43
Gráficos Além de utilizar as tabelas para organizar e resumir um conjunto de dados, os gráficos fornecem um impacto visual alternativo. Os gráficos devem possuir a mesma estrutura das tabelas, porém não necessariamente na mesma ordem: título (cabeçalho ou rodapé); corpo (desenho do gráfico); fonte e explicações. 44
Gráfico de Barras 45
Gráfico de Colunas 46
Gráfico de Colunas Comparativo - com mais variáveis - 47
Gráfico de Setores 48
Cálculo para gráfico de setores Para a construção deste tipo de gráfico, sem recurso de software, é necessário calcular o ângulo correspondente a cada categoria e construir os setores com um transferidor. Para isso utiliza-se da proporcionalidade (regra de três): 360º ---- 100% X ---- 54% X = 54. 360 / 100 = 194,4º 49
Gráfico de Linhas 50
Histograma - Para dados agrupados em classes - 51
Polígono de Frequência Gráfico de linha para dados agrupados em classes. Na horizontal tem-se os pontos médios das classes e na vertical a frequência absoluta ou relativa. O gráfico é fechado horizontalmente, e para isso é necessário acrescentar uma classe antes e depois das já existentes. Permite comparação entre várias linhas no mesmo gráfico. 52
53
Ogiva frequência acumulada 54
- Lista de Exercícios 1-55
Referências http://www.ibge.gov.br/home/presidencia/ noticias/noticia_visualiza.php?id_noticia=12 86&id_pagina=1 Acesso em 10 de agosto de 2012. http://www.sebrae-rs.com.br/produtosservicos/publicacoes/pesquisa-gestaoambiental-nas-mpes/1400.aspx 56