Prof. Paulo Cesar F. de Oliveira, BSc, PhD 1
Seção 1.1 Uma visão geral da Estatística 2
Ø O que são Dados? Ø Consistem de informações oriundas de observações, contagens, medições ou respostas. Ø Pessoas que comem três porções diárias de cereais apresentaram uma redução no risco de derrame em 37%. (Fonte: Whole Grains Council) Ø 70% das 1500 lesões de medula espinhal em crianças americanas resultam de acidentes de carro, e 68% delas não estavam usando o cinto de segurança. (Fonte: UPI) 3
Ø O que é Estatística? Ø Ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem decisões. 4
Ø Terminologia Ø População Ø O conjunto de todas as respostas, medidas ou contagens que sejam de interesse. Ø Amostra Ø Uma parte ou subconjunto da população. 5
Ø Eemplo Ø Em uma pesquisa recente, 1708 pessoas adultas nos EUA foram questionadas se elas pensam que o aquecimento global é um problema que requer uma ação imediata do governo. 939 pessoas responderam que sim. Identifique a população e a amostra. Descreva o conjunto de dados. (Adaptado de: Centro de Pesquisa Pew) 6
Ø Resposta Ø População: as respostas de todos os adultos nos EUA Ø Amostra: as respostas das 1708 pessoas adultas dos EUA na pesquisa Ø Amostra é um subconjunto das respostas de todos os adultos nos EUA Ø O conjunto de dados consiste de 939 respostas sim e 769 respostas não Respostas de todos os adultos nos EUA (população) Respostas dos adultos na pesquisa (amostra) 7
Ø Terminologia Ø Parâmetro Ø Descrição numérica de uma característica da população. Ø A renda média bruta de todos os norte-americanos em 2002 Ø Estatística Ø Descrição numérica de uma característica da amostra. Ø Renda bruta, em 2002, de uma amostra formada pelos habitantes de três estados norte-americanos. 8
Ø Eemplo Ø Verificar se o valor numérico descreve um parâmetro ou uma estatística Ø Uma pesquisa recente de uma amostra de MBAs reportou que o salário médio para quem possui tal título é de $82.000. (Fonte: The Wall Street Journal) Ø Resposta: estatística (a média de $82.000 é baseada em um subconjunto da população) 9
Ø Eemplo Ø Verificar se o valor numérico descreve um parâmetro ou uma estatística Ø Os salários iniciais de 667 graduados no MBA da Faculdade de Administração da Universidade de Chicago cresceu 8,5% em relação ao ano anterior. Ø Resposta: parâmetro (o percentual de crescimento de 8,5% é baseado em todos os salários iniciais dos 667 graduados) 10
Ø Ramos da Estatística Estatística Descritiva Estatística Inferencial Ø Trata da organização, resumo e apresentação dos dados. Ø A partir de uma amostra, tira conclusões sobre a população. 11
Seção 1.2 Classificação dos Dados 12
Ø Tipos de Dados Ø Qualitativos Ø Consistem de atributos, rótulos ou entradas não numéricas Curso Local de nascimento Cor dos olhos 13
Ø Tipos de Dados Ø Quantitativos Ø Medidas ou contagens numéricas Idade Peso de uma carta Temperatura 14
Ø Eemplo Ø Classificando os dados pelo tipo Ø Os preços básicos de vários veículos são mostrados na tabela abaio. Quais dados são qualitativos e quais os quantitativos? (Fonte: Ford Motor Company) 15
Ø Solução Dados Qualitativos (são entradas não numéricas) Dados Quantitativos (são entradas numéricas) 16
Ø Níveis de Medida Ø Um conjunto de dados pode ser classificado de acordo com o nível de medida mais alto que ele aplica. Os quatro níveis de medida, do mais baio para o mais alto, são: 1. Nominal 2. Ordinal 3. Intervalar 4. Racional 17
Ø Níveis de Medida Ø Nominal Ø Categorias, nomes, marcas ou qualidades. Nenhuma operação matemática pode ser feita com esses dados. Ø E.: o modelo do seu carro, seu curso na faculdade. 18
Ø Níveis de Medida Ø Ordinal Ø Os dados podem ser arranjados em ordem. Você pode dizer que uma entrada de dados é superior a outra. Ø E.: os programas de TV mais assistidos, a condição de pacientes hospitalizados. 19
Ø Eemplo Ø Classificando os dados pelo nível Ø São mostrados 2 conjuntos de dados. Qual deles está no nível nominal e qual deles está no nível possui ordinal? (Fonte: Nielsen Media Research) 20
Ø Solução Nível Ordinal (lista o ranking dos 5 programas de TV. Dados podem ser ordenados. Diferença entre os ranks não tem sentido.) Nível Nominal (lista a sigla de cada rede afiliada.) 21
Ø Níveis de Medida Ø Intervalar Ø Os dados podem ser ordenados e a diferença entre duas entradas pode ser calculada. Ø Zero representa uma posição em uma escala. Ø Não eiste o zero inerente (um zero que significa nenhum ). Ø E.: temperatura, ano de nascimento. 22
Ø Níveis de Medida Ø Racional Ø Eiste o zero inerente. Ø Os dados podem ser ordenados, as diferenças podem ser calculadas, e uma razão pode ser formada, de modo que se possa epressar determinado valor como múltiplo de outro. Ø E.: altura, peso, idade. 23
Ø Eemplo Ø Classificando os dados pelo nível Ø São mostrados 2 conjuntos de dados. Qual deles possui dados intervalares e qual possui dados racionais? (Fonte: Major League Baseball) 24
Ø Solução Nível Intervalar (dados quantitativos. Pode-se calcular a diferença entre as datas, mas uma razão entre elas não faz sentido.) Nível Racional (pode-se encontrar diferenças e razões.) 25
Ø Sumário (resumo) Nível de Medida Dados em categorias Arranja os dados em ordem Subtrai valores dos dados Determina se um valor é múltiplo de outro Nominal Sim Não Não Não Ordinal Sim Sim Não Não Intervalar Sim Sim Sim Não Racional Sim Sim Sim Sim 26
Seção 1.3 Planejamento Eperimental 27
Planejando um estudo estatístico PASSO 6 Identifique quaisquer erros possíveis PASSO 1 Identifique a(s) variável(is) de interesse (foco) e a população do estudo PASSO 5 Interprete os dados e tome decisões sobre a população usando estatística inferencial PASSO 4 Descreva os dados usando as técnicas de estatística descritiva. PASSO 2 Desenvolva um plano detalhado para coleta de dados. Se usar amostra, ela deve ser representativa PASSO 3 Colete os dados 28
Coleta de Dados Estudo Observacional Pesquisador observa e mede as características interessantes de uma parte da população Pesquisadores observaram e registraram o comportamento oral de crianças acima de três anos de idade com objetos não comestíveis (Fonte: Pediatric Magazine) 29
Coleta de Dados Eperimento Um tratamento é aplicado em uma parte da população e suas respostas são observadas Foi realizado um eperimento no qual diabéticos tomaram etrato de canela diariamente, enquanto um grupo de controle não. Depois de 40 dias, os diabéticos que tomaram canela reduziram o risco de doenças do coração, enquanto o grupo de controle não apresentou mudanças (Fonte: Diabetes Care) 30
Coleta de Dados Simulação Usa um modelo matemático ou físico para reproduzir as condições de uma situação ou processo Envolve o uso de computadores Empresas automobilísticas usam simulações com bonecos para estudar os efeitos de acidentes em pessoas 31
Coleta de Dados Levantamento ou Pesquisa de Mercado (Survey) Investigação de uma ou mais características de uma população Feita por entrevistas, correspondências ou telefone Um estudo é conduzido em uma amostra de médicas mulheres para determinar se a razão primária na escolha de suas carreiras é estabilidade financeira 32
Ø Eemplo: métodos de coleta de dados Ø Considere os seguintes estudos estatísticos. Qual método de coleta de dados você usaria em cada um destes casos? 33
Capítulo 01 Ø Eemplo: métodos de coleta de dados 1. Um estudo do efeito da mudança dos padrões de voo no número de acidentes com aviões Solução: Simulação (não é prático criar essa situação). 09/09/15 P C F de Oliveira 2013 34
Ø Eemplo: métodos de coleta de dados 2. Um estudo sobre o efeito da aveia para abaiar a pressão sanguínea Solução: Eperimento (mede o efeito do tratamento comer aveia). 35
Ø Eemplo: métodos de coleta de dados 3. Um estudo sobre como alunos da quarta série montam um quebra-cabeça Solução: Estudo observacional (observa e mede uma certa característica da população). 36
Ø Eemplo: métodos de coleta de dados 4. Um estudo dizendo se os residentes nos EUA aprovam seu presidente ou não. Solução: Pesquisa (perguntar Você aprova o modo como o presidente está lidando com o cargo? ). 37
Ø Técnicas de Amostragem Ø Amostra aleatória Ø Cada membro da população tem a mesma chance de ser selecionado. 09/09/15 38 P C F de Oliveira 2013 Capítulo 01
Ø Tipos de Amostragem Ø Amostra aleatória simples Ø Todas as amostras de mesmo tamanho são igualmente prováveis. Ø Atribua um número a cada membro da população. Ø Números aleatórios podem ser gerados por uma tabela apropriada, por um software ou ainda por uma calculadora. Ø Os dados dos membros da população que correspondam a tais números passarão a ser os membros da amostra. 39
Ø Eemplo Ø Eistem atualmente 731 estudantes matriculados em Estatística na sua escola. Você deseja formar uma amostra de 8 alunos para responder algumas questões de pesquisa. Selecione aqueles que irão pertencer a uma amostra aleatória simples. Ø Atribua números de 1 a 731 para cada aluno cursando Estatística Ø Na tabela de números randômicos, escolha um lugar inicial aleatoriamente (e.g. Terceira linha, segunda coluna). 40
Ø Solução Ø Leia os dígitos em grupos de 3 Ø Ignore números maiores que 731 Ø Os estudantes atribuídos com os números 719, 662, 650, 4, 53, 589, 403, e 129 farão parte da amostra. 41
Ø Tipos de Amostragem Ø Amostra estratificada Ø Quando for importante ter uma amostra com membros de cada segmento da população Ø Membros são divididos em 2 ou mais subconjuntos (estratos) que compartilham uma característica similar Ø e.g. Idade, gênero, etnia ou preferência política Ø Em seguida, selecione aleatoriamente membros a partir de cada estrato 42
Ø Eemplo Ø Para coletar uma amostra estratificada do número de pessoas que vivem nas casas do Condomínio Orleans, você poderia dividir essas casas em níveis sócioeconômicos e então aleatoriamente selecionar as casas para cada nível. 43
Ø Tipos de Amostragem Ø Amostra por agrupamento Ø Quando a população apresenta a ocorrência natural de subgrupos e cada um deles com características similares. Ø Divida a população em grupos e selecione todos os membros de 1 ou mais grupos (mas não todos). Ø e.g. Séries diferentes de um mesmo curso, diferentes departamentos de um banco. 09/09/15 44 P C F de Oliveira 2013
Ø Eemplo Ø No eemplo do Condomínio Orleans, você poderia dividir as casas em grupos de acordo com os CEPs, e então selecionar casas segundo um ou mais CEPs (mas não todas). Ø Depois, conte o número de pessoas que vivem em cada casa. 45
Ø Tipos de Amostragem Ø Amostra sistemática Ø Selecione aleatoriamente um valor inicial. Depois, escolha os membros da amostra a intervalos regulares. Ø Digamos que vamos selecionar cada k-ésimo membro. Nesse caso, k = 5. Logo, cada 5 membro da população será selecionado. 46
Ø Eemplo Ø No eemplo do Condomínio Orleans, você poderia atribuir um número diferente para cada casa, aleatoriamente escolher um número inicial, e então selecionar cada n-ésima casa. 47
Ø Tipos de Amostragem Ø Amostra de conveniência Ø Para formar sua amostra, escolha os membros disponíveis da população. 48