e Generalidades Júlio Osório 1 1. Definir Estatística. Objectivos 2. Descrever as utilizações da Estatística. 3. Caracterizar Estatística Descritiva e Estatística Inferencial. 4. Definir população, amostra, variável, parâmetro e estatístico. 5. Comparar as fontes de dados. 6. Explicar os tipos de dados. 2 1
O que é a Estatística? 1. Ramo das Matemáticas Aplicadas: é a Matemática aplicada aos dados da observação e da experimentação. 2. Ciência dos dados: corpo de métodos usados para recolher e interpretar dados de uma investigação científica, e para tirar conclusões em situações em que a incerteza e a variação estão presentes. 3 O que a Estatística não é: 1. Mera compilação de dados sobre um fenómeno ou situação ( estatísticas do fenómeno). 2. Técnica especialmente imaginada para justificar opiniões pré-concebidas pelo cientista. 3. Panaceia para remediar experiências mal concebidas ou mal conduzidas. 4. Substituto do raciocínio teórico específico de cada domínio científico de investigação. 4 2
A Estatística envolve: A recolha dos dados. A classificação dos dados. A condensação e apresentação dos dados. A redução dos dados. A análise dos dados. A interpretação dos dados. A redacção de conclusões sobre o estudo. 5 Níveis de Estudo da Estatística Estatística Estatística Matemática Estatística Aplicada 9 3
Níveis de Estudo da Estatística Teoria Estatística: ramo das Matemáticas; Estatística Matemática. Estatística Aplicada: aplicação dos procedimentos criados pela Estatística Matemática à análise dos dados obtidos em situações concretas da investigação científica. Este é um curso de Estatística Aplicada! 10 Campos da Área Estatística Métodos Estatísticos Estatística Descritiva Estatística Inferencial 14 4
Estatística Descritiva 1. Envolve: Recolha dos dados Condensação e apresentação dos dados. Redução dos dados 2. Objectivo: Descrever os dados. Frequência Dados de Michelson sobre a velocidade da luz no ar 30 20 10 0 299,575 299,675 299,775 299,875 299,975 300,075 299,625 299,725 299,825 299,925 300,025 300,125 velocidade da luz (milhares km/s) Ӯ = 24,63 ; s 2 =2,85 15 Estatística Inferencial 1. Envolve: Generalizações dos dados (amostra) para a respectiva fonte (população). Estimativas e Testes de Hipóteses. 2. Objectivo: Tomar decisões sobre as características da população. População? 16 5
Conceitos fundamentais 1. População: totalidade dos objectos de interesse. 2. Variável: característica acerca da qual os indivíduos da população exibem diferenças. 3. Amostra: parte da população que é seleccionada para estudo. 4. Parâmetros: medidas estatísticas respeitantes à população. 5. Estatísticos: medidas estatísticas calculadas na amostra. 21 População 22 21 22 Amostra 23 21 24 23 23 Média da população, µ, é 22,2 anos Idade Média amostral, Ӯ, é 23 anos 24 Proveniência dos Dados Fontes de Dados Primárias Secundárias Experiências Inquéritos Observação Publicações 32 6
Tipos de Variáveis e Escalas de Medida Variáveis Quantitativas Qualitativas Escala de Intervalo Escala de Razão Escala Nominal Escala Ordinal 38 O que é a medição? Processo de atribuição de números a objectos ou acontecimentos de acordo com um conjunto bem definido de regras. Implica a utilização de escalas de medida, distintas consoante o tipo de variável que esteja a ser estudado. Os números resultantes da medição são os dados, o material em bruto que vai ser objecto de tratamento estatístico. 39 7
Variáveis Qualitativas Os indivíduos ou objectos que estão a ser estudados apenas podem ser enquadrados numa de um certo número de categorias, definidas com base num atributo. As categorias de um caracter qualitativo têm de ser: mutuamente exclusivas colectivamente exaustivas. 40 Escalas de Medida para Dados Qualitativos Variáveis Qualitativas Escalas Nominais Escalas Ordinais 41 8
Escala Nominal Os indivíduos (ou objectos) são enquadrados em categorias que não têm qualquer ordenação lógica (nãoordenadas). Dados dois indivíduos (ou objectos), apenas se pode afirmar se eles são iguais ou diferentes, mas não que um deles é superior ou inferior ao outro. 42 Exemplos: Escalas Nominais Dicotomias: masculino/feminino. presente/ausente. jovem/adulto. vivo/morto. solteiro/casado. fumador/não-fumador. Fenótipos genéticos: côr do cabelo (louro, castanho, branco, preto, etc.) côr dos olhos (verdes, negros, azuis, castanhos, etc.) Raça: Caucasiana, Afro-Americana, Asiática, etc. 43 9
Escala Ordinal Os indivíduos (ou objectos) são enquadrados em categorias que podem ser ordenadas ou escalonadas de uma forma objectiva e lógica. Dados dois indivíduos (ou objectos), podese afirmar que um deles é maior, menor ou mais qualquer coisa que o outro, sem que todavia consigamos especificar quanto. 44 Exemplos: Escalas Ordinais Postos de carreiras profissionais: carreira académica (assistente < Prof. Auxiliar < Prof. Associado< Prof.Catedrático). carreira militar (alferes < tenente < capitão < major < ) Escalas de gravidade de uma patologia: ausente < suave < moderada < severa < grave < muito grave. Opinião dos estudantes sobre a obrigação do Estágio: contra < neutro < favor. 45 10
Escalas de Medida para Dados Quantitativos Variáveis Quantitativas Escalas de Intervalo Escalas de Razão 46 Escala de Intervalo Dados dois indivíduos (ou objectos), permite-nos afirmar quanto é que um deles é superior/inferior ao outro. Tem uma origem da escala ( ponto zero ) e uma unidade de graduação da escala convencionados. 47 11
Exemplos: Escalas de Intervalo Escalas Celsius e Fahrenheit de medida da temperatura. Na Escala Celsius : o zero (0ºC) é a temperatura de congelação da água (uma convenção). A unidade de graduação (ºC) é a centésima parte do intervalo entre as temperaturas de congelação e de ebulição da água (outra convenção). 48 Escala de Razão Dados dois indivíduos (ou objectos), permite-nos afirmar quanto é que um deles é superior/inferior ao outro. Tem uma ponto zero verdadeiro (com significado físico). 49 12
Exemplos: Escalas de Razão Escala Kelvin de medida das temperaturas absolutas (0ºK indica total ausência de calor, não é uma convenção). outras : alturas. comprimentos. pesos. capacidades. tempo. taxas. 50 Escala de Intervalo vs. Escala de Razão Escala de Intervalo - a razão entre dois pontos quaisquer não é independente da unidade de medida adoptada: 50ºC/20ºC=1,5 122ºF/68ºF=1,8 Escala de Razão - a razão entre dois pontos quaisquer é independente da unidade de medida adoptada: 75 kg/50 kg=1,5 165,3 libras/110,2 libras=1,5 51 13
Classificação das Variáveis Quantitativas Variáveis Quantitativas Discretas Contínuas 52 Variáveis Discretas Só assumem determinados valores (existem lacunas entre os valores possíveis). Variáveis Contínuas Teoricamente, podem assumir qualquer valor de um intervalo real: tudo depende de se dispôr do instrumento de medida com a sensibilidade apropriada. 53 14
Varável Discreta -- Lacunas entre os valores 0 1 2 3 4 5 6 7 Variável Contínua -- Teoricamente, não há lacunas entre os valores 0 1000 54 Exemplos: Variáveis Discretas Número de carros estacionados num parque. Número de alunos presentes numa aula. Número de folhas de uma planta. Número de ovos postos por uma galinha. Em geral, os dados de natureza discreta provêm de actos de contagem. 55 15
Exemplos: Variáveis Contínuas Nível de colesterol no sangue. Altura de uma pessoa. Produção de alfarroba/hectare de terreno. Tempo necessário para completar o teste de Estatística. Em geral, os dados de natureza contínua provêm de actos de medição. 56 Natureza do Raciocínio Estatístico Na maior parte dos estudos científicos, é difícil ou até mesmo impossível observar/medir toda a população. Temos então de nos basear em amostras para fazer estimativas ou inferências relativas à população. 57 16
Natureza do Raciocínio Estatístico População parâmetros: µ e σ 2 seleccionar Amostra estimar descrever calcular estatísticos: Ӯ, s 2 58 Qual a proporção de sementes que vai originar plantas com flores vermelhas e azuis? Uma tulha de madeira com 10 milhões de sementes! 59 17
Qual a proporção de sementes que vai originar plantas com flores vermelhas e azuis? 1ª solução: semear todas as sementes e contar as vermelhas e as azuis. Tipo de Resposta: categórica, sem erro, mas trabalhosa, morosa, onerosa e não factível. 60 Qual a proporção de sementes que vai originar plantas com flores vermelhas e azuis? 2ª solução : semear uma parte (amostra),contar vermelhas e azuis, predizer o que se passará no todo (população). Tipo de Resposta: predição ou avaliação probabilística, rodeada de uma certa margem de erro, mas factível. 61 18
Natureza do Raciocínio Estatístico O raciocínio estatístico é de tipo indutivo: parte todo amostra população A prova estatística produz conclusões com um certo grau de incerteza (erro). O Cálculo das Probabilidades é o instrumento de medida do grau de incerteza que rodeia as conclusões da Estatística. 62 19