Estatística Descritiva 1
O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. No século XIX, o desenvolvimento do cálculo de probabilidade e outras metodologias matemáticas, tais como a técnica de Mínimos Quadrados, foram fundamentais para o desenvolvimento da Estatística 2
O que é Estatística Somente no século XX a Estatística desenvolve-se como uma área específica do conhecimento a partir do desenvolvimento da Inferência Estatística; uma metodologia baseada em probabilidade que tem ampla aplicação nas ciências experimentais. A Estatística hoje consiste num metodologia científica para obtenção, organização e análise de dados, oriundos das mais variadas áreas das ciência experimentais, cujo objetivo principal é auxiliar a tomada de decisões em situações de incerteza. 3
Estatística Descritiva Etapa inicial da análise utilizada para descrever, organizar e resumir os dados coletados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística. 4
1. CONCEITOS BÁSICOS 1.1 Estatística A Estatística compreende os métodos científicos utilizados para coleta, organização, resumo, apresentação e análise, ou descrição, de dados de observação. Também abrange métodos utilizados para tomadas de decisões sob condições de incerteza. 5
1.2 Estatística Descritiva Inclui as técnicas empregadas para coleta e descrição de dados. Também é empregada na análise exploratória de dados. 6
1.3 Estatística Inferencial É utilizada para tomar decisões a respeito de uma população, geralmente utilizando dados de amostras. Uma vez que tais decisões são tomadas sob condições de incerteza, faz-se necessário o uso deconceitos relativos à Teoria da Probabilidade. 7
1.4 População Um dos conceitos fundamentais na Estatística, é empregado para designar um conjunto de indivíduos que possuem pelo menos uma característica, ou atributo, em comum. Alguns autores empregam o termo universopara referir-se a uma população. 8
1.5 Amostra Refere-se a qualquer subconjunto de uma população. A amostragem é uma das etapas mais importantes na aplicação de métodos estatísticos, envolvendo aspectos como determinação do tamanho da amostra, metodologia de formação e representatividade da amostra com relação à população. 9
1.6 Variável É usada para atribuição dos valores correspondentes aos dados observados. É importante ressaltar que os dados em questão não são necessariamente numéricos, uma vez que podem dizer respeito a atributos qualitativos observados na população. Por esta razão costuma-se classificar as variáveis nas categorias definidas a seguir. 10
1.6.1 Variável Numérica.Também chamada variável quantitativa, é utilizada para representação de dados numéricos, ou quantitativos. 1.6.1.1 Variável Numérica Discreta. Variável cujo domínio é um conjunto enumerável. Geralmente corresponde a dados de contagem. Exemplo: Número de defeitos em um componente, total de unidades defeituosas em uma amostra. 1.6.1.2 Variável Numérica Contínua. Variável cujodomínio é um conjunto não enumerável. Refere-se a dados de mensuração. Exemplo: Diâmetro de um eixo, peso de um recém-nascido. 11
1.6.2 Variável Qualitativa. É utilizada para representação de atributos. Pode ser dicotômica, ou binária, quando assume apenas dois possíveis valores, ou politômica, também referida como multinomial, quando pode assumir mais de dois possíveis valores. 1.6.2.1 Variável Qualitativa Categórica. É empregada para representar categorias, ou classes, às quais pertencem as observações registradas. Exemplo: Cor dos olhos, sexo. 1.6.2.2 Variável Qualitativa Ordinal. Utiliza-se este tipo de variável em situações nas quais presume-se a necessidade de uma ordem, crescente ou decrescente, para os resultados. Exemplo: Grau de escolaridade, categoria salarial. 12
1.7 Séries Estatísticas Uma série estatística consiste basicamente de um conjunto de valores observados para diferentes categorias de uma variável. As séries estatísticas são classificadas em três categorias, apresentadas a seguir 13
1.7.1 Série Temporal. A variável de interesse refere-se a um período de tempo. Exemplo 1.7.1 A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC durante o ano de 20XY. 14
1.7.2 Série Geográfica. Aqui a variável estudada é o local. Exemplo 1.7.2 A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC durante o ano de 20XY, nas respectivas regiões de atuação. 15
1.7.3 Série Específica. Exemplo 1.7.3 - A tabela a seguir mostra o faturamento, em milhões de reais, da empresa fictícia ABC durante o ano de 20XY, especificado por produto. 16
1.7.4 Séries Combinadas. Na prática, é comum combinar séries estatísticas com o objetivo de aumentar, ou detalhar, as informações disponíveis. Exemplo 1.7.4 O quadro a seguir mostra o faturamento da empresa ABC por produto e região, isto é, uma combinação de uma série geográfica e uma série específica. 17
Estatística Descritiva O que fazer com as observações que coletamos? Primeira Etapa: Resumo dos dados = Estatística descritiva 18
Variável: Qualquer característica associada a uma população. Classificação das variáveis: QUALITATIVA NOMINAL ORDINAL sex, ocor dos olhos classe social, grau de instrução QUANTITATIVA CONTÍNUA DISCRETA peso, altura, salário, idade número de filhos, número de carros 19
Variáveis Quantitativas MEDIDAS DE POSIÇÃO: Mínimo, Máximo, Moda, Média, Mediana, Percentis MEDIDAS DE DISPERSÃO: Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação. 20
Medidas de Posição Máximo (max): a maior observação Mínimo (min): a menor observação Moda (mo): é o valor (ou atributo) que ocorre com maior freqüência. Dados: 4, 5, 4, 6, 5, 8, 4 max = 8 min = 4 mo = 4 21
Média: x x x x... 1 2 3 n i 1 n x n n x i Dados: 2, 5, 3, 7, 8 x 2 5 3 5 7 8 5 22
Mediana: A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados. Posição da mediana: n+1 2 23
Exemplos: Dados: 2, 6, 3, 7, 8 Dados ordenados: 2 3 6 7 8 Posição da Mediana n = 5 (ímpar) 5+1 = 3 2 Md=6 Dados: 4, 8, 2, 1, 9, 6 n = 6 (par) Dados ordenados: 1 2 4 6 8 9 Md Md = (4 + 6) / 2 = 5 6+1 = 3,5 2 24
Exemplo 2: Considere as notas de um teste de 3 grupos de alunos Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5 G 1 G 2 * * * * * * * * * * G 3 * * * * * 0 5 10 _ Temos: x 1 = x 2 = x 3 = 5 e md 1 = md 2 = md 3 = 5 25
Medidas de Dispersão Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados Amplitude (A): A = máx - min Para os grupos anteriores, temos: Grupo 1, A = 4 Grupo 2, A = 8 Grupo 3, A = 0 26