RANILDO LOPES Estatística 1
A Estatística é um ramos da Matemática que dispõe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar determinados conjuntos de dados. A Estatística tem por objectivo extrair informação dos dados para obter uma melhor compreensão das situações que representam. 2
Tipos de dados Os dados estatísticos nem sempre são da mesma natureza. É diferente estudar a cor dos olhos ou a cor do cabelo do que fazer o estudo sobre a altura ou o número de pessoas de um agregado familiar. As primeiras duas variáveis (cor dos olhos e cor do cabelo) são expressas através de uma qualidade, categoria ou característica, não susceptível de medida, mas de classificação. São chamados dados qualitativos. Outro exemplo deste tipo de dados é o Estado Civil. Este é expresso através das categorias Solteiro, Casado, Viúvo e Divorciado. 3
Tipos de dados As outras duas variáveis (altura e número de pessoas do agregado familiar) representam informação resultante de características susceptíveis de serem medidas. São chamados dados quantitativos. Os dados quantitativos podem ser de natureza discreta ou contínua. O número de pessoas de um agregado familiar é expresso através de um número inteiro, por exemplo: 1, 5, 6, 3, 3, 4, 2, 3, 6, 3, 2, 5 Pode representar o número de pessoas que constituem o agregado familiar numa amostra de 12 famílias consideradas ao acaso. Este tipo de dados é quantitativo discreto. Este tipo de variável pode tomar um número finito (ou infinito numerável) de valores. 4
Tipos de dados Escolhida agora uma amostra de 12 pessoas ao acaso, os dados relativos à altura, em centímetro, podem ser os seguintes, por exemplo: 142, 175, 166, 133, 143, 144, 172, 163, 176, 193, 182, 185 Este tipo de dados é quantitativo contínuo. As alturas podem tomar qualquer valor, dependendo da precisão com que podemos ou queremos efectuar a medição. Uma variável quantitativa contínua pode tomar qualquer valor dentro do seu intervalo de variação. 5
Tipos de dados Dados Qualitativos Quantitativos Discretos Continuos 6
Dados Qualitativos Relativamente a uma amostra de 20 portugueses, com mais de 18 anos, obtiveram-se os seguintes dados relativos ao seu estado civil. Solteiro Solteiro Casado Solteiro Solteiro Divorciado Solteiro Viúvo Casado Divorciado Solteiro Casado Solteiro Solteiro Casado Casado Solteiro Solteiro Casado Divorciado 7
Tabela de frequências Estado Cívil (Valores da variável estatística) Dados Qualitativos N.º de pessoas (Frequência absoluta) % de pessoas (Frequência relativa) Solteiro 10 10/20 x 100 = 50% Casado 6 6/20 x 100 = 30% Viúvo 1 1/20 x 100 = 5% Divorciado 3 3/20 x 100 = 15% O tamanho ou dimensão da amostra é 20. Repara que a soma das frequências absolutas tem de ser igual ao tamanho da amostra e que a somas das frequências relativas igual a 100%. 8
Dados Qualitativos Como as variáveis qualitativas não tomam valores numéricos não existe a possibilidade de se determinar a média ou a mediana. No entanto, pode determinar-se a moda da distribuição. No exemplo, a moda corresponde ao estado cívil Solteiro, uma vez que é a característica (valor da variável qualitativa) que se repete com maior frequência. Pode escrever-se m o = Solteiro. 9
Dados Qualitativos Os dados qualitativos podem ser representados através de gráficos de barras ou gráficos circulares, como os abaixo representados. Estado Cívil (Estudo efectuado a 20 portugueses, com m ais de 18 anos de idade) Estado cívil (Estudo efectuado a 20 portugueses, com m ais de 18 anos de idade) N.º de pessoas 12 10 8 6 4 2 0 Solteiro Casado Viúvo Divorciado Divorciado 15% Viúvo 5% Casado 30% Solteiro 50% Estado Cívil Neste exemplo, o gráfico de barras foi construído com as frequências absolutas e o circular com as respectivas frequências relativas. 10
Dados Qualitativos Repara que, nos gráficos de barras, cada uma das barras é separada da anterior. As barras têm todas a mesma largura e a sua altura é proporcional. Nos gráficos circulares, o ângulo definido por cada um dos sectores é proporcional à freqüência observada. Assim, para determinar a amplitude do sector relativo aos portugueses com o estado cívil Solteiro, faremos: 360º x x 360 50 x 180º 100% 50% 100 (Nota: A frequência relativa de Solteiros é de 50%) 11
Dados Quantitativos Discretos Na organização de dados quantitativos discretos podem usar-se técnicas semelhantes, quer na organização, quer na representação, às utilizadas para os dados qualitativos. No entanto, como estamos a trabalhar com variáveis que assumem vaolores numéricos, temos a possibilidade de determinar, para além da moda, também a média e a mediana. 12
Dados Quantitativos Discretos N.º de irmãos N.º de alunos % de alunos 0 60 44,5% 1 40 29,6% 2 20 14,8% 3 10 7,4% 4 3 2,2% 5 2 1,5% A tabela acima refere-se a um estudo sobre o número de irmãos, tendo por base uma amostra de 135 alunos de uma Escola Básica do 2.º e 3.º ciclos. 13
Dados Quantitativos Discretos N.º de irmãos N.º de alunos % de alunos 0 60 44,5% 1 40 29,6% 2 20 14,8% 3 10 7,4% 4 3 2,2% 5 2 1,5% Observando a tabela é fácil verificar que a moda é ser filho único, isto é, ter 0 irmãos. Logo: m o = 0. 14
Dados Quantitativos Discretos N.º de irmãos N.º de alunos % de alunos 0 60 44,5% 1 40 29,6% 2 20 14,8% 3 10 7,4% 4 3 2,2% 5 2 1,5% O que fazer para determinar a média? Vamos multiplicar cada valor da variável pela respectiva frequência absoluta. De seguida, somamos todos os resultados obtidos. Por últimi, dividimos pelo número total de observações (a dimensão da amostra). 15
N.º de irmãos N.º de alunos Dados Quantitativos Discretos % de alunos 0 60 44,5% 1 40 29,6% 2 20 14,8% 3 10 7,4% 4 3 2,2% 5 2 1,5% O múmero médio de irmãos por aluno é aproximadamente 1. Escreve-se: X = 1. 0 x 60 + 1 x 40 + 2 x 20 + 3 x 10 + 4 x 3 + 5 x 2 132 = = 0,97 (aprox. 1) 135 135 16
Dados Quantitativos Discretos N.º de irmãos N.º de alunos % de alunos 0 60 44,5% 1 40 29,6% 2 20 14,8% 3 10 7,4% 4 3 2,2% 5 2 1,5% Para determinarmos a mediana podemos usar as frequências relativas. Vamos somando as frequências relativas até atingirmos o valor 50% ou superior. Podemos, para isso, criar uma nova coluna na tabela. 17
Dados Quantitativos Discretos N.º de irmãos N.º de alunos % de alunos % acumulada 0 60 44,5% 44,5% 1 40 29,6% 74,1% 2 20 14,8% 3 10 7,4% 4 3 2,2% 5 2 1,5% A frequência relativa acumulada correspondente a 50% refere-se ao valor 1 da variável (n.º de irmãos). Então, a mediana é 1. Escreve-se: ~ X = 1. 18
Dados Quantitativos Contínuos Para efetuarmos um estudo sobre a altura dos alunos do 3.º ciclo da escola, escolheu-se uma amostra aleatória constituída por 23 alunos. Os dados obtidos, em centímetro, foram os seguintes: 145 151 147 167 175 174 153 167 173 162 158 149 170 167 168 175 174 157 149 150 169 156 171 Como deveremos organizar este tipo de dados? 19
01) N Total da amostra Dados Quantitativos Contínuos 02) K Quantidade CLASSES k N ou 2 k N 03) A Amplitude da amostra A ValorMáximo ValorMínimo k 20
Dados Quantitativos Contínuos Os dados quantitativos contínuos organizam-se de uma forma diferente dos discretos. Devemos, em primeiro lugar, identificar o valor mínimo e o valor máximo de entre todas as observações, bem como o número total de observações. 145 151 147 167 175 174 153 167 173 162 158 149 170 167 168 175 174 157 149 150 169 156 171 Neste caso, temos X min = 145 (valor mínimo) e X max = 175 (valor máximo), sendo n = 23 (número total de observações). ValorMáximo ValorMínimo A k 21
Dados Quantitativos Contínuos Os dados quantitativos contínuos organizam-se por classes ou intervalos de valores. Existem formas de determinar o melhor número de classes, tendo em conta o número de observações recolhidas. Uma das formas de determinar o número de classes ( k ) é através da fórmula: 2 k n Sabemos o valor da letra n (n.º de observações) e o objetivo é determinar o valor de k (n.º de classes). 22
Dados Quantitativos Contínuos Usando a fórmula anterior já podemos descobrir o melhor número de classes pelas quais vamos distribuir os valores das alturas dos 23 alunos. Temos de encontrar o valor de k que é solução da desigualdade: 2 k 23 Vamos procurar qual é a potência de 2 cujo valor é maior ou igual a 23. Fazendo alguns cálculos vimos que: 2 1 = 2 ; 2 2 = 4 ; 2 3 = 8 ; 2 4 = 16 ; 2 5 = 32 Temos de escolher para k (n.º de classes) o 5. 23
Dados Quantitativos Contínuos Já sabemos, então, que temos de formar 5 classes para organizarmos os dados que foram recolhidos. Como vamos obter as classes? Em primeiro lugar vamos efectuar a seguinte operação: X max X min (diferença entre o valor máximo e o valor mínimo das observações) 24
Dados Quantitativos Contínuos Temos, então: 175 145 = 30 Dividindo aquele valor pelo n.º de classes, obtemos a amplitude ( h ) de cada uma das classes. Neste caso: h = 30 / 5 = 6 O próximo passo é formar 5 classes, cada uma delas com amplitude igual a 5. 25
Dados Quantitativos Contínuos Para formar a primeira classe, partimos do valor mínimo das observações que é, neste caso, 145. Este é o limite inferior da classe. Para obtermos o limite superior da classe adicionamos o valor da amplitude ao limite inferior. Neste caso, o limite superior da classe é: 145 + 6 = 151. A classe a considerar é a seguinte: [145, 151[. Nesta classe iremos colocar o número de observações cujo valor é igual ou maior do que 145 e menor do que 151. 26
Dados Quantitativos Contínuos Para as classes seguintes vamos agir da mesma forma, tomando por limite inferior da classe seguinte, o limite superior da classe anterior. Por exemplo: [151, 157[ (151 é o limite superior da classe anterior) [157, 163[ [163, 169[ [169, 175] (na última classe inclui-se o limite superior) 27
Dados Quantitativos Contínuos Já temos, assim, as 5 classes formadas: [145, 151[ [151, 157[ [157, 163[ [163, 169[ [169, 175] Podemos, então, fazer uma tabela de frequências tendo em conta cada uma das classes. 28
Tabela de frequências Dados Quantitativos Contínuos Classes (Altura dos alunos) N.º de alunos % de alunos [145, 151[ 5 21,8% [151, 157[ 3 13,0% [157, 163[ 3 13,0% [163, 169[ 4 17,4% [169, 175] 8 34,8% 29
Dados Quantitativos Contínuos Observando a tabela de frequências podemos verificar que uma das classes têm maior frequência de observações. Classes (Altura dos alunos) N.º de alunos % de alunos [145, 151[ 5 21,8% [151, 157[ 3 13,0% [157, 163[ 3 13,0% [163, 169[ 4 17,4% [169, 175] 8 34,8% A classe modal, neste caso, é a classe [169, 175]. 30
Dados Quantitativos Contínuos Os gráficos das distribuições usando dados contínuos têm um aspecto diferente dos gráficos de barras das distribuições de dados discretos. Neste caso chamam-se histogramas. Alturas dos alunos (Estudo efectuado para uma amostra aleatória de 23 alunos) N.º de alunos 9 8 7 6 5 4 3 2 1 0 [145, 151[ [151, 157[ [157, 163[ [163, 169[ [169, 175] Altura (em cm) Num histograma as barras são contíguas, ou seja, são unidas umas às outras. 31
Dados Quantitativos Contínuos É também usual traçar-se uma linha que une os pontos médios das barras do histograma. À região limitada por essa linha chama-se polígono de frequências. Alturas dos alunos (Estudo efectuado para uma amostra aleatória de 23 alunos) N.º de alunos 9 8 7 6 5 4 3 2 1 0 [145, 151[ [151, 157[ [157, 163[ [163, 169[ [169, 175] Altura (em cm) A linha a vermelho limita o chamado polígono de frequências.. 32
Exercício Para estudar o peso dos alunos do 3.º ciclo de uma Escola Básica foi recolhida, aleatoriamente, uma amostra constituída por 15 alunos dessa Escola. Os pesos (em kg) observados são os seguintes: 45,3 70,0 64,8 60,5 54,2 51,1 60,4 69,8 67,6 44,3 47,9 50,6 65,3 56,9 61,9 a) Constrói uma tabela de frequências absolutas e relativas. b) Identifica a classe modal. c) Constrói um histograma e o respectivo polígono de frequências. 33
Exercício - Resolução Variável estatística: X Peso dos alunos (Trata-se de uma variável quantitativa contínua) 45,3 70,0 64,8 60,5 54,2 51,1 60,4 69,8 67,6 44,3 47,9 50,6 65,3 56,9 61,9 n = 15 (dimensão da amostra = n.º total de observações) X min = 44,3 X max = 70,0 34
Exercício - Resolução 2 k 15 k = 4 (Nota: 2 4 =16) Devemos distribuir os dados por 4 classes. X max - X min = 70,0 44,3 = 25,7 h = 25,7 / 4 = 6,5 (aproximadamente) Cada classe deve ter amplitude igual a 6,5. 35
Classes a considerar: Exercício - Resolução [44,3 ; 50,8[ [50,8 ; 57,3[ [57,3 ; 63,8[ [63,8 ; 70,3] Nota: Ao limite inferior de cada classe, soma-se a amplitude da classe de modo a se determinar o respectivo limite superior. 36
Exercício - Resolução Tabela de frequências absolutas e relativas: 45,3 70,0 64,8 60,5 54,2 51,1 60,4 69,8 67,6 44,3 47,9 50,6 65,3 56,9 61,9 Peso dos alunos Contagem N.º de alunos % de alunos [44,3 ; 50,8[ IIII 4 27% [50,8 ; 57,3[ III 3 20% [57,3 ; 63,8[ III 3 20% [63,8 ; 70,3] IIII 5 33% 37
Classe modal: Exercício - Resolução Peso dos alunos N.º de alunos % de alunos [44,3 ; 50,8[ 4 27% [50,8 ; 57,3[ 3 20% [57,3 ; 63,8[ 3 20% [63,8 ; 70,3] 5 33% A Classe modal é a classe [63,8 ; 70,3] uma vez que é a que tem maior frequência. 38
Histograma: Exercício - Resolução 39
Exercício - Resolução Polígono de frequências (linha a vermelho): José Carvalho@2007 40
Exercício - Resolução Polígono de frequências (linha a vermelho): 41