MATEMÁTICA NOME: ANO: TURMA: N.º FICHA INFORMATIVA ESTATÍSTICA A estatística é uma área da Matemática que trata da recolha, organização, resumo e interpretação de dados, e está presente em todos os ramos da actividade humana, como por exemplo, na Biologia, na Medicina, na Economia, na Educação, na Meteorologia ou na Sociologia. Recenseamento/Sondagem Os recenseamentos ou censos gerais de uma população remontam à antiga Roma e antigo Egipto, trata-se de um estudo de todos os elementos de um determinado universo, desde as pessoas e instituições aos objectos e serviços. Os mais vulgares são os Censos periódicos realizados de 10 em 10 anos por indicação dos governos, onde se consideram as características de todas as pessoas de um determinado país ou região. Em Portugal os últimos censos realizaram-se em 2001 e os seus resultados permitiram caracterizar a população segundo diversos parâmetros, o sexo, a idade, o agregado familiar, o alojamento, etc.
Quando não é possível ou praticável inquirir toda a população efectuam-se sondagens. Geralmente ouvimos falar em sondagens quando há eleições, por exemplo. Uma sondagem é um estudo sobre uma parte representativa da população, a amostra, cujos resultados são depois extrapolados para a população. População/Amostra/ Variável Estatística Geralmente e devido a várias limitações o estudo estatístico não tem em conta toda a população mas apenas parte dela. A parte da população que se escolhe para desenvolver o estudo designa-se por amostra. Se quisermos saber qual é o clube de futebol com mais adeptos numa turma, basta perguntar a cada aluno qual o seu clube preferido, já que o número de alunos é pequeno e portanto praticável. Neste caso a população é constituída por todos os alunos da turma e a variável estatística é o clube de futebol preferido pelos alunos da turma. No entanto se pretendêssemos saber qual o clube com mais adeptos em Portugal não se iria interrogar a população toda mas apenas uma parte, ou seja, uma amostra. Nesta situação a população é o conjunto de todos os portugueses, a amostra é o conjunto dos portugueses a quem se fez o inquérito e a variável estatística é o clube de futebol preferidos pelos portugueses.
É preciso ter muito cuidado na escolha da amostra porque esta deve ser representativa de toda a população, por exemplo, num estudo sobre a altura dos alunos de uma escola EB23 será uma turma de quinto ano uma boa amostra? É claro que não, porque este alunos são de um modo geral mais baixos que os mais velhos. A melhor opção seria escolher uma amostra que englobe alunos de todos os anos e de ambos os sexos em quantidade proporcional. População ou Universo Estatístico é o conjunto de pessoas, objectos ou acontecimentos sobre o qual incide um estudo estatístico. Amostra é uma parte representativa da população, sobre a qual incide o estudo. Variáveis Estatísticas são todas as características que determinado elemento pode tomar num estudo estatístico.
s s e s s A frequência absoluta de um acontecimento é o número de vezes que esse acontecimento se repete. A frequência relativa de um acontecimento (fr) é o quociente entre a frequência absoluta desse acontecimento (fi) e o número total de elementos em estudo (N): f = r fi N Exemplo 1: No quadro seguinte estão representadas as idades dos alunos de uma turma de 7.º ano. (A variável estatística em estudo é a idade dos alunos da turma) 12 12 13 13 13 14 14 13 13 13 13 13 14 12 13 15 14 15 12 13 13 Vejamos a tabela de frequências absolutas: Idade 12 4 13 11 14 4 15 2 Total
Agora vamos dividir cada frequência absoluta pelo número total de alunos e vamos apresentar o resultado arredondado a duas casas decimais, obtendo assim as frequências relativas. Idade (fracção) (dízima) 12 4 13 11 14 4 15 2 4 11 4 2 0,19 0,52 0,19 Total 1 1 0,1 As frequências relativas também podem ser apresentadas sob a forma de percentagem. Para isso, basta multiplicar cada uma das dízimas obtidas por 100. Idade 12 4 13 11 14 4 15 2 (fracção) 4 11 4 2 (dízima) (percentagem) 0,19 19% 0,52 52% 0,19 19% 0,1 10% Total 1 1 100%
Quando existem muitos numéricos com valores diferentes, mas relativamente próximos, tais como as alturas ou os pesos de um elevado número de pessoas, é preferível agrupá-los em classes. Exemplo 2: Considera agora a altura (em cm) dos alunos. 141 147 155 160 161 156 158 142 163 163 164 151 149 144 157 152 152 145 160 148 149 Como há muitos dados diferentes vamos agrupá-los em intervalos ou classes, de amplitude igual a 5cm. Vejamos a tabela de frequências absolutas: Altura 140-145 3 145-150 5 150-155 3 155-160 4 160-165 6 Total Nota: No primeiro intervalo entram os alunos com alturas superiores ou iguais a 140 e inferiores a 145 (145cm pertence à classe seguinte).
Agora vamos dividir cada frequência absoluta pelo número total de alunos e vamos apresentar o resultado arredondado a duas casas decimais, obtendo assim as frequências relativas. Altura 140-145 3 145-150 5 150-155 3 155-160 4 160-165 6 (fracção) 3 5 3 4 6 (dízima) (percentagem) 0,14 14% 0,24 24% 0,14 14% 0,19 19% 0,29 29% Total 1 1 100% Gráficos de Barras/Histogramas/Pictogramas Consideremos novamente a altura dos alunos do 7.º ano. 12 12 13 13 13 14 14 13 13 13 13 13 14 12 13 15 14 15 12 13 13 Idade 12 4 0,19 13 11 0,52 14 4 0,19 15 2 0,1 Total 1
Podemos construir um gráfico de barras, que não são mais do que rectângulos, que traduza a frequência absoluta ou a frequência relativa das idades dos alunos. Neste gráficos só varia uma das dimensões das barras, geralmente a altura, em função dos valores das frequências. Assim, para construirmos um gráfico de barras, devemos ter em atenção: - O gráfico deve ter um título; - Num dos eixos colocam-se os dados a estudar; - No outro eixo colocam-se as frequências absolutas ou as frequências relativas; - As barras devem ter todas a mesma largura; - O espaço entre as barras deve ser sempre igual; - O comprimento de cada barra deve ser directamente proporcional à frequência que lhe corresponde. Consideremos novamente a altura (em cm) dos alunos: 141 147 155 160 161 156 158 142 163 163 164 151 149 144 157 152 152 145 160 148 149 Altura (dízima) 140-145 3 0,14 145-150 5 0,24 150-155 3 0,14 155-160 4 0,19 160-165 6 0,29 Total 1
Para representar dados agrupados em classes usam-se, normalmente, gráficos designados por Histogramas. Neste tipo de gráficos não existem espaços entre as barras cuja altura, tal como no gráfico de barras, está directamente relacionada com a frequência absoluta das classes.
Os pictogramas são gráficos que utilizam símbolos para representar a variável em estudo. Um pictograma é visualmente muito atractivo no entanto é de todos o menos rigoroso. Quando se constrói um pictograma devemos ter o cuidado de indicar o significado do símbolo ou símbolos utilizados. Esses símbolos devem ter sempre o mesmo tamanho e estarem separados por espaços iguais. Outros gráficos também muito utilizados são os gráficos circulares ou sectogramas. Nestes gráficos podemos mostrar as frequências absolutas, mas, na maioria dos casos, apresentam as frequências relativas, geralmente sob a forma de percentagens. Um gráfico circular ou sectograma é um círculo dividido em sectores de amplitudes angulares proporcionais às frequências. No nosso exemplo existem 4 idades diferentes, logo vamos dividir o círculo em quatro sectores diferentes. Como temos um total de alunos, alunos irá corresponder a uma amplitude de 360º, para determinar as amplitudes dos sectores utilizamos a regra de três simples. Voltando ao exemplo das idades dos alunos da turma do 7.º ano, verificamos que iremos ter um gráfico circular com quatro sectores. Vejamos como determinar a amplitude de cada um dos sectores:
n.º de Alunos Amplitude Idade Amplitude do Sector Circular 360º 4 x x = 4 360 x o 68,57 12 4 68,57º 13 11 188,57º 14 4 68,57º 15 2 34,29º Total 360º n.º de Alunos Amplitude 360º 11 x 11 360 x = o x 188,57 n.º de Alunos Amplitude 360º 2 x 2 360 x = x o 34,29
Medidas de Tendência Central Consideremos novamente as idades dos alunos de uma turma de 7.º ano. 12 12 13 13 13 14 14 13 13 13 13 13 14 12 13 15 14 15 12 13 13 Para calcularmos a idade média dos alunos da turma do 7.º ano somamos todas as idades e dividimos o resultado pelo número total de alunos. 12 + 12 + 13 + 13 + 13 + 14 + 14 + 13 + 13 + 13 +... + 12 + 13 + 13 = 13,2 Assim a idade média dos alunos desta turma de 7.º ano é de aproximadamente 13,2 anos. Dado um conjunto de dados numéricos, calcula-se a média somando todos os dados e dividindo o resultado pelo número total de dados. Podemos calcular a idade média a partir da tabela de frequências absolutas. Para isso basta multiplicar cada idade pela sua frequência absoluta, somar as parcelas obtidas e dividir pelo número total de alunos. Vejamos:
Idade 12 4 13 11 14 4 15 2 Total 12 4 + 13 11+ 14 4 + 15 2 = = 277 13,2 Podemos igualmente calcular a idade média a partir da tabela de frequências relativas. Para isso basta multiplicar cada idade pela sua frequência relativa e somar as parcelas obtidas. Vejamos: Idade (dízima) 12 0,19 13 0,52 14 0,19 15 0,1 Total 1 = 12 0,19 + 13 0,52 + 14 0,19 + 15 0,1 = 13,2 A moda de um conjunto de dados é o valor mais frequente, ou seja, o valor que tem maior frequência absoluta. No exemplo anterior podemos dizer que a moda é 13 anos. Idade 12 4 13 11 14 4 15 2 Total
A moda de um conjunto de dados é o valor mais frequente. Tendo os dados representados num gráfico a moda é o valor da que tem a barra mais alta, o maior número de símbolos ou sector com maior amplitude. Uma distribuição que apresenta duas modas diz-se bimodal e uma que não tem moda diz-se amodal.
Voltando novamente as idades dos alunos de uma turma de 7.º ano. 12 12 13 13 13 14 14 13 13 13 13 13 14 12 13 15 14 15 12 13 13 Para calcularmos a mediana escrevemos as idades dos alunos por ordem crescente e escolhemos o termo intermédio: 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 15 15 Dizemos então que a mediana da distribuição é 13. Vejamos outro exemplo: Consideremos a distribuição que representa o número de lápis e canetas que seis amigos trazem no porta-lápis. 4 8 6 4 7 10 Organizando os dados por ordem crescente obtemos: 4 4 6 7 8 10
Como estamos perante um número par de dados não existe um mas dois valores centrais. Neste caso a mediana é a média aritmética destes dois valores: 6 + 7 Mediana = = 6,5 2