AMEI Escolar Matemática 8º Ano Estatística: Organização e Tratamento de Dados Conteúdos desta unidade: Organização, representação e interpretação de dados; Medidas de tendência central; Medidas de localização. Organização, representação e interpretação de dados Quando falamos em estatística e em estudo estatístico, há uma série de expressões que vêm associados. São estas: população conjunto de pessoas, objectos ou acontecimentos sobre os quais incide um estudo estatístico; amostra parte representativa da população, sobre a qual incide o estudo; censo ou recenseamento estudo estatístico realizado sobre a totalidade da população; sondagem estudo estatístico realizado a partir de uma amostra; variável estatística características que os elementos da população podem ou não ter e que é alvo de investigação num estudo estatístico. Exemplos: A Joana realizou um estudo estatístico na sua escola sobre a cor favorita dos alunos do 8º ano. Primeiro, interrogou para o estudo 2 alunos de cada uma das turmas de 8º ano da sua escola e anotou os dados obtidos. Seguidamente, interrogou, na totalidade, todos os alunos do 8º ano da sua escola e voltou a anotar os dados obtidos. Neste caso: - a população são os alunos do 8º ano da escola da Joana; - a amostra é o conjunto de todos os 2 alunos escolhidos de cada turma; - quando a Joana interrogou apenas os 2 alunos de cada turma realizou uma sondagem; - quando a Joana interrogou todos os alunos do 8º ano realizou um censo; - a variável estatística é a cor favorita dos alunos do 8º ano. As estatísticas podem ser classificadas em quantitativas e qualitativas. As quantitativas
representam informação que é susceptível de medida e as qualitativas representam informação que identifica alguma qualidade ou categoria, logo, não são susceptíveis de medida. Dentro das quantitativas podemos encontrar: quantitativas discretas representam informação que apenas pode tomar um número finito (ou infinito numerável) de valores distintos; quantitativa contínua representam informação que pode tomar todos os valores no seu intervalo de variação. estatísticas quantitativas qualitativas quantitativas discretas quantitativas contínuas Exercício resolvido: Classifica as seguintes estatísticas: - cor favorita dos alunos do 8º ano: variável qualitativa - idade dos alunos do 7º ano: variável quantitativa discreta - altura dos alunos do 9º ano: variável quantitativa contínua Existem mais dois conceitos relacionados com os estudos estatísticos: frequência absoluta e frequência relativa. A frequência absoluta representa-se por e é o número de vezes que um acontecimento se repete. A frequência relativa representa-se por e é o quociente entre a frequência absoluta de um acontecimento e o número total de observações (N). A soma das frequências relativas é sempre 1. Podemos multiplicar a frequência relativa de um acontecimento por 100 e obtemos a frequência relativa em percentagem.
Exercício resolvido: A turma do 8ºA tem 25 alunos. 10 alunos preferem gelado de chocolate, 10 alunos preferem o de morango e 5 alunos preferem o de nata. Calcula: - a frequência absoluta do acontecimento gostar de gelado de chocolate : 10 - a frequência relativa do acontecimento gostar de gelado de nata : ou. Tabelas e gráficos Uma tabela de frequências é uma tabela onde se indica uma ou duas frequências. Exemplo Tabela de Frequências: Clube de futebol favorito do 8º B Clube Frequência absoluta Frequência relativa Frequência relativa (percentagens) Sporting 5 Benfica 6 Porto 9 TOTAL 20 1 100% Os gráficos constituem uma forma prática e eficiente de transmitir informação. Dos gráficos mais utilizados destacam-se os gráficos de barras, histogramas, gráficos circulares e pictogramas. Observa a tabela para ficares a conhecer melhor estes e outros gráficos. GRÁFICO EXEMPLO REGRAS DE CONSTRUÇÃO Gráfico de barras - só uma das dimensões das barras varia (geralmente a altura); - a dimensão que varia corresponde à frequência da variável estatística; - as barras devem estar separadas por espaços iguais; - o gráfico deve ter um título adequado.
Gráfico circular Pictograma Diagrama de caule-efolhas - a amplitude de cada sector é proporcional à frequência que representa; - os sectores circulares devem ser identificados, podendo recorrer-se a uma legenda; - podem usar-se cores diferentes para os diferentes sectores; - o gráfico deve ter um título adequado. - indicar no gráfico o significado de cada símbolo utilizado; - utilizar símbolos ou figuras sugestivas de acordo com a variável estatística a representar; - utilizar sempre o mesmo símbolo ou símbolos; - os símbolos devem ser apresentados em linhas ou colunas e com espaçamento uniforme entre eles; - as diferentes frequências são representadas por um maior ou menor número de símbolos e nunca por símbolos de tamanhos diferentes. Se for necessário poderão ser utilizadas fracções dos símbolos; - o gráfico deve ter título adequado. - deve começar-se por traçar um segmento de recta que servirá de separador entre o caule e as folhas; - os dados devem ser ordenados; - números que diferem apenas no algarismo da menor ordem (algarismo mais à direita) devem ser representados na mesma linha; no início de cada linha (caule) deverão ser colocados os algarismos comuns a todos esses números; - em cada linha os algarismos de menor ordem (folhas) devem ser colocados por ordem do menor para o maior; - o gráfico deve ter título adequado.
Histograma Polígono de frequências - os dados devem ser agrupados em classes; - os intervalos das classes representam-se no eixo horizontal; - as frequências das classes representam-se no eixo vertical; - as barras são desenhadas verticalmente para cada uma das classes não existindo qualquer espaço entre elas; - a área de cada uma das barras é proporcional à frequência da respectiva classe; - o gráfico deve ter título adequado. - em cada uma das barras marcam-se os pontos médios do lados superiores; - unem-se ponto médios consecutivos através de segmentos de recta; - para finalizar o polígono de frequências consideram-se duas classes de frequência zero, uma imediatamente à esquerda de todas as classes existentes e outra imediatamente à direita e unem-se, através de um segmento de recta, os pontos médios dessas classes aos pontos médios subjacentes. Medidas de tendência central Habitualmente, quando estamos perante um conjunto de dados estatísticos, interessa-nos saber se estes têm tendência a concentrarse em torno de algum valor médio ou central. As medidas estatísticas que nos dão essa indicação são a média, a moda e a mediana e designam-se por medidas de tendência central. A moda é a única das três que pode ser determinada para qualitativas. A moda de uma distribuição é a observação que mais vezes se repete. Se não houver nenhuma observação que se repita mais vezes que as restantes então diz-se que a distribuição é amodal. No caso de haver duas modas diz-se que a distribuição é bimodal. Se houver três ou mais modas, diz-se que a distribuição é plurimodal.
A média ( ) apenas pode ser calculada para quantitativas. Dado um conjunto de dados numéricos, calcula-se a média somando todos os dados e dividindo o resultado pelo número total de observações. A mediana ( ) também pode ser calculada apenas para quantitativas. Dada uma sequência ordenada (por ordem crescente ou decrescente) dos dados observados, a mediana é o valor que ocupa a posição intermédia. Se o número de dados for par, a mediana é a média aritmética dos dois valores centrais. Exercício resolvido: Na turma do 8ªC existem 20 alunos cuja idade se distribuem da seguinte maneira. 11 anos 5 12 anos 10 13 anos 5 Calcule a média, a moda e a mediana destes dados. moda = 12 anos Medidas de localização A média, moda e mediana não são por vezes suficientes para retirar conclusões sobre uma dada amostra. Para além destas medidas existem outras medidas importantes que nos permitem descrever melhor a distribuição de um conjunto de dados. São elas as medidas de localização. Numa distribuição existem três quartis, o primeiro quartil ( ), o segundo quartil ( ), que coincide com a mediana, e o terceiro quartil ( ). Dada uma sequência ordenada (por ordem crescente ou decrescente) dos dados em estudo, o segundo quartil (mediana) é o
valor que ocupa a posição intermédia. Se o número de dados for par, o segundo quartil (mediana) é a média aritmética dos dois valores centrais. Uma vez determinada a mediana ( ) a distribuição fica dividida a meio. Para calcularmos o primeiro quartil ( ) determinamos a mediana da primeira metade da distribuição. Para calcularmos o terceiro quartil ( ) determinamos a mediana da segunda metade da distribuição. Todas as distribuições têm dois extremos, o extremo máximo, que é a maior das observações feitas, e o extremo mínimo, que é a menor das observações feitas. A amplitude (A) é a diferença entre o máximo e o mínimo de uma distribuição. A amplitude interquartis (AIQ) é a diferença entre o valor do terceiro e do primeiro quartis. O diagrama de extremos e quartis (ou caixa de bigodes) é uma forma esquemática de representar os extremos, mediana e quartis de uma distribuição. Para construir um diagrama de extremos e quartis é necessário conhecer os seguintes valores: extremos (máximo e mínimo); mediana; 1.º quartil ( ); 3.º quartil ( ). O conjunto dos valores da amostra compreendidos entre o 1.º e o 3.º quartis são representados por um rectângulo (a largura do rectângulo não dá qualquer informção). No rectângulo marca-se o valor da mediana com uma barra. De seguida, marcam-se duas linhas que unem os meios dos lados do rectângulo com os extremos da amostra.
Exercício resolvido: 2 4 1 5 7 10 8 9 3 6 Observa os dados obtidos num estudo e coloca-os num diagrama de extremos e quartis.