NOÇÕES BÁSICAS DE ESTATÍSTICA
Tipos de Estatísticas Estatística descritiva É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe o quão freqüente é o uso de médias, índices e gráficos nas notícias. Estatística inferencial (ou indutiva) A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da amostra, constitui o problema central da inferência estatística.
TERMOS DE UMA PESQUISA ESTATÍSTICA População e amostra Um total de elementos descreve o universo estatístico, como nem sempre é possível consultar a todos, recorremos, então, ao que se chama de amostra, ou seja, um grupo de elementos que consultados, permitem que se chegue a um resultado mais próximo da realidade. A amostra pode ser um indivíduo ou um objeto.
TIPOS DE AMOSTRAS Amostragem casual ou aleatória simples: É o processo mais elementar e freqüentemente utilizado. É equivalente a um sorteio lotérico. Amostragem proporcional estratificada: Quando a população se divide em estratos (subpopulações) Amostragem sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Amostragem por conglomerados (ou agrupamentos): Algumas populações não permitem ou tornam extremamente difícil que se identifiquem seus elementos. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios, etc.
Amostragem acidental: Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Amostragem intencional: De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irá compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Amostragem por quotas: Um dos métodos de amostragem mais comumente usado em levantamentos de mercado e em prévias eleitorais.
Variável qualitativ a Variável quantitativa nomin al ordinal discreta contínua
Variável qualitativa nominal são valores que estão relacionados a uma qualidade ou atributo dos elementos pesquisados sem uma ordem nos seus valores. Ex: cor de cabelo ou esporte favorito Variável qualitativa ordinal são valores que estão relacionados a uma qualidade ou atributo dos elementos pesquisados com uma ordem nos seus valores Ex: grau de instrução: fundamental, médio, superior, etc. Variável quantitativa discreta são valores que estão relacionados a números, se tratando de contagem (números inteiros) Ex: Número de irmãos: 0, 1,, etc. Variável quantitativa contínua são valores que estão relacionados a números, se tratando de medidas (números reais) Ex: Altura:1,55 m, 1,80 m, etc.
ROL E AMPLITUDE Rol: É o arranjo dos dados Brutos em ordem crescente ou decrescentes. Amplitude total: É a diferença o maior e o menor dos valores observados.
FREQÜÊNCIA ABSOLUTA(FA) E FREQÜÊNCIA RELATIVA (FR) O número de vezes que um valor de uma variável é citado representa a freqüência absoluta daquele valor. A freqüência relativa é a que registra a freqüência absoluta em relação ao total de citações.
Ex: Suponha que entre um grupo de turistas, participantes de uma excursão, tenha sido feita uma pesquisa sobre a nacionalidade de cada um e que o resultado dela tenha sido o seguinte: Pedro: brasileiro; Ana: brasileira; Ramón: espanhol; Laura: espanhola; Cláudia: brasileira; Sergio: brasileiro; Raul: argentino; Nélson: brasileiro; Sílvia: brasileira; Pablo: espanhol. Nesse exemplo, a variável é a nacionalidade, os valores são: brasileira, espanhola e argentina.
Nacionalidade Freqüência Absoluta (FA) Freqüência Relativa (FR) 6 Brasileira 6 ou 0,6 ou 60% 10 3 Espanhola 3 ou 0,3 ou 30% 10 Argentina 1 ou 0,1 ou 10% Total 10 ou 1 ou 100% 1 10 10 10
REPRESENTAÇÃO GRÁFICA Gráficos de segmentos Os gráficos de segmentos são utilizados principalmente para mostrar a evolução das freqüências dos valores de uma variável durante certo período. A tabela abaixo mostra a venda de livros em uma livraria no segundo semestre de determinado ano.
Com base na tabela temos o gráfico de segmentos
Gráficos de barras Com base no desempenho em Química demonstrando pelos alunos de uma classe, um professor elaborou a seguinte tabela:
Com os dados da tabela é possível construir o gráfico de barras
Gráficos de setores (ou gráfico pizza ) Em um shopping há três salas de cinema, e o número de espectadores em cada uma delas num determinado dia da semana foi de 300 na sala A, 00 na B e 500 na C. Observe a tabela de freqüências e depois em gráficos de setores:
Em cada gráfico de setores o círculo todo indica o total (1000 espectadores ou 100%) e cada setor indica a ocupação de uma sala. Na construção do gráfico de setores, determina-se o ângulo correspondente a cada setor por regra de três. Veja como exemplo o da sala A 300 x Usando a freqüência absoluta, x 108 1000 360 30 x Usando a freqüência relativa (em %), x 108 100 360
MEDIDAS DE TENDÊNCIA CENTRAL Média aritmética (MA) Considerando um grupo de pessoas com, 0, 1, 4 e 0 anos, temos que: MA 0 1 5 4 0 107 5 1,4. Assim, a média aritmética ou a média da idade do grupo é 1,4 anos. Logo de forma geral temos: MA x1 x x3... n n i1 x n n x i
MÉDIA PONDERADA
MODA (MO) Moda é a medida de tendência central definida como o valor mais freqüente de um grupo de valores observados. Ex: 1) Do grupo de pessoas com idades de, 3,, 1, e 50 anos, a moda é anos (Mo = ). Observação: Quando não há repetição de números, como, por exemplo, para 7, 9, 4, 5 e 8, não há moda.
MEDIANA (ME) Dados n números em ordem crescente ou decrescente, a mediana será: O número que ocupar a posição central se n for ímpar; Ex: Numa classe, foram anotadas as faltas durante um período de 15 dias: 3, 5,, 0,, 1, 3, 4, 5, 7, 0,, 3, 4 e 7 Em ordem crescente, temos: 0,0,1,,,,3, 3, 3,4,4,5,5,7,7, 7 valores 7 valores Me 3
A média aritmética dos dois números que estiverem no centro se n for par. Ex: As idades dos alunos de uma equipe são 1, 16, 14, 1, 13, 16, 16 e 17 anos Colocamos inicialmente na ordem crescente ou decrescente: 1,1,13, 14,16,16,16,17 As duas posições centrais 14 16 Me 15
MEDIDAS DE DISPERSÃO As medidas de dispersão são usadas quando as medidas de tendência central são insuficientes. Variância (V) É dado pela fórmula V n i 1 ( x i para diferenciar a dispersão das variáveis n MA ) e é suficiente
Desvio Padrão (DP) DP É a raiz quadrada da variância facilita a interpretação dos dados da variância. V. Ele
Observe a seguinte situação: Uma pessoa é encarregada de organizar atividades de lazer para um grupo de 6 pessoas e recebe a informação de que a média de idade do grupo é 0 anos. Nesse caso, apenas a informação da média não é suficiente para planejar as atividades, pois podemos ter grupos com média de idade de 0 anos e características totalmente diferentes. Observemos alguns grupos possíveis:
Grupo A: 0 anos; 0 anos; 0 anos; 0 anos; 0 anos; 0 anos. 0 0 0 0 0 0 10 MA 0 6 6 anos Grupo B: anos; 3 anos; 18 anos; 19 anos; 0 anos; 18 anos. 3 18 19 0 18 10 MA 0 6 6 anos Grupo C: 6 anos; 6 anos; 39 anos; 4 anos; 8 anos; 1 ano. 6 6 39 4 8 1 10 MA 0 6 6 anos Neste tipo de situação devemos usar as medidas de dispersão pois o grupo C é um exemplo claro de um grupo heterogêneo.
O cálculo da variância e do desvio padrão dos grupos acima é dado por: Grupo A: 0 anos; 0 anos; 0 anos; 0 anos; 0 anos; 0 anos MA = 0 Desvios: 0 0 0, todos iguais a zero V = 0 DP 0 = 0 ano
18 0 Grupo B: anos; 3 anos; 18 anos; 19 anos; 0 anos; 18 anos. MA = 0 Desvios: 0 ; 3 0 3; 18 0 ; 19 0 1; 0 0 0; V 3 ( ) ( 1) 6 0 ( ) 4 9 4 1 0 6 4 6 3,6 DP 3,6 1,9 anos
Grupo C: 6 anos; 6 anos; 39 anos; 4 anos; 8 anos; 1 ano. MA = 0 Desvios: 6 0 14 8 0 1; 1 0 19 ; 6 0 4; 39 0 19 ; 4 0 16; V 308 6 ( 14) 4 19 ( 16) 6 ( 1) ( 19) 196 1764 361 56 144 3 6 513,6 DP 513,6,6 anos