ESTATÍSTICA- I 1- INTRODUÇÃO -A Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização e a descrição de dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. 2- FASES DO MÉTODO ESTATÍSTICO Podemos distinguir no método estatístico as seguintes fases 2.1- Coleta de dados A coleta pode ser direta e indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a. contínua (registro) quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas; b. periódica quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos; c. ocasional quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 2.2- Crítica dos Dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da coleta. 2.3- Apuração dos dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. 2.4- Exposição ou apresentação dos dados. Por mais diversa que seja a finalidade que se tenha em vista, os dados levem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas. 2.5- Análise dos resultados Como já dissemos, o objetivo último da Estatística é tirar conclusões; sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 3- POPULAÇÃO E AMOSTRA 3.1- Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo: para o fenômeno sexo são dois os resultados possíveis: sexo masculino e sexo feminino; para o fenômeno número de filhos há um número de resultados possíveis expresso através dos números naturais: 0,1,2,3,..., n para o fenômeno estatura temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo.
Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos acima nos dizem que uma variável pode ser: a. qualitativa quando seus valores são expressos por atributos: sexo (masculino feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.; b. quantitativa quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = {1, 2, 3,..., 58,...}, mas nunca valores como 2,5 ou 3,78 ou 4,325 etc. Logo, é uma variável discreta. Já o peso desses alunos é uma variável contínua, pois um dos alunos tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg etc., dependendo esse valor da precisão da medida. De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas. Designamos as variáveis por letras latinas, em geral, as últimas: x, y, z Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possíveis de um dado fenômeno. Fazendo uso da letra x para indicar a variável relativa ao fenômeno considerado, temos: x {2, 3, 5, 8} 3.2- População e Amostra População Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística ou universo estatístico. Amostra Uma amostra é um subconjunto finito de uma população. 3.3- Amostragem É uma técnica especial para recolher amostras. a) Amostragem casual ou aleatória simples. É um tipo de amostragem equivalente a um sorteio lotérico. b) Amostragem proporcional estratificada. Muitas vezes a população se divide em subpopulações estratos. O que fazemos é, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. SEXO POPULAÇÃO 10% AMOSTRA M 54 5,4 5 F 36 3,6 4 Total 90 9,0 9 c) Amostragem sistemática Quando os elementos da população já se acham ordenados. 4- TABELAS - É um quadro que resume um conjunto de observações. Uma tabela compõe-se de: a. corpo conjunto de linhas e colunas que contém informações sobre a variável em estudo; b. cabeçalho parte superior da tabela que especifica o conteúdo das colunas; c. coluna indicadora parte da tabela que especifica o conteúdo das linhas; d. linhas retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; e. casa ou célula espaço destinado a um só número; f. título conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?, Quando? e Onde?, localizado no topo da tabela. Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas e as chamadas, colocados, de preferência, no seu rodapé.
5- SÉRIES ESTATÍSTICAS Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Podemos classifica-la em: histórica, geográfica e específica. 5.1- Séries históricas, cronológicas, temporais ou marchas Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. 5.2- Séries geográficas, espaciais, territoriais ou de localização. Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. 5.3- Séries específicas ou categóricas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. 6- GRÁFICOS ESTATÍSTICOS O gráfico estatístico é uma forma de representação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil: simplicidade, clareza e veracidade. Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. 6.1- Diagramas São gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais diagramas, destacamos: a) Gráfico em linha ou em curva Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística. b) Gráfico em colunas ou em barras É a representação de uma série por meio de retângulos, dispostos verticalmente ou horizontalmente. Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Gráfico em colunas Gráfico em barras
c) Gráfico em colunas ou em barras múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. d) Gráfico em setores Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360º. 6.2- Cartogramas O cartograma é representado sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações: a) representar dados absolutos(população) neste caso, laçamos mão, em geral, dos pontos, em número proporcional aos dados
b) Representar dados relativos(densidade) neste caso, lançamos mão, em geral, de hachuras ou cores. 6.3- Pictogramas O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.