Estatística Aula 1 -Fundamentos e conceitos básicos (Notas de aula) Prof. Idemauro Antonio Rodrigues de Lara
Objetivo da disciplina Adquirir conhecimento dos fundamentos da Estatística, em seus campos Descritivo e Inferencial, como base para aplicação em estudos inerentes à Agronomia, Pecuária, Biologia e demais áreas afins.
Aspectos históricos A palavra estatística provém do latim status, que significa estado. A utilização primitiva envolvia compilações de dados e gráficos que descreviam aspectos de um estado ou país. Com o desenvolvimento das Ciências, da Teoria da Probabilidade e da Informática, a Estatística adquiriu status de Ciência com aplicabilidade em praticamente todas as áreas do saber.
Algumas definições: Estatística e a ciência que nos ensina qual é a situação política de todos os estados modernos no nosso mundo. [Hopper,1770] Estatística é o estudo das populações, das variações e dos métodos de redução dos dados. [Fisher início do século XX] Estatística são dados quantitativos afetados, na maioria dos casos, por uma multiplicidade de causas. [Yule e Kendall,1958] Estatística pode ser vista como um conjunto de técnicas que ajudam na tomada de decisões, quando prevalecem condições de incerteza [Vieira, 1986] Estatística é a ciência que tem por objetivos fornecer subsídios para o planejamento e a condução de experimentos, bem como para a coleta, descrição e a análise de dados, e para a interpretação de resultados [Iemma, 1992] Estatística envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais.[barbetta, Reis e Bornia, 2004]
Campos ou Funções da Estatística 1. Função Descritiva: Estatística Descritiva 2. Função Indutiva: Inferência Estatística A ligação entre essas duas funções se dá por meio da teoria de probabilidades.
Campos ou funções da Estatística Estatística Descritiva Inferência Teoria da Probabilidade Metodologia para efetuar síntese do fenômeno em estudo Metodologia para tomada de decisões e grau de confiabilidade nas decisões (validade) Descrição do fenômeno em estudo Processo de generalização de resultados
Conceitos População: conjunto de elementos que apresentam uma ou mais características em comum, cujo comportamento interessa analisar (inferir). Recenseamento: processo de se coletar dados de toda uma população. Censo é o conjunto de informações, ou seja de dados relativos a todos os elementos da população objeto de estudo.
Fatores limitantes do Recenseamento Populações infinitas Custo Tempo Processos destrutivos Valor científico
Conceitos Amostra: é um subconjunto não vazio de elementos (sujeitos, medidas, valores, etc...) extraídos da população objeto de estudo. Amostragem é um conjunto de técnicas para se obter amostras da população.
Conceitos relacionados à população e à amostra Parâmetro é um valor ou uma medida numérica que descreve uma característica populacional. (são valores estabelecidos para a população) Estimativa é um valor ou uma medida que descreve uma característica de uma amostra (são medidas ou valores estabelecidos para uma amostra)
Exemplo 1 Pesquisa eleitoral População: Eleitores brasileiros (N) π =? Amostra: uma parte desses Eleitores (n) Voto do eleitor: X 1 X 2 X 3... p Fonte: Barbetta P. A., Reis M.M. e Bornia A. C., Estatística para os cursos de Engenharia e Informática, 2004 (pág. 26)
Exemplo 2 Saúde Pública Estudo da anemia em crianças com idade entre 5 e 7 anos, numa região do município com uma população de 12000 crianças nessa faixa etária. População Amostragem aleatória N=12000 Amostra (n=600) Parâmetros Características (Características) Inferência (margem de erro) Peso médio, estatura média, taxa média de hemoglobina e ferro, proporção de crianças com anemia Estimativas desses parâmetros mediante avaliação da amostra
Exemplo 3 Rede de computadores População: Todos os arquivos que entram na rede Amostra: Conjunto de arquivos observados em um intervalo de tempo Características: tipos de arquivos, tamanho dos arquivos, tempos de transmissão.
Estatística e as Ciências Agrárias Nas Ciências agrárias realizam-se pesquisas para avaliar a eficácia de fertilizantes, comparar variedades quanto à produção, avaliar a potência de produtos químicos etc Os pesquisadores procuram isolar efeitos que podem influenciar o resultado, porém sempre existem variações aleatórias devido a fatores não controláveis.
Exemplo 4 - Agronomia Considere um estudo para verificar a produção de milho, em kg/ha, sob o efeito de diferentes doses de nitrogênio, em kg/ha. (Fonte: Andrade, D. F.; Ogliari, P.J. Estatística para as Ciências Agrárias e Biológicas, pág. 39) População: todos os valores possíveis da produção de milho Amostra: Cinco valores da produção de milho de cada dosagem
Exemplo 4 -Questões do estudo Tabela 1. Produção de milho, em kg/ha, submetido a diferentes dosagens de nitrogênio, no oeste catarinense, 1993. Repetições Total Média Dosagens 1 2 3 4 5 0 2850 1780 2100 2900 2010 11640 2328 25 3200 1980 2220 2850 2100 12350 2470 50 4150 2330 3700 4050 2500 16730 3346 75 4380 2830 3420 3900 3080 17610 3522 100 4000 2630 3150 3780 2670 16230 3246 Fonte: Andrade e Ogliari, pág. 40. 1. Existe diferença entre as produções das dosagens? 2. A diferença observada entre as produções é devida às diferentes dosagens ou é meramente aleatória?
Os modelos Modelos são representações da realidade em estudo. Alguns tipos de modelos: modelo analógico modelo icônico modelo matemático modelo probabilístico modelo estatístico ou estocástico
modelo matemático x modelo estatístico Modelo matemático: Y=2X+3 Modelo estatístico: Yˆ = 5,21X + 10, 53 16 60 14 12 50 10 40 Y 8 Y 30 6 20 4 2 10 0 0 1 2 3 4 5 6 7 0 0 1 2 3 4 5 6 7 X X Isenção de erro presença de erro
Modelo estatístico do exemplo 4 y = µ + d + ij i ε ij y ij representa a j-ésima produção no nível i de nitrogênio; µ d i ε ij é uma constante geral é o efeito do nitrogênio sobre a produção é a soma de todos os efeitos não controláveis ou erro experimental
Um exemplo de modelo probabilístico O número de casos de dengue, por Km², em uma região da cidade, distribui-se de forma independente e aleatória a uma taxa constante α. f ( x) = P( X = x) =. e x! α α Este modelo pode auxiliar um profissional da área epidemiológica, permitindo-o predizer a probabilidade de ocorrência do número de casos de dengue na região.
Natureza dos dados Dados estatísticos são informações obtidas a respeito das características do objeto de estudo. Todo dado estatístico se refere a determinada variável. Variável qualitativa nominal ordinal Variável quantitativa discreta contínua
Exemplos relacionados às situações anteriores 1. Sexo, idade, escolaridade, renda dos eleitores; 2. Peso, estatura, taxas de hemoglobina no sangue em crianças; 3. Tipo de arquivo, tamanho do arquivo, número de arquivos, tempo de transmissão; 4. Produção de milho.
Algumas Referências Andrade, D. F.; Ogliari, P.J. Estatística para as ciências agrárias e biológicas. Ed. UFSC, 2010. Barbetta P. A., Reis M.M. e Bornia A. C., Estatística para os cursos de Engenharia e Informática. São Paulo, Atlas, 2004. Bussab, W. O; Morettin, P.A. Estatística Básica. São Paulo, Saraiva, 5 ed. 2002. Triola, M. F. Introdução à Estatística. Rio de Janeiro, LTC, 7 ed, 1999. Vieira, S. Elementos de Estatística. São Paulo, Atlas, 3 ed, 1999.