Conceitos básicos, probabilidade, distribuição normal e uso de tabelas padronizadas Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais
Alguns conceitos População: é o conjunto de todos os elementos ou resultados sob investigação. Amostra: qualquer subconjunto da população. Subpopulação: estrato da população que partilha alguma característica comum. Parâmetro: é uma medida numérica que descreve uma população. Estatística: é uma medida numérica que descreve uma amostra. Estimador: é uma estatística da amostra usada para se aproximar de um parâmetro da população. Variáveis: característica de interesse para os elementos analisados, informações numéricas estatisticamente tratáveis. Nominais ou categóricas: profissão, gênero, preferência política... Ordinais: primeiro-segundo..., grau de escolaridade... Intervalares: salário entre 1 e 3 SM, distância entre 0 e 5km... Contínuas: altura, rendimento, peso...
Amostra População Amostra (n=5) Parâmetros Estatísticas Inferência estatística: conhecer os parâmetros, fazer afirmações sobre a população com base em suas amostras.
O que é probabilidade? Número de 0 até 1 que expressa a tendência de um determinado evento acontecer. Número positivo entre 0 e 1, associado a um evento aleatório, que se mede pela frequência relativa da sua ocorrência numa longa sucessão de eventos. Grau de segurança com que se pode esperar a realização de um evento, determinado pela frequência relativa dos eventos do mesmo tipo numa série de tentativas. Perspectiva de que algo venha a ocorrer. 4
Determinação de probabilidade Conceito genérico: Probabilidade de um resultado ou evento número de vezes que o resultado ou evento pode ocorrer número total de vezes que qualquer resultado ou evento pode ocorrer Tipos de determinação: Exata: análise da estrutura do problema, conhecimento da população... Aproximativa: estimativas a partir de amostras. Subjetiva: expressão de crenças. 5
Fonte: Wikipédia Probabilidade em variáveis discretas Qual a probabilidade de se tirar uma carta de copas de um baralho? E de se tirar um ás? Qual a probabilidade de se tirar cara jogando uma moeda para o alto? Qual a probabilidade de obter 5 lançando dois dados? 6
Probabilidade em variáveis contínuas? Qual é a probabilidade de que, ao acordar de repente, sejam exatamente 4h59min16seg147milésimos? 7
Função Densidade de Probabilidade Probabilidade de um valor específico para variáveis contínuas não faz sentido, pois a probabilidade de um ponto é zero. Devemos, portanto, definir intervalos: Ex.: Probabilidade de que sejam entre 15h e 16h P(15h<x<16h) Os intervalos são calculados com base na função que determina a distribuição das variáveis aleatórias contínuas, chamada de Função Densidade de Probabilidade (f.d.p.). 15 16 horas 8
Formalização matemática Função Densidade de Probabilidade (f.d.p.): prob ( a x b) ( x) dx Em palavras: a área debaixo da função de densidade entre dois limites fornece a probabilidade de ocorrer um evento dentro de um determinado intervalo de valores. b a f.d.p. 34 P( 29 x 34) ( x) dx 29 29 34 9
Distribuição normal Também chamada de distribuição gaussiana, é utilizada para descrever muitos fenômenos e possui grande utilidade na inferência estatística. Indicamos que uma população é normal usando a seguinte notação: X~N(μ;σ 2 ). Ex.: Uma população normal com peso médio de 70kg e desviopadrão de 16kg será notada como: X~N(70;16 2 ) 10
Formato de uma distribuição normal Fonte: Wikipédia 11
Parâmetros de uma distribuição normal A curva normal é definida por uma equação que possui os seguintes parâmetros: Média (μ) e desvio-padrão (σ). ( x x ) (,, ) e 2 2 f 2 1 2 2 Fonte: Wikipédia 12
Outras distribuições Outras distribuições serão utilizadas ao longo do curso: t de Student (parâmetros: graus de liberdade ν) Qui-quadrado (parâmetros: graus de liberdade ν) F de Fisher-Snedecor (parâmetros: graus de liberdade do numerador e denominador ν 1 e ν 2 ) Elas serão detalhas e explicadas no momento adequado. 13
Cuidado! A distribuição paranormal assombra os conceitos de muitos alunos, aparecendo com freqüência em provas e exercícios. Exorcize-a! 14
Valor padronizado (z) O valor z mede o quanto x se afasta da média ( ), em unidade de desvio padrão ( ). O desvio-padrão é a nossa régua. É usado nas tabelas de referência, onde μ=0 e σ=1. z = x - μ σ x x 15
Preste atenção nessa imagem!
Exercícios básicos: uso da curva normal 1. Uma v.a. X tem distribuição normal, com média 100 e desvio-padrão 10. a. Qual a probabilidade de que um indivíduo dessa população tenha um valor entre P(90<X<110)? b. P(x>120)? c. P(x<120)? d. Probabilidade de um indivíduo ter um valor menor que 85 e maior que 124 P(x<85 x>124)? e. Se sortearmos aleatoriamente 1000 indivíduos dessa população, quantos devem valores entre 90 e 110? Dica: desenhe a curva normal e marque a área a ser determinada 18
Exercícios básicos: uso da curva normal 2. Um levantamento realizado pela ANAC* verificou que a altura dos usuários de aviação segue uma distribuição normal com média de 171,3cm e desvio-padrão de 7,3cm. Com base nesses dados determine: a. Probabilidade de um usuário ter mais de 1,90m de altura P(X>190) b. P(X<140) c. Um intervalo simétrico em relação à média que exclua apenas 5% dos indivíduos. * SILVA, S. C; MONTEIRO, D.. Levantamento do perfil antropométrico da população brasileira usuária do transporte aéreo nacional: Projeto Conhecer. Relatório Técnico Final. Agência Nacional de Aviação Civil. 2009. Disponível em http://www2.anac.gov.br/arquivos/pdf/relatorio_final_projeto_conhecer.pdf 19