Introdução à Probabilidade e Estatística I

Documentos relacionados
Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

3º Ano do Ensino Médio. Aula nº06

Pressuposições à ANOVA

Métodos Estatísticos Avançados em Epidemiologia

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

P R O G R A M A TERCEIRA FASE. DISCIPLINA: Estatística Aplicada à Pesquisa Educacional Código: 3EAPE Carga Horária: 54h/a (crédito 03)

Os dados quantitativos também podem ser de natureza discreta ou contínua.

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

AULA 07 Distribuições Discretas de Probabilidade

Medidas de Localização

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

Conteúdo programático por disciplina Matemática 6 o ano

Universidade Federal de Ouro Preto UFOP. Instituto de Ciências Exatas e Biológicas ICEB. Departamento de Computação DECOM

Estatística AMOSTRAGEM

PESQUISA OPERACIONAL -PROGRAMAÇÃO LINEAR. Prof. Angelo Augusto Frozza, M.Sc.

Fundamentos de Bancos de Dados 3 a Prova Caderno de Questões

Análise Qualitativa no Gerenciamento de Riscos de Projetos

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

Probabilidade. Luiz Carlos Terra

Técnicas de Contagem I II III IV V VI

Unidade 3 Função Afim

GRADUAÇÃO TECNOLÓGICA EM GESTÃO DA PRODUÇÃO INDUSTRIAL GERENCIAMENTO ESTATÍSTICO DOS PROCESSOS PRODUTIVOS (tópicos da aula 3)

DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE DISCRETAS

Física Experimental III

Módulo de Equações do Segundo Grau. Equações do Segundo Grau: Resultados Básicos. Nono Ano

Dureza Rockwell. No início do século XX houve muitos progressos. Nossa aula. Em que consiste o ensaio Rockwell. no campo da determinação da dureza.

Inteligência Artificial

Pós-Graduação em Computação Distribuída e Ubíqua

GUIA DE FUNCIONAMENTO DA UNIDADE CURRICULAR

Obtenção Experimental de Modelos Matemáticos Através da Reposta ao Degrau

Seu pé direito nas melhores Faculdades

Entropia, Entropia Relativa

Probabilidade. Evento (E) é o acontecimento que deve ser analisado.

MOQ-14 Projeto e Análise de Experimentos

Resumo: Estudo do Comportamento das Funções. 1º - Explicitar o domínio da função estudada

Matemática Básica Intervalos

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

GEOMETRIA. sólidos geométricos, regiões planas e contornos PRISMAS SÓLIDOS GEOMÉTRICOS REGIÕES PLANAS CONTORNOS

Aula 5. Uma partícula evolui na reta. A trajetória é uma função que dá a sua posição em função do tempo:

FERRAMENTAS DA QUALIDADE FOLHA DE VERIFICAÇÃO

Modelo Entidade Relacionamento (MER) Professor : Esp. Hiarly Alves

Distribuição Normal de Probabilidade

Medida de Tendência Central

Modelo Comportamental

FÍSICA EXPERIMENTAL 3001

UM JOGO BINOMIAL 1. INTRODUÇÃO

Figura 4.1: Diagrama de representação de uma função de 2 variáveis

DISCIPLINA DE ESTATÍSTICA

AULA 19 Análise de Variância

Função. Adição e subtração de arcos Duplicação de arcos

ESTATÍSTICA DESCRITIVA:

Aula 6 Medidas de Tendência Central

Prof. Daniela Barreiro Claro

Estatística. Conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos ou de massa.

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO PROGRAMA DE EDUCAÇÃO TUTORIAL - MATEMÁTICA PROJETO FUNDAMENTOS DE MATEMÁTICA ELEMENTAR

Programação para Web HTML - Parte 2

Probabilidade e Estatística

Modelo Lógico: Tabelas, Chaves Primárias e Estrangeiras

Uso de escalas logaritmicas e linearização

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Estatística Analítica

M =C J, fórmula do montante

Medidas de dispersão e assimetria

TESTES SOCIOMÉTRICOS

LINEARIZAÇÃO DE GRÁFICOS

Correlação e Regressão linear simples

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Estudo sobre a dependência espacial da dengue em Salvador no ano de 2002: Uma aplicação do Índice de Moran

QUESTÕES PARA A 3ª SÉRIE ENSINO MÉDIO MATEMÁTICA 2º BIMESTE SUGESTÕES DE RESOLUÇÕES

1 - POLÍGONOS REGULARES E CIRCUNFERÊNCIAS

Álgebra Linear Aplicada à Compressão de Imagens. Universidade de Lisboa Instituto Superior Técnico. Mestrado em Engenharia Aeroespacial

AULA 4 DELINEAMENTO EM QUADRADO LATINO (DQL)

Apresentação de Dados

Confira se os dados contidos na parte inferior desta capa estão corretos e, em seguida, assine no espaço reservado para isso.

TEORIA 5: EQUAÇÕES E SISTEMAS DO 1º GRAU MATEMÁTICA BÁSICA

DEPARTAMENTO DE MATEMÁTICA

AVALIAÇÃO DE UM TANQUE DE DECANTAÇÃO DE SÓLIDOS UTILIZANDO FLUIDODINÂMICA COMPUTACIONAL

Condução. t x. Grupo de Ensino de Física da Universidade Federal de Santa Maria

I. Conjunto Elemento Pertinência

Gerenciamento do Escopo do Projeto (PMBoK 5ª ed.)

Aula 6 Propagação de erros

Gerenciador de Ambiente Laboratorial - GAL Manual do Usuário Módulo Controle de Qualidade Analítico

Modelos de Probabilidade e Inferência Estatística

Lista de Exercícios 04 Estruturas de Dados Homogêneas - Vetores

Introdução. Ou seja, de certo modo esperamos que haja uma certa

CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE

Métodos Estatísticos Avançados em Epidemiologia

Função Seno. Gráfico da Função Seno

ANÁLISE EXPLORATÓRIA DE DADOS


CONFIGURAçÃO E GERAÇÃO DO LALUR. Parâmetros

índice Introdução Estatística Descritiva Capítulo 1 Capítulo 2 O que é a Estatística Escalas de medida Escalas Nominais Escalas Ordinais

Avaliação Econômica Projeto de Inclusão Digital. Naercio Aquino Menezes Filho Centro de Políticas Públicas Insper FEA-USP e Fundação Itaú Social

Comandos de Eletropneumática Exercícios Comentados para Elaboração, Montagem e Ensaios

A vida sem reflexão não merece ser vivida Sócrates Disciplina: ESTATÍSTICA e PROBABILIDADE

Desvio Padrão ou Erro Padrão

CURSO DE APERFEIÇOAMENTO ACESSIBILIDADE CULTURAL: ARTICULAÇÕES E REFLEXÕES NA FORMAÇÃO DE PROFESSORES Edital

FUNDAÇÃO EDUCACIONAL DE ANDRADINA NOME DO(S) AUTOR(ES) EM ORDEM ALFABÉTICA TÍTULO DO TRABALHO: SUBTÍTULO DO TRABALHO, SE HOUVER

Transcrição:

Introdução à Probabilidade e Estatística I População e Amostra Medidas resumo Prof. Alexandre G Patriota Sala: 298A Email: patriota@ime.usp.br Site: www.ime.usp.br/ patriota

Passos iniciais O primeiro passo em uma investigação científica é definir o alvo de interesse, ou seja, qual a população de interesse. Devemos criar um procedimento (experimento, questionário, etc) para acessar as características de interesse dessa população. A partir do procedimento (experimento), obtemos os dados observados que devem ser organizados em uma tabela de dados brutos (a seguir).

População A coleção de todos os possíveis elementos sob investigação é denominada de população ou universo. Em todos os problemas estatísticos devemos inicialmente definir qual a população alvo. Com ela, estarão relacionadas as quantidades de interesse. Pode-se definir que os habitantes do Brasil formam nossa população de interesse, neste caso o número de elementos da nossa população é de aproximadamente 190 milhões. Pode-se definir que os alunos desta disciplina formam nossa população de interesse, neste caso o número de elementos da nossa população é de 46 alunos.

Amostra É um subconjunto da população. A amostra é utilizada quando não temos acesso a população toda e serve como base para inferir sobre quantidades de interesse relacionadas à população. Se os habitantes do Brasil formam nossa população de interesse, uma possível amostra são os alunos desta disciplina. Se os alunos desta disciplina formam nossa população de interesse, uma possível amostra são os alunos das duas primeiras fileiras. 10 carros de uma determinada marca para fazer testes de sergurança.

Amostra representativa da População Uma amostra é representativa da população quando nela estão contidas idealmente todas as características e/ou propriedades da população alvo. Ou seja, uma amostra representativa deve ter um comportamento parecido com o da população. Caso contrário, diremos que a amostra é enviesada ou viciada. Os métodos estatísticos para a retirada de amostras representativas são estudados na disciplina de amostragem.

Diagrama esquemático

Conjunto de dados Um conjunto de dados é uma coleção de características de indivíduos de uma amostra ou população. Obtém-se um conjunto de dados através de questionários. Usualmente, um conjunto de dados (tabela bruta de dados) é organizado da seguinte forma: cada linha contém informações de apenas um indivíduo, linhas diferentes contém informações de indivíduos diferentes; cada coluna representa uma característica específica (idade, escolaridade, etc).

Questionário Exemplo As pessoas de uma amostra (ou população) devem responder o seguinte questonário. Nome: Estado civil: Grau de instrução: N o de filhos: Salário ( sal. mín.): Idade: (anos) (meses) Região de procedência:..

Tabela bruta de dados Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estatística Básica.

Tipos de variáveis Há dois tipos de variáveis, a saber: variáveis quantitativas e qualitativas. Variáveis quantitativas (descrevem quantidades): podem ser discretas ou contínuas. Variáveis qualitativas (descrevem qualidades): podem ser ordinais ou nominais.

Diagrama Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estatística Básica.

Variável ordinal É uma variável que descreve uma qualidade, porém existe uma ordem entre seus resultados. Por exemplo, o grau de instrução de um indivíduo pode assumir os seguintes resultados: analfabeto, ensino fundamental, ensino médio, superior.

Variável nominal É uma variável que descreve uma qualidade, porém não existe uma ordem entre seus resultados. Por exemplo, a cor dos cabelos é uma variável nominal, pois assume os resultados: ruívo, loiro, castanho e preto que não podem ser ordenados.

Variável contínua É uma variável que pode assumir qualquer valor real dentro de um intervalo é dita ser contínua. O nível de colesterol em miligramas por decilitro, por exemplo, varia entre [0, )mg/dl. Fixado dois pontos quaisquer 200mg/dl e 201mg/dl podemos encontrar teoricamente uma quantidade não-enumerável de valores entre esse intervalo. Ou seja, não existe uma relação biunívoca entre os possíveis valores da variável contínua e os números naturais.

Variável discreta É uma variável que pode assumir apenas um quantidade enumerável de valores. Por exemplo, idade (em anos) e número de filhos são variáveis quantitativas discretas. Ou seja, existe uma relação biunívoca entre o conjunto de possíveis valores da variável discreta e os números naturais.

Conjuntos de dados Forma genérica O conjunto de dados pode ser escrito de forma genérica, isso facilita o uso de ferramentas matemáticas na análise dos dados. Assuma que o tamanho da amostra é n e que observaremos variáveis X, Y e Z em cada indivíduo da amostra. A tabela bruta de dados pode ser escrita da seguinte forma: Ind. X Y Z... 1 x 1 y 1 z 1... 2 x 2 y 2 z 2.......... n 1 x n 1 y n 1 z n 1... n x n y n z n... Veja a Tabela bruta de dados do slide 9, encontre n e relacione as três primeiras variáveis das duas tabelas.

Medidas resumo para dados quantitativos As principais medidas que resumem os dados quantitativos são: Medidas de posição (localização): Média Mediana Moda Quartis (quantis) Medidas de dispersão (variabilidade): Variância Desvio-padrão Intervalo-interquartil Coeficiente de variação Cada medida pode ser calculada para dados brutos e dados agrupados.

Média para dados brutos A média amostral nos informa a localização nos dados na reta real. Considere o conjunto de dados brutos X = {x 1, x 2,..., x n }. A média amostral para este conjunto de dados é definida por x = 1 n n x i = 1 n (x 1 + x 2 +... + x n ) i=1 Calcule a média para os três conjunto de dados abaixo Ind. X Y Z 1 30 60 33 2 33 66 36 3 36 72 39 4 39 78 42 5 30 60 33

Propriedades da Média amostral Seja x a média do conjunto X = {x 1, x 2,..., x n }. Se y i = x i + b para todo i = 1,..., n, então ȳ = x + b; Se w i = ax i para todo i = 1,..., n, então w = a x Se z i = ax i + b para todo i = 1,..., n, então z = a x + b Prove os resultados acima.

Estatísticas de ordem Considere o conjunto X = {x 1, x 2,..., x n }. Ordene os dados e defina: x (1) x (2)... x (n) As quantidades x (1), x (2),..., x (n) são as estatísticas de ordem do conjunto de dados. Encontre as estatísticas de ordem para o conjunto: X = {3; 4; 6; 4; 5; 7}

Mediana A mediana também nos informa a localização nos dados na reta real. Considere o conjunto {x 1, x 2,..., x n }. A mediana é o ponto que divide o conjunto de dados ao meio, ou seja, é o ponto em que 50% das observações estão abaixo e 50% estão acima. Definimos a mediana da seguinte forma: md(x ) = x ( n+1 2 ), se n for ímpar, se n for par ( ) 1 2 x ( n 2) + x ( n +1) 2 Encontre a média e a mediana para os conjuntos de dados: {3; 4; 6; 4; 5; 7} e {3; 4; 6; 4; 5; 70}.

Variância A variância amostral nos informa qual a distância média dos dados observados em relação à média. Ou seja, é uma medida de dispersão dos dados. Considere o conjunto de dados brutos X = {x 1, x 2,..., x n }. A variância amostral para este conjunto de dados é definida por Var(X ) = 1 n n (x i x) 2. i=1 Calcule a variância para os quatro conjunto de dados abaixo Ind. X Y Z 1 30 60 33 2 33 66 36 3 36 72 39 4 39 78 42 5 30 60 33

Variância - Propriedades Seja Var(X ) a variância amostral do conjunto X = {x 1, x 2,..., x n }. Se y i = x i + b para todo i = 1,..., n, então Var(Y ) = Var(X ); Se w i = ax i para todo i = 1,..., n, então Var(W ) = a 2 Var(X ) Se z i = ax i + b para todo i = 1,..., n, então Var(Z) = a 2 Var(X ) Prove os resultados acima e compare com os resultados do slide anterior. Mostre que Var(X ) = n i=1 x 2 i n x2.

Desvio-Padrão Note que a variância modifica a unidade dos dados. Se os dados foram medidos em centímetros a variância está em centímetros quadrados. Uma medida de variabilidade que tenha a mesma unidade dos dados é o desvio-padrão que é definido pela raíz quadrada da variância: DP(X ) = Var(X ) e tem a mesma unidade de medida que os dados originais. Mostre as propriedades do desvio-padrão.

Coeficiente de variação O coeficiente de variação é medida de dispersão relativa e é definido quando a média é diferente de zero. Sua definição é dada abaixo: se x 0 CV (X ) = DP(X ) x Observe que o coeficiente de variação é adimensional. Dessa forma podemos comparar duas medidas que tenham unidades diferentes. Calcule a variância e o coeficiente de variação para os dois conjuntos de dados {101; 102; 103; 104; 105; 106; 107; 108; 109; 110} e {1; 2; 3; 4; 5; 6; 7; 8; 9; 10}

Primeiro modelo estatístico O modelo estatístico tem a seguinte fórmula DADOS = MODELO + RESÍDUO. Seja X = {x 1, x 2,..., x n } o conjunto de dados de interesse. Note que sempre é possível escrever DADOS MODELO }{{}}{{} x i = com e i = x i x. x + RESÍDUO }{{} e i para i = 1, 2,..., n Seja E = {e 1, e 2,..., e n } o conjunto de dados dos resíduos. Mostre que ē = 0 e VAR(E) = VAR(X ).

Primeiro modelo estatístico Continuação Ou seja, pode-se utilizar a média amostral para explicar o comportamento médio dos dados. o erro do modelo está relacionado com a variância dos dados. quanto menor o erro em valor absoluto, melhor será a explicação da média amostral

Média ponderada Seja X = {x 1, x 2,..., x n } o conjunto de dados de interesse. Em alguns casos é importante dar pesos diferentes para cada observação. Sejam a 1,..., a n os pesos positivos para as observações x 1,..., x n, respectivamente, então a média ponderada é definida por: em que x p = 1 A A = n a i x i i=1 n i=1 Exemplo: seja {8,5,2} o conjunto de notas na P1, P2 e P3 (provas), respectivamente. Se a P1 tem peso 1, a P2 tem peso 2 e a P3 tem peso 4, calcule a média ponderada das provas. a i

Próximos tópicos Tabelas de frequências Gráficos de barras, histogramas, ramo-e-folhas Medidas resumo para tabela de frequências