Estatítica Descritiva e Exploratória

Documentos relacionados
Medidas-Resumo. Tipos de Variáveis

Conceito de Estatística

Introdução à análise exploratória de dados

Introdução à análise exploratória de dados

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Estatística Básica. PhD. Wagner Hugo Bonat 1/2017. Universidade Federal do Paraná. Bonat, W. H. (LEG/UFPR) 1/ / 18

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Estatística Descritiva (I)

Medidas resumo. Wagner H. Bonat Elias T. Krainski Fernando P. Mayer

Estatística Descritiva (I)

Estatística Descritiva (I)

Introdução à probabilidade e à estatística II. Prof. Alexandre G Patriota Sala: 298A Site:

Estatística Descritiva

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Estatística Descritiva e Exploratória

Tutorial para o desenvolvimento das Oficinas

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Estatística. O que é Estatística? Estatística pode ser: Estatística Descritiva. Ivonete Melo de Carvalho. Conteúdo

MAE116 Farmácia Estatística Descritiva (I)

UNIVERSIDADE FEDERAL DA PARAÍBA. Variáveis Aleatórias. Departamento de Estatística Luiz Medeiros

Estatística Básica MEDIDAS RESUMO

VARIÁVEIS ALEATÓRIAS

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

Aula 4 - Medidas resumo

Comprovação Estatística de Medidas Elétricas

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Unidade III Medidas Descritivas

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

Estatística Básica. Variáveis Aleatórias Contínuas. Renato Dourado Maia. Instituto de Ciências Agrárias. Universidade Federal de Minas Gerais

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

Noções de Estatística Airlane P. Alencar LANE

Estatística 1. Resumo Teórico

Variáveis Aleatórias. Esperança e Variância. Prof. Luiz Medeiros Departamento de Estatística - UFPB

Estatística Descritiva

Métodos Quantitativos

Apontamentos de Introdução às Probabilidades e à Estatística

Introdução à Probabilidade e Estatística I

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Cap. 6 Medidas descritivas

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

DISCIPLINA: EPIDEMIOLOGIA E BIOESTATÍSTICA LICENCIATURA: ENFERMAGEM; FISIOTERAPIA

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Estatística Aplicada II. } Revisão: Probabilidade } Propriedades da Média Amostral

Introdução à estatística. Prof. Anderson Rodrigo da Silva

Prof. Francisco Crisóstomo

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Medidas Estatísticas NILO FERNANDES VARELA

Adilson Cunha Rusteiko

Estatística

Variáveis Aleatórias - VA

Introdução à Estatística Estatística Descritiva 22

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Cálculo das Probabilidades e Estatística I

Importância da estatística 17. O que é a Estatística? 18

CAD. 8 SETOR A AULAS 45-48

Amostragem Aleatória e Descrição de Dados - parte I

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Estatística Descritiva (I)

Prof. Lorí Viali, Dr.

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Elementos de Estatística. Michel H. Montoril Departamento de Estatística - UFJF

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Variáveis aleatórias

Lecture Notes Estatística. Rodrigo Leandro de Moura. 1ª versão: 10/08/2010

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 08

Probabilidade e Estatística

ESTATÍSTICA Medidas de Síntese

AULA DO CPOG. Estatística básica

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d

MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor

Profa. Lidia Rodella UFPE-CAA

VARIÁVEIS ALEATÓRIAS 1

5 TORIA ELEMENTAR DA AMOSTRAGEM

Enrico Antonio Colosimo Depto. Estatística UFMG

EELT-7035 Processos Estocásticos em Engenharia. Variáveis Aleatórias. EELT-7035 Variáveis Aleatórias Discretas. Evelio M. G.

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

CONHECIMENTOS ESPECÍFICOS

Transcrição:

Gledson Luiz Picharski e Wanderson Rodrigo Rocha 3 de Abril de 2008

Estatística Descritiva e exploratória 1 Introdução à análise exploratória de dados 2 Análise exploratória de dados: Medidas-resumo 3 Probabilidades

O que é Estatística? A Estatística é um conjunto de métodos de coleta e descrição de dados, e então a verificação da força da evidência nos dados pró ou contra certas idéias científicas.

Estatística descritiva: conjunto de técnicas destinadas a descrever e resumir dados. Probabilidade: teoria matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório. Inferência estatística: técnicas que possibilitam a extrapolação, a um grande conjunto de dados (população), dos resultados obtidos a partir de um subconjunto de valores (amostra). Note que se tivermos acesso a todos os elementos que desejamos estudar, não é necessário o uso de técnicas de inferência estatística.

População x amostra

Tipos de amostragem casual simples: Selecionamos ao acaso, com ou sem reposição, os itens da população que farão parte da amostra. Se houver informações adicionais a respeito da população de interesse, podemos utilizar outros esquemas de amostragem mais sofisticados. Amostragem estratificada: Por exemplo, se numa cidade, tivermos mais mulheres do que homens, podemos selecionar um certo número de indivíduos entre as mulheres e outro número entre homens. Amostragem sistemática: Pode existir uma relação numerada dos itens da população (uma lista de referência) que nos permite selecionar os indivíduos de forma pré-determinada, por ex de 8 em 8 ou de 10 em 10.

Organização dos dados Suponhamos que um questionário seja aplicado a alunos da Universidade fornecendo as seguintes informações: Id Turma Sexo Idade Alt Peso Filhos Fuma 1 A F 17 1.60 60.50 2 NAO 2 A F 18 1.69 55.00 1 NAO 3 A M 18 1.85 72.80 2 NAO 4 A M 25 1.85 80.90 2 NAO 5 A F 19 1.58 55.00 1 NAO 6 A M 19 1.76 60.00 3 NAO

Tipos de Variáveis VARIAVEL QUALITATIVA QUANTITATIVA NOMINAL ORDINAL DISCRETA CONTINUA

Exemplos de tabelas Idade ni fi fac 17 9 0,18 0,18 18 22 0,44 0,62 19 7 0,14 0,76 20 4 0,08 0,84 21 3 0,06 0,90 22 0 0 0,90 23 2 0,04 0,94 24 1 0,02 0,96 25 2 0,04 1,00 total n=50 1 Tabela: Frequências para Idade Peso ni fi fac 40,0-50,0 8 0,16 0,16 50,0-60,0 22 0,44 0,60 60,0-70,0 8 0,16 0,76 70,0-80,0 6 0,12 0,88 80,0-90,0 5 0,10 0,98 90,0-100,0 1 0,02 1,00 total 50 1 Tabela: Freqüências para Peso

Exemplos de Gráficos Gráfico de setores Histograma Boxplot Apple Cherry Blueberry Vanilla Cream Other Boston Cream Frequency 0 50 100 150 4 2 0 2 4 6 0 2 4 6 8 10 12 Uni05 Norm 5T Gam2

Estatística Descritiva e exploratória 1 Introdução à análise exploratória de dados 2 Análise exploratória de dados: Medidas-resumo 3 Probabilidades

Introdução Medidas resumo são técnicas que nos auxiliam a sumarizar informações disponíveis sobre o comportamento de uma variável.

Medidas de Posição para um conjunto de dados Média x obs = x 1 + x 2 +... + x n n = Σn i=1 x i n Soma dos valores que a variável assume dividida pelo número de observações. Média para conjunto de dados organizados em tabela de Frequência x obs = n 1x 1 + n 2 x 2 +... + n k x k n 1 +... + n k = Σk i=1 n ix i n Média dos k diferentes valores ponderada pelas respectivas frequências de ocorrências.

Mediana Representada por: md obs É o valor que ocupa a posição central dos dados ordenados. Coloca-se os dados em ordem crescente, se o número de elementos no conjunto de dados é ímpar selecionamos o dado central. No caso em que o número de elementos for par a mediana será a média dos dois valores que ocupam a posição central. Moda Representada por: mo obs É dada pelo valor mais frequente do conjunto de dados.

Quartis Definições: Q 1 : Valor que deixa 25% das observações ordenadas abaixo dele. Q 2 : Valor coincidente com a mediana. Q 3 : Valor que deixa 75% das observações ordenadas abaixo dele. Amplitude Interquartílica: É a diferença entre Q 3 - Q 1.

Exemplo Calcular Q 1, md obs e Q 3 a seguir: Mediana 1º Quartil 3º Quartil Densidade 0.00 0.01 0.02 0.03 0.04 0.05 16% 44% 16% 12% 10% 2% Densidade 0.00 0.01 0.02 0.03 0.04 0.05 16% 44% 16% 12% 10% 2% Densidade 0.00 0.01 0.02 0.03 0.04 0.05 16% 44% 16% 12% 10% 2% 40 50 60 70 80 90 100 40 50 60 70 80 90 100 40 50 60 70 80 90 100 Peso Assim Q 1 seria dado por: Q 1 50 0.09 = 60 50 0.44 = Q 1 = 52, 05. Peso Peso

Medidas de posição para variáveia aleatórias Discretas Valor Esperado Valor Esperado de uma variável aleatória X é dada pela expressão: kx E(X) = x i p i Outra notação possível seria µ X Mediana A mediana é o valor Md que satisfaz ás seguintes condições: P(X Md) >= 1 e P(X Md) >= 1 Em algumas situações, as 2 2 desigualdades serão satisfeitas por qualquer valor num intervalo. Moda A moda Mo será dada pelo valor que apresentar a maior probabilidade de ocorrência. i=1

Exemplo aplicado a uma Variável Aleatória X discreta Função densidade: X 2 5 8 15 20 p 0.1 0.3 0.2 0.2 0.2 Analizando a variável teremos: µ = 10, 3; Md = 8; Mo = 5.

Medidas de dispersão Apesar de muitas vezes as medidas de tendência central nos fornecerem uma idéia do comportamento da variável, precisamos de ferramentas que quantifiquem a dispersão dos valores que a variável assume. Esse é o papel das medidas de dispersão.

Amplitude dos dados A amplitude dos dados será dada pela diferença entre o maior e o menor valor do conjunto de dados, representada por. Desvio Médio Calcula-se o somatório dos desvios dos valores absolutos em relação á média. 1 n Σn i=1 x i x obs Embora seja muito útil, torna-se complicada pelas propriedades da função módulo.

Variância e desvio-padrão em um conjunto de dados. A variância referente a uma variável aleatória X em um conjunto de dados é dada por: var obs = 1 n Σn i=1 (x i x obs ) 2 ou pela expressão alternativa: var obs = 1 n Σn i=1 x 2 i x 2 obs Desvio-padrão Usado para representar a variabilidade nas mesmas unidades de medida dos nossos dados. É dado pela raiz quadrada da variância: var obs

Variância de uma va. Discreta Se X é uma variável aleatória com P(X i = x i ) i = 1, 2,..., k e média µ. Então sua variância é dada pela expressão: Ou pela expressão: Var(X) = Σ k i=1 (x i µ) 2 p i Var(X) = E(X 2 ) µ 2

Exemplo de cálculo da Variância de va. Discreta Admita que X possua a seguinte função de probabilidade: X 4 5 6 p 0.3 0.4 0.3 Então teremos µ = 5, E(X 2 ) = 25.6 e µ 2 = 25. A partir daí concluiremos que var obs = 0.6

Estatística Descritiva e exploratória 1 Introdução à análise exploratória de dados 2 Análise exploratória de dados: Medidas-resumo 3 Probabilidades

Fenômeno Aleatório São fenômenos não deterministicos, eventos que não podem ser previstos com absoluta certeza.

Fenômeno Aleatório São fenômenos não deterministicos, eventos que não podem ser previstos com absoluta certeza. Espaço amostral - Ω Conjunto de todos os eventos possiveis para um determinado experimento.

Axiomas de Probabilidade i) 0 P(A), A Ω;

Axiomas de Probabilidade i) 0 P(A), A Ω; ii) P(Ω) = 1;

Axiomas de Probabilidade i) 0 P(A), A Ω; ii) P(Ω) = 1; n n iii) P( A j ) = P(A j ), com os A j s disjuntos. j=1 j=1

P(A B) = P(A) + P(B) P(A B).

P(A B) = P(A) + P(B) P(A B). P(A B) = P(A).P(B) (Para eventos independentes).

P(A B) = P(A) + P(B) P(A B). P(A B) = P(A).P(B) (Para eventos independentes). P(A A c ) = P(A) + P(A c ).

P(A B) = P(A) + P(B) P(A B). P(A B) = P(A).P(B) (Para eventos independentes). P(A A c ) = P(A) + P(A c ). P(A B) P(A B) =, P(B) > 0. P(B)

P(A B) = P(A) + P(B) P(A B). P(A B) = P(A).P(B) (Para eventos independentes). P(A A c ) = P(A) + P(A c ). P(A B) P(A B) =, P(B) > 0. P(B) P(A) = P(A B) + P(A B c ).

Teorema de Bayes P(C j A) = j = 1, 2,..., k. P(A C j )P(C j ) k i=1 P(A C i)p(c i ),

B O A P R O V A