Princípios de Bioestatística Estatística Descritiva/Exploratória

Documentos relacionados
Estatística Descritiva/Exploratória

Enrico Antonio Colosimo Depto. Estatística UFMG

SS714 - Bioestatística

Medidas Descritivas de Posição, Tendência Central e Variabilidade

ESTATÍSTICA DESCRITIVA

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Estatística Aplicada

ESTATÍSTICA DESCRITIVA

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Medidas Descritivas de Posição, Tendência Central e Variabilidade

ESTATÍSTICA Medidas de Síntese

ESTATÍSTICA DESCRITIVA APLICADA NA SAÚDE. Hospital Universitário Prof. Edgard Santos UFBA Unidade de Planejamento Julho de 2016

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

Estatística Descritiva

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

Revisão de estatística descritiva

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Bioestatística. Parte I. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Elementos de Estatística

6 - Apresentação de Dados em Gráficos

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Bioestatística Aula 2

Stela Adami Vayego DEST/UFPR

Estatística para Cursos de Engenharia e Informática

MAE0219 Introdução à Probabilidade e Estatística I

Estatística Descritiva

Estatística Aplicada

Cap. 6 Medidas descritivas

ESTATÍSTICA DESCRITIVA E INDUTIVA 2EMA010

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 1-BIOESTATÍSTICA II (CE020)

1 Estatística Descritiva

Estatística Descritiva

Importância prática do desvio padrão. Obs. Para uma distribuição normal.

Aula 2 Planejamento e Análise de Experimentos

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Estatística Descritiva

Representação de dados

Estatística Descritiva (I)

INTRODUÇÃO À ESTATÍSTICA

Capítulo 1. Análise Exploratória de Dados

Revisão de estatística descritiva

Distribuição de Frequência de Variáveis Qualitativas e Quantitativas Discretas (Tabelas e Gráficos)

Estatística Descritiva

Aula 4: Medidas Resumo

MAE0219 Introdução à Probabilidade e Estatística I

Estatística Descritiva

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Estatística Descritiva

PARTE 1. Profa. Dra. Alessandra de Ávila Montini

Organização Descrição Quantificação de variabilidade Identificação de valores típicos e atípicos

Distribuição de frequências:

Estatística Descritiva (II)

Elementos de Estatística

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Introdução à análise exploratória de dados

Estatística Descritiva (I)

Lista de Exercícios Cap. 2

Estatística Descritiva

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

Estatística Descritiva

SCC0173 Mineração de Dados Biológicos

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

Análise Descritiva de Dados

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Ensino de Estatística. Tratamento da Informação. Ensino de Estatística Profs. L. Bessegato e R. Bastos Estatística/ UFJF 1.

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

Estatística Aplicada

Estatítica Descritiva e Exploratória

Estatística Descritiva (I)

MAE116 Farmácia Estatística Descritiva (I)

Estatística descritiva básica: Medidas de tendência central

MAE116 Noções de Estatística

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA

TIPOS DE VARIÁVEIS E RESUMO DE DADOS

Tutorial para o desenvolvimento das Oficinas

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

N o. Grau de Instrução 2 0 grau. No de filhos -

Conceito de Estatística

Técnicas Computacionais em Probabilidade e Estatística I. Aula III

TIPOS DE VARIÁVEIS E RESUMO DE DADOS

ORGANIZAÇÃO E DESCRIÇÃO DE DADOS

20 Sidia M. Callegari-Jacques

Medidas Separatrizes

IFF FLUMINENSE CST EM MANUTENÇÃO INDUSTRIAL

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

Estatística Básica. PhD. Wagner Hugo Bonat 1/2017. Universidade Federal do Paraná. Bonat, W. H. (LEG/UFPR) 1/ / 18

u unidades elementares, i = 1, 2,..., N.

Transcrição:

1/31 Princípios de Bioestatística Estatística Descritiva/Exploratória Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Depto. Estatística - ICEx - UFMG

2/31 Descrição de Dados Variável: característica de interesse Variáveis: desfecho/resposta e covariáveis

3/31 Definições Variáveis quantitativas discretas: podem ser vistas como resultantes de contagens, assumindo assim, em geral, valores inteiros. Ex: número de ovos de um parasita por volume de fezes. Variáveis quantitativas numéricas: assumem valores em um intervalo de números e, geralmente, são provenientes de uma escala numérica. Ex.: peso, altura, glicemia, etc

4/31 Examinando descritivamente variáveis 1. Univariada: uma única variável é examinada por indivíduo. 2. Bivariada: duas variáveis são examinadas por indivíduo. 3. Multivariada: mais de duas variáveis são examinadas por indivíduo.

5/31 Construção do Banco de Dados 1. Planilha ou Banco de Dados. 2. Tantas linhas quanto indivíduos (tamanho da amostra). 3. Tantas colunas quanto variáveis medidas.

6/31 Exemplo: Base de Dados id Nível.Educ. Peso(Kg) Altura(cm) Idade Fumante Gênero 1 1 52 152 40 0 0 2 3 46 160 47 0 0 3 2 89 168 53 0 1 4 1 86 173 38 1 1 5 4 61 169 52 0 0 6 4 87 170 50 0 1 7 1 67 161 51 0 1 8 3 78 166 61 0 1 9 2 99 178 38 1 1 10 2 62 162 63 0 0... 99 1 110 198 59 0 1 100 2 77 168 48 0 1. 1:Ens.Fund.Inc. 0: Não 0: Feminino 2:Ens.Fund. 1: Sim 1: Masculino 3:Ens.Medio 4:Ens.Superior...

7/31 Análise Descritiva/Exploratória 1. Técnicas gráficas. 2. Síntese numérica.

Interpretando Gráficos 8/31

9/31 Técnicas Gráficas 1 Variáveis Qualitativas/Categóricas Barras (variável vs frequência) Disco/ Torta/ Pizza 2 Variáveis Quantitativas/Contínuas Histograma (polígono de frequência) Boxplot

10/31 Variáveis Categóricas - Tabela de Frequência Variável n i f i fac valor 1 valor 2. Total n 1 Nível Educacional n i f i fac Ens.Fund.Inc 44 0,44 0,44 Ens.Fund 25 0,25 0,69 Ens.Médio 20 0,20 0,89 Ens.Superior 11 0,11 1 Total 100 1

Categórica Ordinal: Nível Educacional 11/31

12/31 Variável Numérica: Peso (kg) Dividir em classes: Quantas? (n)? Tamanho das classes: xmax x min k k representa o numero de classes. Diferentes softwares vão apresentar diferentes histogramas. x max = 110 x min = 40 Obs. Gráfico típico de mistura de distribuições (mulher e homem)

Variável Numérica: Peso (kg) 13/31

14/31 Gráficos Bivariados 1. Tabela de Contingência Gênero Homem Mulher Total Não 48 (92%) 36 (75%) 84 Fumante Sim 4 (8%) 12 (25%) 16 Total 52 48 100

15/31 Gráficos Bivariados Gráfico de Dispersão

16/31 Síntese Numérica Medidas de Posição (Tendência Central) 1.1 Média amostral (x): Sejam x 1, x 2,...x n observaccões da variável X: x = x 1 + x 2 +... + x n n = soma de todas tamanho amostra 1.2 Mediana (md): Valor que ocupa a posição central dos dados ordenados. 1.3 Moda (mo): Valor de maior frequência dos dados.

Me dia vs Mediana 17/31

18/31 Medidas de Dispersão 1. Amplitude: Diferença entre o maior e menor valor do conjunto de dados: 2. Desvio-Padrão Amplitude(Amp) = maior menor s = 1 Exemplo: Dados 1:{5, 7, 9, 11, 13} Dados 2:{1, 5, 9, 13, 19} x 1 = x 2 = 9 (mesma média) s 1 = 3, 2 Amp 1 = 8 s 2 = 7, 0 Amp 2 = 18 (x 1 x) 2 +... + (x n x) 2 n 1

19/31 Percentis e Quartis 1 Percentil: O percentil de ordem 100p% de um conjunto de valores em ordem crescente é um valor tal que (100p)% das observações são menores ou iguais a ele e 100(1-p)% são maiores ou igual a ele. 2 Quartis: Os percentis de ordem 25, 50 e 75 são chamados quartis. São representados por Q 1, Q 2 (mediana) e Q 3. OBS.: Q 1 deixa pelo menos 25% dos dados abaixo dele e pelo menos 75% dos dados acima dele.

20/31 Exemplos: Percentis e Quartis Dados: 1,2,3,4,5,6,7,8,9,10 Encontrar: P 10, P 25 Exercício: P 50, P 75 = Q 3 P 10 : Verdadeiro: qualquer valor entre 1 e 2. np=10x(0,1)=1 Software:11x(0,1)=1,1 P 25 : Verdadeiro: 3 np=10x(0,25)=2,5 3 Software:11x(0,25)=2,75

21/31 Síntese Numérica: Peso (kg) Estatística Geral Feminino Masculino Máximo 110,00 66,00 110,00 Q 3 79,25 55,25 87,00 Média 65,35 50,83 81,08 Mediana 62,50 50,50 80,00 Q 1 50,00 46,00 75,00 Mínimo 40,00 40,00 62,00 Desvio-Padrão 17,24 6,73 9,52 Amplitude 70,00 26,00 48,00

Síntese Numérica 22/31

23/31 Construção do Box-Plot É um gráfico que apresenta simultaneamente várias características de dados: locação, dispersão, simetria e presença de observações discrepantes ( outliers)

Comparação de Grupos 24/31

25/31 Valores atípicos ou outliers Valores diferentes dos demais. Fonte de preocupação. Possíveis Causas: Leitura, anotação ou transcrição incorreta dos dados. Erro na execução do experimento ou na tomada da medida. Mudanças não controláveis nas condições experimentais ou dos pacientes. Características inerentes à variável estudada (Ex.: Grande instabilidade do que está sendo medido).

26/31 Ogiva - Frequência Acumulada Ogiva: gráfico de frequências acumuladas. Ogiva é construída a partir de uma tabela de frequência. Usualmente, a mesma tabela de frequências utilizada para a construção do histograma. A partir da ogiva é possível calcular graficamente os percentis.

27/31 Ogiva - Tabela de Frequências - Peso Classes Freq. Freq.% Freq. Acum. Freq. Acum.% [40, 50) 24 24 24 24 [50, 60) 23 23 47 47 [60, 70) 9 9 56 56 [70, 80) 19 19 75 75 [80, 90) 17 17 92 92 [90, 100) 7 7 99 99 [100, 110] 1 1 100 100

28/31 Ogiva - Frequência Acumulada Porcentagem acumulada 0 20 40 60 80 100 40 50 60 70 80 90 100 Peso (kgs)

Exemplo 1 Deseja-se comparar três técnicas cirúrgicas para a extração de dente siso. Cada uma das técnicas foi aplicada em 20 pacientes e os resultados são apresentados a seguir: Qual é a impressão inicial ao se comparar estas técnicas cirúrgicas? 29/31

30/31 Exemplo 2 Suponha que duas empresas desejam empregá-lo e após considerar as vantagens de cada uma você escolha aquela que lhe paga melhor. Após certa pesquisa, você consegue a distribuição de salário das empresas dadas segundo os gráficos abaixo. Com base nas informações de cada gráfico, qual seria a sua decisão?

31/31 Comando do R # Lendo os dados bd = read.table(file= /BancoDados.txt, dec=,, header=true, sep= ; ) # Gráfico de barras barplot(table(bd$nivel educ), main= Nível Educacional, ylab= Frequência ) # Gráfico de pizza pie(table(bd$nivel educ), main= Nível Educacional, col= gray( c(1, 0.75, 0.5, 0.25)) ) # Histograma hist(bd$ peso, xlab= Peso (Kg), ylab= Frequência, main= Histograma ) # Boxplot boxplot(bd$peso, main= Peso (Kg) ) # Medidas descritivas summary(bd$peso) quantile(bd$peso) sd(bd$peso) # Tabela de Contingência addmargins(table(bd$fumante, bd$genero)) # Gráfico de Dispersão plot(bd$ altura, bd$ peso, xlab= Altura, ylab= Peso, main= Peso vs Altura ) # Boxplot que compara duas classes/fatores (tratamentos) droga1 = read.table(file= /droga1.txt, dec=,, header=true, sep= ; ) names(droga1) = c( trat, exp ) droga1$trat = as.factor(droga1$trat) droga1$exp = as.numeric(droga1$exp) boxplot(exp trat, data=droga1, main= Droga 01 )