ANÁLISE DESCRITIVA. ICB Airlane P. Alencar

Documentos relacionados
Enrico Antonio Colosimo Depto. Estatística UFMG

Unidade III Medidas Descritivas

Estatística Descritiva (II)

Medidas-Resumo. Tipos de Variáveis

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Estatítica Descritiva e Exploratória

SS714 - Bioestatística

Cap. 6 Medidas descritivas

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Estatística Descritiva

Estatística Descritiva

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

Estatística Descritiva

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Princípios de Bioestatística Estatística Descritiva/Exploratória

Estatística Descritiva (I)

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

Estatística Descritiva (II)

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Estatística Descritiva (I)

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Estatística Descritiva/Exploratória

Estatística Descritiva

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Técnicas Computacionais em Probabilidade e Estatística I. Aula III

Domingo Braile FAMERP & UNICAMP

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Estatística Descritiva (I)

Medidas de dispersão. 23 de agosto de 2018

Estatística Descritiva (I)

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PONTA GROSSA METROLOGIA II

Adilson Cunha Rusteiko

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Estatística Descritiva

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Estatística descritiva

Conceitos básicos Revisão de estatística descritiva

Representação de dados

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

ESTATÍSTICA BÁSICA COM USO DO SOFTWARE R

Aula 2 Planejamento e Análise de Experimentos

Introdução à Probabilidade e Estatística I

MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor

INTRODUÇÃO À ESTATÍSTICA: Medidas de Tendência Central e Medidas de Dispersão. Prof. Dr. Guanis de Barros Vilela Junior

Noções de Estatística Airlane P. Alencar LANE

MAE116 Farmácia Estatística Descritiva (I)

Estatística para Cursos de Engenharia e Informática

Estatística Descritiva

MAE116 Noções de Estatística

ESTATÍSTICA DESCRITIVA

Análise descritiva de Dados. A todo instante do nosso dia-a-dia nos deparamos com dados.

Estatística Básica. Profa. Andreza Palma

1 Estatística Descritiva

Estatística Descritiva

Distribuição de frequências:

ORGANIZAÇÃO E DESCRIÇÃO DE DADOS

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Estatística Aplicada

Apontamentos de Introdução às Probabilidades e à Estatística

Grupo A - 1 semestre de 2012 Lista de exercícios 1 - Introdução à Estatística Descritiva C A S A (gabarito)

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

* Descrição: organização, resumo, apresentação e interpretação de dados (tabelas, gráficos e sumários estatísticos, de posição e de dispersão)

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

AULA 1 - LABORATÓRIO EST 0002/ EST 0003

ESTATÍSTICA PARA GEOGRAFIA AULA DE 23/08/2017

ESTATÍSTICA E. Prof Paulo Renato A. Firmino. Aulas

Estatística Aplicada

ESTATÍSTICA: UMA RÁPIDA ABORDAGEM Prof. David B.

MEDIDAS DE TENDÊNCIA CENTRAL

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Estatística Descritiva II

Conceito de Estatística

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

CAD. 8 SETOR A AULAS 45-48

ESTATÍSTICA DESCRITIVA

ESTATÍSTICA DESCRITIVA APLICADA NA SAÚDE. Hospital Universitário Prof. Edgard Santos UFBA Unidade de Planejamento Julho de 2016

Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo.

(tabelas, gráficos e sumários estatísticos, de posição e de dispersão)

Estatística Descritiva

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

Bioestatística Básica

IFF FLUMINENSE CST EM MANUTENÇÃO INDUSTRIAL

Bioestatística. Parte I. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

MAE Introdução à Probabilidade e Estatística I 1 o semestre de 2014 Gabarito da lista de exercícios 1 - Estatística descritiva I - CASA

Estatística Descritiva

Tutorial para o desenvolvimento das Oficinas

Introdução à estatística. Prof. Anderson Rodrigo da Silva

SCC0173 Mineração de Dados Biológicos

Estatística

2. Estatística Descritiva

Estatística Descritiva

Capítulo 1. Análise Exploratória de Dados

Transcrição:

ANÁLISE DESCRITIVA ICB Airlane P. Alencar

Banco de dados http://biostat.mc.vanderbilt.edu/wiki/main/datasets Diabetes These data are courtesy of Dr John Schorling, Department of Medicine, University of Virginia School of Medicine. 19 variables on 403 subjects from 1046 subjects who were interviewed in a study to understand the prevalence of obesity, diabetes, and other cardiovascular risk factors in central Virginia for African Americans. According to Dr John Hong, Diabetes Mellitus Type II (adult onset diabetes) is associated most strongly with obesity. The waist/hip ratio may be a predictor in diabetes and heart disease. DM II is also associated with hypertension - they may both be part of "Syndrome X". The 403 subjects were the ones who were actually screened for diabetes. Glycosolated hemoglobin > 7.0 is usually taken as a positive diagnosis of diabetes. Willems JP, Saunders JT, DE Hunt, JB Schorling: Prevalence of coronary heart disease risk factors among rural blacks: A community-based study. Southern Medical Journal 90:814-820; 1997 Schorling JB, Roach J, Siegel M, Baturka N, Hunt DE, Guterbock TM, Stewart HL: A trial of church-based smoking cessation interventions for rural African Americans. Preventive Medicine 26:92-101; 1997

Diabetes Name Labels Units Levels Storage NAs id Subject ID double 0 chol Total Cholesterol double 1 stab.glu Stabilized Glucose double 0 hdl High Density Lipoprotein double 1 ratio Cholesterol/HDL Ratio double 1 glyhb Glycosolated Hemoglobin double 13 location 2 integer 0 age years double 0 gender 2 integer 0 height inches double 5 weight pounds double 1 frame 3 integer 12 bp.1s First Systolic Blood Pressure double 5 bp.1d First Diastolic Blood Pressure double 5 bp.2s Second Systolic Blood Pressure double 262 bp.2d Second Diastolic Blood Pressure double 262 waist inches double 2 hip inches double 2 time.ppn Postprandial Time when Labs were Drawn minutes double 3

Tipos de variáveis Quantitativas: numéricas Discretas: número de filhos Contínuas: renda, concentração de alguma substância Qualitativas ou categóricas ( s/n ) Nominal: estado civil, sexo, presença de diabetes Ordinal: grau de instrução, dor forte, moderada ou fraca

Medidas resumo para as variáveis quantitativas Média y = n i=1 n y i = y 1 + + y n n Mediana (md): metade das observações são menores que md e metade são maiores que md Ordeno todos os valores e encontro a observação central Ex: 2, 2, 4, 5, 8 => Md=4 pega valor na posição (1+5)/2=3 1, 3, 5, 7, 7, 9 => Md=(5+7)/2=6 posição (1+6)/2=3,5 Moda: é o valor mais frequente na amostra

Percentis O valor px tal que x% das observações são menores que ele é denominado percentil x%. O percentil 25%, também chamado de primeiro quartil, deixa ¼ das observações abaixo dele. P25=Q1= (79+81)/2=80 ¼ dos pacientes tem glicose abaixo de 80. A mediana é o percentil 50% =88. i glicose ordenado 1 82 75 2 97 75 3 92 76 4 93 78 5 90 79 6 94 81 7 92 82 8 75 82 9 87 83 10 89 87 11 82 89 12 128 90 13 75 92 14 79 92 15 76 93 16 83 94 17 78 97 18 112 112 19 81 128 20 206 206

Medidas de variabilidade Variância amostral Nos dados dos 20 pacientes, a glicose média é 94,55 e a variância amostral é 854,26. Desvio Padrão= raiz quadrada da variância dp= s= 9.7

Medidas de variabilidade Amplitude= Máximo Mínimo Amplitude interquartílica= Q3-Q1 Amplitude= 206-75 Amplitude interquartílica=93,5-80=13,5 i glicose ordenado 1 82 75 2 97 75 3 92 76 4 93 78 5 90 79 6 94 81 7 92 82 8 75 82 9 87 83 10 89 87 11 82 89 12 128 90 13 75 92 14 79 92 15 76 93 16 83 94 17 78 97 18 112 112 19 81 128 20 206 206

Desvio e Erro Padrão Desvio Padrão Erro Padrão s ep 2 s s Qual a diferença? n O erro padrão corresponde ao desvio padrão da média amostral. Ex: dp= s= 9.7 e o ep=2,17

Boxplot Q1=80; Q2=Md=85; Q3=93,5 Vamos usar o R também. i glicose ordenado 1 82 75 2 97 75 3 92 76 4 93 78 5 90 79 6 94 81 7 92 82 8 75 82 9 87 83 10 89 87 11 82 89 12 128 90 13 75 92 14 79 92 15 76 93 16 83 94 17 78 97 18 112 112 19 81 128 20 206 206

Frequency 0 20 40 60 80 Histograma Gráfico de colunas justapostas Definir Número de intervalos Sugestão: Sturges: k=1+ln 2 n Altera até ficar adequado Construir tabela de frequências Ex: Diabetes- Peso n=402 k=9.7 No R, hist() Histogram of d$weight 100 150 200 250 300 350 d$weight

Frequency 0 20 40 60 80 100 Histograma Posso definir os valores dos intervalos hist(d$weight, breaks=seq(75,350,25)) Histogram of d$weight Contagens 100 150 200 250 300 350 d$weight 2 25 39 76 93 71 43 22 15 8 5 2 1 2 27 66 142 235 306 349 371 386 394 399 401 402

Frequency 0 20 40 60 80 100 Cálculo de quantis em histograma Tabela Lim.Inf 75 100 125 150 175 200 225 250 275 300 325 350 375 freq. 2 25 39 76 93 71 43 22 15 8 5 2 1 freq.acum. 2 27 66 142 235 306 349 371 386 394 399 401 402 Histogram of d$weight 100 150 200 250 300 350 d$weight

Dados glicose população de N=10000 https://www.ime.usp.br/~lane/home/mae0261/medias.r

Tabelas Vale a pena fazer tabelas e gráficos dinâmicos na planilha eletrônica. Frequências absolutas e relativas

Programa R www.r-project.org Instalar library(rcmdr) Usar os dados de glicose para fazer tabelas de frequências, boxplots e histogramas.

Alguns comandos d= read.csv("c:/2017/mae0261/dados/diabetes.csv", sep=";") names(d) hist(d$stab.glu) summary(d$stab.glu) hist(d$stab.glu, breaks=seq(0,400,25), main="histograma", xlab="glicose", ylab="frequência") boxplot(stab.glu ~ gender, data=d, ylab="glicose")