Estatística-2018/2. Turma: Geografia

Documentos relacionados
Estatística-2017/2 aula de 14/08 TURMA: IGA

ESTATÍSTICA PARA GEOGRAFIA AULA DE 23/08/2017

Aula 4: Medidas Resumo

ESTATÍSTICA COMPUTACIONAL AULA 5 ASSIMETRIA E CURTOSE

Elementos de Estatística

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Estatística Descritiva

Estatística Descritiva

Aula 4. Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro

MAE0219 Introdução à Probabilidade e Estatística I

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Estatística Descritiva

Importância prática do desvio padrão. Obs. Para uma distribuição normal.

Lista de Exercícios Cap. 2

REPRESENTAÇÃO GRÁFICA E INTERPRETAÇÃO DE DADOS

AULA 5 MEDIDAS DESCRITIVAS DOCENTE: CIRA SOUZA PITOMBO

Amostragem Aleatória e Descrição de Dados - parte II

ESTATÍSTICA BÁSICA COM USO DO SOFTWARE R

SS714 - Bioestatística

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

Fernando de Pol Mayer

Unidade III Medidas Descritivas

Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

MAE0219 Introdução à Probabilidade e Estatística I

SCC0173 Mineração de Dados Biológicos

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano

Resumo para iniciar a trabalhar no R Lisbeth Cordani R instalar o R Rcmdr R Commander

Técnicas Computacionais em Probabilidade e Estatística I. Aula III

Seção 2.4. Valores Atípicos (Outliers), Diagramas de Caixa (Boxplots), e Relações Quantitativas / Categóricas

Estatística Descritiva

Bioestatística Aula 2

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Unidade III Medidas Descritivas

Módulo VII: Estatística elementar

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Gabarito - Lista 1. x i = 19, 01 (1) x = 1 15

Prof. Lorí Viali, Dr.

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Introdução à Estatística Estatística Descritiva 22

Apresentação Caule e Folha. Exemplo. Ramo e Folha. Análise Exploratória de Dados

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

Cap. 6 Medidas descritivas

Descrevendo Distribuições com Números TADI

Estatística Aplicada a Negócios

AULA 02 Distribuição de probabilidade normal

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

Importação e Exportação de dados

1. Registou-se o número de assoalhadas de 100 apartamentos vendidos num bairro residencial

AULA 1 - LABORATÓRIO EST 0002/ EST 0003

Estatística Descritiva (II)

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

Stela Adami Vayego DEST/UFPR

Estatística Descritiva (II)

Estatística Amostral Medidas Descritivas MÉDIA - MEDIANA - MODA - QUANTIS

Aula 2: Tipos de variáveis

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

x n 3.3. Medidas descritiva de variáveis quantitativas: Medidas de Posição: Considere uma amostra com n observações: x 1, x 2,..., x n.

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

Princípios de Bioestatística Estatística Descritiva/Exploratória

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Introdução à probabilidade e estatística I

ESTATÍSTICA DESCRITIVA

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

AGA Análise de Dados em Astronomia I. 1. Introdução

Tutorial para o desenvolvimento das Oficinas

ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

(Q1 CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças.

Capítulo 2 Resumindo Dados e Gráficos. Seção 2-1 Visão Geral. Visão Geral Características Importantes dos Dados

Medidas de Posição ou Tendência Central

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Revisão de estatística descritiva

Encontre o conjunto solução de cada uma das inequações a seguir: 6 x

Importação e Exportação de dados

Figura 3.42 Resultados das medidas de tendência central.

SME0320 Estatistica ICMC-USP Ricardo Ehlers Lista 1

Seção 2.1. Distribuições de freqüência e seus gráficos

SME0123 Estatistica ICMC-USP Ricardo Ehlers Lista 1

Análise Descritiva de Dados

TRATAMENTO DA INFORMAÇÃO/ANÁLISE DE DADOS AULA 10. Universidade Federal Fluminense

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Medidas de Tendência Central

Princípios de Bioestatística Aula 4 Análise Descritiva Medidas de Posição: Percentis e Escores Padronizados Box-plot

Lista 8 - Introdução à Probabilidade e Estatística

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Estatística Descritiva

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Capítulo 1. Análise Exploratória de Dados

Aula 2: Resumo de Dados

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

MAE Introdução à Probabilidade e Estatística I 2 o semestre de 2017 Gabarito da Lista de Exercícios 2 - Estatística Descritiva II - CASA

ESTATÍSTICA. Ana Paula Fernandes - FAMAT/UFU

Estatística para Cursos de Engenharia e Informática

Estatística 1. Resumo Teórico

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Transcrição:

Estatística-2018/2 Turma: Geografia

Objetivos da aula Mostrar como o usar o R para: calcular medidas de posição e dispersão de um conjunto de dados; construir um boxplot.

Determinação dos quantis de uma distribuição usando o R A função apropriada do R para obter os quantis de uma distribuição é a função quantile. Se x é o vetor contendo os dados, e desejamos determinar os três quartis, digitamos quantile(x,c(0.25,0.5,0.75)) Se desejamos o quinto (5%) e o nonagésimoquinto (95%) percentis, pedimos quantile(x,c(0.05,0.95)) Em geral, q(p) quantile(x,p)

Exemplo dos salários: dados=read.table( E:\\geografia\\ciaMB.txt,header=T) # calculando os quartis quantile(dados$sal, c(0.25,0.5,0.75)) 25% 50% 75% 7.5525 10.1650 14.0600 Pedindo a saída com duas casas decimais round(quantile(dados$sal,c(0.25,0.5,0.75)),digits=2) 25% 50% 75% 7.55 10.16 14.06

Continuação do Exemplo: Esquema dos cinco números: fivenum(dados$sal) [1] 4.000 7.515 10.165 14.270 23.300 mean(dados$sal) # média [1] 11.12222 median(dados$sal) #mediana [1] 10.165 max(dados$sal) # máximo [1] 23.3 min(dados$sal) #mínimo [1] 4

Exemplo 1: Emissão de Dióxido de Carbono Os dados no arquivo dados13bm.txt fornecem emissões de dióxido de carbono "per capita", para uma amostra de 72 países. Os dados são do ano de 1995. Fonte: Stabilizing The Atmosphere: Population, Consumption and Greenhouse Gases.

Comando para ler o arquivo dados=read.table( c:\\flavia\\dados13bm.txt,header=t) # na primeira coluna está o nome do país e, na segunda, o dado sobre emissão do país.

Exemplo 1: Emissão de Dióxido de Carbono (cont.) Determine os três quartis, os decis, a média e o desvio-padrão das emissões registradas para os 72 países em 1995.

Exemplo 1: Emissão de Dióxido de Carbono (cont.) names(dados) # nomes atribuídos as duas colunas do conjunto de dados "pais" "emissao" quantile(dados$emissao,c(0.25,0.5,0.75)) # comando para retornar os quantis de 25%, 50% e 75%, os três quartis. 25% 50% 75% 0.0675 0.4150 1.4725

Exemplo 1: Emissão de Dióxido de Carbono (cont.) quantile(dados$emissao,c(.1,.2,.3,.4,.5,.6,.7,.8,.9)) # comando para retornar os 9 decis, a saber, 10%, 20%,..., 90%. 10% 20% 30% 40% 50% 60% 70% 80% 90% 0.02 0.05 0.14 0.28 0.42 0.87 1.26 1.99 3.02 Observe que nessa lista os valores estão arredondados com duas casas decimais.

Exemplo 1: Emissão de Dióxido de Carbono (cont.) > mean(dados$emissao) # retorna a média de emissões [1] 1.174167 > var(dados$emissao) # retorna a variância 2.853036 > sd(dados$emissao) #retorna o desvio padrão de emissões [1] 1.689093 median(dados$emissao) # retorna a mediana de emissões [1] 0.415

Exemplo 1: Emissão de Dióxido de Carbono (cont.) > round(mean(dados$emissao),digit=2) # retorna a média de emissões com duas casas decimais [1] 1.17 > round(sd(dados$emissao),digit=2) #retorna o desvio padrão de emissões com duas casas decimais [1] 1.69

Histograma das emissões Observe que a distribuição de frequências de dados sobre emissão apresenta forte assimetria positiva Observe também que há uma classe sem representantes nessa distribuição

Histograma das emissões: sugerindo 10 intervalos: (0,0.33,0.67,1,1.33,1.67,2,3,4,6,10) Observe que nesse histograma os intervalos têm comprimentos diferentes. Nesse caso devemos usar a escala de densidade de frequência dada pela razão da frequência com o comprimento do intervalo.

Observe que nessa figura tem-se Q2-Q1<Q3-Q2 Q2-x(1)<<x(n)-Q2 Q1-x(1)<<x(n)-Q3

Esquema dos cinco números É uma lista de informações da distribuição que inclui cinco medidas, a saber, x (1), Q1, Q2, Q3 e x (n). Estes cinco valores são importantes para se ter uma boa ideia da assimetria dos dados.

Esquema dos cinco números Para uma distribuição simétrica ou aproximadamente simétrica, deveríamos ter: (a) Q2- x (1) x (n) -Q2; (b) Q2-Q1 Q3-Q2; (c) Q1- x (1) x (n) -Q3;

Comandos summary() e fivenum() O R possui uma função que retorna as informações do esquema dos cinco números: fivenum(x), se x é o vetor que contém os dados. Exemplo: x<-c(1,1,1,2,2,2,2,3,3,3,4,4,4,5,5,6,7,8,9,10) fivenum(x) [1] 1.0 2.0 3.5 5.5 10.0

Comandos summary() e fivenum() summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 2.00 3.50 4.10 5.25 10.00 O comando summary(x), quando x é um vetor numérico, produz as informações do esquema dos cinco números e a média.

Desenho Esquemático (Box Plots) A informação contida no esquema dos cinco números pode ser traduzida graficamente num diagrama, conhecido como box plot. A figura a seguir, ilustra o boxplot.

Boxplot O retângulo no boxplot é traçado de tal maneira que suas bases têm alturas correspondentes aos primeiro e terceiro quartis da distribuição. O retângulo é cortado por um segmento paralelo às bases, na altura correspondente ao segundo quartil. Assim, o retângulo do boxplot correponde aos 50% valores centrais da distribuição.

Cosntruindo o boxplot Depois de desenhado o retângulo, traça-se um segmento paralelo ao eixo, partindo do ponto médio da base superior do retângulo até o maior valor observado que NÃO supera o valor de Q3+(1,5)DEQ. O mesmo é feito a partir do ponto médio da base inferior do retângulo, até o menor valor que NÃO é menor do que Q1-(1,5)DEQ.

Fechando o boxplot As observações que estiverem acima de Q3+(1,5)DEQ ou abaixo de Q1-(1,5)DEQ são chamadas pontos exteriores e representadas por asteriscos. Essa observações destoantes das demais podem ser o que chamamos de outliers ou valores atípicos.

Observações Não necessariamente haverá a presença de pontos exteriores num boxplot. Quando for este o caso, o esquema terá a seguinte aparência:

A função boxplot no R Experimente pedir ao R para construir um boxplot dos dados sobre emissões de dióxido de carbono: boxplot(dados$emissao)

Alguns argumentos da função boxplot Observação: é possível construir vários boxplots na mesma função. boxwex: controla a largura dos retângulos no boxplot. O default é 0.8. outline: valor lógico. Se T, os pontos exteriores são assinalados (default). Se F, os pontos exteriores não são assinalados

Exemplo 2 Vamos trabalhar com os dados sobre salários para diferentes profissões/formações do conjunto dados6bm.txt. dados<-read.table( c:\\flavia\\dados6bm.txt,header=t) Há quatro profissões diferentes, a saber, nivelmedio, mecanico, administrador, engeletrico. boxplot(dados[,2],dados[,3],dados[,4],dados[,5],names=c( nivel medio, mecanico, administrador, eng.eletrico ))

1 nível médio 2 mecânico 3 administrador 4 Eng. Elétrico

Cores col - cor de preenchimento dos retângulos

Boxplots horizontais horizontal - valor lógico, se T o boxplot fica na posição horizontal. Se F (default) fica na posição vertical.

Outros argumentos ylim: controla a escala de valores main: título sub: sub-título names: vetor com os rótulos dos conjuntos de dados, quando são pedidos mais de um boxplot. pch: específica o caracter a ser usado nos pontos exteriores. Ex.: pch= *.

Exemplo 3 Dados sobre temperaturas médias mensais. (dados5bm.txt) Com as temperaturas médias mensais, separadas mês a mês, para cada cidade, construa boxplots para analisar o comportamento das mesmas, para cada cidade.

Boxplots das temperaturas mensais de Ubatuba e Cananéia mês do ano mês do ano