Prof. Estevam Martins

Documentos relacionados
I.1. Seleccionado um passageiro ao acaso, qual a probabilidade de ter idade no intervalo [20 a 50) anos e ser fraudulento?

Séries Temporais by Estevam Martins

Estatística descritiva

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Métodos Experimentais em Ciências Mecânicas

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

n = 25) e o elemento (pois = 19) e terá o valor 8. Verifique que antes e depois do 19 o elemento, teremos 18 elementos.

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

ANÁLISE EXPLORATÓRIA DE DADOS 2ª PARTE

Medidas resumo numéricas

Autores: Fernando Sebastião e Helena Silva


Introdução à análise estatística com SPSS. Guião nº2: Descrição de variáveis estatísticas

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Apontamentos de Introdução às Probabilidades e à Estatística

CAPÍTULO II. Descrevendo Dados: análise inicial dos dados

Distribuição de frequências:

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza

Estatística Aplicada a Negócios

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Estatística Descritiva

Medidas de Posição ou Tendência Central

ASSIMETRIA E CURTOSE

Prof. Lorí Viali, Dr.

Prof. Dr. Engenharia Ambiental, UNESP

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. PUCRS Prof. Titular da FAMAT - Departamento de Estatística. Curso: Engenharia de Produção

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

Estatística para Cursos de Engenharia e Informática

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PONTA GROSSA METROLOGIA II

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

IFF FLUMINENSE CST EM MANUTENÇÃO INDUSTRIAL

INTRODUÇÃO À ESTATÍSTICA

APONTAMENTOS DE SPSS

Construção da base de dados

PLANO DE ENSINO E APRENDIZAGEM

CURSO BÁSICO SPSS Rosangela A. B. Assumpção 2008

AULA 5 MEDIDAS DESCRITIVAS DOCENTE: CIRA SOUZA PITOMBO

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

Unidade III Medidas Descritivas

ASSIMETRIA E CURTOSE

Universidade Federal da Bahia Programa de Pós Graduação em Engenharia Elétrica

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

PARTE 1. Profa. Dra. Alessandra de Ávila Montini

Importância da estatística 17. O que é a Estatística? 18

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

PLANO DE ENSINO. Disciplina: Estatística e Probabilidade Carga Horária: 40h Período: 1º. Ementa

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Representação de dados

Estatística Aplicada

Cap. 6 Medidas descritivas

Estatística Descritiva

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

Introdução ao SPSS 17.0

Unidade II ESTATÍSTICA. Prof. Celso Guidugli

MEDIDAS DE TENDÊNCIA CENTRAL

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

Métodos Estatísticos Básicos

Aula 3 MEDIDAS DE DISPERSÃO, ASSIMETRIA E CURTOSE.

Filho, não é um bicho: chama-se Estatística!

1. Registou-se o número de assoalhadas de 100 apartamentos vendidos num bairro residencial

SS714 - Bioestatística

Exame Final de Métodos Estatísticos

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

Medidas de dispersão. 23 de agosto de 2018

APRESENTAÇÃO DO SPSS

IBM SPSS como Ferramenta de Pesquisa Quantitativa

Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo.

Introdução 5 PREFÁCIO 15

Curso de Especialização em Fisioterapia Traumato-Ortopédica / 2010 NOÇÕES DE STICA

PARTE 3- MEDIDAS DE DISPERSÃO VERSÃO: MARÇO DE 2017

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Estatística Descritiva

Intervalo de confiança. Intervalo de confiança. Inferência. Generalizar os resultados da pesquisa a todo o universo de eleitores margem de erro

ESTATÍSTICA DESCRITIVA

SCC0173 Mineração de Dados Biológicos

Inferência Estatística: Conceitos Básicos II

UNIVERSIDADE DE SÃO PAULO

Universidade de Brasília - Y Instituto de Psicologia. Programa de Pós-graduação em Psicologia Social, do Trabalho e das Organizações.

CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada

CONTEÚDOS PROGRAMÁTICOS

Ficha da Unidade Curricular (UC)

Resumo para iniciar a trabalhar no R Lisbeth Cordani R instalar o R Rcmdr R Commander

NOTAS DE AULA. Medidas Descritivas. Prof.: Idemauro Antonio Rodrigues de Lara

CURSO DE ADMINISTRAÇÃO Autorizado plea Portaria nº de 04/07/01 DOU de 09/07/01 PLANO DE CURSO

ESTATÍSTICA. na Contabilidade Parte 6. Medidas Estatísticas

ESTATÍSTICA. June 4, UFOP June 4, / 87

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Inferência Estatística: Conceitos Básicos I

Considere os portfolios X, Y e Z, abaixo, caracterizados pelas respectivas distribuições de probabilidades:

Errata. Mattos/Konrath/Azambuja Introdução à Estatística - Aplicações em Ciências Exatas 1ª Edição/2017 1ª Impressão

Medidas de localização (ou de tendência central) Média: definida como o centro de massa (ou ponto de equilíbrio) do conjunto.

Stela Adami Vayego DEST/UFPR

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d

Assimetria e Curtose

Elementos de Estatística

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

SÃO PAULO TURISMO S.A. PROCESSO SELETIVO Nº 001/2007. Cód 36 Estatístico

Apostila de estatística básica R Commander Organizador: Daniel Magalhães Lima. Autores:

Transcrição:

Análise Exploratória de Dados Prof. Estevam Martins

"O único lugar onde o sucesso vem antes do trabalho, é no dicionário" Albert Einstein

Introdução O principal objetivo de uma análise exploratória é extrair informações dos dados estabelecendo relações entre objetos e variáveis. A análise exploratória não estabelece modelos a priori, mas permite que, a partir das relações observadas nos dados, sejam levantadas hipóteses e propostos modelos.

Introdução Nesse capítulo, serão analisados quatro procedimentos para que se possa iniciar de forma adequada uma análise exploratória de um arquivo de dados: Procedimento FREQUENCIES. Procedimento DESCRIPTIVES. Procedimento EXPLORE. Procedimento CROSSTABS.

Introdução É evidente, que antes de iniciar a utilização do SPSS a fim de iniciar um processo de análise de dados, o usuário deverá carregar na memória do computador o arquivo devidamente formatado que deseja trabalhar. Para tanto, na barra de menus selecione o arquivo desejado em: File Open Data

O Procedimento FREQUENCIES O procedimento FREQUENCIES permite gerar tabelas de freqüências (contagem de casos) quer de variáveis alfanuméricas, quer de variáveis numéricas. Adicionalmente, pode calcular os parâmetros estatísticos calculados pelos procedimentos DESCRIPTIVES e EXPLORE; pode igualmente gerar histogramas, com o ajustamento a uma função de distribuição de probabilidades. Para utilizar esse procedimento deve-se escolher na barra de menu do SPSS: Analyze Descriptive Statistics Frequencies

O Procedimento FREQUENCIES

O Procedimento FREQUENCIES

O Procedimento FREQUENCIES Percentiles Values - essa opção possibilita o cálculo l dos quartis, decis e quaisquer percentis de interesse. Central Tendency - com essa opção é possível calcular a média (Mean), mediana (Median), moda (Mode) e soma (Sum).

O Procedimento FREQUENCIES Dispersion - calcula o desvio padrão (Std. deviation), variância (Variance), amplitude (Range), valor mínimo (Mimimum), valor Máximo (Maximum) e erro padrão (S.E. mean). Ditib ti ã ibilit ál l d d did d ditibiã K t i Distribution essa opção possibilita o cálculo de duas medidas de distribuição: Kurtosis e Skewness. A Kurtosis é uma medida de achatamento da distribuição enquanto Skewness é um índice que reflete a simetria da distribuição em torno de um valor central.

O Procedimento DESCRIPTIVES Este procedimento fornece as estatísticas descritivas somente para variáveis numéricas. Calcula, também, todas as estatísticas do procedimento FREQUENCIES, exceto a mediana e a moda O df default fornece as estatísticas: média, desvio padrão, dã mínimo e máximo. Para obter as estatísticas elementares de uma variável numérica, escolher na barra de menu do SPSS Analyze Descriptive Statistics Descriptives

O Procedimento DESCRIPTIVES Irá aparecer a seguinte caixa de diálogo, onde se definem as variáveis a analisar.

O Procedimento DESCRIPTIVES Para definir os parâmetros estatísticos a estimar, selecionar o botão Options, obtendo-se a seguinte caixa de diálogo:

OP Procedimento DESCRIPTIVES Mean (Média). Em sua acepção mais ampla, qualquer promédio de uma distribuição de freqüência. Em sentido estrito, média aritmética. Std. deviation (desvio padrão). Medida de dispersão ou variabilidade de um conjunto de valores. É igual à raiz quadrada da soma dos desvios ao quadrado dividida pelo número de casos. Em outras palavras, é a raiz quadrada da média dos desvios elevados ao quadrado. É evidente que quanto maior for o desvio padrão, maior será a flutuação da variável em torno da média.

O Procedimento DESCRIPTIVES Variance (variância). Desvio padrão elevado ao quadrado. É, como o desvio padrão, uma medida de dispersão. É também chamada de variança. Range (intervalo de variação). Diferença entre o limite superior real e o limite inferior real de uma classe numa distribuição de freqüências.

O Procedimento DESCRIPTIVES S.E. mean (erro padrão da média). Desvio-padrão da distribuição dos diversos valores de uma estatística, em conseqüência da flutuação das amostras. Se, de uma população, for tirada um grande número de amostras e calculadas as respectivas médias, haverá uma diferença entre cada média e a média da população. Se for computada a média de tais médias, seu desvio padrão será o erro da amostragem (a margem de erro a ser esperada toda vez que seempregar tal processo de amostragem).

O Procedimento DESCRIPTIVES Kurtosis (curtose ou achatamento). Grau de achatamento de uma distribuição. Ela é medida em relação a uma curva normalmente achatada chamada mesocúrtica. Uma curva mais achatada que ela será denominada platicúrtica e uma menos achatada (ou mais afilada), leptocúrtica. Skewness (enviesamento ou assimetria). Característica de gráficos ou de curvas em que a maioria dos valores não se concentra no meio (como acontece com a curva normal), mas em uma extremidade.

O Procedimento EXPLORE Em alguns casos o usuário se depara com a necessidade de apresentar todos os parâmetros estatísticos cujo quadro de resultados se desenvolve na vertical, sendo mais fácil, portanto, incluí-los no relatório em Word. Isso pode ser feito usando o procedimento EXPLORE.

O Procedimento EXPLORE O procedimento EXPLORE calcula os parâmetros estatísticos, elabora o gráfico caulee-folhas (steam-and-leaf) e o gráfico de extremos-e-quartis (Boxplot), útil para analisar a amostra em termos de concentração ou dispersão dos valores por intervalos quartílicos, bem como a sua simetria. Na barra de menu do SPSS escolher Analyze Descriptive Statistics Explore

O Procedimento EXPLORE Na caixa de diálogo que se segue, seleciona-se a variável a desejada de forma semelhante ao que foi feito no procedimento FREQUENCIES. No presente caso, escolhendo a variável p10 (produção) a caixa de dialogo seguinte aparecerá no monitor:

O Procedimento EXPLORE Na caixa de diálogo que se segue, seleciona-se a variável a analisar p9 (turno) para o campo Factor List:

O Procedimento CROSSTABS O procedimento CROSSTABS fornece tabelas contendo a distribuição conjunta de duas variáveis medidas numa escala nominal e que têm um número limitado de categorias distintas. Essas tabelas, conhecidas também por tabelas de contingência, são utilizadas para estudar a relação entre duas variáveis categóricas descrevendo a freqüências das categorias de uma das variáveis relativamente às categorias de outra. A distribuição de freqüências de uma variável é subdividida de acordo com os valores de uma ou mais variáveis. A célula, que é o elemento básico da tabela, é definida pela combinação dos valores de duas ou mais variáveis.

O Procedimento CROSSTABS Admitindo d um arquivo com as variáveis i p1 e p2, onde p1 representa o sexo dos respondentes e p2 a idade, no SPSS, na barra de menus escolher: Analyze Descriptive Statistics Crosstabs O usuário deve mover diversas variáveis para as listas de linhas ou colunas para obter múltiplos l cruzamentos bivariados. i Para visualizar três ou mais cruzamentos simultâneos, colocar as variáveis adicionais em camadas sucessivas (layers).

O Procedimento CROSSTABS

Conteúdo Gerado pelo Comando CROSSTABS O procedimento CROSSTABS gera tabelas ou subtabelas cruzadas cujas células contêm a freqüência absoluta, as percentagens marginais e o número de missing cases. Como foi dito anteriormente, usando o botão Cells é possível obter mais informações sobre as células, tais como:

Conteúdo Gerado pelo Comando CROSSTABS Percentagem das linhas (Row). Percentagem das colunas (Column). Percentagens total da tabela de dupla entrada (Total). Suprime a freqüência das células (Supress tables). Mostra as freqüências esperadas (Expected). Mostra os resíduos estandardizados ajustados do qui-quadrado (Residuals). Suprime todas as informações das células: l freqüências (Counts), percentagens (Percentages) e resíduos (Residuals).

Conteúdo Gerado pelo Comando CROSSTABS

Créditos FRANCISCO ESTEVAM MARTINS DE OLIVEIRA é graduado em Estatística pelo Departamento de Estatística e Matemática Aplicada (DEMA) da Universidade Federal do Ceará, pós-graduado no ensino da matemática e mestre em Engenharia de Produção pela UFSC. É autor do livro Estatística e Probabilidade 2ª Edição, 8ª tiragem editado pela Editora Atlas, SPSS Básico para Análise de Dados 1ª Edição, 1ª tiragem editado pela Editora Ciência Moderna. Atualmente é Professor Titular do Centro de Ciências Administrativas da Universidade de Fortaleza (UNIFOR), Estatístico do Instituto Fecomercio/CE de Pesquisa e Desenvolvimento do Comércio IPDC, Estatístico Ad Hoc do Instituto Fecomercio/SE de Estudos, Pesquisas e Desenvolvimento IFPD, Consultor Senior da FCDL Bahia, Estatístico Ad Hoc do Instituto Fecomercio/AL de Estudos, Pesquisas e Desenvolvimento IFEPD.