Multivariada de dados aplicada à administração

Documentos relacionados
Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Análise Fatorial Exploratória (AFE) Disciplina: Medidas em Psicologia Professora: Ana Carolina Rodrigues

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA

Análise estatística multivariada

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Análise Multivariada Aplicada à Contabilidade

5 Análise dos resultados

AULA 08 Correlação e Análise Fatorial

RAD5017 Estatística II Aula 2 Análise Fatorial (Conceitos Teóricos) 1. Validade (definição do conceito) x Confiabilidade (consistência da medida)

Análise de Regressão Linear Simples e

Introdução 5 PREFÁCIO 15

ÍNDICE Janelas Menus Barras de ferramentas Barra de estado Caixas de diálogo

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Gilberto Müller Beuren

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

Estimação e Testes de Hipóteses

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

Sumário. Prefácio, xix Apresentação, xxi

SCC0173 Mineração de Dados Biológicos

Métodos Quantitativos Aplicados

Mais Informações sobre Itens do Relatório

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior

Conceitos centrais em análise de dados

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

CONHECIMENTOS ESPECÍFICOS

Bioestatística Básica

Curso de Especialização em Fisioterapia Traumato-Ortopédica / 2010 NOÇÕES DE STICA

INTRODUÇÃO À ANALISE DE DADOS ESE. Prof. Paulo C. Masiero 1º. 2017

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

Análise Multivariada Aplicada à Contabilidade

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

REGRESSÃO E CORRELAÇÃO

8 JÚLIO CESAR R. PEREIRA

CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA

Bioestatística. Mestrado Saúde Materno Infantil 2005 Prof. José Eulálio Cabral Filho

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

Métodos Quantitativos para Avaliação de Políticas Públicas

Estatística II. Tópico: Análise Fatorial. Exemplo completo (Livro Corrar modificado)

Anova para medidas repetidas

Delineamento e Análise Experimental Aula 3

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo

Mario de Andrade Lira Junior

Análise de regressão linear simples. Diagrama de dispersão

Estatística aplicada ao Melhoramento animal

Estatística. Correlação e Regressão

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Análise de dados, tipos de amostras e análise multivariada

Investigação Aplicada I

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Estatística Descritiva

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros

Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Análise Multivariada Aplicada à Contabilidade

Tutorial para o desenvolvimento das Oficinas

Estudo dirigido de Análise Multivariada

Por que testes não-paramétricos?

Especialização em Engenharia de Processos e de Sistemas de Produção

Métodos de pesquisa QUANTITATIVA em Turismo. Glauber Eduardo de Oliveira Santos

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

CORRELAÇÃO E REGRESSÃO

Aplicação da análise descritiva e espacial em dados de capacidade de troca de cátions

Regression and Clinical prediction models

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Verificando as pressuposições do modelo estatístico

Mario de Andrade Lira Junior lira.pro.br\wordpress

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

17/04/2017. Tipos de dados. Primários. Secundários

MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor

1 Introdução aos Métodos Estatísticos para Geografia 1

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

ESTATÍSTICA. Tabelas e Gráficos. Elisabeti Kira - IME USP. Beti Kira (IME-USP) Estatística 18.abril.

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Capítulo 1. Análise Exploratória de Dados

Análise de Dados da Avaliação II

Renda x Vulnerabilidade Ambiental

M l u t l i t c i oli l n i e n arid i a d de

Anexo II Resolução nº 133/2003-CEPE

EXERCÍCIOS SOBRE TESTE T

1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21

Stela Adami Vayego DEST/UFPR

Correlação e Regressão Linear

Análise Multivariada Aplicada à Contabilidade

Stela Adami Vayego DEST/UFPR

9 Análise Multivariada de Dados

Métodos Quantitativos Aplicados

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Métodos Estatísticos sticos Aplicados à Engenharia de Software Experimental

1 - Noções de álgebra matricial

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

Transcrição:

Multivariada de dados aplicada à administração PROFA. DRA. LUCIANA ORANGES CEZARINO -AULA PPGAO/FEARP 2017 11 1

AGENDA 26/7 14h: Apresentações 14:15h 15:45h: Técnicas da pesquisa quantitativa : AF e Regressão 16h 18h:Start dos artigos 02/08 14h: Apresentações 14:15h 15:45h: Análise de métodos quantitativos 16h 18h: Utilização dos softwares 14h às 18h: Apresentações de seminários 2

Quem sou? Docente Fagen UFU, desde 2013 Pós-doutora pelo Politécnico de Milão 2016/2017 Mestre e Doutora pela FEA USP (2005 e 2013) Economista pela UEL; Coordenadora Capítulo Brasileiro Golden for Sustainability; Coordenadora do PRME Fagen UFU; Coordenadora Scor; Ex-consultora COHROS, Ex- gerente da Vivo, ex-consultora Sebrae, ex-professora substituta da FEARP-USP, ex-professora UNAERP (2005-2010); Autora de artigos e consultora. 3

AMD O truque da estatística multivariada, se existe, não está nos cálculos, fácil e rapidamente feitos num computador com software adequado instalado. O truque consiste em escolher o método apropriado ao tipo de dado, usá-lo corretamente, saber interpretar os resultados e retirar deles as conclusões corretas (REIS, 2001) 4

Introdução 1. Análise multivariada: conjunto de métodos estatísticos que possibilita a análise simultânea de medidas múltiplas para cada dado ou sequencia de dados; 2. Aplicado a duas ou mais variáveis; 3. Formam um único relacionamento Freitas & Moscarola, 2017 5

Tipos de variáveis QUANTITATIVAS DISCRETAS: VALORES INTEIROS; EX: número de empresas, funcionários, clientes, fornecedores CONTÍNUAS: FRACIONADAS Tempo de produção, idade, índice de rentabilidade, preços. QUALITATIVAS NOMINAIS OU CATEGÓRICAS: não apresentam ordenação: sexo, estado civil, sim ou não. ORDINAIS: possuem ordenação, Salários, escolaridade, tempo (em meses), cargos, classe social. 6

Relações entre variáveis VARIÁVEL INDEPENDENTE VARIÁVEL DEPENDENTE É aquela que é fator determinante para que ocorra um determinado resultado; é a condição ou causa para um determinado efeito ou consequência; é o estímulo que condiciona uma resposta. É aquele fator ou propriedade que é efeito, resultado, consequência ou resposta de algo que foi estimulado; não é manipulada, mas é o efeito observado como resultado da manipulação da variável independente. 7

Hipóteses Suposição que pode ser colocada à prova para determinar sua validade; pode parecer contrária, ou de acordo com o senso comum, pode ainda ser correta ou errada. Conduz a uma verificação empírica, independendo do resultado; ela é uma questão proposta de tal maneira que uma resposta de algum tipo pode estar próxima a aparecer. Karl Popper e a falseabilidade das hipóteses; H0 (hipótese nula) e H1, 2, 3, 4 (alternativas) Hipótese alternative é que o pesquisador quer comprovar Erro do tipo I: decisão de rejeitar H0 quando de fato H0 é verdadeira. Erro do tipo II: decisão de não rejeitar H0 quando de fato H0 é falsa. 8

Técnicas mais utilizadas na administração Análise Fatorial Não Independência Lógica Fuzzy MDS Clusters Há variável dependente no problema de pesquisa? Quanti Regressão Equacões Estruturais Sim Dependência Variável Quantitativa ou Qualitativa? Redes Neurais Regressao Logística Quali Discriminante 9

Estatística Descritiva N Mínimo Máximo Média Desvio-padrão 100 N número de observações; Mínimo Menor valor da base; Máximo maior valor da base; Média aritmética; Desvio-padrão dispersão da média. 10

Estatística Descritiva por gráfico Duas opções: Histograma Boxplot 11

Outliers São observações atípicas, inconsistentes com o resto da base de dados. Causas Erro de medição; Variabilidade inerente da amostra Devem ser retirados? 12

Dados perdidos Missing Values São dados ausentes causados pela falta de respostas a um questionário ou pela ausência de informações de uma base de dados. Podem ser ignorados ou uma série deve ser eliminada. Ações corretivas: Incluir atribuições medias (replace missing values) 13

Premissas da AMD 1) Normalidade 2) Homocedasticidade 3) Linearidade 14

Normalidade Significa que a base segue uma distribuição normal de dados. É a forma (física) dos dados da amostra. Normalidade pode ser individual ou multivariada Para a utilização de testes paramétricos é preciso que a amostra de dados seja normal. Para Hair Jr (1995) se a variação dos dados da normalidade é grande então os testes serão inválidos, sendo necessários os teste t e f (regressão, ANOVA, Variância etc) Teste não paramétrico mais utilizado é o Mann-Whitney Segundo Paes (2003) tem-se Wilcoxon como alternativa ao teste t pareado e Kruskall-Wallis como alternativa à ANOVA com um fator. Apesar de parecer uma solução relativamente simples, a grande desvantagem dos testes não-paramétricos é que eles tendem a ser bem menos poderosos que os paramétricos 15

Testes de normalidade Histograma com faixa de probabilidade normal; Teste KS (Kolmogorov-Smirnov) qualquer resultado abaixo de 0,005% de significância revela a não normalidade de dados Outros testes: Lilliefors (LF) que é apenas uma correção para o teste KS), Shapiro-Wilk (SW) e Shapiro- Francia (SF) Fazer testes diferentes ou eliminar variáveis não normais; Corrigir a normalidade univariada por meio da variável identidade, logarítima ou de raiz quadrada. 16

Homoscedasticidade - correto: homocedastiscidade É a suposição que há relacionamento entre as variáveis dependentes iguais, ou seja, a variância entre as variáveis dependentes é a mesma sob o domínio das independentes. Variância dos resíduos erros ( ε) é constante. Teste mais conhecido para a detecção da heteroscedasticidade é o teste de Park 17

Linearidade A linearidade mede a variação da tendência para diferentes valores de referência na faixa de interesse; A linearidade é avaliada pela inclinação da reta formada pelos diferentes valores de referência em relação a respectiva tendência. Quanto menos inclinada a reta, melhor será a qualidade do sistema de medição. Somente relações lineares são detectadas pelo coeficiente de correlação Dados não lineares 18

Linearidade Pode ser corrigido, mudando y por x ou vice-versa 19

Análise Fatorial 20

Objetivo Simplificar os dados, agrupar as variáveis em fatores altamente correlacionados; Criar índices com variáveis que medem dimensões conceituais similares ou complementares; Tipos: Exploratória: quando não temos uma idéia pré-definida da estrutura e de quantas dimensões estão presentes em um conjunto de variáveis. factor var1 var2 var3... varn Confirmatória: quando queremos testar hipóteses específicas sobre a estrutura de um número de dimensões subjacentes a um conjunto de variáveis. Por exemplo, pensamos que nossos dados possuem duas dimensões e queremos verificar isto. factor var1 var2 var3... varn, factors(#) 21

Eigenvalues e factors Cargas fatoriais (factors) são as correlações entre as variáveis originais e os fatores. Esse é um dos pontos principais da análise fatorial, quanto maior a carga fatorial maior será a correlação com determinado fator. Um valor negativo indica um impacto inverso no fator. A quantidade de cargas fatoriais é automaticamente calculada pelo Stata com base nos autovalores (iguais ou superiores a uma unidade - critério de Kaiser). Por sua vez, as cargas fatoriais relevantes são aquelas com valores maiores que 0,5. 22

Rotacão Rotação fatorial ( rotação fatorial (rotation rotation) é o processo de é o processo de manipulação ou de ajuste dos eixos fatoriais para conseguir uma solução fatorial mais simples e pragmaticamente mais significativa, cujos fatores sejam mais facilmente interpretáveis Varimax e ortogonal são as mais utilizadas Teste: O teste de Kaiser-Meyer-Olklin (KMO) varia entre 0 e 1. Quanto mais perto de 1, melhor. Friel (2009) sugere a seguinte escala para interpretar o valor da estatística KMO: * Entre 0,90 e 1: excelente. * Entre 0,80 e 0,89: bom. * Entre 0,70 e 0,79: mediano. * Entre 0,60 e 0,69: medíocre. * Entre 0,50 e 0,59: ruim. * Entre 0 e 0,49: inadequado. Pallant (2007) sugere 0,60 como um limite razoável. Hair et al. (2006) sugerem 0,50 como patamar aceitável. 23

Resultados da AF Matriz de Correlação são as possíveis correlações de Pearson entre as variáveis Os valores da diagonal principal é igual a um, devido à perfeita correlação entre as mesmas variáveis 24

Resultados da AF Na apresentação as correções são espelhadas As correlações nestes casos são relativamente fracas, próximas de Zero. Como nestes casos, você deve reconsiderar o uso do método de análise fatorial com os seus dados. 25

Muitos deste valores devem ser pequenos para o emprego do método de análise fatorial. Estes valores representam a significância do teste de correlação de Pearson (quanto ficou de fora). Estes p-values da testagem indicam quais são as correspondências são diferente de zero.

Deve-se analisar o valor do determinante da matriz de correlação. Este indica a possibilidade de inversão da matriz. Se o valor do determinante é zero, a matriz de correlação não pode ser invertida e certamente os métodos de extração de análise fatorial serão impossíveis de serem computados.

ce Análise de Variância f es Caoaoa 95908 1 37320 2 269240 3 43454 4 25 46 87 28 09 91 81 31 41 71 01 Ex 28

Matriz de rotação mp a VARIMAX po 1234 6 m 7 e 2 e a 3 p 2 p 1 p 3 e a 5 p n 05 p 69 a o 9 ju 5 p 93 p 6 t q 9 o E R Ra 29

Conclusões O resultado mostra que as variáveis anteriores podem ser estatisticamente agrupadas em 4 fatores ou dimensões 30

Análise de Regressão 31

Variáveis Y : independente X1, X2 etc : dependentes 32

Y Objetivo Verificar se há associação entre os dados, se as variáveis dependentes explicam a variação da independente. Equacão Y = a + b.x X 33

Resultados 35

Resultados O coeficiente apresentado na tabela refere-se ao coeficiente parcial da regressão e difere do da regressão simples considerando a relação de cada variável independente em separado. O coeficiente expressa o aumento médio em Y dado um aumento de 1 unidade de X, sem considerar o efeito de qualquer outra variável independente (mantendo todos os outros fatores constantes). Para um aumento de 1 unidade na altura, há um aumento médio de 0.724 no peso, para crianças de mesma idade. 36

O coeficiente apresentado na tabela refere-se ao coeficiente parcial da regressão e difere do da regressão simples considerando a relação de cada variável independente em separado. O coeficiente expressa o aumento médio em Y dado um aumento de 1 unidade de X, sem considerar o efeito de qualquer outra variável independente (mantendo todos os outros fatores constantes). Para um aumento de 1 unidade na altura, há um aumento médio de 0.724 no peso, para crianças de mesma idade.

Referência Básica: CORRAR, Luiz J., PAULO, Edilson, DIAS FILHO, José Maria. Análise Multivariada para os cursos de Administração, Ciências Contábeis e Economia. São Paulo: Atlas, 2007. FREITAS, Henrique; MOSCAROLA, Jean. Da observação à decisão: métodos de pesquisa e de análise quantitativa e qualitativa de dados. RAE electron., São Paulo, v. 1, n. 1, p. 1-30, June 2002. Available from <http://www.scielo.br/scielo.php?script=sci_arttext&pid=s1676-56482002000100006&lng=en&nrm=iso>. access on 25 July 2017. http://dx.doi.org/10.1590/s1676-56482002000100006 38