Análise Multivariada Aplicada à Contabilidade
|
|
|
- Andreia Vasques Balsemão
- 7 Há anos
- Visualizações:
Transcrição
1 Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes [email protected] Turma: 2º /
2 Agenda Aula 12/15 Análise de Conglomerados Uso Medidas de similaridade ou distância utilizadas Procedimentos hierárquico e não hierárquico Interpretação dos resultados Número de agrupamentos Identificação dos elementos que formam cada conglomerado 2
3 Análise de Conglomerados 3
4 Análise de Conglomerados Análise de conglomerados, análise de agrupamentos ou cluster analysis, são técnicas de interdependência que permite agrupar casos ou variáveis em um grupo homogêneo, em função de sua similaridade Cada objeto é semelhante aos demais do grupo, maximizando a homogeneidade dentro do grupo e maximizando a heterogeneidade entre grupos 4
5 Análise de Conglomerados É uma técnica exploratória, permite estudar a estrutura de grupos, dimensionalidade dos dados, identificar outlier e levantar hipóteses sobre as associações dos objetos Semelhante a análise fatorial, porém, menos robusta Técnica sem base teórica e não-inferencial, não possibilitando inferências sobre a população com base na amostra 5
6 Análise de Conglomerados Etapas Análise das variáveis e dos objetivos a serem agrupados (seleção de variáveis, identificação de outliers e padronização) Seleção da medida de distância ou semelhança entre cada par de objetos Seleção do algoritmo de agrupamento: método hierárquico e método não hierárquico Escolha da quantidade de agrupamentos formados Interpretação e validação dos agrupamentos 6
7 Análise das Variáveis e dos Objetivos a Serem Agrupados Identificação de Outliers e Seleção de Variáveis Os grupos refletem as variáveis selecionadas A técnica não distingue a relevância das variáveis A questão da multicolinearidade interfere na ponderação das medidas de similaridade Uma forma de reduzir isso é com o uso da distância de Mahalanobis (D 2 ), que padroniza os dados, estabelece uma escala em termos de desvio padrão e soma a variância-covariância acumulada dentro dos grupos, semelhante ao R 2 da regressão 7
8 Análise das Variáveis e dos Objetivos a Serem Agrupados Identificação de Outliers e Seleção de Variáveis A técnica é muito sensível à outliers Cabe analisar se devem ou não ser retirados É comum que os outliers formem grupos isolados 8
9 Análise das Variáveis e dos Objetivos a Serem Agrupados Padronização de Variáveis Utilização de escalas de medida em grandezas diferentes pode distorcer a análise A forma mais utilizada é a padronização (Z score), com média zero de desvio padrão 1 x média Z = desvio padrão A padronização deve ser utilizada com cuidado, pois se existir alguma relação natural refletida nas escalas das variáveis, a padronização pode não ser adequada 9
10 Análise das Variáveis e dos Objetivos a Serem Agrupados Padronização de Variáveis São utilizadas também Método Range -1 a 1 x amplitude Método Range 0 a 1 x mínimo amplitude Método de máxima amplitude x máximo 10
11 Análise das Variáveis e dos Objetivos a Serem Agrupados Padronização de Variáveis São utilizadas também Método de média 1 média Método de desvio padrão 1 x x desvio padrão 11
12 Medidas de Similaridade ou Distância (Dissimilaridade) Modelos geométricos Empresas Vendas (US$ milhões) Número empregados Ferramentas Gerais 327, Fiori 312,2 661 Bretas Supermercados 652, Renner Lojas Americanas 1.613, Ponto Frio
13 Medidas de Similaridade ou Distância (Dissimilaridade) Modelos geométricos Lojas Americanas Bretas Renner Ponto Frio Ferramentas Gerais 0 Fiori
14 Medidas de Similaridade ou Distância (Dissimilaridade) Padronização dos Dados Empresas Vendas (US$ milhões) Número empregados Ferramentas Gerais -0,931-1,038 Fiori -0,953-1,427 Bretas Supermercados -0,458 0,282 Renner -0,056 0,429 Lojas Americanas 0,939 1,087 Ponto Frio 1,459 0,666 14
15 Medidas de Similaridade ou Distância (Dissimilaridade) 3 Tipos Medidas de Distância Medidas Correlacionadas Medidas de Associação 15
16 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Distância Distância Euclidiana: a distância entre duas observações (i e j) correspondente à raiz quadrada da soma dos quadrados das diferenças entre os pares de observações (i e j) para todas as p variáveis d ij = p k=1 (x ik x jk ) 2 d ij = (x i1 x j1 ) 2 +(x i2 x j2 ) (x ip x jp ) 2 Em que x ik é o valor da variável k referente à observação i e x jk representa a variável k para a observação j Quanto menor a distância, mais similares são as observações 16
17 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Distância Distância Quadrática Euclidiana: a distância entre duas observações (i e j) correspondente à soma dos quadrados das diferenças entre os pares de observações (i e j) para todas as p variáveis d ij 2 = p k=1 (x ik x jk ) 2 Mais comum Quanto menor a distância, mais similares são as observações 17
18 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Distância Distância de Minkowski: a distância euclidiana é um caso particular de uma distância mais geral, chamada de Minkowski d ij = p k=1 ( x ik x jk ) n 1/n Se aplicarmos n = 2, chegamos a distância euclidiana Para n = 1 temos a Distância City-Block, ou Manhattan Distance 18
19 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Distância Distância Absoluta, Bloco, City-Block ou Manhattan: representa a soma das diferenças absolutas entre os valores das p variáveis para os dois casos d ij = p k=1 x ik x jk 19
20 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Distância Mahalanobis: é a distância estatística entre dois indivíduos i e j, considerando a matriz de covariância para o cálculo das distâncias d ij = (x i x j ) S 1 (x i x j ) Em que S é a estimativa amostral da matriz de variância-covariância Σ dentro dos agrupamentos 20
21 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Distância Chebychev: diferença absoluta máxima entre todas as p variáveis entre duas observações d ij = max x ik x jk Em que S é a estimativa amostral da matriz de variância-covariância Σ dentro dos agrupamentos 21
22 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas Correlacionadas Representam similaridade pela correspondência de padrões ao longo das características (X variáveis) Correlação de Pearson é a mais utilizada p k=1(x 1k x i )(x 1j x j ) r ij = p k=1(x 1k x i ) 2 p k=1 (x 1j x j ) 2 22
23 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Associação Utilização de variáveis binárias Tabela de Contingência Indivíduo j 1 0 Total Indivíduo i 1 a b a+b 0 c d c+d Total a+c b+d p = a+b+c+d 23
24 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Associação Coeficientes de Emparelhamento Simples: Medida de Semelhança (S ij ) a + d S ij = a + b + c + d Medida de Distância (d ij ) b + c d ij = a + b + c + d 24
25 Medidas de Similaridade ou Distância (Dissimilaridade) Medidas de Associação Coeficientes de Jaccard Medida de Semelhança (S ij ) a S ij = a + b + c Medida de Distância (d ij ) b + c d ij = a + b + c Existem outros métodos não apresentados em aula, disponíveis no livro referência 25
26 Determinação e Avaliação dos Grupos Envolve: a escolha do algoritmo de agrupamento e a decisão quanto ao número de grupos Algoritmo de agrupamento: qual o procedimento deve ser usado para colocar objetos similares dentro de grupos? Temos os hierárquicos e os nãohierárquicos Todo algoritmo visa maximizar as diferenças entre os grupos em confronto com a variação dentro dos mesmos (between-cluster x within-cluster). 26
27 Métodos de Agrupamento em Análise de Conglomerados Conglomerados Hierárquicos Conglomerados Não-Hierárquicos 27
28 Tipos de Cluster Procedimentos hierárquicos de agrupamento: envolvem a construção de uma hierarquia semelhante a uma árvore. São de dois tipos: aglomerativos e divisivos. Algoritmos mais populares: (1) single linkage; (2) complete linkage; (3) avarage linkage; (4) Ward s method; e (5) centroid method. 28
29 Tipos de Cluster 1) Single linkage: baseado na distância mínima entre dois objetos. É também chamado de nearest neighbor 2) Complete linkage: é baseado na distância máxima, razão pela qual é conhecido como a abordagem do vizinho mais longe (furthest neighbor) 29
30 Tipos de Cluster 3) Avarage linkage: ou ligação média, onde o critério é a distância de todos os indivíduos de um grupo em relação a todos de outro (no SPSS, as opções between-groups e within-groups linkage). Tende a produzir grupos com aproximadamente a mesma variância 4) Ward s method: minimiza a soma dos quadrados entre dois grupos em relação a todas as variáveis. Tende a produzir grupos com mesmo número de observações 30
31 Tipos de Cluster 5) Centroid method: a distância entre os grupos é a distância entre seus centróides, que são os valores médios das observações em relação às variáveis. Cada vez que indivíduos são agrupados, um novo centróide é calculado. Tanto este método quanto o de Ward exigem a distância euclidiana. 31
32 Tipos de Cluster Métodos não-hierárquicos de agrupamento: ou métodos de partição, atribuem objetos a um grupo uma vez que o número de grupos a ser formado esteja especificado. São referidos como K-means clustering Seleciona um grupo semente (seed) como grupo inicial, e todos os objetos próximos são incluídos nesse grupo. Um novo grupo semente é escolhido, e o processo continua até todas as observações serem distribuídas 32
33 Tipos de Cluster O métodos não-hierárquicos são os seguintes: Sequential threshold: ou princípio sequencial, seleciona um grupo semente e inclui todos os objetos dentro de uma distância preestabelecida. Após, um novo grupo semente é selecionado, e o processo continua. Quando um objeto é destinado a um grupo semente, ele não é mais considerado nos subsequentes. 33
34 Tipos de Cluster Parallel threshold: ou princípio paralelo, seleciona vários grupos semente e inclui todos os objetos dentro daquele mais próximo. À medida que o processo evolui, as distâncias podem ser ajustadas para incluir menos ou mais objetos (disponível no SPSS). Optimization: similar aos anteriores, exceto que ele permite a realocação de objetos em função da maior proximidade com outro grupo (disponível no SPSS). 34
35 Tipos de Cluster Seleção dos grupos sementes: pode ser aleatório ou escolhidos pelo pesquisador. Um dos problemas no primeiro caso é que o resultado final depende da ordem dos dados. Vantagens e desvantagens dos métodos hierárquicos: (v) são rápidos e exigem menos tempo de processamento; (d) não realocam combinações anteriores; (d) é sensivelmente impactado por outliers; (d) não são apropriados para amostras muito grandes. 35
36 Tipos de Cluster Vantagens e desvantagens dos métodos nãohierárquicos: (v) podem realocar combinações anteriores; (v) são menos sensíveis a outliers, à medida de distância e a variáveis inapropriadas (quando os grupos sementes são escolhidos pelo pesquisador); (d) os resultados dependem do processo de escolha dos pontos semente. Segundo Hair, o processo aleatório é inferior às técnicas hierárquicas; (d) Johnson e Wichern criticam prefixação do número de grupos. 36
37 Tipos de Cluster Uma combinação de ambos os métodos: primeiro, uma técnica hierárquica estabelece o número de grupos, traça o perfil dos núcleos centrais e identifica outliers; Depois de eliminar eventuais outliers, aplica-se um método não-hierárquico, tendo como grupos sementes os núcleos centrais definidos através do método hierárquico. 37
38 Análise de Cluster Quantos grupos devem ser formados? Não existe um critério categórico Uma regra de parada (stopping rule) simples é examinar a distância entre os grupos a cada passo sucessivo; Outra regra seria adaptar um teste estatístico de significância; Além disso, o pesquisador deve confrontar com o referencial teórico, que pode sugerir um número natural de grupos; Deve-se, ao final, buscar a melhor solução dentre as possíveis. 38
39 Análise de Cluster A análise cluster deve ser estruturada novamente? Analisar se existe um disparate acentuado entre o tamanho dos grupos, ou se existem grupos com uma ou duas observações (possíveis outliers); Comparar a solução final com as expectativas do pesquisador; Bussab refere uma técnica quantitativa para avaliação dos agrupamentos, o Coeficiente de Correlação Cofenética, que relaciona a matriz de distâncias originais com a oriunda da classificação (matriz cofenética); algo em torno de 0,8 já seria bom. 39
40 Análise de Cluster Envolve o exame de cada grupo, tendo em vista o conjunto de variáveis, para denominar ou atribuir uma identificação que descreva adequadamente a natureza dos mesmos. Para esse processo, podem ser utilizados escores, de modo a identificar alguma hierarquia dentre os mesmos. Nessa fase, o pesquisador deve comparar os resultados com aqueles propostos anteriormente pela teoria ou pela experiência prática. 40
41 Validação e Perfil dos Grupos Alguns procedimentos de validação da solução: 1) dividir a amostra em dois grupos; 2) usar outras variáveis conhecidas por discriminar entre os grupos, ou refazer a análise excluindo algumas variáveis; 3) refazer a análise utilizando outros métodos de agrupamento e outras medidas de similaridade. 41
42 Validação e Perfil dos Grupos Definindo o perfil da solução: consiste na descrição das características de cada grupo para explicar como elas podem diferir em dimensões relevantes. Utilizam-se dados não previamente incluídos no procedimento de agrupamento (demográficos, psicográficos etc.). O enfoque é na descrição, não do que determinou diretamente os grupos, mas das características dos grupos depois de que eles foram identificados. Pode-se utilizar a análise discriminante: a variável dependente categórica são os grupos. 42
43 Obrigado pela Atenção!!! Até a próxima aula [email protected] 43
Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta
2 Processo de Agrupamentos
20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y
Aprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113
SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25 Principais objetivos do curso Estudar e desenvolver
A análise de aglomerados
Mais importante do que saber fazer é saber o por quê (Norbert Wiener (1894 1964). Prof. Lorí Viali, Dr. [email protected]; [email protected]; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/
Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados
UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise
Comparação entre o método Ward e o método K-médias no agrupamento de produtores de leite
Comparação entre o método Ward e o método K-médias no agrupamento de produtores de leite Enio Júnior Seidel,Fernando de Jesus Moreira Júnior, Angela Pelegrin Ansuj, Maria Rosane Coradini Noal Departamento
UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada
UNIVERSIDADE FEDERAL FLUMINENSE Programa de Mestrado e Doutorado em Engenharia de Produção Disciplina: Estatística Multivariada Aula: Análise Discriminante Professor: Valdecy Pereira, D. Sc. email: [email protected]
Análise de agrupamento dos dados sedimentológicos da plataforma e talude continentais da Bahia
Análise de agrupamento dos dados sedimentológicos da plataforma e talude continentais da Bahia ÂNGELA CRISTINA DA FONSECA MIRANTE 1 2 4 JOÃO DOMINGOS SCALON 2 4 TÂNIA MARIA FONSECA ARAÚJO 3 TÂNIA JUSSARA
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda
Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI
1 Sumário 2 Introdução Técnicas de ESDA Matrizes de Proximidade Espacial Média Espacial Móvel (m i ) Indicadores Globais de Autocorrelação Espacial Índices Globais de Moran (I), Geary (C) e Getis e Ord
ANÁLISE DE AGRUPAMENTO APLICADA AO CRESCIMENTO POPULACIONAL DE ALGUNS PAÍSES EUROPEUS
ANÁLISE DE AGRUPAMENTO APLICADA AO CRESCIMENTO POPULACIONAL DE ALGUNS PAÍSES EUROPEUS Edwirde Luiz SILVA 1, Dalila Camêlo AGUIAR 2 1 Departamento de Estatística, Universidade Estadual da Paraíba - UEPB,
Medidas de Dispersão. Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação
Medidas de Dispersão Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação Introdução Estudo de medidas que mostram a dispersão dos dados em torno da tendência central Analisaremos as seguintes
Escalonamento Multidimensional
Programa de Pós-Graduação em Administração de Organizações (PPGAO) Análise de dados multivariados I Escalonamento Multidimensional Escalonamento Multidimensional (EMD) CAPÍTULO 9 Escalonamento Multidimensional
APLICAÇÃO DE ANÁLISE DE CLUSTER EM VALORES NUTRICIONAIS REFERENTES Á TIPOS DE CARNES
APLICAÇÃO DE ANÁLISE DE CLUSTER EM VALORES NUTRICIONAIS REFERENTES Á TIPOS DE CARNES Samara Rilda de S.BEZERRA 1, Edwirde Luiz SILVA 1,Aldreany P.Araújo SILVA 1 1 Departamento de Estatística, Universidade
ANÁLISE DE AGRUPAMENTOS
ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos
Análise Discriminante
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Análise Discriminante Análise Discriminante 1 Análise discriminante - A
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda
1 Introdução aos Métodos Estatísticos para Geografia 1
1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade
Níveis descritivos de testes estatísticos de variabilidade como medidas de similaridade entre objetos em análises de agrupamento
Níveis descritivos de testes estatísticos de variabilidade como medidas de similaridade entre objetos em análises de agrupamento Luiz Roberto Martins Pinto 1 Leonardo Evangelista Moraes 2 Priscila Ramos
PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y)
PRÁTICA 8 1) Medidas de Distância. A Distância Euclidiana entre dois vetores n-dimensionais e y é definida como o escalar: d 1 2 2 [( y ) + + ( y ) ] 2 e (, y) = y = y = 1 1 L n n esta epressão é a Norma
Análise de Correspondência (ANACOR)
Universidade de São Paulo Faculdade de Economia, Administração e Contabilidade EAC 0355 Análise Multivariada Análise de Correspondência (ANACOR) F 1 1 INTRODUÇÃO ANACOR: A ANÁLISE DE CORRESPONDÊNCIA SIMPLES
UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada
UNIVERSIDADE FEDERAL FLUMINENSE Programa de Mestrado e Doutorado em Engenharia de Produção Disciplina: Estatística Multivariada Aula: Escalonamento Multidimensional Professor: Valdecy Pereira, D. Sc. /
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS A distribuição dos tempos de permanência dos estudantes nos cursos de graduação de certa universidade é uma distribuição normal com média igual a 6 anos e desvio padrão igual
AULA 07 Inferência a Partir de Duas Amostras
1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
Redes Neurais não Supervisionadas: SOM
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos
Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)
Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Resumo: Veremos nesta aula tabelas, cálculos de porcentagem e gráficos; amostras e tipo de amostragem; Medidas de tendência central e medidas
Mais Informações sobre Itens do Relatório
Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo
Modelos de Regressão Linear Simples - Análise de Resíduos
Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro
Capítulo 1 Conceitos de Marketing e Marketing Research
Índice Prefácio 21 Introdução 25 PARTE I Capítulo 1 Conceitos de Marketing e Marketing Research 1. Evolução do Marketing 33 2. Evolução do conceito de Marketing 35 3. Modelo do sistema de Marketing 38
PERFIL DOS AUTORES... XVII PREFÁCIO... XIX INTRODUÇÃO... XXI
Sumário PERFIL DOS AUTORES... XVII PREFÁCIO... XIX INTRODUÇÃO... XXI CAPÍTULO 1 O processo de pesquisa e os enfoques quantitativo e qualitativo rumo a um modelo integral... 2 Que enfoques foram apresentados
5 Definição da Árvore de Cenários
5 Definição da Árvore de Cenários 5.1. Considerações Iniciais Com o intuito de propor um método para definir a sub-árvore a ser visitada durante o processo do cálculo da estratégia ótima de operação, de
Gilberto Müller Beuren
Gilberto Müller Beuren Coleta dos dados: Processo de obtenção dos dados Validação Interna: O quão bem o instrumento mede o que está proposto a medir Validação Externa: Refere-se às hipóteses do estudo
Estatística Descritiva
C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística
AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.
AMOSTRAGEM É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. Nos planejamentos amostrais, a coleta dos dados deve ser realizada
Conceito de Estatística
Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir
RAD5017 Estatística II Aula 2 Análise Fatorial (Conceitos Teóricos) 1. Validade (definição do conceito) x Confiabilidade (consistência da medida)
Aula 2 Análise Fatorial (Conceitos Teóricos) 1 Conceitos importantes: Validade (definição do conceito) x Confiabilidade (consistência da medida) Análise Fatorial Técnica adequada para analisar os padrões
Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser
Análise de dados, tipos de amostras e análise multivariada
Les-0773: ESTATÍSTICA APLICADA III Análise de dados, tipos de amostras e análise multivariada AULA 1 12/05/17 Prof a Lilian M. Lima Cunha Maio de 2017 Introdução O que significa o termo estatística? No
Medidas Estatísticas NILO FERNANDES VARELA
Medidas Estatísticas NILO FERNANDES VARELA Tendência Central Medidas que orientam quanto aos valores centrais. Representam os fenômenos pelos seus valores médios, em torno dos quais tendem a se concentrar
Elementos de Estatística
Elementos de Estatística Lupércio F. Bessegato & Marcel T. Vieira UFJF Departamento de Estatística 2013 Medidas Resumo Medidas Resumo Medidas que sintetizam informações contidas nas variáveis em um único
Aula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
ANÁLISE DE CLUSTER APLICADA À LOGÍSTICA: DEFINIÇÃO DE ZONAS DE TRANSPORTE PARA UMA EMPRESA DO SETOR SIDERÚRGICO
ANÁLISE DE CLUSTER APLICADA À LOGÍSTICA: DEFINIÇÃO DE ZONAS DE TRANSPORTE PARA UMA EMPRESA DO SETOR SIDERÚRGICO Alvaro Simões da Conceição Neto (UFMG) [email protected] Juliana Jacob Ferreira (UFMG)
Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados Aula 9 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise clusters: técnica de agrupamento de observações/ variáveis com base na similaridade das suas característicassters
4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)
ANÁLISE DE DADOS 4 ANÁLISE DE DADOS A definição das características das águas subterrânea baseou-se nas análises químicas e físico-químicas e na utilização de métodos estatísticos, como a estatística multivariada
3 Técnicas de agrupamento
3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Análise da Regressão. Prof. Dr. Alberto Franke (48)
Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas
Aula 25: Análise Fatorial. Prof. Eduardo A. Haddad
Aula 25: Análise Fatorial Prof. Eduardo A. Haddad Utilização específica Como identificar o potencial de desenvolvimento agropecuário dos municípios brasileiros? Banco de dados municipais: Tamanho do rebanho,
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões
AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012
1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à
Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento
Contabilometria Aula 9 Regressão Linear Inferências e Grau de Ajustamento Interpretação do Intercepto e da Inclinação b 0 é o valor estimado da média de Y quando o valor de X é zero b 1 é a mudança estimada
Prova de Estatística
UNIVERSIDADE FEDERAL DO PARÁ CURSO DE MESTRADO EM ECONOMIA PROCESSO SELETIVO 2010 Prova de Estatística INSTRUÇÕES PARA A PROVA Leia atentamente as questões. A interpretação das questões faz parte da prova;
AUTOCORRELAÇÃO ESPACIAL. Flávia F. Feitosa
AUTOCORRELAÇÃO ESPACIAL Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015 AULAS ANTERIORES A importância analítica do espaço para o Planejamento Territorial
Disciplina de Modelos Lineares
Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique
PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL
PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL Dr Sivaldo Leite Correia CONCEITOS E DEFINIÇÕES FUNDAMENTAIS Muitos experimentos são realizados visando
ESTATÍSTICA Medidas de Síntese
2.3 - Medidas de Síntese Além das tabelas e gráficos um conjunto de dados referente a uma variável QUANTITATIVA pode ser resumido (apresentado) através de Medidas de Síntese, também chamadas de Medidas
DELINEAMENTO FATORIAL. Profª. Sheila Regina Oro
DELINEAMENTO FATORIAL Profª. Sheila Regina Oro Existem casos em que vários fatores devem ser estudados simultaneamente para que possam nos conduzir a resultados de interesse. Experimentos fatoriais: são
CAPÍTULO 3 POPULAÇÃO E AMOSTRA
DEPARTAMENTO DE GEOCIÊNCIAS GCN 7901 ANÁLISE ESTATÍSTICA EM GEOCIÊNCIAS PROFESSOR: Dr. ALBERTO FRANKE CONTATO: [email protected] F: 3721 8595 CAPÍTULO 3 POPULAÇÃO E AMOSTRA As pesquisas de opinião
Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:
Pessoal, trago a vocês a resolução da prova de Estatística do concurso para Auditor Fiscal aplicada pela FCC. Foram 10 questões de estatística! Não identifiquei possibilidade para recursos. Considero a
Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47
CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................
Estatística Multivariada
Estatística Multivariada UNIVERSIDADE FEDERAL DE LAVRAS REITOR: Antônio Nazareno Guimarães Mendes VICE-REITOR: Elias Tadeu Fialho Diretoria Executiva Renato Paiva (Diretor) Elias Tadeu Fialho Conselho
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20
SUMÁRIO Prefácio, 1 3 1 CÁLCULO DAS PROBABILIDADES, 15 1.1 Introdução, 15 1.2 Caracterização de um experimento aleatório, 15 1.3 Espaço amostrai, 16 1.4 Evento, 17 1.5 Eventos mutuamente exclusivos, 17
Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM
Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM Noções básicasb de Inferência Estatística descritiva inferencial População - Parâmetros desconhecidos (reais) Amostra
9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla
9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual
Renda x Vulnerabilidade Ambiental
Renda x Vulnerabilidade Ambiental ANEXO D ANÁLISE EXPLORATÓRIA E PREPARAÇÃO DOS DADOS Identificamos tendência linear positiva. A correlação entre as variáveis é significativa, apresentando 99% de confiança.
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Diogo de Carvalho Bezerra Universidade Federal de Pernambuco Núcleo de Gestão e-mail:[email protected] SOBREA Sociedade
A Importância do Desenho Amostral. Donald Pianto Departamento de Estatística UnB
A Importância do Desenho Amostral Donald Pianto Departamento de Estatística UnB Objetivo dessa aula Explicar os tipos básicos de amostragem e a razão pelo uso de cada um Contemplar o uso simultaneo de
Modificação do teste de Tukey para uso sob heterocedasticidade e desbalanceamento
Modificação do teste de Tukey para uso sob heterocedasticidade e desbalanceamento Paulo César de Resende Andrade 1 Lucas Luciano Barbosa 1 Regiane Teixeira Farias 1 Ana Luisa de Castro Pereira Martins
Profa. Lidia Rodella UFPE-CAA
Profa. Lidia Rodella UFPE-CAA O que é estatística? É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,
Les Estatística Aplicada II AMOSTRA E POPULAÇÃO
Les 0407 - Estatística Aplicada II AMOSTRA E POPULAÇÃO AULA 1 04/08/16 Prof a Lilian M. Lima Cunha Agosto de 2016 Estatística 3 blocos de conhecimento Estatística Descritiva Levantamento e resumo de dados
Coeficiente de Assimetria
Coeficiente de Assimetria Rinaldo Artes Insper Nesta etapa do curso estudaremos medidas associadas à forma de uma distribuição de dados, em particular, os coeficientes de assimetria e curtose. Tais medidas
25/08/2016. Estatística. Estatística. Medidas Estatísticas Medidas de Posição. Mariele Bernardes. Mariele Bernardes
s 12/08/2016 As medidas estatísticas resumem as informações obtidas dando uma visão global dos dados. s ou estimadores dados da amostra Parâmetros dados populacionais. de posição de dispersão de posição
