Análise de Componentes Principais
|
|
|
- Heitor Felgueiras
- 6 Há anos
- Visualizações:
Transcrição
1 Análise de Componentes Principais Adilson dos Anjos
2
3 Sensometria 2 Objetivo O objetivo dessa aula é apresentar a Análise de Componentes Principais. As análises serão realizadas com uso do R;
4 Pacotes utilizados nessa aula readxl FactoMineR bpca
5 Dados Café
6 Análise de Componentes Principais (ACP): Introdução PCA: Principal Component Analysis (Pearson, 1901) Objetivo: explicar a estrutura de variância/covariância por meio de combinações lineares das variáveis originais; As combinações lineares são chamadas de Componentes Principais; Essas combinações são não correlacionadas;
7 ACP Busca-se uma redução do número de p variáveis para k componentes principais; Em geral, a análise de componentes principais serve como um método intermediário de avaliação; Por exemplo: construção de agrupamentos em análise de segmentação (cluster).
8 ACP Na análise de componentes principais, busca-se a informação contida em p variáveis por meio de k componentes principais não correlacionadas (k < p); A qualidade da informação pode ser medida por meio da proporção de variância total explicada pelas k componentes principais; A suposição de normalidade não é necessária para utilização de ACP.
9 ACP Para a obtenção dos componentes principais utiliza-se a matriz de covariâncias dos vetores aleatórios das variáveis originais; É comum utilizar-se uma transformação das variáveis; Os componentes principais podem ser obtidos a partir da matriz de covariância das variáveis originais padronizadas ou,... de maneira equivalente, a partir da matriz de correlação das variáveis originais Os componentes principais dependem apenas da matriz de covariância (ou correlação);
10 ACP Dado o vetor X = [X 1, X 2,..., X p ] e a matriz de covariâncias Σ com autovalores λ 1 λ 2... λ p 0; As combinações lineares são dadas da forma: Y 1 = l 1X Y 2 = l 2X.. Y p = l px = l 11 X 1 + l 21 X l p1 X p = l 12 X 1 + l 22 X l p2 X p. = l 1p X 1 + l 2p X l pp X p A primeira combinação linear é a que possui a maior variância.
11 ACP A variância total é: σ 11 + σ σ pp = λ 1 + λ λ p Assim, a proporção da variância total explicada pela k-ésima componente principal é Var devida a k-ésima CP = λ 1 + λ λ p λ k
12 ACP Se Σ é a matriz de covariância associada com o vetor X = [X 1, X 2,..., X p ] e Σ tem os pares de autovalores e autovetores (λ p, e p ) com λ 1 λ 2... λ p 0, o i-ésimo componente principal é dado por: Com a condição: Y i = e 1i X 1 + e 2i X e pi X p Var(Y i ) = e iσe i = λ i e Cov(Y i, Y k ) = e iσe k = 0(i k)
13 ACP Em geral, entre 80 e 90% da variabilidade pode ser explicada por até 3 componentes principais (considerando um grande número de variáveis originais); A variabilidade depende do fenômeno em estudo; Em alguns casos, pode-se considerar uma variabilidade menor, em geral, em torno de 70%.
14 ACP Há diferenças entre os componentes principais obtidos a partir da matriz de variância e covariância em comparação com a matriz de correlação; Recomenda-se a padronização quando as variáveis possuem escalas diferentes (inclusive em magnitude)
15 ACP Representação Gráfica Utiliza-se um gráfico de dispersão entre as duas componentes principais e o escores de cada componente;
16 ACP ACP Definição dos Componentes Percentual: depende do fenômeno (scree-plot); Interpretação prática do componente; Aproximação da matriz de variâncias/covariâncias (original).
17 ACP Quando as variáveis possuem Distribuição Normal (normal multivariada) podem ser realizadas algumas inferências; Exemplo: elipses de confiança.
18 Exemplo: coxinha library(factominer)
19 Nesse exemplo são considerados quatro atributos: sabor, aroma, massa e recheio. Cada avaliador atribuiu uma nota na escala ordinal de 1 a 5. Notas maiores estão relacionadas com melhor qualidade da coxinha. sabor<-c(2.75,3.90,3.12,4.58,3.97,3.01,4.19,3.82) aroma<-c(4.03,4.12,3.97,4.86,4.34,3.98,4.65,4.12) massa<-c(2.80,3.40,3.62,4.34,4.28,2.90,4.52,3.62) recheio<-c(2.62,3.52,3.05,4.82,4.98,2.82,4.77,3.71) produto<-c(paste( 'C',1:8,sep="")) coxa<-data.frame(sabor,aroma,massa,recheio,produto)
20 Alguma observação sobre esses valores? sobre as coxinhas? coxa sabor aroma massa recheio produto C C C C C C C C8
21 produto C1 :1 C2 :1 C3 :1 C4 :1 C5 :1 C6 :1 Um resumo dos dados: summary(coxa) sabor aroma massa recheio Min. :2.750 Min. :3.970 Min. :2.800 Min. :2. 1st Qu.: st Qu.: st Qu.: st Qu.:2. Median :3.860 Median :4.120 Median :3.620 Median :3. Mean :3.667 Mean :4.259 Mean :3.685 Mean :3. 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:4. Max. :4.580 Max. :4.860 Max. :4.520 Max. :4.
22 Obtendo os componentes principais: prcomp(coxa[,1:4]) # base Standard deviations (1,.., p=4): [1] Rotation (n x k) = (4 x 4): PC1 PC2 PC3 PC4 sabor aroma massa recheio A função prcomp está no base do R. Não é necessário instalar pacotes.
23 A função estim_ncp sugere o número de dimensões: estim_ncp(coxa[,1:4]) # factominer $ncp [1] 1 $criterion [1] Nesse caso, é sugerida apenas uma dimensão.
24 -Graficamente, pode-se obter o mesmo resultado: screeplot(prcomp(coxa[,1:4])) # base prcomp(coxa[, 1:4]) Variances
25 Obtendo as componentes principais: Nesse primeiro caso, utilizamos a opção scale=f. Isso significa que estamos utilizando a escala natural do atributo, sem nenhuma transformação.
26 coxa.pca<-pca(coxa[,1:4],scale=f) Individuals factor map (PCA) Dim 2 (3.50%) Dim 2 (3.50%) Dim 1 (93.78%)
27 Nesse segundo caso, utilizamos a opção scale=t. Isso significa que estamos utilizando a escala natural do atributo, ou seja, fazendo uma transformação. coxa.pca<-pca(coxa[,1:4],scale=t) Individuals factor map (PCA) Dim 2 (4.88%) Dim 2 (4.88%)
28 Graficamente pode-se visualizar o comportamento dos atributos: plot(coxa.pca,choix='var') Variables factor map (PCA) Dim 2 (4.88%) aroma sabor recheio massa
29 E dos tipos de coxinhas: plot(coxa.pca,choix='ind') Individuals factor map (PCA) Dim 2 (4.88%) Dim 1 (90.76%)
30 O percentual explicado por cada componente pode ser obtido da seguinte forma: coxa.pca$eig eigenvalue percentage of variance cumulative percent comp comp comp comp
31 Os coeficientes da primeira componente principal podem ser obtidos da seguinte maneira: coxa.pcapr<-prcomp(coxa[,1:4]) names(coxa.pcapr) [1] "sdev" "rotation" "center" "scale" "x" coxa.pcapr$rotation[,1] sabor aroma massa recheio Onde usar essa informação?
32 Para obter os escores para cada tipo de coxinha: apply(coxa.pcapr$rotation[,1]*coxa[1,1:4],1,sum) ou de outra maneira: y1<-0.456* * * *2.62 y1 [1]
33 Utilizando o critério da componente principal, qual a melhor coxinha?
34 Exemplo: Café Arquivo de dados library(readxl) cafe<-read_excel('cafe.xls') head(cafe) # A tibble: 6 x 4 Consumidor A B C <chr> <dbl> <dbl> <dbl> 1 C C C C C C
35 summary(cafe) Consumidor A B C Length:75 Min. :1.000 Min. :2.000 Min. Class :character 1st Qu.: st Qu.: st Qu. Mode :character Median :6.000 Median :7.000 Median Mean :5.973 Mean :6.227 Mean 3rd Qu.: rd Qu.: rd Qu. Max. :9.000 Max. :9.000 Max.
36 library(factominer) par(mfrow=c(1,2)) cafe.pca<-pca(cafe[,2:4]) Individuals factor map (PCA) Variables factor map (PCA) Dim 2 (23.83%) Dim 2 (23.83%) B A C Dim 1 (58.53%) Dim 1 (58.53%)
37 par(mfrow=c(1,1)) plot(cafe.pca,choix=c('ind')) # linhas Individuals factor map (PCA) Dim 2 (23.83%) Dim 1 (58.53%)
38 par(mfrow=c(1,1)) plot(cafe.pca,choix=c('var')) # colunas Variables factor map (PCA) Dim 2 (23.83%) B A C Dim 1 (58.53%)
39 head(round(cafe.pca$ind$contrib[,1:2],2)) Dim.1 Dim
40 round(cafe.pca$var$contrib[,1:2],2) Dim.1 Dim.2 A B C
41 round(cafe.pca$var$coord[,1:2],2) Dim.1 Dim.2 A B C
42 round(cafe.pca$eig,2) eigenvalue percentage of variance cumulative percent comp comp comp
43 Utilizando o pacote bpca library(bpca)
44 PC1 (59.86%) Duas dimensões bp2 <- bpca(cafe[,2:4],d=1:2,scale=f) plot.bpca.2d(bp2,var.cex=1.2,obj.cex=1.2,var.offset=.2, var.factor=.45) PC2 (21.6%) B C A
45 Três dimensões bp3 <- bpca(cafe[,2:4],d=1:3) plot.bpca.3d(bp3) PC3 (17.64%) C A B PC2 (23.83%) PC1 (58.53%) Experimente ratacionar o gráfico plot.bpca.3d(bp3,rgl=t)
46 Exemplo: Suco de Laranja Suco de Laranja 6 sucos 7 variáveis/atributos 2 variáveis auxiliares Variáveis 8:15 são quantitativas suplementares e 16 e 17 são qualitativas suplementares
47 Arquivo de dados orange<-read.table(' h=t,sep=';',dec='.',row.names=1)
48 Odour.intensity Odour.typicality Pulpiness Intensity Min. :2.760 Min. :2.530 Min. :1.660 Min. :3 1st Qu.: st Qu.: st Qu.: st Qu.:3 Median :2.825 Median :2.775 Median :2.625 Median :3 Mean :2.907 Mean :2.762 Mean :2.710 Mean :3 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:3 Max. :3.200 Max. :3.020 Max. :4.000 Max. :3 Acidity Bitterness Sweetness Glucose Min. :2.330 Min. :1.760 Min. :2.600 Min. :17 1st Qu.: st Qu.: st Qu.: st Qu.:22 Median :2.800 Median :2.320 Median :3.110 Median :24 Mean :2.802 Mean :2.328 Mean :3.057 Mean :24 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:26 Max. :3.310 Max. :2.970 Max. :3.380 Max. :32 Descrição rápida dos dados summary(orange)
49 PCA library(factominer) X11() par(mfrow=c(1,2)) res.pca <- PCA(orange[,1:7]) Individuals factor map (PCA) Variables factor map (PCA) Dim 2 (19.05%) Pampryl fr. Tropicana fr. Pampryl amb. Fruvita fr. Joker amb. Tropicana amb. Dim 2 (19.05%) Odour.intensity Pulpiness Intensity.of.taste Acidity Bitterness Odour.typicality Sweetness
50 res.pca **Results for the Principal Component Analysis (PCA)** The analysis was performed on 6 individuals, described by 7 *The results are available in the following objects: name description 1 "$eig" "eigenvalues" 2 "$var" "results for the variables" 3 "$var$coord" "coord. for the variables" 4 "$var$cor" "correlations variables - dimensions" 5 "$var$cos2" "cos2 for the variables" 6 "$var$contrib" "contributions of the variables" 7 "$ind" "results for the individuals" 8 "$ind$coord" "coord. for the individuals" 9 "$ind$cos2" "cos2 for the individuals" 10 "$ind$contrib" "contributions of the individuals" 11 "$call" "summary statistics"
51 par(mfrow=c(1,1)) plot(res.pca,choix=c('ind')) Individuals factor map (PCA) Dim 2 (19.05%) Pampryl fr. Pampryl amb. Joker amb. Tropicana amb. Fruvita fr. Tropicana fr Dim 1 (67.77%)
52 par(mfrow=c(1,1)) plot(res.pca,choix=c('var')) Variables factor map (PCA) Dim 2 (19.05%) Intensity.of.taste Acidity Bitterness Odour.intensity Pulpiness Odour.typicality Sweetness Dim 1 (67.77%)
53 Interpretação DIM1 tropicana.fr e Pampryl.amb-> extremos para odour typicality tropicana.fr é mais typical e menos bitter Pampryl.amb é menos typical e mais bitter DIM2 Tropicana.amb tem odor menos intenso Pampryl.fr tem odor mais intenso
54 Correlação entre variáveis e as primeiras duas componentes round(res.pca$var$coord[,1:2],2) Dim.1 Dim.2 Odour.intensity Odour.typicality Pulpiness Intensity.of.taste Acidity Bitterness Sweetness
55 Variância explicada round(res.pca$eig,2) eigenvalue percentage of variance cumulative percent comp comp comp comp comp
56 Contribuição de cada indivíduo ou variável para cada uma das dimensões round(res.pca$ind$contrib[,1:2],2) Dim.1 Dim.2 Pampryl amb Tropicana amb Fruvita fr Joker amb Tropicana fr Pampryl fr
57 round(res.pca$var$contrib[,1:2],2) Dim.1 Dim.2 Odour.intensity Odour.typicality Pulpiness Intensity.of.taste Acidity Bitterness Sweetness
58 Adicionando informação: variáveis suplementares: Variáveis suplementares não contribuem para a construção do PCA auxiliam na interpretação par(mfrow=c(1,2)) res.pca <- PCA(orange,quanti.sup=8:14, quali.sup=15:16) Individuals factor map (PCA) Variables factor map (PCA) Dim 2 (19.05%) Pampryl fr. Tropicana Fresh Other fr. Pampryl amb. Fruvita fr. Joker amb. Florida Ambient Tropicana amb. Dim 2 (19.05%) Odour.intensity Sweeten Acidity Pulpiness Fructose Glucose Intensity.of.taste Odour.typicality Bitterness Saccharose Citric.acid Sweetness Vitamin.C ph
59 par(mfrow=c(1,1)) plot(res.pca,choix=('var')) Variables factor map (PCA) Dim 2 (19.05%) Odour.intensity Sweetening.power Intensity.of.taste Pulpiness Acidity Fructose Glucose Saccharose Bitterness Odour.typicality Citric.acid Sweetness ph Vitamin.C Dim 1 (67.77%)
60 par(mfrow=c(1,1)) plot(res.pca,choix=('ind')) Individuals factor map (PCA) Dim 2 (19.05%) Pampryl fr. Fresh Tropicana fr. Other Fruvita fr. Pampryl amb. Florida Joker amb. Ambient Tropicana amb Dim 1 (67.77%)
61 Interpretação ph e sacarose são correlacionadas com a primeira dimensão Primeira dimensão: doce e ácido Em ambiente ácido, sacarose transforma-se em glicose e frutose. A variável categórica suplementar é posicionada no centro dos indivíduos aos quais ela pertence
62 Biplot representando produtos/amostras e atributos/variáveis no mesmo gráfico Função biplot (base do R) biplot(prcomp(orange[,1:7])) PC Pampryl fr. Pampryl am piness Bitterness Acidity Odour.intensity Intensity.of.taste ruvita Odour.typicality fr. Joker amb
63 Os componentes principais prcomp(orange[,1:7]) Standard deviations (1,.., p=6): [1] e e e e [6] e-16 Rotation (n x k) = (7 x 6): PC1 PC2 PC3 Odour.intensity Odour.typicality Pulpiness Intensity.of.taste Acidity Bitterness Sweetness PC5 PC6
64 Utilizando o pacote bpca library(bpca)
65 bp2 <- bpca(orange[,1:7],d=1:2) plot.bpca.2d(bp2,var.cex=1.2,obj.cex=1.2) PC2 (19.05%) Tropicana amb. Joker amb. Sweetness Fruvita fr. Pampry Tropicana Odour.typicality fr. Bitterness Intensity.of.taste Acidity Pulpiness Odour.intensityPampryl fr PC1 (67.77%)
66 Utilizando 3 dimensões bp3 <- bpca(orange[,1:7],d=1:3) plot.bpca.3d(bp3) PC3 (11.71%) Fruvita fr. Intensity.of.taste Sweetness Tropicana amb. Pulpiness Joker amb. Odour.typicality Pampryl amb. Pampryl fr. Acidity Bitterness Tropicana fr. Odour.intensity PC2 (19.05%) PC1 (67.77%)
67 Experimente rotacionar o gráfico! plot.bpca.3d(bp3,rgl=t)
Sensometria, Segmentação. Adilson dos Anjos
Segmentação Adilson dos Anjos Segmentação Objetivo O objetivo dessa aula é apresentar alguns métodos de Segmentação. As análises serão realizadas com uso do R; Pacotes utilizados nessa aula FactoMineR
Estudo dirigido de Análise Multivariada
Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto
Função prcomp. 1. Introdução
Função prcomp 1. Introdução Apresentamos alguns exemplos de utilização da função prcomp do pacote stats em R. Esta função permite realizar uma análise de componentes principais a partir de uma matriz de
Função prcomp em R. 1. Introdução
Função prcomp em R 1. Introdução Apresentamos alguns exemplos de utilização da função prcomp do pacote stats em R. Esta função permite realizar uma análise de componentes principais a partir de uma matriz
8. Análise em Componentes Principais - ACP
8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP
Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais
Estatística Aplicada à Administração II Tópico Análise de Componentes Principais Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 99 Análise de Componentes Principais
ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP
Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 9 de junho de Departamento de Estatística Universidade Federal do Paraná
SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná [email protected] Curitiba, PR 9 de junho de 2015 1 / 15 MAPA PROJECTIVO R 2 / 15 Princípio Identificar a importância
Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais
Estatística: Aplicação ao Sensoriamento Remoto SER 4 - ANO 9 Componentes Principais Camilo Daleles Rennó camilorenno@inpebr http://wwwdpiinpebr/~camilo/estatistica/ Associação entre Variáveis r = < r
ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP
Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA
Análise de Correspondência (ANACOR)
Universidade de São Paulo Faculdade de Economia, Administração e Contabilidade EAC 0355 Análise Multivariada Análise de Correspondência (ANACOR) F 1 1 INTRODUÇÃO ANACOR: A ANÁLISE DE CORRESPONDÊNCIA SIMPLES
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade
Análise fatorial em R
Análise fatorial em R 1. Dados Referem-se a n = 54 observações de p = 7 variáveis apresentadas na Tabela 1.9, p. 44 em Johnson and Wichern (2007, Applied Multivariate Statisitical Analysis, sixth ed. Upper
Módulo VII: Estatística elementar
Módulo VII: Estatística elementar 166 Revisão 167 Palavras-chave em estatística A estatística é composta por um conjunto de métodos destinados à coleta, à apresentação, à análise e à interpretação de dados,
Aula 25: Análise Fatorial. Prof. Eduardo A. Haddad
Aula 25: Análise Fatorial Prof. Eduardo A. Haddad Utilização específica Como identificar o potencial de desenvolvimento agropecuário dos municípios brasileiros? Banco de dados municipais: Tamanho do rebanho,
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Diogo de Carvalho Bezerra Universidade Federal de Pernambuco Núcleo de Gestão e-mail:[email protected] SOBREA Sociedade
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda
Perfil Livre: Procrustes/Análise Fatorial Múltipla
Perfil Livre: Procrustes/Análise Fatorial Múltipla Adilson dos Anjos Objetivo O objetivo dessa aula é apresentar uma introdução à Análise de Procrustes e um exemplo Análise Fatorial Múltipla para análise
Multicolinariedade e Autocorrelação
Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não
Análise de Dados Longitudinais Aula
1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 010 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade
Tutorial para o desenvolvimento das Oficinas
Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina
Análise estatística multivariada
Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Medidas Descritivas de Posição, Tendência Central e Variabilidade
Medidas Descritivas de Posição, Tendência Central e Variabilidade Prof. Gilberto Rodrigues Liska UNIPAMPA 29 de Agosto de 2017 Material de Apoio e-mail: [email protected] Local: Sala dos professores
Medidas Descritivas de Posição, Tendência Central e Variabilidade
Medidas Descritivas de Posição, Tendência Central e Variabilidade Prof. Gilberto Rodrigues Liska UNIPAMPA 27 de Março de 2017 Material de Apoio e-mail: [email protected] Sumário 1 Introdução
1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21
OS SABERES INDISPENSÁVEIS 7 Índice Prefácio 13 Capítulo 1 Os Saberes Indispensáveis 1. Conceitos básicos de estatística 17 1.1. Níveis de medição 18 1.2. Medidas características de distribuições univariadas
A2 - ANÁLISE FATORIAL
A2 - ANÁLISE FATORIAL Prof. Evandro M Saidel Ribeiro A2.1 A Análise Fatorial A2.2 Modelo matemático da análise fatorial A2.3 Fatores em termos de variáveis A2.4 Exemplo Clientes de um banco A2.5 Exemplo
Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!
Análise Fatorial 1 Na análise fatorial as variáveis y1, y,..., Yp, são combinações lineares de umas poucas variáveis F1, F,..., Fm (m
Análise Multivariada. Distribuição Normal Multivariada. Roteiro. Lupércio França Bessegato Dep. Estatística/UFJF
Análise Multivariada Lupércio França Bessegato Dep. Estatística/UFJF. Introdução. Vetores Aleatórios 3. Normal Multivariada Roteiro 4. Componentes Principais 5. Análise Fatorial 6. Análise de Conglomerados
Análise Fatorial Exploratória (AFE) Disciplina: Medidas em Psicologia Professora: Ana Carolina Rodrigues
Análise Fatorial Exploratória (AFE) Disciplina: Medidas em Psicologia Professora: Ana Carolina Rodrigues O que é análise fatorial? É uma técnica de interdependência, cujo propósito principal é definir
Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados Aula 7 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Relações de interdependência entre variáveis quantitativas: A Análise Factorial Análise Factorial: técnica
Estatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos
SCC0173 Mineração de Dados Biológicos
SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de
CE-001: Bioestatística, turma A
CE-001: Bioestatística, turma A 1 a Prova - 2 o semestre 2004 01 de outubro de 2004 Prova 1 1. (2,0 pontos) Os dados a seguir correspondem a teores de um elemento coletados em amostras de sangue de dois
Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica
1/41 Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Revisão para Dados Transversais 1 Características Informações amostrais
ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS
ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS ANÁLISE DE VARIÁVEIS CANÔNICAS Carlos Alberto Alves Varella 1 ÍNDICE INTRODUÇÃO... 2 DIMENSIONALIDADE
INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.
INSTRUÇÕES Para a realização desta prova, você recebeu este Caderno de Questões. 1. Caderno de Questões Verifique se este Caderno de Questões contém a prova de Conhecimentos Específicos referente ao cargo
8 JÚLIO CESAR R. PEREIRA
SUMÁRIO Lista de Tabelas... 09 Lista de Figuras... 11 Agradecimentos... 15 Apresentação... 17 Prefácio... 19 1. O Dado Qualitativo... 21 O Dado e o Evento... 21 A Análise de Dados Qualitativos e a Pesquisa
MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS
Universidade Federal do Paraná Departamento de Estatística MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme
Estatística Descritiva (I)
Estatística Descritiva (I) O que é Estatística Para muitos, a Estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são as pessoas que coletam esses dados. A Estatística originou-se
Modelo de Regressão Múltipla
Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão
Técnicas Computacionais em Probabilidade e Estatística I. Aula I
Técnicas Computacionais em Probabilidade e Estatística I Aula I Chang Chiann MAE 5704- IME/USP 1º Sem/2008 1 Análise de Um conjunto de dados objetivo: tratamento de um conjunto de dados. uma amostra de
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados
UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise
Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47
CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................
PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.
PREVISÃO O problema: usar a informação disponível para tomar boas decisões com impacto no futuro Informação disponível -qualitativa Prever o que irá acontecer -quantitativa: dados t DEI/FCTUC/PGP/00 1
Estatística descritiva
Estatística descritiva Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo
Análise de Componentes Principais (PCA)
Análise de Componentes Principais (PCA) Lailson B. Moraes, George D. C. Cavalcanti {lbm4,gdcc}@cin.ufpe.br Roteiro Introdução Características Definição Algoritmo Exemplo Aplicações Vantagens e Desvantagens
9 Análise Multivariada de Dados
9 Análise Multivariada de Dados 9.1 Introdução Uma das dificuldades inerentes em estatística multivariada é a visualização dos dados, principalmente em dimensões maiores que três. No entanto, é importante
Estatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos
CORRELAÇÃO. Flávia F. Feitosa
CORRELAÇÃO Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015 Revisão Inferência Estatística: Método científico para tirar conclusões sobre os parâmetros
Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. [email protected] http://www.ufrgs.br/~viali/ Coleção de números n estatísticas sticas O número n de carros vendidos no país aumentou em 30%. A taxa de desemprego atinge, este mês,
ANÁLISE DE COMPONENTES PRINCIPAIS APLICADO A SENSORIAL DE ALIMENTOS
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO PRÓ-REITORIA DE PESQUISA, PÓS-GRADUAÇÃO E INOVAÇÃO htttp://editora.iftm.edu.br/index.php/sepit ISSN 2594-7605 (Digital ANÁLISE DE
Análise de componentes principais (PCA)
Análise de componentes principais (PCA) Redução de dados Sumarizar os dados que contém muitas variáveis (p) por um conjunto menor de (k) variáveis compostas derivadas a partir do conjunto original. p k
Estatística 1. Resumo Teórico
Estatística 1 Resumo Teórico Conceitos do Curso 1. Tipos de Variáveis e Representações Gráficas a. Tipos de Variáveis b. Distribuição de Frequências c. Histograma 2. Estatística Descritiva Medidas Estatísticas
AULA 08 Correlação e Análise Fatorial
1 AULA 08 Correlação e Análise Fatorial Ernesto F. L. Amaral 12 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F.
Reconhecimento de Padrões. Principal Component Analysis (PCA) Análise dos Componentes Principais
Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência da Computação (PPGCC) Reconhecimento de Padrões Principal Component Analysis (PCA) Análise dos Componentes Principais David
PROCESSAMENTO DE IMAGENS
PROCESSAMENTO DE IMAGENS Introdução Conceitos básicos Pré-processamento Realce Classificação PROCESSAMENTO DE IMAGENS- aula de 25/5/10 Introdução Conceitos básicos Pré-processamento Realce Classificação
4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)
ANÁLISE DE DADOS 4 ANÁLISE DE DADOS A definição das características das águas subterrânea baseou-se nas análises químicas e físico-químicas e na utilização de métodos estatísticos, como a estatística multivariada
ESTATÍSTICA. Ana Paula Fernandes - FAMAT/UFU
ESTATÍSTICA Ana Paula Fernandes - FAMAT/UFU 1 REFERÊNCIAS BIBLIOGRÁFICAS 2 BUSSAB & MORETTIN Quadro! 3 QUANTIS EMPÍRICOS 4 QUANTIL DE ORDEM P OU P-QUANTIL Quantil de ordem p ou p-quantil, indicada por
1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27
Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4
MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo APRESENTAÇÃO Métodos Multivariados: São métodos (ferramentas analíticas) utilizados na transformação de dados (várias medidas
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos
Tratamento estatístico de observações
Tratamento estatístico de observações Prof. Dr. Carlos Aurélio Nadal OBSERVAÇÃO: é o valor obtido durante um processo de medição. DADO: é o resultado do tratamento de uma observação (por aplicação de uma
Tratamento estatístico de observações
Tratamento estatístico de observações Prof. Dr. Carlos Aurélio Nadal OBSERVAÇÃO: é o valor obtido durante um processo de medição. DADO: é o resultado do tratamento de uma observação (por aplicação de uma
SME0822 Análise Multivariada 2 o semestre de 2014
SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014
Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões PCA Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos de PCA e suas aplicações
Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)
Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste
SS714 - Bioestatística
SS714 - Bioestatística Silvia Shimakura [email protected] Página da disciplina: http://www.leg.ufpr.br/doku.php/disciplinas:ss714 ESTATÍSTICA DESCRITIVA Organização Descrição Quantificação de variabilidade
