MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
|
|
- Baltazar Neiva Macedo
- 7 Há anos
- Visualizações:
Transcrição
1 MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel
2 APRESENTAÇÃO Métodos Multivariados: São métodos (ferramentas analíticas) utilizados na transformação de dados (várias medidas / variáveis de cada observação) em informações. KDD Data Mining Machine Learning AI Pattern Recognition Multivariate Statistics
3 APRESENTAÇÃO Métodos Multivariados: Processo de DM / KDD /... : Problem specification Data Prospecting Methodology identification Data preprocessing Building the model Knowledge postprocessing
4 APRESENTAÇÃO Métodos Multivariados: Data preprocessing Building the model Métodos comumente utilizados: Redução de dimensão (seleção de atributos, escalonamento, visualização de dados) Geração de agrupamentos homogêneos (clusters) Attribute-oriented induction approach Modelos de classificação e de previsão
5 APRESENTAÇÃO Métodos Multivariados: Etapas de análise: Criação de agrupamentos homogêneos (clusters):... DADOS REDUÇÃO DE DIMENSÃO GERAÇÃO DE AGRUPAMENTOS MODELO DE CLASSIFICAÇÃO Criação de classificadores:... DADOS REDUÇÃO DE DIMENSÃO MODELO DE CLASSIFICAÇÃO
6 Métodos de redução de dimensão: APRESENTAÇÃO São métodos utilizados na redução do número de atributos (variáveis) usados na visualização dos dados, na geração de agrupamentos homogêneos e na classificação. Esses métodos geram novas variáveis compondo as variáveis originais. Exemplos: Um analista financeiro está interessado em estudar a saúde financeira de empresas. Para isso, identificou 8 indicadores (liquidez corrente, giro do ativo, receita operacional líquida, lucro líquido, endividamento geral, endividamento corrente,...). Entretanto, a tarefa do analista seria simplificada se os 8 indicadores pudessem ser reduzidos para poucos índices, independentes (fatores que impactam na saúde financeira). O diretor de marketing de uma organização quer determinar quais são os fatores que impactam nas atitudes e hábitos dos consumidores de seus produtos.
7 APRESENTAÇÃO Métodos redução de dimensão: Um fabricante de bens de consumo gostaria de analisar a estrutura de mercado mapeando os produtos ofertados (seus e da concorrência) para determinar quem são seus maiores concorrentes e quais são os produtos percebidos como similares aos seus, segundo os consumidores.
8 APRESENTAÇÃO Métodos de geração de agrupamentos homogêneos: São métodos utilizados no agrupamento de observações (produtos, consumidores,...) maximizando a similaridade dentro do agrupamento e a dissimilaridade entre agrupamentos. Exemplos: O analista financeiro gostaria de segmentar as empresas analisadas de acordo com os fatores (que impactam na saúde financeira) identificados. O fabricante de bens de consumo, após mapear a estrutura de mercado e determinar os fatores que diferenciam os produtos / marcas, gostaria de segmentar os produtos / marcas.
9 Attribute-oriented induction approach: INTRODUÇÃO APRESENTAÇÃO All Rows Count ,043 G^ Level band noband Prob 0,3965 0,6035 PRESSPED>=89 PRESSPED<89 Count 90 33,4964 G^ Level band noband Prob 0, 0,8778 Count 47 94,9033 G^ Level band noband Prob 0,4543 0,5457 HUMIDITY<70 HUMIDITY>=70 Count 38 4, G^ Level band noband Prob 0,36 0,8684 Count ,4787 G^ Level band noband Prob 0,4859 0,54 VISCOSIT<63 VISCOSIT>=63 Count ,380 G^ Level band noband Prob 0,456 0,5439 Count 36 9,06943 G^ Level band noband Prob 0,7778 0, Detecção das causas de falhas no processo (early fault detection) Melhoria no conhecimento do processo (fatores de risco)
10 INTRODUÇÃO APRESENTAÇÃO Métodos de classificação: CLASS-CONDITIONAL DENSITIES CONHECIDA DESCONHECIDA TEORIA BAYESIANA DE DECISÃO APRENDIZAGEM SUPERVISIONADA PARAMÉTRICOS ANÁLISE DISCRIMINANTE: -LINEAR -QUADRÁTICA NÃO PARAMÉTRICOS ESTIM. DENSIDADE: KERNELS, KNN CONSTR. FRONTEIRA DECISÃO: RNEURAIS, SVM, AID,
11 APRESENTAÇÃO Métodos de classificação e de previsão: São métodos utilizados para classificar novas observações (produtos, consumidores,...) em categorias ou agrupamentos, pré-estabelecidos. Exemplos: O analista financeiro criou 3 agrupamentos de empresas: alto risco, risco moderado e baixo risco. Ele precisa monitorar e reclassificar, mês a mês, cada uma das empresas avaliadas. Um fabricante de bens de consumo gostaria de prever a aceitação de um produto (combinação de atributos) que lançará (seria ou não o produto escolhido). Um pesquisador, da área de saúde, está interessado em saber se é possível determinar a probabilidade de um paciente ter ataque cardíaco dado sua pressão sanguínea, seu nível de colesterol, seu consumo diário de calorias, seu sexo e seu estilo de vida.
12 APRESENTAÇÃO Ementa: Self-study (pré-requisitos): modelos probabilísticos e métodos estatísticos, álgebra linear, regressão linear (simples e múltipla) e métodos de otimização (programação matemática). Métodos de interdependência: Análise de componentes principais, Análise Fatorial, Escalonamento Multidimensional, Análise de agrupamentos (hierárquica, não-hierárquica e baseada em densidade). Métodos avançados em análise de agrupamentos. Métodos de dependência: Métodos de detecção de interações (AID, ID3). Classificadores lineares. Análise Discriminante paramétrica e não-paramétrica. Regressão Logística. Support Vector Machine.
13 APRESENTAÇÃO Avaliação: Provas ( por bimestre) Listas de exercícios Exame final: trabalho individual
14 APRESENTAÇÃO Bibliografia: SHARMA,S. Applied Multivariate Techniques. John Wiley & Sons, 996. MYERS, J. H. e MULLET G. M. Managerial Applications of Multivariate Analysis in Marketing. Thomson, 003. DUDA, R. O., HART, P. E. e STORK, D. G. Pattern classification, nd. Edition, John Wiley & Sons, 00. WEBB, A. Statistical Pattern Recognition, nd edition. John Wiley & Sons, 00.
15 APRESENTAÇÃO Software: R O que é o R? É um ambiente desenvolvido para o desenvolvimento de análises. Quais as vantagens em utilizar o R? É um software gratuito e com código aberto (open source). Quem distribui o R? O R é distribuído por CRAN ( Comprehensive R Archive Network ). Onde consigo o R? Ele está disponível para download em Observação: é necessário carregar pacotes para análise multivariada.
16 APRESENTAÇÃO Para casa: Site: (Plano do curso,...) Seleção de algum software (Matlab, R, SAS,...) Leitura do artigo: Data Mining in Manufacturing: A Review (J. A. Harding, M. Shahbaz, S. Srinivas, A. Kusiak)
17 ANÁLISE DE COMPONENTES PRINCIPAIS (ACP) Rodrigo A. Scarpel
18 ANÁLISE DE COMPONENTES PRINCIPAIS É um método de escalonamento e de redução de dimensão (métodos utilizados na redução do número de variáveis por meio da geração de novas variáveis compondo as variáveis originais). Exemplos: i) Um analista financeiro interessado em estudar a saúde financeira de empresas identificou 8 indicadores financeiros. Entretanto, sua tarefa seria simplificada se os 8 indicadores pudessem ser reduzidos para poucos índices, independentes. ii) O departamento de controle de qualidade está interessado em desenvolver alguns poucos indicadores chave a partir de informações coletadas no processo de manufatura para determinar se este está ou não sob controle.
19 ANÁLISE DE COMPONENTES PRINCIPAIS Princípios: CP = w + w wp, p =,, Os pesos são determinados de forma que: i) A primeira componente principal (CP) deve capturar a máxima variância dos dados, ou seja: VAR CP ( ) = E[ ( ' x)( ' x) '] E[ ( ' x) ] E[ ( ' x) '] = E[ ' x x' ] E[ ' x] E[ x' ] VAR CP ( ) = '( E[ x x' ] E[ x] E[ x] ) = ' Max VAR ( CP ) = [ w w L w ],, p, σσ σ σ M σ pσ σ σ σ σ p σ M σ L L O L σσ p w σ σ p w M M σ pσ p wp,,, ii) = p w, + w, w, =, para fixar a escala das novas variáveis
20 ANÁLISE DE COMPONENTES PRINCIPAIS Princípios: no caso bi-dimensional CP + = w, w, Formulação: Max V = [ w w ] = w,, σ, + w σσ σ σ, σ σσ w σ σ w,,,, + w w σ σ S. A. w, + w, = CP w, = w w,, w w + w,,, = () 0
21 ANÁLISE DE COMPONENTES PRINCIPAIS Generalização do procedimento (ACP) para o caso p-dimensional: CP CP M CP p = w, = w = w,, p + w + w, + w,, p w w p, w p, M M M p, p p p p Os pesos são determinados seqüencialmente de forma que: i) A primeira componente principal (CP) deve capturar a máxima variância dos dados, a segunda componente (CP) capture a máxima variância dos dados desconsiderando o que já foi capturado por CP, e assim por diante.,, w j + w j w p j = ii), para fixar a escala das novas variáveis iii) Os novos eixos sejam ortogonais, ou seja,, w, t w [ w w w ], t L = 0, j t, j, j p, j M wp, t
22 ANÁLISE DE COMPONENTES PRINCIPAIS Formulação Geral: '.. '.. = Σ A S Max F O ) ' ( ' λ + Σ L = ( ) = Σ = Σ = = = ' 0 λ λ λ I L L = 0 Σ I λ (que é polinomial em λ de ordem p tendo, portanto, p raízes)
23 ANÁLISE DE COMPONENTES PRINCIPAIS Obtenção da autoestrutura de Σ: Para resolver a formulação geral, utilizando multiplicadores de Lagrange, é necessário obter as raízes de Σ-λI = 0. Como Σ é simétrica, as raízes são reais e correspondem aos autovetores de Σ e i corresponde ao autovetor associado ao autovalor λ i. Portanto, o procedimento (ACP) pode ser simplificado se considerarmos que estamos obtendo a autoestrutura de Σ, ou seja, estamos decompondo Σ em Λ Λ em que Λ é uma matriz diagonal com os autovalores λ λ... λ p 0 e é uma matriz ortogonal pxp em que as colunas são os p autovetores de Σ.
24 ANÁLISE DE COMPONENTES PRINCIPAIS Propriedades das componentes principais: i) As componentes são não correlacionadas: ( Λ ) Σ = Λ Var( ) = Var( ) = Σ = ii) A variância total é dada por Variância Total p = s= λ = λ + λ + L+ λ s p de forma que a proporção da variância explicada pela k-ésima CP é λk, k =, L, λ + λ + L+ λ p p
25 ANÁLISE DE COMPONENTES PRINCIPAIS Questões relacionadas à utilização da análise de componentes principais: i) Quantas componentes principais? ii) Como interpretar as componentes principais (novas variáveis)? iii) Linearmente independentes x estatisticamente independentes. iv) Padronizar ou não os dados (utilizar a matriz de variâncias covariâncias ou a matriz de correlação)
MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Leia maisMétodos de Análise de Dados (AO-802)
Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados
Leia maisProfessora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados
UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise
Leia maisEstatística Aplicada à Administração II. Tópico. Análise de Componentes Principais
Estatística Aplicada à Administração II Tópico Análise de Componentes Principais Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 99 Análise de Componentes Principais
Leia mais29 e 30 de julho de 2013
Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 29 e 30 de julho de 2013 Dia 2 - Conteúdo 1 2 3 Dados multivariados Estrutura: n observações tomadas de p variáveis resposta.
Leia maisMestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015
Mestrado Profissional em Administração Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 015 Decomposição Espectral Autovalores e autovetores MANLY, Cap. Objetivo e Definição
Leia maisFACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
Leia maisPLANO DE ENSINO MÉTODOS ESTATÍSTICOS II. 1) IDENTIFICAÇÃO Disciplina: Método Estatístico II Código da Disciplina:
PLANO DE ENSINO MÉTODOS ESTATÍSTICOS II 1) IDENTIFICAÇÃO Disciplina: Método Estatístico II Código da Disciplina: 9071008 Carga Horária: 40 horas/aula Período Letivo: Professor(a): Édila Cristina de Souza
Leia maisMB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel
MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana 1 2 Conteúdo Princípios de POAP : 1. O processo decisório
Leia maisMáquinas de Vetores de Suporte
Máquinas de Vetores de Suporte Marcelo K. Albertini 14 de Setembro de 2015 2/22 Máquinas de Vetores de Suporte Support Vector Machines (SVM) O que é? Perceptron revisitado Kernels (núcleos) Otimização
Leia maisSME0822 Análise Multivariada 2 o semestre de 2014
SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014
Leia maisSME0822 Análise Multivariada 2 o semestre de 2014
SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 7 de agosto de 2014
Leia maisDisciplinas Eletivas 1
Disciplinas Eletivas 1 Syllabus Nome da disciplina: Pesquisa de Mercado e Opinião Série: 2 o ano Ensino Médio (1º semestre) Carga Horária Semanal: 75min Duração: semestral Docente(s) responsável(eis):
Leia maisEstudo dirigido de Análise Multivariada
Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto
Leia maisTécnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Leia maisMáquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino
Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Leia maisMáquinas de suporte vetorial e sua aplicação na detecção de spam
e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura
Leia maisSME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113
SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25 Principais objetivos do curso Estudar e desenvolver
Leia maisSensoriamento Remoto II
Sensoriamento Remoto II Componentes principais Revisão de matemática Análise de componentes principais em SR UFPR Departamento de Geomática Prof. Jorge Centeno 2016 copyright@ centenet Revisão matemática
Leia maisAnálise estatística multivariada
Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser
Leia maisG4 de Álgebra Linear I
G4 de Álgebra Linear I 27.1 Gabarito 1) Considere a base η de R 3 η = {(1, 1, 1); (1,, 1); (2, 1, )} (1.a) Determine a matriz de mudança de coordenadas da base canônica para a base η. (1.b) Considere o
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisMáquinas de Vetores de Suporte
Máquinas de Vetores de Suporte Prof. Marcelo Keese Albertini Faculdade de Computação Universidade Federal de Uberlândia 19 de Junho de 2017 2/27 Máquinas de Vetores de Suporte Support Vector Machines (SVM)
Leia maisSME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de Prof. Cibele Russo
SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de 2015 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 23 de fevereiro de 2015 1 / 19 Principais objetivos
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE DATA MINING
PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de
Leia maisDATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados.
DATA MINING Mineração De Dados fulviocristofoli@uol.com.br www.fulviocristofoli.com.br Conceito As organizações perseguem inteligência. Nessa perseguição, elas processam informação, formulam planos e aspirações,
Leia maisAnálise multivariada
UNIFAL-MG, campus Varginha 11 de Setembro de 2018 Dada uma matriz A (p p), podemos obter um escalar λ e um vetor v (p 1) de modo que seja satisfeita? Av = λv (1) Dada uma matriz A (p p), podemos obter
Leia maisAPLICAÇÃO DE TÉCNICAS MULTIVARIADAS NA SELEÇÃO DE GENÓTIPOS DE PLANTAS PARA GRAMADOS RESISTENTES A INSETOS
APLICAÇÃO DE TÉCNICAS MULTIVARIADAS NA SELEÇÃO DE GENÓTIPOS DE PLANTAS PARA GRAMADOS RESISTENTES A INSETOS Waldomiro Barioni Júnior 1, Marcos Rafael Gusmão 2, Francisco Humberto Dübbern de Souza 2, Frederico
Leia maisDEPARTAMENTO DE ENGENHARIA MECÂNICA
DEPARTAMENTO DE ENGENHARIA MECÂNICA Otimização: Algoritmos e Aplicações na Engenharia Mecânica ENG1786 & MEC2403 Ivan Menezes 2018-2 1 EMENTA 1. Introdução 1.1 Definições Básicas 1.2 Classificação dos
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Agradecimentos
Leia maisMOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 3 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 2 3 4 5 6 7 8 9 0 2 3 4 5 e 6 Introdução à probabilidade (eventos, espaço
Leia maisProfissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada
MBA ANALYTICS OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de decisão com base nas
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisMOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisPatrícia de Siqueira Ramos. 29 de Agosto de 2018
UNIFAL-MG, campus Varginha 29 de Agosto de 2018 Conteúdo programático A disciplina Introdução à análise multivariada Álgebra matricial Análise de componentes principais Análise de agrupamento (cluster
Leia maisANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP
Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA
Leia maisMario de Andrade Lira Junior
Mario de Andrade Lira Junior www.lira.pro.br 1 Apenas uma breve apresentação Para não dizerem que nunca viram Um conjunto de técnicas de análise que usa diversas variáveis dependentes simultaneamente Mais
Leia maisEstatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais
Estatística: Aplicação ao Sensoriamento Remoto SER 4 - ANO 9 Componentes Principais Camilo Daleles Rennó camilorenno@inpebr http://wwwdpiinpebr/~camilo/estatistica/ Associação entre Variáveis r = < r
Leia maisMáquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos
Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos Introdução * Método supervisionado de aprendizagem de máquina * Empregado em classificação de dados Classificação binária
Leia maisG3 de Álgebra Linear I
G3 de Álgebra Linear I 2.2 Gabarito ) Considere a matriz 4 N = 4. 4 Observe que os vetores (,, ) e (,, ) são dois autovetores de N. a) Determine uma forma diagonal D de N. b) Determine uma matriz P tal
Leia maisProjeto de Trabalho de Conclusão de Curso
ADRIANO SHON MAXIMILIANO MARCOS TADEU ANDRADE CORDEIRO Projeto de Trabalho de Conclusão de Curso Trabalho apresentado para a disciplina Laboratório de Estatística II do curso de graduação em Estatística
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina
Leia maisUNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada
UNIVERSIDADE FEDERAL FLUMINENSE Programa de Mestrado e Doutorado em Engenharia de Produção Disciplina: Estatística Multivariada Aula: Análise Discriminante Professor: Valdecy Pereira, D. Sc. email: valdecy.pereira@gmail.com
Leia maisENG-418 OTIMIZAÇÃO DE PROCESSOS QUÍMICOS
Universidade Federal da Bahia - UFBA Escola Politécnica EP Departamento de Engenharia Química - DEQ Laboratório de Controle e Otimização de Processos Industriais - LACOI Disciplina: Otimização de Processos
Leia maisANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP
Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA
Leia maisPrograma do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas
Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação
Leia maisMBA ANALYTICS EM BIG DATA
MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação
Leia maisÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA
ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA Álgebra Linear e Geometria Analítica Prof. Aline Paliga EMENTA Vetores Dependência Linear Bases Produto Escalar Produto Vetorial Produto Misto Coordenadas Cartesianas
Leia maisNEUROCOMPUTAÇÃO E SIG NO SUPORTE AO PLANEJAMENTO URBANO. Marcos Aurélio Santos da Silva 1
NEUROCOMPUTAÇÃO E SIG NO SUPORTE AO PLANEJAMENTO URBANO Marcos Aurélio Santos da Silva 1 Palavras-chave: Redes Neurais Artificiais, Análise Espacial de Área, Visualização de dados, Análise de Agrupamentos
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Leia maisAnálise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Diogo de Carvalho Bezerra Universidade Federal de Pernambuco Núcleo de Gestão e-mail:dicbezerra@hotmail.com SOBREA Sociedade
Leia maisSUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Leia maisAprendizado de Máquina. Combinando Classificadores
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores
Leia maisMINISTÉRIO DA EDUCAÇÃO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS CONSELHO DE GRADUAÇÃO
DISCIPLINA: GEOMETRIA ANALÍTICA E ÁLGEBRA VETORIAL CÓDIGO: 2DB.004 VALIDADE: Início: 01/2013 Término: Eixo: Matemática Carga Horária: Total: 75 horas/ 90 horas-aula Semanal: 06 aulas Créditos: 6 Modalidade:
Leia maisAvaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação
Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas
Leia maisMOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
Leia maisÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2
COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA
Leia maisMineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
Leia maisMOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
Leia maisFunção prcomp. 1. Introdução
Função prcomp 1. Introdução Apresentamos alguns exemplos de utilização da função prcomp do pacote stats em R. Esta função permite realizar uma análise de componentes principais a partir de uma matriz de
Leia maisExemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:
Exemplo : Variáveis padronizadas t = (,,, ) = = Matriz de correlações: Ρ Ρ Ρ Ρ Ρ.0 0.4 0.5 0.6 0.4.0 0.3 0.4 0.5 0.3.0 0. 0.6 0.4 0..0 De onde se obtém: /.068 0.9.047 0.083 Ρ Ρ 0.9.068 0.083.047 Ρ / /
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisMOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
Leia mais10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR
10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir
Leia maisSCC0173 Mineração de Dados Biológicos
SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de
Leia maisTécnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Leia maisUNIVERSIDADE FEDERAL DE UBERLÂNDIA - UFU
UNIVERSIDADE FEDERAL DE UBERLÂNDIA - UFU PLANO DE TRABALHO EM INICIAÇÃO CIENTÍFICA Desenvolvimento de toolbox de análise multivariada para o matlab. Uberlândia 28/09/10 IDENTIFICAÇÃO DO TRABALHO Título
Leia maisDetecção de mudanças em imagens multitemporais de sensoriamento remoto empregando support vector machines
Detecção de mudanças em imagens multitemporais de sensoriamento remoto empregando support vector machines Rute Henrique da Silva Ferreira, Vitor Haertel Universidade Federal do Rio Grande do Sul UFRGS/PPGSR
Leia maisMulticolinariedade e Autocorrelação
Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não
Leia maisExame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões PCA Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos de PCA e suas aplicações
Leia maisTécnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Leia maisMOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
Leia maisSME0803 ANÁLISE DE REGRESSÃO 1º/2011
SME0803 ANÁLISE DE REGRESSÃO 1º/2011 Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-160, ramal 8174 CoteiaWIKI: http://wiki.icmc.usp.br/index.php/sme-260 OBJETIVO DO CURSO Introduzir
Leia maisESTUDO COMPARATIVO DOS ESCORES FATORIAIS E DE COMPONENTES PRINCIPAIS EM DADOS ARQUEOMÉTRICOS.
ESTUDO OMPRTIVO DOS ESORES FTORIIS E DE OMPONENTES PRINIPIS EM DDOS RQUEOMÉTRIOS. P.T.M.S. Oliveira, IME-USP,poliveir@ime.usp.br.. S. Munita, IPEN-NEN/SP, munita@curiango.ipen.br RESUMO: Em estudos arqueométricos
Leia maisUniversidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Classificação. David Menotti.
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Classificação David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Redução de Dimensionalidade Principal Component Analysis (PCA)
Leia maisSME0820 Análise de Regressão 1º/2014
Mário de Castro mcastro@icmc.usp.br Sala 4-240, telefone 3373-6631 Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113, telefone 3373-6606 SME0820 Análise de Regressão 1º/2014 Site
Leia maisGeração de cenários de energia renovável correlacionados com hidrologia: uma abordagem bayesiana multivariada.
Geração de cenários de energia renovável correlacionados com hidrologia: uma abordagem bayesiana multivariada [alessandro@psr-inc.com] Conteúdo Introdução Estimação não paramétrica (Kernel density) Transformação
Leia maisSME0820 Análise de Regressão 1º/2013
Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113, ramal 73-6606 Mariana Cúri mcuri@icmc.usp.br http://www.icmc.usp.br/~mcuri Sala 4-211, ramal 73-8175 SME0820 Análise de Regressão
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
Leia mais8. Análise em Componentes Principais - ACP
8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Leia maisANÁLISE DE COMPONENTES PRINCIPAIS APLICADO A SENSORIAL DE ALIMENTOS
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO PRÓ-REITORIA DE PESQUISA, PÓS-GRADUAÇÃO E INOVAÇÃO htttp://editora.iftm.edu.br/index.php/sepit ISSN 2594-7605 (Digital ANÁLISE DE
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Leia maisAnálise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!
Análise Fatorial 1 Na análise fatorial as variáveis y1, y,..., Yp, são combinações lineares de umas poucas variáveis F1, F,..., Fm (m
Leia maisIntrodução ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática
ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática fabricio@utfpr.edu.br UTFPR-CP Grupo de Pesquisa em Bioinformática e Reconhecimento de Padrões bioinfo-cp@utfpr.edu.br Curso de
Leia maisPontifícia Universidade Católica de São Paulo Graduação em Matemática Empresarial
Ciências Humanas e Sociais 36 30 -- -- -- -- -- -- 30 -- 2 36 30 Economia 1 36 30 18 15 -- -- -- -- 45 -- 3 54 45 Fundamentos de Matemática 72 60 -- -- -- -- -- -- -- 60 4 72 60 1º Introdução à Geometria
Leia maisANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA
CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,
Leia maisAnálise de Componentes Principais (PCA)
Análise de Componentes Principais (PCA) Lailson B. Moraes, George D. C. Cavalcanti {lbm4,gdcc}@cin.ufpe.br Roteiro Introdução Características Definição Algoritmo Exemplo Aplicações Vantagens e Desvantagens
Leia maisFundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Leia maisFunções Reais I. Espaços Vetoriais
ESTRUTURA CURRICULAR Ênfase em Matemática Aplicada Funções Reais I Análise e aprofundamento dos tópicos necessários para desenvolver um estudo completo sobre funções de uma variável real, preparando os
Leia mais4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)
ANÁLISE DE DADOS 4 ANÁLISE DE DADOS A definição das características das águas subterrânea baseou-se nas análises químicas e físico-químicas e na utilização de métodos estatísticos, como a estatística multivariada
Leia maisData Mining. Felipe E. Barletta Mendes. 21 de maio de 2008
21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é
Leia maisSéries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9
em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review
Leia mais