MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

Tamanho: px
Começar a partir da página:

Download "MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel"

Transcrição

1 MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel

2 APRESENTAÇÃO Métodos Multivariados: São métodos (ferramentas analíticas) utilizados na transformação de dados (várias medidas / variáveis de cada observação) em informações. KDD Data Mining Machine Learning AI Pattern Recognition Multivariate Statistics

3 APRESENTAÇÃO Métodos Multivariados: Processo de DM / KDD /... : Problem specification Data Prospecting Methodology identification Data preprocessing Building the model Knowledge postprocessing

4 APRESENTAÇÃO Métodos Multivariados: Data preprocessing Building the model Métodos comumente utilizados: Redução de dimensão (seleção de atributos, escalonamento, visualização de dados) Geração de agrupamentos homogêneos (clusters) Attribute-oriented induction approach Modelos de classificação e de previsão

5 APRESENTAÇÃO Métodos Multivariados: Etapas de análise: Criação de agrupamentos homogêneos (clusters):... DADOS REDUÇÃO DE DIMENSÃO GERAÇÃO DE AGRUPAMENTOS MODELO DE CLASSIFICAÇÃO Criação de classificadores:... DADOS REDUÇÃO DE DIMENSÃO MODELO DE CLASSIFICAÇÃO

6 Métodos de redução de dimensão: APRESENTAÇÃO São métodos utilizados na redução do número de atributos (variáveis) usados na visualização dos dados, na geração de agrupamentos homogêneos e na classificação. Esses métodos geram novas variáveis compondo as variáveis originais. Exemplos: Um analista financeiro está interessado em estudar a saúde financeira de empresas. Para isso, identificou 8 indicadores (liquidez corrente, giro do ativo, receita operacional líquida, lucro líquido, endividamento geral, endividamento corrente,...). Entretanto, a tarefa do analista seria simplificada se os 8 indicadores pudessem ser reduzidos para poucos índices, independentes (fatores que impactam na saúde financeira). O diretor de marketing de uma organização quer determinar quais são os fatores que impactam nas atitudes e hábitos dos consumidores de seus produtos.

7 APRESENTAÇÃO Métodos redução de dimensão: Um fabricante de bens de consumo gostaria de analisar a estrutura de mercado mapeando os produtos ofertados (seus e da concorrência) para determinar quem são seus maiores concorrentes e quais são os produtos percebidos como similares aos seus, segundo os consumidores.

8 APRESENTAÇÃO Métodos de geração de agrupamentos homogêneos: São métodos utilizados no agrupamento de observações (produtos, consumidores,...) maximizando a similaridade dentro do agrupamento e a dissimilaridade entre agrupamentos. Exemplos: O analista financeiro gostaria de segmentar as empresas analisadas de acordo com os fatores (que impactam na saúde financeira) identificados. O fabricante de bens de consumo, após mapear a estrutura de mercado e determinar os fatores que diferenciam os produtos / marcas, gostaria de segmentar os produtos / marcas.

9 Attribute-oriented induction approach: INTRODUÇÃO APRESENTAÇÃO All Rows Count ,043 G^ Level band noband Prob 0,3965 0,6035 PRESSPED>=89 PRESSPED<89 Count 90 33,4964 G^ Level band noband Prob 0, 0,8778 Count 47 94,9033 G^ Level band noband Prob 0,4543 0,5457 HUMIDITY<70 HUMIDITY>=70 Count 38 4, G^ Level band noband Prob 0,36 0,8684 Count ,4787 G^ Level band noband Prob 0,4859 0,54 VISCOSIT<63 VISCOSIT>=63 Count ,380 G^ Level band noband Prob 0,456 0,5439 Count 36 9,06943 G^ Level band noband Prob 0,7778 0, Detecção das causas de falhas no processo (early fault detection) Melhoria no conhecimento do processo (fatores de risco)

10 INTRODUÇÃO APRESENTAÇÃO Métodos de classificação: CLASS-CONDITIONAL DENSITIES CONHECIDA DESCONHECIDA TEORIA BAYESIANA DE DECISÃO APRENDIZAGEM SUPERVISIONADA PARAMÉTRICOS ANÁLISE DISCRIMINANTE: -LINEAR -QUADRÁTICA NÃO PARAMÉTRICOS ESTIM. DENSIDADE: KERNELS, KNN CONSTR. FRONTEIRA DECISÃO: RNEURAIS, SVM, AID,

11 APRESENTAÇÃO Métodos de classificação e de previsão: São métodos utilizados para classificar novas observações (produtos, consumidores,...) em categorias ou agrupamentos, pré-estabelecidos. Exemplos: O analista financeiro criou 3 agrupamentos de empresas: alto risco, risco moderado e baixo risco. Ele precisa monitorar e reclassificar, mês a mês, cada uma das empresas avaliadas. Um fabricante de bens de consumo gostaria de prever a aceitação de um produto (combinação de atributos) que lançará (seria ou não o produto escolhido). Um pesquisador, da área de saúde, está interessado em saber se é possível determinar a probabilidade de um paciente ter ataque cardíaco dado sua pressão sanguínea, seu nível de colesterol, seu consumo diário de calorias, seu sexo e seu estilo de vida.

12 APRESENTAÇÃO Ementa: Self-study (pré-requisitos): modelos probabilísticos e métodos estatísticos, álgebra linear, regressão linear (simples e múltipla) e métodos de otimização (programação matemática). Métodos de interdependência: Análise de componentes principais, Análise Fatorial, Escalonamento Multidimensional, Análise de agrupamentos (hierárquica, não-hierárquica e baseada em densidade). Métodos avançados em análise de agrupamentos. Métodos de dependência: Métodos de detecção de interações (AID, ID3). Classificadores lineares. Análise Discriminante paramétrica e não-paramétrica. Regressão Logística. Support Vector Machine.

13 APRESENTAÇÃO Avaliação: Provas ( por bimestre) Listas de exercícios Exame final: trabalho individual

14 APRESENTAÇÃO Bibliografia: SHARMA,S. Applied Multivariate Techniques. John Wiley & Sons, 996. MYERS, J. H. e MULLET G. M. Managerial Applications of Multivariate Analysis in Marketing. Thomson, 003. DUDA, R. O., HART, P. E. e STORK, D. G. Pattern classification, nd. Edition, John Wiley & Sons, 00. WEBB, A. Statistical Pattern Recognition, nd edition. John Wiley & Sons, 00.

15 APRESENTAÇÃO Software: R O que é o R? É um ambiente desenvolvido para o desenvolvimento de análises. Quais as vantagens em utilizar o R? É um software gratuito e com código aberto (open source). Quem distribui o R? O R é distribuído por CRAN ( Comprehensive R Archive Network ). Onde consigo o R? Ele está disponível para download em Observação: é necessário carregar pacotes para análise multivariada.

16 APRESENTAÇÃO Para casa: Site: (Plano do curso,...) Seleção de algum software (Matlab, R, SAS,...) Leitura do artigo: Data Mining in Manufacturing: A Review (J. A. Harding, M. Shahbaz, S. Srinivas, A. Kusiak)

17 ANÁLISE DE COMPONENTES PRINCIPAIS (ACP) Rodrigo A. Scarpel

18 ANÁLISE DE COMPONENTES PRINCIPAIS É um método de escalonamento e de redução de dimensão (métodos utilizados na redução do número de variáveis por meio da geração de novas variáveis compondo as variáveis originais). Exemplos: i) Um analista financeiro interessado em estudar a saúde financeira de empresas identificou 8 indicadores financeiros. Entretanto, sua tarefa seria simplificada se os 8 indicadores pudessem ser reduzidos para poucos índices, independentes. ii) O departamento de controle de qualidade está interessado em desenvolver alguns poucos indicadores chave a partir de informações coletadas no processo de manufatura para determinar se este está ou não sob controle.

19 ANÁLISE DE COMPONENTES PRINCIPAIS Princípios: CP = w + w wp, p =,, Os pesos são determinados de forma que: i) A primeira componente principal (CP) deve capturar a máxima variância dos dados, ou seja: VAR CP ( ) = E[ ( ' x)( ' x) '] E[ ( ' x) ] E[ ( ' x) '] = E[ ' x x' ] E[ ' x] E[ x' ] VAR CP ( ) = '( E[ x x' ] E[ x] E[ x] ) = ' Max VAR ( CP ) = [ w w L w ],, p, σσ σ σ M σ pσ σ σ σ σ p σ M σ L L O L σσ p w σ σ p w M M σ pσ p wp,,, ii) = p w, + w, w, =, para fixar a escala das novas variáveis

20 ANÁLISE DE COMPONENTES PRINCIPAIS Princípios: no caso bi-dimensional CP + = w, w, Formulação: Max V = [ w w ] = w,, σ, + w σσ σ σ, σ σσ w σ σ w,,,, + w w σ σ S. A. w, + w, = CP w, = w w,, w w + w,,, = () 0

21 ANÁLISE DE COMPONENTES PRINCIPAIS Generalização do procedimento (ACP) para o caso p-dimensional: CP CP M CP p = w, = w = w,, p + w + w, + w,, p w w p, w p, M M M p, p p p p Os pesos são determinados seqüencialmente de forma que: i) A primeira componente principal (CP) deve capturar a máxima variância dos dados, a segunda componente (CP) capture a máxima variância dos dados desconsiderando o que já foi capturado por CP, e assim por diante.,, w j + w j w p j = ii), para fixar a escala das novas variáveis iii) Os novos eixos sejam ortogonais, ou seja,, w, t w [ w w w ], t L = 0, j t, j, j p, j M wp, t

22 ANÁLISE DE COMPONENTES PRINCIPAIS Formulação Geral: '.. '.. = Σ A S Max F O ) ' ( ' λ + Σ L = ( ) = Σ = Σ = = = ' 0 λ λ λ I L L = 0 Σ I λ (que é polinomial em λ de ordem p tendo, portanto, p raízes)

23 ANÁLISE DE COMPONENTES PRINCIPAIS Obtenção da autoestrutura de Σ: Para resolver a formulação geral, utilizando multiplicadores de Lagrange, é necessário obter as raízes de Σ-λI = 0. Como Σ é simétrica, as raízes são reais e correspondem aos autovetores de Σ e i corresponde ao autovetor associado ao autovalor λ i. Portanto, o procedimento (ACP) pode ser simplificado se considerarmos que estamos obtendo a autoestrutura de Σ, ou seja, estamos decompondo Σ em Λ Λ em que Λ é uma matriz diagonal com os autovalores λ λ... λ p 0 e é uma matriz ortogonal pxp em que as colunas são os p autovetores de Σ.

24 ANÁLISE DE COMPONENTES PRINCIPAIS Propriedades das componentes principais: i) As componentes são não correlacionadas: ( Λ ) Σ = Λ Var( ) = Var( ) = Σ = ii) A variância total é dada por Variância Total p = s= λ = λ + λ + L+ λ s p de forma que a proporção da variância explicada pela k-ésima CP é λk, k =, L, λ + λ + L+ λ p p

25 ANÁLISE DE COMPONENTES PRINCIPAIS Questões relacionadas à utilização da análise de componentes principais: i) Quantas componentes principais? ii) Como interpretar as componentes principais (novas variáveis)? iii) Linearmente independentes x estatisticamente independentes. iv) Padronizar ou não os dados (utilizar a matriz de variâncias covariâncias ou a matriz de correlação)

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise

Leia mais

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais Estatística Aplicada à Administração II Tópico Análise de Componentes Principais Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 99 Análise de Componentes Principais

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel

MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana 1 2 Conteúdo Princípios de POAP : 1. O processo decisório

Leia mais

SME0822 Análise Multivariada 2 o semestre de 2014

SME0822 Análise Multivariada 2 o semestre de 2014 SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014

Leia mais

Disciplinas Eletivas 1

Disciplinas Eletivas 1 Disciplinas Eletivas 1 Syllabus Nome da disciplina: Pesquisa de Mercado e Opinião Série: 2 o ano Ensino Médio (1º semestre) Carga Horária Semanal: 75min Duração: semestral Docente(s) responsável(eis):

Leia mais

Estudo dirigido de Análise Multivariada

Estudo dirigido de Análise Multivariada Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Máquinas de suporte vetorial e sua aplicação na detecção de spam e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura

Leia mais

SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113

SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo.  Sala 3-113 SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25 Principais objetivos do curso Estudar e desenvolver

Leia mais

Análise estatística multivariada

Análise estatística multivariada Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser

Leia mais

G4 de Álgebra Linear I

G4 de Álgebra Linear I G4 de Álgebra Linear I 27.1 Gabarito 1) Considere a base η de R 3 η = {(1, 1, 1); (1,, 1); (2, 1, )} (1.a) Determine a matriz de mudança de coordenadas da base canônica para a base η. (1.b) Considere o

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de Prof. Cibele Russo

SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de Prof. Cibele Russo SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de 2015 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/ cibele Sala 3-139 23 de fevereiro de 2015 1 / 19 Principais objetivos

Leia mais

DATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados.

DATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados. DATA MINING Mineração De Dados [email protected] www.fulviocristofoli.com.br Conceito As organizações perseguem inteligência. Nessa perseguição, elas processam informação, formulam planos e aspirações,

Leia mais

DEPARTAMENTO DE ENGENHARIA MECÂNICA

DEPARTAMENTO DE ENGENHARIA MECÂNICA DEPARTAMENTO DE ENGENHARIA MECÂNICA Otimização: Algoritmos e Aplicações na Engenharia Mecânica ENG1786 & MEC2403 Ivan Menezes 2018-2 1 EMENTA 1. Introdução 1.1 Definições Básicas 1.2 Classificação dos

Leia mais

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ 3 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 2 3 4 5 6 7 8 9 0 2 3 4 5 e 6 Introdução à probabilidade (eventos, espaço

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA

Leia mais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais Estatística: Aplicação ao Sensoriamento Remoto SER 4 - ANO 9 Componentes Principais Camilo Daleles Rennó camilorenno@inpebr http://wwwdpiinpebr/~camilo/estatistica/ Associação entre Variáveis r = < r

Leia mais

G3 de Álgebra Linear I

G3 de Álgebra Linear I G3 de Álgebra Linear I 2.2 Gabarito ) Considere a matriz 4 N = 4. 4 Observe que os vetores (,, ) e (,, ) são dois autovetores de N. a) Determine uma forma diagonal D de N. b) Determine uma matriz P tal

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina

Leia mais

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada UNIVERSIDADE FEDERAL FLUMINENSE Programa de Mestrado e Doutorado em Engenharia de Produção Disciplina: Estatística Multivariada Aula: Análise Discriminante Professor: Valdecy Pereira, D. Sc. email: [email protected]

Leia mais

ENG-418 OTIMIZAÇÃO DE PROCESSOS QUÍMICOS

ENG-418 OTIMIZAÇÃO DE PROCESSOS QUÍMICOS Universidade Federal da Bahia - UFBA Escola Politécnica EP Departamento de Engenharia Química - DEQ Laboratório de Controle e Otimização de Processos Industriais - LACOI Disciplina: Otimização de Processos

Leia mais

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA

Leia mais

MBA ANALYTICS EM BIG DATA

MBA ANALYTICS EM BIG DATA MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação

Leia mais

ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA

ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA Álgebra Linear e Geometria Analítica Prof. Aline Paliga EMENTA Vetores Dependência Linear Bases Produto Escalar Produto Vetorial Produto Misto Coordenadas Cartesianas

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem

Leia mais

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Diogo de Carvalho Bezerra Universidade Federal de Pernambuco Núcleo de Gestão e-mail:[email protected] SOBREA Sociedade

Leia mais

SUPPORT VECTOR MACHINE - SVM

SUPPORT VECTOR MACHINE - SVM SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

MINISTÉRIO DA EDUCAÇÃO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS CONSELHO DE GRADUAÇÃO

MINISTÉRIO DA EDUCAÇÃO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS CONSELHO DE GRADUAÇÃO DISCIPLINA: GEOMETRIA ANALÍTICA E ÁLGEBRA VETORIAL CÓDIGO: 2DB.004 VALIDADE: Início: 01/2013 Término: Eixo: Matemática Carga Horária: Total: 75 horas/ 90 horas-aula Semanal: 06 aulas Créditos: 6 Modalidade:

Leia mais

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2 COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior [email protected] 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

Função prcomp. 1. Introdução

Função prcomp. 1. Introdução Função prcomp 1. Introdução Apresentamos alguns exemplos de utilização da função prcomp do pacote stats em R. Esta função permite realizar uma análise de componentes principais a partir de uma matriz de

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR 10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

Técnicas Multivariadas em Saúde

Técnicas Multivariadas em Saúde Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

Multicolinariedade e Autocorrelação

Multicolinariedade e Autocorrelação Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões PCA Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos de PCA e suas aplicações

Leia mais

Técnicas Multivariadas em Saúde

Técnicas Multivariadas em Saúde Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

8. Análise em Componentes Principais - ACP

8. Análise em Componentes Principais - ACP 8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

ANÁLISE DE COMPONENTES PRINCIPAIS APLICADO A SENSORIAL DE ALIMENTOS

ANÁLISE DE COMPONENTES PRINCIPAIS APLICADO A SENSORIAL DE ALIMENTOS INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO PRÓ-REITORIA DE PESQUISA, PÓS-GRADUAÇÃO E INOVAÇÃO htttp://editora.iftm.edu.br/index.php/sepit ISSN 2594-7605 (Digital ANÁLISE DE

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial! Análise Fatorial 1 Na análise fatorial as variáveis y1, y,..., Yp, são combinações lineares de umas poucas variáveis F1, F,..., Fm (m

Leia mais

Introdução ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática

Introdução ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática [email protected] UTFPR-CP Grupo de Pesquisa em Bioinformática e Reconhecimento de Padrões [email protected] Curso de

Leia mais

Análise de Componentes Principais (PCA)

Análise de Componentes Principais (PCA) Análise de Componentes Principais (PCA) Lailson B. Moraes, George D. C. Cavalcanti {lbm4,gdcc}@cin.ufpe.br Roteiro Introdução Características Definição Algoritmo Exemplo Aplicações Vantagens e Desvantagens

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes [email protected] O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

Funções Reais I. Espaços Vetoriais

Funções Reais I. Espaços Vetoriais ESTRUTURA CURRICULAR Ênfase em Matemática Aplicada Funções Reais I Análise e aprofundamento dos tópicos necessários para desenvolver um estudo completo sobre funções de uma variável real, preparando os

Leia mais

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1) ANÁLISE DE DADOS 4 ANÁLISE DE DADOS A definição das características das águas subterrânea baseou-se nas análises químicas e físico-químicas e na utilização de métodos estatísticos, como a estatística multivariada

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais