MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
|
|
|
- Baltazar Neiva Macedo
- 9 Há anos
- Visualizações:
Transcrição
1 MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel
2 APRESENTAÇÃO Métodos Multivariados: São métodos (ferramentas analíticas) utilizados na transformação de dados (várias medidas / variáveis de cada observação) em informações. KDD Data Mining Machine Learning AI Pattern Recognition Multivariate Statistics
3 APRESENTAÇÃO Métodos Multivariados: Processo de DM / KDD /... : Problem specification Data Prospecting Methodology identification Data preprocessing Building the model Knowledge postprocessing
4 APRESENTAÇÃO Métodos Multivariados: Data preprocessing Building the model Métodos comumente utilizados: Redução de dimensão (seleção de atributos, escalonamento, visualização de dados) Geração de agrupamentos homogêneos (clusters) Attribute-oriented induction approach Modelos de classificação e de previsão
5 APRESENTAÇÃO Métodos Multivariados: Etapas de análise: Criação de agrupamentos homogêneos (clusters):... DADOS REDUÇÃO DE DIMENSÃO GERAÇÃO DE AGRUPAMENTOS MODELO DE CLASSIFICAÇÃO Criação de classificadores:... DADOS REDUÇÃO DE DIMENSÃO MODELO DE CLASSIFICAÇÃO
6 Métodos de redução de dimensão: APRESENTAÇÃO São métodos utilizados na redução do número de atributos (variáveis) usados na visualização dos dados, na geração de agrupamentos homogêneos e na classificação. Esses métodos geram novas variáveis compondo as variáveis originais. Exemplos: Um analista financeiro está interessado em estudar a saúde financeira de empresas. Para isso, identificou 8 indicadores (liquidez corrente, giro do ativo, receita operacional líquida, lucro líquido, endividamento geral, endividamento corrente,...). Entretanto, a tarefa do analista seria simplificada se os 8 indicadores pudessem ser reduzidos para poucos índices, independentes (fatores que impactam na saúde financeira). O diretor de marketing de uma organização quer determinar quais são os fatores que impactam nas atitudes e hábitos dos consumidores de seus produtos.
7 APRESENTAÇÃO Métodos redução de dimensão: Um fabricante de bens de consumo gostaria de analisar a estrutura de mercado mapeando os produtos ofertados (seus e da concorrência) para determinar quem são seus maiores concorrentes e quais são os produtos percebidos como similares aos seus, segundo os consumidores.
8 APRESENTAÇÃO Métodos de geração de agrupamentos homogêneos: São métodos utilizados no agrupamento de observações (produtos, consumidores,...) maximizando a similaridade dentro do agrupamento e a dissimilaridade entre agrupamentos. Exemplos: O analista financeiro gostaria de segmentar as empresas analisadas de acordo com os fatores (que impactam na saúde financeira) identificados. O fabricante de bens de consumo, após mapear a estrutura de mercado e determinar os fatores que diferenciam os produtos / marcas, gostaria de segmentar os produtos / marcas.
9 Attribute-oriented induction approach: INTRODUÇÃO APRESENTAÇÃO All Rows Count ,043 G^ Level band noband Prob 0,3965 0,6035 PRESSPED>=89 PRESSPED<89 Count 90 33,4964 G^ Level band noband Prob 0, 0,8778 Count 47 94,9033 G^ Level band noband Prob 0,4543 0,5457 HUMIDITY<70 HUMIDITY>=70 Count 38 4, G^ Level band noband Prob 0,36 0,8684 Count ,4787 G^ Level band noband Prob 0,4859 0,54 VISCOSIT<63 VISCOSIT>=63 Count ,380 G^ Level band noband Prob 0,456 0,5439 Count 36 9,06943 G^ Level band noband Prob 0,7778 0, Detecção das causas de falhas no processo (early fault detection) Melhoria no conhecimento do processo (fatores de risco)
10 INTRODUÇÃO APRESENTAÇÃO Métodos de classificação: CLASS-CONDITIONAL DENSITIES CONHECIDA DESCONHECIDA TEORIA BAYESIANA DE DECISÃO APRENDIZAGEM SUPERVISIONADA PARAMÉTRICOS ANÁLISE DISCRIMINANTE: -LINEAR -QUADRÁTICA NÃO PARAMÉTRICOS ESTIM. DENSIDADE: KERNELS, KNN CONSTR. FRONTEIRA DECISÃO: RNEURAIS, SVM, AID,
11 APRESENTAÇÃO Métodos de classificação e de previsão: São métodos utilizados para classificar novas observações (produtos, consumidores,...) em categorias ou agrupamentos, pré-estabelecidos. Exemplos: O analista financeiro criou 3 agrupamentos de empresas: alto risco, risco moderado e baixo risco. Ele precisa monitorar e reclassificar, mês a mês, cada uma das empresas avaliadas. Um fabricante de bens de consumo gostaria de prever a aceitação de um produto (combinação de atributos) que lançará (seria ou não o produto escolhido). Um pesquisador, da área de saúde, está interessado em saber se é possível determinar a probabilidade de um paciente ter ataque cardíaco dado sua pressão sanguínea, seu nível de colesterol, seu consumo diário de calorias, seu sexo e seu estilo de vida.
12 APRESENTAÇÃO Ementa: Self-study (pré-requisitos): modelos probabilísticos e métodos estatísticos, álgebra linear, regressão linear (simples e múltipla) e métodos de otimização (programação matemática). Métodos de interdependência: Análise de componentes principais, Análise Fatorial, Escalonamento Multidimensional, Análise de agrupamentos (hierárquica, não-hierárquica e baseada em densidade). Métodos avançados em análise de agrupamentos. Métodos de dependência: Métodos de detecção de interações (AID, ID3). Classificadores lineares. Análise Discriminante paramétrica e não-paramétrica. Regressão Logística. Support Vector Machine.
13 APRESENTAÇÃO Avaliação: Provas ( por bimestre) Listas de exercícios Exame final: trabalho individual
14 APRESENTAÇÃO Bibliografia: SHARMA,S. Applied Multivariate Techniques. John Wiley & Sons, 996. MYERS, J. H. e MULLET G. M. Managerial Applications of Multivariate Analysis in Marketing. Thomson, 003. DUDA, R. O., HART, P. E. e STORK, D. G. Pattern classification, nd. Edition, John Wiley & Sons, 00. WEBB, A. Statistical Pattern Recognition, nd edition. John Wiley & Sons, 00.
15 APRESENTAÇÃO Software: R O que é o R? É um ambiente desenvolvido para o desenvolvimento de análises. Quais as vantagens em utilizar o R? É um software gratuito e com código aberto (open source). Quem distribui o R? O R é distribuído por CRAN ( Comprehensive R Archive Network ). Onde consigo o R? Ele está disponível para download em Observação: é necessário carregar pacotes para análise multivariada.
16 APRESENTAÇÃO Para casa: Site: (Plano do curso,...) Seleção de algum software (Matlab, R, SAS,...) Leitura do artigo: Data Mining in Manufacturing: A Review (J. A. Harding, M. Shahbaz, S. Srinivas, A. Kusiak)
17 ANÁLISE DE COMPONENTES PRINCIPAIS (ACP) Rodrigo A. Scarpel
18 ANÁLISE DE COMPONENTES PRINCIPAIS É um método de escalonamento e de redução de dimensão (métodos utilizados na redução do número de variáveis por meio da geração de novas variáveis compondo as variáveis originais). Exemplos: i) Um analista financeiro interessado em estudar a saúde financeira de empresas identificou 8 indicadores financeiros. Entretanto, sua tarefa seria simplificada se os 8 indicadores pudessem ser reduzidos para poucos índices, independentes. ii) O departamento de controle de qualidade está interessado em desenvolver alguns poucos indicadores chave a partir de informações coletadas no processo de manufatura para determinar se este está ou não sob controle.
19 ANÁLISE DE COMPONENTES PRINCIPAIS Princípios: CP = w + w wp, p =,, Os pesos são determinados de forma que: i) A primeira componente principal (CP) deve capturar a máxima variância dos dados, ou seja: VAR CP ( ) = E[ ( ' x)( ' x) '] E[ ( ' x) ] E[ ( ' x) '] = E[ ' x x' ] E[ ' x] E[ x' ] VAR CP ( ) = '( E[ x x' ] E[ x] E[ x] ) = ' Max VAR ( CP ) = [ w w L w ],, p, σσ σ σ M σ pσ σ σ σ σ p σ M σ L L O L σσ p w σ σ p w M M σ pσ p wp,,, ii) = p w, + w, w, =, para fixar a escala das novas variáveis
20 ANÁLISE DE COMPONENTES PRINCIPAIS Princípios: no caso bi-dimensional CP + = w, w, Formulação: Max V = [ w w ] = w,, σ, + w σσ σ σ, σ σσ w σ σ w,,,, + w w σ σ S. A. w, + w, = CP w, = w w,, w w + w,,, = () 0
21 ANÁLISE DE COMPONENTES PRINCIPAIS Generalização do procedimento (ACP) para o caso p-dimensional: CP CP M CP p = w, = w = w,, p + w + w, + w,, p w w p, w p, M M M p, p p p p Os pesos são determinados seqüencialmente de forma que: i) A primeira componente principal (CP) deve capturar a máxima variância dos dados, a segunda componente (CP) capture a máxima variância dos dados desconsiderando o que já foi capturado por CP, e assim por diante.,, w j + w j w p j = ii), para fixar a escala das novas variáveis iii) Os novos eixos sejam ortogonais, ou seja,, w, t w [ w w w ], t L = 0, j t, j, j p, j M wp, t
22 ANÁLISE DE COMPONENTES PRINCIPAIS Formulação Geral: '.. '.. = Σ A S Max F O ) ' ( ' λ + Σ L = ( ) = Σ = Σ = = = ' 0 λ λ λ I L L = 0 Σ I λ (que é polinomial em λ de ordem p tendo, portanto, p raízes)
23 ANÁLISE DE COMPONENTES PRINCIPAIS Obtenção da autoestrutura de Σ: Para resolver a formulação geral, utilizando multiplicadores de Lagrange, é necessário obter as raízes de Σ-λI = 0. Como Σ é simétrica, as raízes são reais e correspondem aos autovetores de Σ e i corresponde ao autovetor associado ao autovalor λ i. Portanto, o procedimento (ACP) pode ser simplificado se considerarmos que estamos obtendo a autoestrutura de Σ, ou seja, estamos decompondo Σ em Λ Λ em que Λ é uma matriz diagonal com os autovalores λ λ... λ p 0 e é uma matriz ortogonal pxp em que as colunas são os p autovetores de Σ.
24 ANÁLISE DE COMPONENTES PRINCIPAIS Propriedades das componentes principais: i) As componentes são não correlacionadas: ( Λ ) Σ = Λ Var( ) = Var( ) = Σ = ii) A variância total é dada por Variância Total p = s= λ = λ + λ + L+ λ s p de forma que a proporção da variância explicada pela k-ésima CP é λk, k =, L, λ + λ + L+ λ p p
25 ANÁLISE DE COMPONENTES PRINCIPAIS Questões relacionadas à utilização da análise de componentes principais: i) Quantas componentes principais? ii) Como interpretar as componentes principais (novas variáveis)? iii) Linearmente independentes x estatisticamente independentes. iv) Padronizar ou não os dados (utilizar a matriz de variâncias covariâncias ou a matriz de correlação)
Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados
UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise
Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais
Estatística Aplicada à Administração II Tópico Análise de Componentes Principais Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 99 Análise de Componentes Principais
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel
MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana 1 2 Conteúdo Princípios de POAP : 1. O processo decisório
SME0822 Análise Multivariada 2 o semestre de 2014
SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014
Disciplinas Eletivas 1
Disciplinas Eletivas 1 Syllabus Nome da disciplina: Pesquisa de Mercado e Opinião Série: 2 o ano Ensino Médio (1º semestre) Carga Horária Semanal: 75min Duração: semestral Docente(s) responsável(eis):
Estudo dirigido de Análise Multivariada
Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto
Redes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Máquinas de suporte vetorial e sua aplicação na detecção de spam
e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura
SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113
SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25 Principais objetivos do curso Estudar e desenvolver
Análise estatística multivariada
Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser
G4 de Álgebra Linear I
G4 de Álgebra Linear I 27.1 Gabarito 1) Considere a base η de R 3 η = {(1, 1, 1); (1,, 1); (2, 1, )} (1.a) Determine a matriz de mudança de coordenadas da base canônica para a base η. (1.b) Considere o
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de Prof. Cibele Russo
SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de 2015 Prof. Cibele Russo [email protected] http://www.icmc.usp.br/ cibele Sala 3-139 23 de fevereiro de 2015 1 / 19 Principais objetivos
DATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados.
DATA MINING Mineração De Dados [email protected] www.fulviocristofoli.com.br Conceito As organizações perseguem inteligência. Nessa perseguição, elas processam informação, formulam planos e aspirações,
DEPARTAMENTO DE ENGENHARIA MECÂNICA
DEPARTAMENTO DE ENGENHARIA MECÂNICA Otimização: Algoritmos e Aplicações na Engenharia Mecânica ENG1786 & MEC2403 Ivan Menezes 2018-2 1 EMENTA 1. Introdução 1.1 Definições Básicas 1.2 Classificação dos
MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 3 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 2 3 4 5 6 7 8 9 0 2 3 4 5 e 6 Introdução à probabilidade (eventos, espaço
Redes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP
Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA
Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais
Estatística: Aplicação ao Sensoriamento Remoto SER 4 - ANO 9 Componentes Principais Camilo Daleles Rennó camilorenno@inpebr http://wwwdpiinpebr/~camilo/estatistica/ Associação entre Variáveis r = < r
G3 de Álgebra Linear I
G3 de Álgebra Linear I 2.2 Gabarito ) Considere a matriz 4 N = 4. 4 Observe que os vetores (,, ) e (,, ) são dois autovetores de N. a) Determine uma forma diagonal D de N. b) Determine uma matriz P tal
Aprendizagem de Máquina
Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina
UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada
UNIVERSIDADE FEDERAL FLUMINENSE Programa de Mestrado e Doutorado em Engenharia de Produção Disciplina: Estatística Multivariada Aula: Análise Discriminante Professor: Valdecy Pereira, D. Sc. email: [email protected]
ENG-418 OTIMIZAÇÃO DE PROCESSOS QUÍMICOS
Universidade Federal da Bahia - UFBA Escola Politécnica EP Departamento de Engenharia Química - DEQ Laboratório de Controle e Otimização de Processos Industriais - LACOI Disciplina: Otimização de Processos
ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP
Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA
MBA ANALYTICS EM BIG DATA
MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação
ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA
ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA Álgebra Linear e Geometria Analítica Prof. Aline Paliga EMENTA Vetores Dependência Linear Bases Produto Escalar Produto Vetorial Produto Misto Coordenadas Cartesianas
2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações
Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Diogo de Carvalho Bezerra Universidade Federal de Pernambuco Núcleo de Gestão e-mail:[email protected] SOBREA Sociedade
SUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Aprendizado de Máquina. Combinando Classificadores
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores
MINISTÉRIO DA EDUCAÇÃO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS CONSELHO DE GRADUAÇÃO
DISCIPLINA: GEOMETRIA ANALÍTICA E ÁLGEBRA VETORIAL CÓDIGO: 2DB.004 VALIDADE: Início: 01/2013 Término: Eixo: Matemática Carga Horária: Total: 75 horas/ 90 horas-aula Semanal: 06 aulas Créditos: 6 Modalidade:
Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação
Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2
COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA
Mineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior [email protected] 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
Função prcomp. 1. Introdução
Função prcomp 1. Introdução Apresentamos alguns exemplos de utilização da função prcomp do pacote stats em R. Esta função permite realizar uma análise de componentes principais a partir de uma matriz de
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares
10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR
10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir
SCC0173 Mineração de Dados Biológicos
SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Multicolinariedade e Autocorrelação
Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não
Exame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores
Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões PCA Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos de PCA e suas aplicações
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
8. Análise em Componentes Principais - ACP
8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
ANÁLISE DE COMPONENTES PRINCIPAIS APLICADO A SENSORIAL DE ALIMENTOS
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO PRÓ-REITORIA DE PESQUISA, PÓS-GRADUAÇÃO E INOVAÇÃO htttp://editora.iftm.edu.br/index.php/sepit ISSN 2594-7605 (Digital ANÁLISE DE
Inteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!
Análise Fatorial 1 Na análise fatorial as variáveis y1, y,..., Yp, são combinações lineares de umas poucas variáveis F1, F,..., Fm (m
Introdução ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática
ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática [email protected] UTFPR-CP Grupo de Pesquisa em Bioinformática e Reconhecimento de Padrões [email protected] Curso de
Análise de Componentes Principais (PCA)
Análise de Componentes Principais (PCA) Lailson B. Moraes, George D. C. Cavalcanti {lbm4,gdcc}@cin.ufpe.br Roteiro Introdução Características Definição Algoritmo Exemplo Aplicações Vantagens e Desvantagens
Fundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes [email protected] O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Funções Reais I. Espaços Vetoriais
ESTRUTURA CURRICULAR Ênfase em Matemática Aplicada Funções Reais I Análise e aprofundamento dos tópicos necessários para desenvolver um estudo completo sobre funções de uma variável real, preparando os
4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)
ANÁLISE DE DADOS 4 ANÁLISE DE DADOS A definição das características das águas subterrânea baseou-se nas análises químicas e físico-químicas e na utilização de métodos estatísticos, como a estatística multivariada
Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9
em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review
