MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel

Tamanho: px
Começar a partir da página:

Download "MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel"

Transcrição

1 MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel

2 Programa do curso: Semana 1 2 Conteúdo Princípios de POAP : 1. O processo decisório no âmbito da produção e da pesquisa operacional; 2. Abordagens de pesquisa operacional para suportar o processo decisório: 2.1. Criação de Modelos de Previsão 2.2. Extração de Conhecimento de Bases de Dados 2.3. Otimização 2.4. Simulação Métodos de Previsão em POAP : 1. Propósitos da Previsão 2. Processo de Criação de Modelos de previsão 2.1. Previsão por séries temporais 2.2. Previsão por modelos causais 2.3. Previsão para variáveis categóricas 3 4 Extração de Conhecimento de Bases de Dados em POAP : 1. Aplicações do Processo ECBD em problemas de Produção 2. O Processo de Extração de Conhecimento de Bases de Dados (ECBD): 2.1. Redução de dimensão e visualização 2.2. Segmentação 2.3. Classificação Otimização em POAP : 1. Aplicação de métodos de Otimização em problemas da Cadeia de Suprimentos: 1.1. Planejamento logístico: transporte e distribuição, localização e cobertura, caminho mais curto Planejamento da Produção: planejamento agregado, otimização em múltiplos períodos, dimensionamento de estoques Avaliação de eficiência: análise de envoltória de dados 1.4. Gerenciamento de projetos: seleção de projetos, problema do caminho crítico. 5 Prova: 04/12/14

3 Aplicação do processo de ECBD em Produção:

4 Abordagens em modelos para ECBD: 1. Processo de ECBD: 2. CRISP-DM (Cross Industry Standard Process for Data Mining): 3. SEMMA:

5 Abordagem em modelos para extração de conhecimento de bases de dados: Observações: É um processo sequêncial com possibilidade de retorno As etapas de seleção, pré-processamento e transformação dos dados consomem cerca de 80% do tempo.

6 Etapa 1: Seleção dos dados Objetivos da seleção: Criar um sub-conjunto dos dados em função dos objetivos da análise Colocar dados no formato analítico : Observações (linhas): uma linha por instância Atributos ou variáveis (colunas) Operações necessárias: Transposição, Sumarização,

7 Etapa 2: Pré-processamento dos dados Objetivos do pré-processamento: Colocar dados no formato analítico : observações (linhas) e atributos (colunas) Verificar a qualidade dos dados Fatores que degradam a qualidade dos dados: Dados com erro: respostas falsas, erros na tabulação das respostas, Outliers: observações que aparentemente são inconsistentes quando comparadas às outras observações. Dados faltantes (missing values)

8 Etapa 2: Pré-processamento dos dados DETECÇÃO DE OUTLIERS: Origem: dados com erro ou observação pertencente a outra população. Critério: O critério para a definição de outliers varia muito conforme os autores. De maneira geral, considera-se outlier uma medida acima ou abaixo de 2,5 desvios-padrão da média. Forma de detecção: estatísticas de sumarização, histogramas, boxplot. Tratamento: eliminação dos outliers ou transformação dos dados

9 Etapa 2: Pré-processamento dos dados DADOS FALTANTES (MISSING VALUES) Missing values é zero (não ocorreu) ou é falta de informação (não sei se ocorreu)? Deve-se tomar cuidado no tratamento dos missing values. Tratar? Eliminar a variável? Eliminar a observação? observações variáveis???? Apenas 8 dos 144 valores são missing (5,55%), porém apenas 6 observações seriam utilizadas.????

10 Etapa 2: Pré-processamento dos dados DADOS FALTANTES (MISSING VALUES) Tratamento: depende de quantos dados estão faltando (percentual de missing values) e de sua distribuição. Alternativas: Omitir observações: é aceitável quando os dados faltantes estão concentrados em algumas observações. Omitir variáveis: é aceitável quando os dados faltantes estão concentrado em algumas variáveis. Atribuir valores: Substituir pela média Método analítico.

11 Etapa 3: Transformação dos dados Objetivos da transformação dos dados: Criação de índices e taxas: são amplamente utilizados em gerenciamento. Padronização e normalização dos dados: para eliminar efeitos de escala ou adequar os dados às hipóteses do modelo. Eliminar outliers: Log (ou Ln), Raiz, Categorização

12 Etapa 4: Mineração dos dados Objetivos da mineração dos dados: 1. Análise de associação (link analysis) 2. Análise de sequência 3. Sumarização (por Visualização) 4. Modelagem de dependência 5. Formação de agrupamentos (clustering) 6. Classificação 7. Previsão: Criar um mapeamento dos dados a uma variável contínua

13 Mineração dos dados: Sumarização Objetivo: Descrever um conjunto de dados considerando Conjunto de variáveis existentes e suas relações Instâncias ou observações Alternativa: Usar técnicas multivariadas de visualização: Análise de correspondência Wordclouds Análise de Homogeneidade

14 Mineração dos dados: Sumarização Uso de técnicas multivariadas de visualização:

15 Mineração dos dados: Sumarização Exemplo 1: Análise de Correspondência (código.1)

16 Mineração dos dados: Sumarização Análise de correspondência: Baseada na decomposição em valores singulares (SVD) da matriz de dados. Exemplo: Posicionamento de cinco airlines AA UA US Con SW Convenience Punctuality Overall_service Comfort

17 Mineração dos dados: Sumarização Exemplo 2: Wordcloud (código.2)

18 MD: Modelagem de Dependência Objetivo: Descrever as relações de um conjunto de variáveis Alternativas: Usar técnicas multivariadas de visualização: Análise de correspondência múltipla (MJCA) BIPLOT Estabelecer uma função que relacione as variáveis: Análise Fatorial Exploratória

19 MD: Modelagem de Dependência Exemplo 1: Pesquisa de mercado Cervejas (código.3) 162 respondentes Atributos: Marca: Brahma, Antárctica Faixa de Renda: AB, C, DE Sexo: Masculino, Feminino Faixa de idade: 18-29, 30-39, 40-49, 50+ Tipo: Regular (Pilsen), Chopp, Outras

20 X2 X2 Mineração dos dados: Sumarização Análise de componentes principais / Biplot: X1 X1 CP 1 w1,1 X1 w2,1 X 2 Formulação Max V S. A. w w 1,1 2 1,1 w 2 1 2,1 w , w 2 w 2 1,1 2,1 1,1 2,1 2w w 1 2 w 2 2 1,1 w2,1 1

21 Mineração dos dados: Sumarização Princípios de Análise Fatorial: Objetivo: mensurar fatores não observáveis (também chamados de constructos) Experimento de Spearman (1904): FATOR () M F Q I H L MATEMÁTICA (M) FÍSICA (F) QUÍMICA (Q) INGLÊS (I) HISTÓRIA (H) L. PORTUGUESA (L) e M e F e Q e I e H e L Desta forma, esperavasse que o desempenho dos alunos, em cada disciplina, dependesse de um fator comum e de um fator específico.

22 Mineração dos dados: Sumarização Princípios de Análise Fatorial: Formulação do problema da análise fatorial: No exemplo: F. O. Max S. A. i j p p 2 i ou Min i1 i1 x, x, i j i j 2 i 1 FATOR () M L F Q H I =0,8 =0,5 =0,7 0,9= =0,6 MATEMÁTICA FÍSICA QUÍMICA INGLÊS HISTÓRIA L. PORTUGUESA (M) (F) (Q) (I) (H) (L) =0,65 0,36 0,51 0,19 0,64 0,75 0,58 e M e M e F e Q e I e H e L e F e Q e I e H e L Variância explicada (comum) = 2,973 (49,5%)

23 MD: Modelagem de Dependência Exemplo 3: Análise Financeira de empresas (código.4) 172 Empresas de capital aberto (com ações na Bovespa) Índices financeiros: Margem de lucro líquido (MLL) Retorno sobre o ativo total (ROA) Giro do ativo total (GA) Endividamento Geral (EG) Endividamento Financeiro (EG) Liquidez corrente (LC)

24 MD: Formação de Agrupamentos Objetivo: Agrupar observações e/ou atributos, de acordo com algum critério de similaridade. Alternativas: Utilização de métodos hierárquicos: Método do vizinho mais próximo Método do centróide Método de Ward Utilização de métodos não-hierárquicos: K-médias Utilização de métodos baseados em inteligência artificial: SOM

25 MD: Formação de Agrupamentos Como o STP cria valor: Segmentation Identificar segmentos Targeting Selecionar alvo Positioning Criar vantagem competitiva Recursos são focados para melhor atender as necessidades dos clientes e entregar mais valor Clientes desenvolvem preferências por marcas que atendem melhor suas necessidades e entregam mais valor Clientes se tornam leais a marcas / fornecedores, repetem compras, comunicam experiências favoráveis Lealdade a Marcas / fornecedores geram aumento na fatia de mercado e criam barreiras a entrada de novos competidores Menos recursos são necessários, ao longo do tempo, para manter a fatia de mercado devido a lealdade às marcas / fornecedores Lucratividade (valor da empresa) aumentam

26 MD: Formação de Agrupamentos Níveis de segmentação: Mercado de Massa Macro Segmentos A B C Micro Segmentos Segmentos de Um

27 Educação (anos) MD: Formação de Agrupamentos Método da ligação simples (vizinho mais próximo) : Cluster K D KL D KL min i C K min j C L d ( x i, x j ) Cluster L CLUSTER Observ Renda Educação 1 S S S S S S Renda (R$ mil) S1 S2 S3 S4 S5 S6 S S S S S S S1&S2 S3&S4 S5 S6 S1&S S3&S S S

28 Educação (anos) MD: Formação de Agrupamentos Método da ligação simples (vizinho mais próximo) : S1&S2 S3&S4 S5 S6 S1&S S3&S S S S1&S2 S3&S4 S5&S6 S1&S S3&S S5&S S1&S2 S3&S4&S5&S6 S1&S S3&S4&S5&S Distance 15, Renda (R$ mil) DENDOGRAMA 10,51 5,25 0, Observations

29 MD: Formação de Agrupamentos NÚMERO IDEAL DE AGRUPAMENTOS: Há diversas abordagens para determinar o número ideal de agrupamentos: 1. Arbitrar o número (valor conhecido, razões práticas). 2. Escolher o número que resulte nos agrupamentos de mais fácil interpretação. 3. Distância entre os agrupamentos: Distance 15,76 10,51 5,25 0,00 DENDOGRAMA 145 1/ / Observations Média = (2 1/ /2 ) / 5 = 6,05 Diferenças: 26 1/2-2 1/2 = 3, /2-26 1/2 = 5,19 2 1/2 2 1/2 26 1/ / /2 = 1,75

30 Educação (anos) MD: Formação de Agrupamentos Método do centróide: Cluster K X D KL D KL x K x L Cluster L X Renda (R$ mil) S1 S2 S3 S4 S5 S6 S S S S S S S1&S2 S3&S4 S5 S6 S1&S ,5 782,5 S3&S ,5 230,5 S5 590,5 120, S6 782,5 230, CLUSTER Observ Renda Educação 1 S S S S S S CLUSTER Observ Renda Educação 1 S1&S2 5,5 5,5 2 S3&S4 15,5 14,5 3 S S

31 Educação (anos) Educação (anos) MD: Formação de Agrupamentos Método do centróide: S1&S2 S3&S4 S5 S6 S1&S ,5 782,5 S3&S ,5 230,5 S5 590,5 120, S6 782,5 230, CLUSTER Observ Renda Educação 1 S1&S2 5,5 5,5 2 S3&S4 15,5 14,5 3 S5&S6 27,5 19, Renda (R$ mil) S1&S2 S3&S4 S5&S6 S1&S S3&S S5&S CLUSTER Observ Renda Educação 1 S1&S2 5,5 5,5 2 S3&S4&S5&S6 21, Renda (R$ mil)

32 Educação (anos) MD: Formação de Agrupamentos Método do centróide: S1&S2 S3&S4 S5&S6 S1&S S3&S S5&S CLUSTER Observ Renda Educação 1 S1&S2 5,5 5,5 2 S3&S4&S5&S6 21, Renda (R$ mil) S1&S2 S3&S4&S5&S6 S1&S ,25 S3&S4&S5&S6 388,25 0 Distance 15,76 10,51 DENDOGRAMA 5,25 0, Observations

33 MD: Formação de Agrupamentos Método de Ward: Por esse método os agrupamentos são formados pela maximização da homogeneidade dentros dos grupos. Para o cálculo da homogeneidade utiliza-se a média de quadrados: ANOVA ANOVA D KL xk xl 1 1 nk n L 2 CLUSTERS MEMBROS DOS CLUSTERS POSSÍVEIS QM 1 S1, S2 S3 S4 S5 S6 0,5 2 S1, S3 S2 S4 S5 S6 45,25 3 S1, S4 S2 S3 S5 S6 55,25 4 S1, S5 S2 S3 S4 S6 156,25 5 S1, S6 S2 S3 S4 S5 205,25 6 S2, S3 S1 S4 S5 S6 36,25 7 S2, S4 S1 S3 S5 S6 45,25 8 S2, S5 S1 S3 S4 S6 139,25 9 S2, S6 S1 S3 S4 S5 186,25 10 S3, S4 S1 S2 S5 S6 0,5 11 S3, S5 S1 S2 S4 S6 34,0 12 S3, S6 S1 S2 S4 S5 62,5 13 S4, S5 S1 S2 S3 S6 26,5 14 S4, S6 S1 S2 S3 S5 53,0 15 S5, S6 S1 S2 S3 S4 6,5 ((5-5,5) 2 +(6-5,5) 2 + (5-5,5) 2 +(6-5,5) 2 )/2 CLUSTER Observ Renda Educação 1 S S S S S S

34 ... MD: Formação de Agrupamentos Método do centróide: CLUSTERS MEMBROS DOS CLUSTERS POSSÍVEIS QM 1 S1, S2,S3 S4 S5 S6 54,7 2 S1, S2,S4 S3 S5 S6 67,335 3 S1, S2,S5 S3 S4 S6 197,335 4 S1, S2,S6 S3 S4 S5 261,335 5 S1, S2 S3,S4 S5 S6 1,0 6 S1, S2 S3,S5 S4 S6 34,5 7 S1, S2 S3,S6 S4 S5 63,0 8 S1, S2 S4,S5 S3 S6 27,0 9 S1, S2 S4,S6 S3 S5 53,5 10 S1, S2 S5,S6 S3 S4 7,0 CLUSTERS MEMBROS DOS CLUSTERS POSSÍVEIS 1 QM 1 S1, S2,S3,S4,S5,S6 58,5

35 MD: Formação de Agrupamentos Método do centróide: número ideal de agrupamentos Para o método Ward, além das abordagens anteriores, utiliza-se: 1. R 2 = 1 (SQW / SQT), em que SQW é a soma de quadrados within-cluster, SQT é a soma de quadrados total SQT = n T * Height T SQW = n 1 *Height 1 + n 2 *Height 2 + n 3 *Height 3

36 MD: Formação de Agrupamentos Exemplo 1: Análise de Correspondência (código.5)

37 MD: Formação de Agrupamentos Exemplo 2: Pesquisa de mercado Cervejas (código.6) 162 respondentes Atributos: Marca: Brahma, Antárctica Faixa de Renda: AB, C, DE Sexo: Masculino, Feminino Faixa de idade: 18-29, 30-39, 40-49, 50+ Tipo: Regular (Pilsen), Chopp, Outras

38 MD: Formação de Agrupamentos Exemplo 3: Análise Financeira de empresas (código.7) 172 Empresas de capital aberto (com ações na Bovespa) Índices financeiros: Margem de lucro líquido (MLL) Retorno sobre o ativo total (ROA) Giro do ativo total (GA) Endividamento Geral (EG) Endividamento Financeiro (EG) Liquidez corrente (LC)

39 MD: Modelos de classificação Objetivo: Associar as instâncias (observações) a categorias prédefinidas. Alternativas: Árvores de regressão e classificação (CART) Análise discriminante Regressão logística Redes neurais artificiais Modelos de programação matemática Support vector machine

40 MD: Modelos de classificação Boas práticas na criação de modelos de classificação: Dividir os dados em bases de treinamento e validação (pode ter uma terceira que é a base de teste). Training Set Test Set Overfitting: Training Set Test Set Better Fitting:

41 MD: Modelos de classificação AUTOMATIC INTERACTION DETECTION Sistema de classificação que particiona o espaço de atributos de forma a criar regras para definir as classes Resultado: um conjunto de regras e uma árvore (diagrama) Algoritmo: CART (Classification And Regression Trees) Elementos da árvore de decisão Nó raiz (primeira questão) Ligações ou ramos (possíveis respostas) Outros nós (outras questões) Nó terminal (decisão final) A classificação de uma observação inicia no nó raiz e segue as ligações correspondentes às respostas corretas até chegar no nó terminal.

42 Renda anual (R$) MD: Modelos de classificação AUTOMATIC INTERACTION DETECTION Ilustração: classificação em risco IDADE > 35 NÃO SIM Alto risco Renda anual maior que R$ ,00 NÃO SIM Médio risco Baixo risco Idade (anos) Acurácia = % Esse modelo é construído a partir de um conjunto de treinamento seguindo algumas regras: Partição: escolha da melhor partição Parada: quando parar de particionar A acurácia é obtida a partir de um conjunto de teste.

43 MD: Modelos de classificação AUTOMATIC INTERACTION DETECTION Critério de partição: Índice de Gini= 1 C 2 p j j1 Entropia= Exemplo: C j1 p j log( p j ) Entropia : C j1 p j log( p j ) 2(3/8)log(3/8) 2(1/8)log(1/8) 0,5452 C j1 p j log( p j ) (1/ 7) log(1/ 7) (6 / 7)log(6/ 7) 0,1781

44 MD: Modelos de classificação AUTOMATIC INTERACTION DETECTION Exemplo 1: Detecção de falhas (código.8) Variável dependente: Falha (Sim ou Não) Variáveis independentes: Viscosidade da tinta Temperatura da tinta Umidade do papel Velocidade da impressora Percentual de tinta Percentual de solvente

45 MD: Modelos de classificação ANÁLISE DISCRIMINANTE Sistema de classificação que se baseia nas médias das variáveis independentes por classe Resultado: Equação de partição e ponto de corte Algoritmo: Análise de Regressão

46 Etapa 5: Avaliação Acerto global = (n 11 +n n NN )/N DE TREINO PARA ,9 7,7-7,1 92,3 VALIDAÇÃO PARA ,4% 7,8% DE - 7,6% 92,2% ACERTO GLOBAL = 92,6% ACERTO GLOBAL = 92,3%

47 MD: Modelos de classificação ANÁLISE DISCRIMINANTE Exemplo 1: Detecção de falhas Variável dependente: Falha (Sim ou Não) Variáveis independentes: Viscosidade da tinta Temperatura da tinta Umidade do papel Velocidade da impressora Percentual de tinta Percentual de solvente

48 MD: Modelos de classificação ANÁLISE DISCRIMINANTE Exemplo 2: Previsão de Insolvência de Empresas TOTAL DE EMPRESAS: 99 (60 SOLVENTES e 39 INSOLVENTES) Distribuição das empresas insolventes () e solventes () nos conjuntos de treino e de validação em função das 3 variáveis utilizadas (ROA, LC e GA) TREINO: 50 EMPRESAS (32 SOLVENTES E 18 INSOLVENTES) VALIDAÇÃO: 49 EMPRESAS (32 SOLVENTES E 17 INSOLVENTES)

49 OBSERVAÇÃO Este material refere-se às notas de aula do curso MB-756 (Pesquisa Operacional Aplicada à Produção) do Instituto Tecnológico de Aeronáutica (ITA). Não substitui o livro texto, as referências recomendadas e nem as aulas expositivas. Este material não pode ser reproduzido sem autorização prévia do autor. Quando autorizado, seu uso é exclusivo para atividades de ensino e pesquisa em instituições sem fins lucrativos.

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise

Leia mais

Métodos de Análise de Dados (AO-802)

Métodos de Análise de Dados (AO-802) Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados

Leia mais

MPEP ITA PG/EAM-P. Turma Senai. Plano de Ensino. MB-756 Pesquisa Operacional Aplicada à Produção

MPEP ITA PG/EAM-P. Turma Senai. Plano de Ensino. MB-756 Pesquisa Operacional Aplicada à Produção MPEP www.mpep.ita.br ITA PG/EAM-P Turma Senai Plano de Ensino MB-756 Pesquisa Operacional Aplicada à Produção Professor responsável: Rodrigo Arnaldo Scarpel São José dos Campos, SP 15 de Junho de 2014

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR 10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir

Leia mais

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008 21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017

Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017 Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO AULA 4 02/06/17 Prof a Lilian M. Lima Cunha Junho de 2017 DEFINIÇÃO Análise de conglomerados (Cluster Analysis) é uma das técnicas de análise multivariada

Leia mais

Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada

Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada MBA ANALYTICS OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de decisão com base nas

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel

MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Rodrigo A. Scarpel Graduação: Engenharia de Produção - UFSCar (1997) Mestrado: ITA Produção

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

APLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO

APLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO CARGA HORÁRIA: 92 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS O curso tem como objetivo apresentar algumas técnicas

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo APRESENTAÇÃO Métodos Multivariados: São métodos (ferramentas analíticas) utilizados na transformação de dados (várias medidas

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

Considerações de Desempenho

Considerações de Desempenho Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem

Leia mais

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Análise estatística multivariada

Análise estatística multivariada Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser

Leia mais

Back Propagation. Dicas para o BP

Back Propagation. Dicas para o BP Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

MB-300 SEMINÁRIO DE TESE

MB-300 SEMINÁRIO DE TESE MB-300 SEMINÁRIO DE TESE FORMULAÇÃO DE PROJETOS DE PESQUISA Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Roteiro: Motivação para formular projetos de pesquisa Roteiro de um projeto de pesquisa

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis: Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização

Leia mais

ÍNDICE Janelas Menus Barras de ferramentas Barra de estado Caixas de diálogo

ÍNDICE Janelas Menus Barras de ferramentas Barra de estado Caixas de diálogo XXXXXXXX ÍNDICE INTRODUÇÃO 15 1. VISÃO GERAL DO SPSS PARA WINDOWS 17 1.1. Janelas 17 1.2. Menus 20 1.3. Barras de ferramentas 21 1.4. Barra de estado 21 1.5. Caixas de diálogo 22 2. OPERAÇÕES BÁSICAS 23

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

Informática Parte 19 Prof. Márcio Hunecke

Informática Parte 19 Prof. Márcio Hunecke Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

FONTES DE ERRO, HIPÓTESES, ANÁLISE EXPLORATÓRIA DE DADOS 1ª PARTE

FONTES DE ERRO, HIPÓTESES, ANÁLISE EXPLORATÓRIA DE DADOS 1ª PARTE FONTES DE ERRO, HIPÓTESES, ANÁLISE EXPLORATÓRIA DE DADOS 1ª PARTE 1 Fontes de erro Mesmos dados População incorreta 2 Prescrição Objetivos: 1º passo Formular hipóteses ANTES Listar fontes de variação Definir

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar

Leia mais

Informática. Aprendizado de Máquina. Professor Márcio Hunecke.

Informática. Aprendizado de Máquina. Professor Márcio Hunecke. Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

SUPPORT VECTOR MACHINE - SVM

SUPPORT VECTOR MACHINE - SVM SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento

Leia mais

MBA ANALYTICS EM BIG DATA

MBA ANALYTICS EM BIG DATA MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28

Leia mais

Análise de Correspondência (ANACOR)

Análise de Correspondência (ANACOR) Universidade de São Paulo Faculdade de Economia, Administração e Contabilidade EAC 0355 Análise Multivariada Análise de Correspondência (ANACOR) F 1 1 INTRODUÇÃO ANACOR: A ANÁLISE DE CORRESPONDÊNCIA SIMPLES

Leia mais

Capítulo 1 Conceitos de Marketing e Marketing Research

Capítulo 1 Conceitos de Marketing e Marketing Research Índice Prefácio 21 Introdução 25 PARTE I Capítulo 1 Conceitos de Marketing e Marketing Research 1. Evolução do Marketing 33 2. Evolução do conceito de Marketing 35 3. Modelo do sistema de Marketing 38

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Descrição do Método de Análise de Clusters

Descrição do Método de Análise de Clusters ANÁLISE DE CLUSTERS A análise de Clusters designa uma série de procedimentos estatísticos sofisticados que podem ser usados para classificar objectos e pessoas por observação das semelhanças e dissemelhanças

Leia mais

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos

Leia mais

CURTA DURAÇÃO MODELOS DE DATA MINING

CURTA DURAÇÃO MODELOS DE DATA MINING CURTA DURAÇÃO MODELOS DE DATA MINING 1 OBJETIVO Este curso tem como objetivo aplicar conceitos de análise quantitativa de informação do ambiente econômico e de negócios; apresenta metodologias de tratamento

Leia mais

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->

Leia mais

FONTES DE ERRO, HIPÓTESES, ANÁLISE EXPLORATÓRIA DE DADOS 1ª PARTE

FONTES DE ERRO, HIPÓTESES, ANÁLISE EXPLORATÓRIA DE DADOS 1ª PARTE FONTES DE ERRO, HIPÓTESES, ANÁLISE EXPLORATÓRIA DE DADOS 1ª PARTE 1 Fontes de erro Mesmos dados População incorreta 2 Prescrição Objetivos: 1º passo Formular hipóteses ANTES Listar fontes de variação Definir

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Pontifícia Universidade Católica de São Paulo Graduação em Matemática Empresarial

Pontifícia Universidade Católica de São Paulo Graduação em Matemática Empresarial Ciências Humanas e Sociais 36 30 -- -- -- -- -- -- 30 -- 2 36 30 Economia 1 36 30 18 15 -- -- -- -- 45 -- 3 54 45 Fundamentos de Matemática 72 60 -- -- -- -- -- -- -- 60 4 72 60 1º Introdução à Geometria

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

Agenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios

Agenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios Machine Learning Agenda Conceitos Iniciais Modelos de aprendizado Oportunidades e casos de uso Ferramentas Desafios Ronald Bertele Bacharelado em Ciências da Computação - UCS MBA em Gestão de Negócios

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Mining Árvores de Decisão Categorização de Dados Parte II Rogério

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos

Leia mais

Pesquisador. Planejamento de Experimentos Design of Experiments - DOE NOÇÕES SOBRE EXPERIMENTOS FATORIAIS. 1 - Fixar T e variar P até > Pureza

Pesquisador. Planejamento de Experimentos Design of Experiments - DOE NOÇÕES SOBRE EXPERIMENTOS FATORIAIS. 1 - Fixar T e variar P até > Pureza 3 NOÇÕES SOBRE EXPERIMENTOS FATORIAIS Planeamento de Experimentos Design of Experiments - DOE Em primeiro lugar devemos definir o que é um experimento: Um experimento é um procedimento no qual alterações

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS 3 NOÇÕES SOBRE EXPERIMENTOS FATORIAIS Planejamento de Experimentos Design of Experiments - DOE Em primeiro lugar devemos definir o que é um experimento: Um experimento é um procedimento no qual alterações

Leia mais

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Mateus Curcino de Lima, Maria Camila Nardini Barioni, Humberto Luiz Razente mateuscurcino@mestrado.ufu.br, {camila.barioni,humberto.razente}@ufu.br

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

índice 2. Vetores e Tipos Primitivos PARTE 1- O Sistema R 1. Introdução ao Sistema R

índice 2. Vetores e Tipos Primitivos PARTE 1- O Sistema R 1. Introdução ao Sistema R índice Os Autores Prólogo XI XIII PARTE 1- O Sistema R 1. Introdução ao Sistema R 1.1. O que é o R? 1.2. Instalar o R 1.3. Edição de Comandos e Ambientes de Desenvolvimento 1.. Objetos, Funções e Packages

Leia mais

Determinação de vícios refrativos oculares utilizando Support Vector Machines

Determinação de vícios refrativos oculares utilizando Support Vector Machines Determinação de vícios refrativos oculares utilizando Support Vector Machines Giampaolo Luiz Libralão, André Ponce de Leon F. de Carvalho, Antonio Valerio Netto, Maria Cristina Ferreira de Oliveira Instituto

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a 1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

CURSO DE LOGÍSTICA INTEGRADA DE PRODUÇÃO. Ferramentas de Apoio à Decisão Prof. Dr. Fabrício Broseghini Barcelos PARTE 01

CURSO DE LOGÍSTICA INTEGRADA DE PRODUÇÃO. Ferramentas de Apoio à Decisão Prof. Dr. Fabrício Broseghini Barcelos PARTE 01 CURSO DE LOGÍSTICA INTEGRADA DE PRODUÇÃO Ferramentas de Apoio à Decisão Prof. Dr. Fabrício Broseghini Barcelos PARTE 01 Tomada de Decisão É o processo de identificar um problema específico e selecionar

Leia mais

Análise de dados multivariados I

Análise de dados multivariados I Análise de dados multivariados I Tópico: Análise de Conglomerados ou Agrupamentos (ou ainda, Cluster Analysis) Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 199

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE: A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE: ESELAW 09 MARCOS ANTÔNIO P. & GUILHERME H. TRAVASSOS) 1 Aluna: Luana Peixoto Annibal

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

Arvores de decisão. O que é uma árvore de decisão? Victor Lobo

Arvores de decisão. O que é uma árvore de decisão? Victor Lobo Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Nós (testes, ou conceitos)

Leia mais

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística 1 Introdução Definição: Estatística é um conjunto de conceitos e métodos científicos para coleta, organização, descrição, análise

Leia mais

Aula 3 Representação do Conhecimento

Aula 3 Representação do Conhecimento Aula 3 Representação do Conhecimento Sumário (Representação do Conhecimento) - Introdução - Tabelas - Modelos Lineares - Árvores - Regras - Baseada em Instância - Clusters (Aglomerado) - Prática: Árvore

Leia mais

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Introdução a Machine Learning: Teoria, Aplicações e IA na Arquitetura Intel Vitor Hugo Ferreira, DSc - UFF Flávio Mello, DSc UFRJ e Ai2Biz

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais