2COP355 INTELIGÊNCIA COMPETITIVA. Algoritmos. Sylvio Barbon Junior 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1

Tamanho: px
Começar a partir da página:

Download "2COP355 INTELIGÊNCIA COMPETITIVA. Algoritmos. Sylvio Barbon Junior 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1"

Transcrição

1 2COP355 INTELIGÊNCIA COMPETITIVA Algoritmos Sylvio Barbon Junior 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1

2 Sumário Etapa I Etapa II Inteligência de Negócios Visão Geral sobre Mineração de Dados Input: Conceitos, Instâncias e Atributos Etapas vinculadas à Mineração de Dados Estudo de Caso 1: Segurança em Redes Sociais Digitais Output: Representação do Conhecimento Algoritmos Básicos Weka: Framework para Machine Learning Avaliando os Resultados Estudo de Caso 2: Produção de Uvas 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 2

3 BI - Business Intelligence Definição: Processo de coleta, organização, análise, compartilhamento, monitoramento de informação que oferecem suporte a gestão de negócios. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 3

4 Comparação de Terminologia 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 4

5 Visão Geral sobre Mineração de Dados Data Mining - Mineração de Dados Volume de dados no qual temos acesso e geramos; Redução dos custos de equipamentos de armazenamento; Fácil disponibilidade e compartilhamento dos dados; As the volume of data increases, inexorably, the proportion of it that people understand decreases alarmingly"; Distanciamento entre: compreensão e geração de dados; Um objetivo mais direto da Mineração de Dados é solucionar problemas analisando dados passados, presentes em um conjunto de dados (dataset); Definição de Mineração de Dados: É o processo de descoberta de padrões em dados. Este processo precisa ser automático ou semi-automático. Os padrões reconhecidos precisam ser significativos e agregar vantagens. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 5

6 Visão Geral sobre Mineração de Dados Machine Learning - Aprendizado de Máquina O que é aprendizado? Adquirir conhecimento por meio de estudos; Tornar-se consciente por meio da informação ou observação; Persistir na memória; Informar-se sobre algo; Receber instruções; Convertendo para computação: Conhecimento e Desempenho; Definição de Aprendizado de Máquina: É uma sub-área da Inteligência Artificial focada no desenvolvimento de algoritmos que podem aprender, melhorar, reconhecer e predizer novas informações baseando-se em dados. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 6

7 Visão Geral sobre Mineração de Dados Exemplos de Áreas de Aplicação Web Mining: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 7

8 Visão Geral sobre Mineração de Dados Exemplos de Áreas de Aplicação Apoio a Decisão Estratégica: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 8

9 Exemplos de Áreas de Aplicação Varredura de Imagens: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 9

10 Visão Geral sobre Mineração de Dados Exemplos de Áreas de Aplicação Previsão de Consumo Energético: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 10

11 Visão Geral sobre Mineração de Dados Exemplos de Áreas de Aplicação Diagnóstico por Imagem: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 11

12 Input: Conceitos, Instâncias e Atributos Conceitos Conceito: Aquilo que se está tentando encontrar [Classe, Grupo, Rótulo]; Inteligibilidade: Capacidade de ser compreendido e discutido; Operacional: Capacidade de ser aplicado a exemplos atuais; Instância: É um indivíduo, um exemplo independente do conceito a ser aprendido [Elemento, Exemplo, Amostra]; Atributos: São os valores que qualificam os aspectos de uma Instância [Descritor, Característica, Valor]; Instâncias Multi-rótulos: Quando uma instância pertence a múltiplas classes [ multilabeled instances]; Modelo: É a descrição da solução aprendida Aprendizado Supervisionado: É o nome dado as técnicas de aprendizado baseados em exemplos rotulados, utilizados na fase de treinamento dos modelos. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 12

13 Input: Conceitos, Instâncias e Atributos Tipos de Atributos Atributos Nominais: Relacionado a nomes, podem ser símbolos ou palavras que relacionam-se as dimensões nos elementos. Exemplo: marrom, vermelho, casado, divorciado. Atributos Binários: São atributos que variam entre duas possibilidades. Normalmente são relacionados a presença ou ausência de uma categoria. Exemplo: fumante e masculino. Podem ser simétricos quando os valores tem o mesmo peso ou assimétricos quando os valores são de importâncias diversas. Exemplos: gênero (simétrico) e HIV (assimétrico). Atributos ordinais: Estão relacionados a ordem ou ranking de algo. Podem ser obtidos pela discretização de informações numéricas. Este atributo, assim como nominal e binário são qualitativos (que descrevem algo). Exemplo: tamanho como pequeno (1), médio (2) e grande (3). Atributos numéricos: É um atributo quantitativo, que mede quantidade de algo e é representado por valores inteiros ou reais. Exemplo: temperatura, altura, pressão, velocidade etc. Devido a sua escala, pode-se computar tendências estatisticamente. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 13

14 Input: Conceitos, Instâncias e Atributos Tipos de Atributos Dados esparsos: Quando muitos atributos de uma instância são 0". A representação destes dados se torna impraticável. Soluções identificação de atributos não zero normalmente são aplicadas. Exemplo: {0, X, 0, 0, 0, 0, Y, 0, 0, 0, ClasseA } {1X, 6Y, 10 ClasseA } Valores desconhecidos: São valores corrompidos ou que não estão presentes no dataset. Medidas como atribuição pela média ou eliminação da instância, são práticas para lidar com esse tipo de problema. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 14

15 Input: Conceitos, Instâncias e Atributos Padrão ARFF ARFF: Attribute-Relation File Format é um dos padrões para a criação dos datasets para Mineração de Dados. É um arquivo de texto ASCII que descreve um dataset, seus atributos e instâncias. sepallength sepalwidth petallength petalwidth class 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 15

16 Etapas vinculadas à Mineração de Dados KDD Sistemas de Descoberta de Conhecimento: A Mineração de Dados é o kernel de um sistema Knowledge Discovery System KDD 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 16

17 Etapas vinculadas à Mineração de Dados KDD 1. Seleção: Tem como objetivo agrupar, filtrar e obter os dados que serão minerados. 2. Pré-processamento: Tem o objetivo de melhorar a qualidade dos dados, isto é aumentar a Acurácia, Completitude, Consistência, Sequência, Credibilidade e Interpretabilidade. Data Cleaning (limpeza) [Valores ausentes, ruído] Data Integration (integração) [Redundância, Conflitos e Correlação] Data Reduction (redução) [Redução de Dimensão, Redução de Amostras] Data Discretization (discretização) [Binning, Histograma, Árvore] 3. Transformação: Tem com objetivo agregar atributos, normalizar valores, construir e suavizar valores para contribuir na mineração dos dados. 4. ** Mineração de Dados ** 5. Interpretação, Avaliação e Visualização: Contempla mecanismos que facilitam a exposição e validação do conhecimento obtido. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 17

18 Etapas vinculadas à Mineração de Dados Projeto de Mineração de Dados Modelo generalizado de projeto de Mineração de Dados. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 18

19 Estudo de Caso: Segurança em Redes Sociais Digitais Área de Mineração de Texto (mineração em base de dados textuais). 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 19

20 Estudo de Caso: Segurança em Redes Sociais Digitais IGAWA, R. A. Mineração de Texto e Wavelets na Classificação de Contas em Redes Sociais Digitais. 71 p. Qualificação de Mestrado (Mestrado em Ciência da Computação) Universidade Estadual de Londrina, Londrina PR, Resumo:Para auxiliar a descoberta de fraudes em RSDs, este trabalho propõe a classificação de contas baseada na TDW para detectar a disseminação de conteúdo textual de bots. O principal objetivo da classificação é distinguir os padrões de classes em: humanos, cyborgs ou bots. A abordagem proposta analisa a distribuição de termos chaves enquanto mantêm custo computacional adequado para RSDs. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 20

21 Estudo de Caso: Segurança em Redes Sociais Digitais Dataset: Base de Tweets (mensagens do Twitter) relacionados a Copa do Mundo de Classes: Humano, Cyborg, Bot e Humano, Não Humano Atributos: Descritores textuais (Comprimento do Corpus, Lexicon e Coeficientes TDW) Pré-processamento: Discretização com novo padrão de pesagem LBCA (inovação) Classificador: Random Forests (Ensemble de árvores) e Multilayer Perceptron (ANN) Resultado: 94% para HCB e 100% para HnH. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 21

22 Estudo de Caso: Segurança em Redes Sociais Digitais Modelo proposto: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 22

23 Estudo de Caso: Segurança em Redes Sociais Digitais Resultados: 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 23

24 Output: Representação do Conhecimento Introdução Quando se obtém o conhecimento, representá-lo pode ser uma tarefa complicada. Qual a diferença entre o gato e o cachorro? Crie um modelo! Antes de se estudar o modelo de classificação, é necessário entender quais são as saídas possíveis do processo de classificação. Cada problema pode ser representado de uma maneira, assim como a solução ou modelo para solucionar: Tabelas; Modelos Lineares; Árvores Regras; Baseada em Instância; Aglomerado (cluters) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 24

25 Output: Representação do Conhecimento Tabelas Simples e mais rudimentar representação de conhecimento; Exibição condensada de informações; Tem como principal obstáculo decidir quais atributos afetam a decisão final; É um elemento importante na descrição dos dados, porém para a descrição de um modelo ou conhecimento adquirido não é tão adequado; 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 25

26 Output: Representação do Conhecimento Modelos Lineares Para a Estatísticas os modelos lineares são chamados de regressão. São fáceis de se visualizar em duas dimensões; A reta"representa o melhor ajuste para as dimensões relacionadas; O modelo pode ser descrito por uma equação de reta. Exemplo: desempenho = 37,06 + 2,47 cache; Pode ser utilizado para a representação de classificação binária (2 classes) de problemas. A linha é o limite (boundary) entre cada classe. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 26

27 Output: Representação do Conhecimento Árvores Abordagem "divisão e conquista"são melhor representados por árvores; Os nós da árvore de decisão são definidos pelos atributos; As folhas definem a classificação esperada; A classificação é obtida percorrendo todos os nós até a folha que descreve a classe; Cada nó deve oferecer dois ou mais "caminhos"para seguir. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 27

28 Output: Representação do Conhecimento Regras É semelhante à árvore de decisão; Tem nas extremidades do modelo a classe. É dividada em condições antecedentes e consequentes (ou conclusão); Diferente das árvores não são "comparações"são formulações ou expressões lógias. Apresentam soluções mais aprimoradas, complexas e otimizadas do que as árvores. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 28

29 Output: Representação do Conhecimento Baseado em Instância - Instance-Based É a técnica mais lenta (custosa computacionalmente); As instâncias são avaliadas uma a uma; Técnicas de distância e vizinhança são utilizadas (K-nearest-neighbor KNN) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 29

30 Output: Representação do Conhecimento Agrupamento - Clustering É uma das abordagens mais utilizadas; A saída é um diagrama (dendograma) que representa a quantidade diversificada de grupos; Esta abordagem pode ser usada em pareceria com outras como Árvores e Regras para verificar um caminho inicial (K-means). 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 30

31 Referências Imagens: https : //datacleansingservices.files.wordpress.com/2013/04/web mining services.jpg https : //quadconsultancy.files.wordpress.com/2010/09/financial planning decision support executive1.jpg http : // project.eu/documents/17293/0/rs20tool.jpg?t = https : // = AEp1hRlF http : // content/uploads/2015/06/exame1.jpg http : // content/uploads/2012/10/kdprocess.png http : //free stock illustration.com/business + intelligence + data http : //scikit learn.org/0.11/ images/plot classification 11.png Código Fonte ARFF: http : // 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 31

32 Referências Livros: Konar, A. Computational Intelligence: Principles, Techniques and Applications (2005) Jensen, R. Shen, Q. Computational Intelligence and Feature Selection (2008) Witten, Ian H., and Eibe Frank. "Data Mining: Practical machine learning tools and techniques". Morgan Kaufmann (2011) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 32

33 Sumário Etapa II Algoritmos Básicos Weka: Framework para Machine Learning Avaliando os Resultados Estudo de Caso 2: Produção de Uvas 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 33

34 Algoritmos Básicos Serão apresentados os seguintes algoritmos: MLP - Multilayer Perceptron; SVM - Support Vector Machine; K-means; PCA - Principal Component Analysis; Apriori; SMOTE - Sythetic Minority Oversampling Technique; J de novembro de 2015 DC-UEL Sylvio Barbon Jr 34

35 MLP - MultiLayer Perceptron Solucionando problemas de classificação como um ser humano! 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 35

36 MLP - MultiLayer Perceptron Redes neurais artificiais são modelos computacionais inspirados no sistema nervoso de seres vivos ; Possuem capacidade de aquisição e manutenção do conhecimento; Principais funções: Classificação de Padrões; Predição de Comportamentos; Processo de estabelecimento de arquitetura é um processo empírico, tal fato implica em abordagens de tentativa e erro para reconhecimento da solução. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 36

37 MLP - MultiLayer Perceptron Perceptron de múltiplas camadas (PMC); Apresenta no mínimo duas camadas de neurônios; Modelo supervisionado e Feedfoward; Publicada em 1986; 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 37

38 MLP - MultiLayer Perceptron Complexidade: O(#epócas*#amostras*#características*#neurônio) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 38

39 SVM - Support Vector Machine Classificador para qualquer tipo de problema, sem muitas configurações e ideal para problemas binários! 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 39

40 SVM - Support Vector Machine Máquina de Vetor de Suporte - MVS; Foi publicada em 1992; Tem a característica da teoria do aprendizado estatístico da década de 60; Complexidade: O(n 3 ) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 40

41 SVM - Support Vector Machine Ideal para aplicações de classificação binária; O kernel da SVM define o comportamento do hiperplano criado; O kernel mais robusto é o SMO (Sequencial Minimal Optimization) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 41

42 K-means Dada uma base de dados, quais itens se assemelham? 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 42

43 K-means K-médias Principal propósito é a divisão das amostras em subgrupos (clusters, subsets ou categorias) que compartilham características; Não oferece um "modelo"com os resultados esperados, ele rotula as instâncias baseado na distância entre as características; Aprendizado não supervisionado; 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 43

44 K-means A quantidade de subgrupos a serem posicionados devem ser passados como parâmetro ao algoritmo. Complexidade: O(amostras*centróides(k)*características) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 44

45 PCA Muitas características, como reduzi-las para encontrar quais são mais adequadas e auxiliar na compreensão do problema? 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 45

46 PCA - Principal Component Analysis Análise de Componentes Principais - ACP Exitem diversas variações. É um método simples e não paramétrico usado para extrair informação relevante de uma base redundante e ruidosa; PCA é uma transformação linear que minimiza a redundância (covariância) e maximiza a informação (variância). Complexidade: O(atributos 2 *exemplos + atributos 3 ) 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 46

47 Apriori Como reconhecer um padrão frequente e quais itens influenciam nas combinações? 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 47

48 Apriori Utilizado na Mineração de Padrões Frequentes; A partir de conjuntos frequentes, é possível derivar as regras de associação. O espaço de busca de todos os possíveis conjuntos de itens para um conjunto A é de exatamente 2 A itemsets diferentes. A representação tradicional é um reticulado que apresenta em suas extremidades um conjunto vazio e um conjunto com todos os itens na base. Se A é grande o suficiente, então uma proposta simples de gerar e contar os suportes de todos os itemsets não é viável. A proposta de nível de confiança do algoritmo Apriori implica em diversas varreduras sobre o banco de dados para calcular o suporte dos itemsets frequentes candidados. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 48

49 Apriori Utilizado na Mineração de Padrões Frequentes; O suporte está relacionado à frequencia mínima; 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 49

50 Apriori 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 50

51 SMOTE Base de Dados com quantidade de amostras discrepantes entre as classes, como corrigir? 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 51

52 SMOTE SMOTE - Sythetic Minority Oversampling technique Lidar com distribuição desbalanceada (imbalanced) nas amostras é um problema para o reconhecimento de um determinado padrão ou classe; Isso ocorre quando o número de exemplos que representam uma classe é muito menor que outra; Tal problema está presente em problemas do mundo real: casos raros ou complexos, mas necessários para descrição completa de um problema; Esta característica ocorre em problemas de uma ou mais classes. A maioria dos sistemas de aprendizado de máquina não estão preparados para tratar classes desbalanceadas; É uma técnica de oversampling, criando novas amostras baseadas na interpolação de instâncias da classes minoritárias. Baseado em knn (k nearest neighbors), aleatóriamente selecionam amostras das classes minoritárias e geram as novas. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 52

53 SMOTE 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 53

54 SMOTE Classificação, compreensão e visualização do modelo gerado! 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 54

55 J48 É uma implementação do algoritmo C4.5 Baseado em Árvore de Decisão, é referenciado como uma aboragem estatística; Em 2008 foi escolhido o melhor algoritmo para Mineração de Dados. É calculado com base na entropia e no ganho de informação. Ideal para classificação de padrões; Fortemente vinculado a uma base de treinamento; Exibe os atributos mais significativos hierarquizados em uma árvore; 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 55

56 J48 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 56

57 Weka É uma biblioteca com uma grande coleção de algoritmos de Aprendizado de Máquina implementado em Java; Permite as tarefas de Classificação, Regressão, Seleção de Atributos e Agrupamento; É compatível com linguagens como Python e R; aplicativos como Octave; 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 57

58 Weka Demonstração com a base tradicional Iris.arff (problema de classificação de sepallength sepalwidth petallength petalwidth class Iris-setosa,Iris-versicolor,Iris-virginica 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 58

59 Avaliando os Resultados 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 59

60 Avaliando os Resultados Quão "preditivo"é o modelo encontrado? Somente o "erro"não é um bom indicador de desempenho; Medir o taxa de sucesso om o training set é uma visão extremamente otimista da solução. Quando existe taxa de erro em avaliações baseadas no training set, chamamos de resubstitution error. Por isso usamos um test set "separado"para calcular o erro real. O test set deve ser independente do training set. Também usamos um validation set para aprimorar a técnica de classificação. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 60

61 Avaliando os Resultados Técnicas de Avaliação do Modelo: Holdout: é o processo de se isolar uma parte do dataset para treinamento e outro para teste (não usado no treinamento). Crossvalidation: Validação Cruzada, onde o dataset é divido em dobras (folds) de subamostras, onde o processo é avaliado para cada dobra, ao final é contabilizada a média de acurácia. Leave-one-out: Uma instância é escolhida para teste e o restante para treinamento. A vantagem é que o training set é grande e a desvantagem é o custo computacional e problemas de estratificação para futuras comparações. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 61

62 Avaliando os Resultados Matriz de Confusão: A de uma hipótese h oferece uma medida efetiva do modelo de classificação, ao mostrar o número de classificações corretas versus as classificações preditas para cada classe, sobre um conjunto de exemplos T. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 62

63 Avaliando os Resultados Exemplo de Matriz de Confusão para avaliação de humanos e bots. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 63

64 Avaliando os Resultados Métricas: Mean-squared error (Erro quadrático médio): É a principal e mais comum medida. É uma medida fácil de se calculada e interpretada. Mean-absolute error (Erro quadrático absoluto): É uma alternativa ao anterior, indicando erros individuais sem considerar o sinal. Relative squared error (Erro quadrático relativo): Esta métrica é relativa a um classificador, considerando um classificador padrão. Relative absolute error: É como o anterior, sem considerar sinal. Coeficiente de Correlação: Avalia a correlação entre dois modelos, 1 é a correlação perfeita e 0 é ausência de correlação. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 64

65 Estudo de Caso de Produção de Uvas Estudo de Caso de Produção de Uvas. 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 65

66 Referências Livros: Konar, A. Computational Intelligence: Principles, Techniques and Applications (2005) Jensen, R. Shen, Q. Computational Intelligence and Feature Selection (2008) Witten, Ian H., and Eibe Frank. "Data Mining: Practical machine learning tools and techniques". Morgan Kaufmann (2011) Silva, IN da, Danilo Hernane Spatti, and Rogério Andrade Flauzino. "Redes neurais artificiais para engenharia e ciências aplicadas."são Paulo: Artliber (2010). 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 66

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

Aula 3 Representação do Conhecimento

Aula 3 Representação do Conhecimento Aula 3 Representação do Conhecimento Sumário (Representação do Conhecimento) - Introdução - Tabelas - Modelos Lineares - Árvores - Regras - Baseada em Instância - Clusters (Aglomerado) - Prática: Árvore

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados Sylvio Barbon Junior barbon@uel.br 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão

Leia mais

2COP229 Inteligência Computacional. Aula 3. Clusterização.

2COP229 Inteligência Computacional. Aula 3. Clusterização. Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância

Leia mais

2COP355 INTELIGÊNCIA COMPETITIVA. Introdução. Sylvio Barbon Junior 14 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1

2COP355 INTELIGÊNCIA COMPETITIVA. Introdução. Sylvio Barbon Junior 14 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1 2COP355 INTELIGÊNCIA COMPETITIVA Introdução Sylvio Barbon Junior barbon@uel.br 14 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Introdução Entendendo Inteligência e Estratégia Ética e Inteligência

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Análise de Dados Sylvio Barbon Junior barbon@uel.br 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Sumário Introdução Caracterização de Dados Exploração de

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 8 Análise de Dados 2 de 23 Sumário Introdução Caracterização de Dados

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL Disciplina Anual Assunto Aula 16 Redes Neurais Artificiais (MLP) 2 de 24 (MLP) Sumário Introdução

Leia mais

K-Nearest Neighbours & RSTUDIO

K-Nearest Neighbours & RSTUDIO K-Nearest Neighbours & RSTUDIO Rodrigo Augusto Igawa Universidade Estadual de Londrina igawa@uel.br 17 de novembro de 2015 Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de 2015 1 / 16 Sumário

Leia mais

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,

Leia mais

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos

Leia mais

Universidade Federal do Paraná

Universidade Federal do Paraná Universidade Federal do Paraná Mineração de Dados e Aprendizado de Máquinas. Aurora Trinidad Ramírez Pozo Roteiro Overview a Descoberta de Conhecimento em Bases de Dados Descoberta de Conhecimento em Bancos

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

Informática Parte 19 Prof. Márcio Hunecke

Informática Parte 19 Prof. Márcio Hunecke Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

Redes Neurais no WEKA

Redes Neurais no WEKA Redes Neurais WEKA http://www.cs.waikato.ac.nz/ml/weka/ Redes Neurais no WEKA Introdução ao WEKA Base Benchmark Estudo de Casos Análise de Crédito Bancário 1 Redes Neurais no Weka WEKA (Waikaito Environment

Leia mais

CLASSIFICADORES ELEMENTARES

CLASSIFICADORES ELEMENTARES CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Boas Maneiras em Aprendizado de Máquinas

Boas Maneiras em Aprendizado de Máquinas Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas

Leia mais

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Introdução a Machine Learning: Teoria, Aplicações e IA na Arquitetura Intel Vitor Hugo Ferreira, DSc - UFF Flávio Mello, DSc UFRJ e Ai2Biz

Leia mais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 27 de maio de 2016 Reconhecimento de objetos Padrão: arranjo

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

MLaaS com Azure: Que tipo de flor de íris é essa?

MLaaS com Azure: Que tipo de flor de íris é essa? MLaaS com Azure: Que tipo de flor de íris é essa? Douglas Lima Dantas Bacharel em Engenharia de Computação pela UEA (2013-2017) Trainee Samsung Ocean (2015-2017) Mestrando em Engenharia Elétrica pela Poli-USP

Leia mais

Mineração de Dados aplicada a Gestão de Negócios. Aula 2. Prof. Dr. Sylvio Barbon Junior

Mineração de Dados aplicada a Gestão de Negócios. Aula 2. Prof. Dr. Sylvio Barbon Junior Aula 2 Introdução Redes Neurais Prof. Dr. Sylvio Barbon Junior barbon@uel.br Sumário 1- Inteligência Artificial 2- Introdução às Redes Neurais Artificiais 3- Modelos de Redes Neurais supervisionados e

Leia mais

Informática. Aprendizado de Máquina. Professor Márcio Hunecke.

Informática. Aprendizado de Máquina. Professor Márcio Hunecke. Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:

Leia mais

Aula 1 Introdução - RNA

Aula 1 Introdução - RNA Aula 1 Introdução - RNA Sumário 1- Conceitos Iniciais; 2- Neurônio Biológico; 3- Neurônio Artificial; 4- Funções de Ativação; 5- Comparação Neurônio Biológico e Artificial. 1- Conceitos Iniciais - Computadores

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 17 Support Vector Machines (SVM) Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Tutorial: Árvore de Decisão com Weka para a classificação de carne suína

Tutorial: Árvore de Decisão com Weka para a classificação de carne suína Universidade Estadual de Londrina - UEL 2 CTA 121 - Processamento de Imagens em Alimentos Prática de Aprendizado de Máquina com Weka 28/07/2016 Prof. Dr. Sylvio Barbon Jr Tutorial: Árvore de Decisão com

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior

Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior Introdução ao Reconhecimento Prof. Dr. Geraldo Braz Junior O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos Vários 4 Pergunta:

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Aluno: Fabricio Aparecido Breve Prof.: Dr. André Ponce

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de

Leia mais

Métodos de Análise de Dados (AO-802)

Métodos de Análise de Dados (AO-802) Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados

Leia mais

TÍTULO: WSDM - WEB SERVICE PARA MINERAÇÃO DE DADOS CATEGORIA: CONCLUÍDO ÁREA: CIÊNCIAS EXATAS E DA TERRA SUBÁREA: COMPUTAÇÃO E INFORMÁTICA

TÍTULO: WSDM - WEB SERVICE PARA MINERAÇÃO DE DADOS CATEGORIA: CONCLUÍDO ÁREA: CIÊNCIAS EXATAS E DA TERRA SUBÁREA: COMPUTAÇÃO E INFORMÁTICA TÍTULO: WSDM - WEB SERVICE PARA MINERAÇÃO DE DADOS CATEGORIA: CONCLUÍDO ÁREA: CIÊNCIAS EXATAS E DA TERRA SUBÁREA: COMPUTAÇÃO E INFORMÁTICA INSTITUIÇÃO: FACULDADE DE TECNOLOGIA PROFESSOR ANTÔNIO SEABRA

Leia mais

Eduardo Vargas Ferreira

Eduardo Vargas Ferreira Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Considerações finais Eduardo Vargas Ferreira Como obter boas predições 1 Entenda os dados: explore as características, crie

Leia mais

SUPPORT VECTOR MACHINE - SVM

SUPPORT VECTOR MACHINE - SVM SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting

Leia mais

Algoritmos Indutores de Árvores de. Fabrício J. Barth

Algoritmos Indutores de Árvores de. Fabrício J. Barth Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Maio de 2018 Problema: Diagnóstico para uso de lentes de contato 2 Diagnóstico para o uso de lentes de contato O setor de oftalmologia de um

Leia mais

scikit-learn: Aprendizado de máquina 101 com Python

scikit-learn: Aprendizado de máquina 101 com Python scikit-learn: Aprendizado de máquina 101 com Python Luciana Fujii Campus Party BH 2016 1 / 30 Introdução Aprendizado de máquina Aprendizado de máquina é o campo da ciência da computação que dá aos computadores

Leia mais

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio

Leia mais

Projeto da Disciplina

Projeto da Disciplina Projeto da Disciplina Germano C. Vasconcelos Centro de Informática - UFPE Germano C.Vasconcelos 1 Objetivo Realizar um estudo experimental sobre a aplicação de modelos de redes neurais em um problema do

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 2: 1 /59 Programa Dia 1: Apresentação

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

Métodos de reamostragem

Métodos de reamostragem Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos de reamostragem Eduardo Vargas Ferreira Função custo 2 Função custo Matriz de confusão: é um layout de tabela que

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de

Leia mais

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD

Leia mais

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani O que é Machine Learning? Estatística Machine Learning

Leia mais

Métodos para Classificação: - Naïve Bayes.

Métodos para Classificação: - Naïve Bayes. Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que

Leia mais

Múltiplos Classificadores

Múltiplos Classificadores Universidade Federal do Paraná (UFPR) Bacharelado em Informátia Biomédica Múltiplos Classificadores David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Múltiplos classificadores Combinação de classificadores

Leia mais

Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada

Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada MBA ANALYTICS OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de decisão com base nas

Leia mais

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education Data Science Data Stream Mining: trabalhando com dados massivos André Luís Nunes Porto Alegre, 2018 Globalcode Open4education Data Stream Mining trabalhando com dados massivos 2018 agenda andré luís nunes

Leia mais

Máquinas de Vetores de Suporte

Máquinas de Vetores de Suporte Máquinas de Vetores de Suporte Prof. Marcelo Keese Albertini Faculdade de Computação Universidade Federal de Uberlândia 19 de Junho de 2017 2/27 Máquinas de Vetores de Suporte Support Vector Machines (SVM)

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

Inteligência Computacional [2COP229]

Inteligência Computacional [2COP229] Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/41) Tema Aula Árvores de Decisão Aula- Árvore de Decisão (3/41) Sumário Introdução Indução de Árvores

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Redes Neurais MLP: Exemplos e Características

Redes Neurais MLP: Exemplos e Características Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais MLP: Exemplos e Características DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

JAI 6 - Deep Learning Teoria e Prática

JAI 6 - Deep Learning Teoria e Prática JAI 6 - Deep Learning Teoria e Prática Esteban Clua e Cristina Nader Vasconcelos Universidade Federal Fluminense Fundamentos Computação baseada em modelos crisnv@ic.uff.br 2 Computação baseada em aprendizado

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina A necessidade de inserir aprendizado nas máquinas surgiu após a construção dos Sistemas Especialistas (SEs). Os primeiros SEs não possuíam mecanismo de aprendizado e tornavam-se

Leia mais

Laboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka

Laboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka Laboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka Faça o download do dataset housing.arff*, e execute as seguintes tarefas: *disponível em: www.inf.ufpr.br/menotti/am-182/data.zip

Leia mais

Aprendizado de Máquina Introdução às Redes Neurais Artificiais

Aprendizado de Máquina Introdução às Redes Neurais Artificiais Aprendizado de Máquina Introdução às Redes Neurais Artificiais Marcos Oliveira Prates (Agradecimento Marcelo Azevedo Costa) Departamento de Estatística Universidade Federal de Minas Gerais Inteligência

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Inteligência Computacional

Inteligência Computacional Inteligência Computacional CP78D Redes Neurais Aula 7 Prof. Daniel Cavalcanti Jeronymo Universidade Tecnológica Federal do Paraná (UTFPR) Engenharia Eletrônica 7º Período 1/24 Plano de Aula Perceptron

Leia mais

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada

Leia mais