CLASSIFICADORES ELEMENTARES
|
|
|
- João Vítor Aveiro Lagos
- 8 Há anos
- Visualizações:
Transcrição
1 CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor, etc 1
2 Classificação 3 Essas características, ou atributos, do objeto formam um espaço multidimensional (espaço de características) Cada objeto é então representado como sendo um ponto nesse espaço Classificador 4 Trata-se de uma função discriminante, que, baseada na informação do conjunto de treinamento (amostras conhecidas) determina a semelhança da nova amostra a uma das classes Nesse espaço de característica é que atua o classificador Um objeto desconhecido é atribuído a uma classe a partir do seu posicionamento no espaço de característica 2
3 Classificador 5 paramétricos 6 Parte da premissa de que as classes dos objetos no espaço de classificação seguem uma distribuição conhecida Muitas vezes se considera a distribuição normal Esta hipótese conduz a superfícies de decisão com formas simples Linear ou quadrática Essa classificação depende da função discriminante 3
4 paramétricos 7 Classificador linear Uma superfície de decisão (ou separação) que separa as amostras é obtida a partir da combinação linear dos atributos paramétricos 8 Classificador quadrático Uma superfície de decisão (ou separação) que separa as amostras é obtida a partir da combinação quadrática dos atributos 4
5 paramétricos 9 Considerar a distribuição normal tem uma série de vantagens a regra de decisão resultante é robusta se a hipótese for violada a degradação do desempenho do classificador é gradual. paramétricos 10 No entanto, é difícil verificar se os dados multivariados possuem distribuição normal Estima-se os dois parâmetros que caracterizam uma função gaussiana a partir dos dados de treino média desvio padrão 5
6 não paramétricos 11 São considerados os classificadores mais simples e intuitivos. Não se conhece o comportamento estatístico dos dados Não existe informação a priori sobre a distribuição de probabilidade ou as funções discriminantes não paramétricos 12 Em geral, utilizam uma função de distância como medida de similaridade entre as amostras Um objeto desconhecido é atribuído a classe a que menos se distancia Uso da distância Euclidiana ou Mahalanobis 6
7 não paramétricos 13 Dados não precisam seguir uma distribuição normal Um dos algoritmos mais conhecidos é o K-NN k-nn (k-nearest neighbor ou k-vizinhos mais próximos) não paramétricos 14 Paramétrico ou não, qual usar? Isso depende da credibilidade do modelo paramétrico Com baixo número de amostras de treino as técnicas não paramétricas conduzem a melhores desempenhos do que as técnicas paramétricas, mesmo quando o modelo é correto 7
8 15 Métodos Hierárquicos e Não- Hierárquicos Se referem principalmente a maneira como os dados são divididos e/ou organizados Métodos Hierárquicos: constroem uma hierarquia de partições Métodos Não-Hierárquicos ou Particionais: constroem uma partição dos dados 16 Métodos Hierárquicos e Não- Hierárquicos Método Hierárquico Método Não-Hierárquico 8
9 17 Métodos Hierárquicos e Não- Hierárquicos Algoritmos Hierárquicos Criam uma hierarquia de relacionamentos entre os elementos. Uso de uma medida de distância Muito populares na área de bioinformática Bom funcionamento Apesar de não terem nenhuma justificativa teórica baseada em estatística ou teoria da informação, constituindo uma técnica ad-hoc de alta efetividade. 18 Métodos Hierárquicos e Não- Hierárquicos Algoritmos Hierárquicos Dendrograma é talvez o algoritmo mais comum Semelhante a uma árvore Exemplo: relações evolutivas entre diferentes grupo de organismos biológicos (árvore filogenética) 9
10 19 Métodos Hierárquicos e Não- Hierárquicos Algoritmos Não-Hierárquicos Separam os objetos em grupos baseando-se nas características que estes objetos possuem Uso de uma medida de similaridade Consistem de técnicas de análise de agrupamento ou clustering 20 Métodos Hierárquicos e Não- Hierárquicos Algoritmos Não-Hierárquicos Normalmente dependem de uma série de fatores que são determinados de forma arbitrária pelo usuário Número de conjuntos Número de seeds de cada conjunto. Esses parâmetros podem causar impacto negativo na qualidade das partições geradas 10
11 21 Métodos Hierárquicos e Não- Hierárquicos Algoritmos Não-Hierárquicos K-means é talvez o algoritmo mais comum Busca particionar n observações em k clusters (agrupamentos) Cada observação pertence ao cluster com a média mais próxima Template matching 22 Técnica que utiliza uma abordagem natural na classificação de objetos ou padrões Baseada na comparação de um objeto com um molde Muito utilizada em processamento de imagens Encontrar as áreas de uma imagem que combinam (são semelhantes) a uma imagem modelo. Comparação pixel a pixel 11
12 Template matching 23 Essa técnica é frequentemente usada para identificar os caracteres impressos, números e outros pequenos objetos simples. Contar o número de concordâncias Máxima correlação Contar o número de não concordâncias Mínimo erro Template matching 24 O processo é simples e funciona quando os padrões são bem comportados Se o objeto é maior que o modelo, percorremos ele todo em busca de onde a combinação é máxima Não funciona bem com distorções do tipo rotação, escala, etc modelo objeto 12
13 Template matching 25 A técnica pode ser utilizada se o desvio padrão do modelo em comparação com o objeto analisado for suficientemente pequeno. Feature matching 26 É uma variante do template matching Ao invés de fazer a comparação pixel a pixel, a a comparação se dá no nível das características Exemplo: momentos de HU: Característica Global e Invariante Medidas puramente estatísticas da distribuição dos pontos São invariantes a rotação, translação e escala 13
14 Feature matching 27 Exemplo Feature matching 28 Momentos de HU 14
15 Regras de Decisão 29 Forma de representação do conhecimento Relaciona informações ou fatos a alguma ação ou resultado Definem um conjunto de condições que devem ocorrer para que uma determinada ação seja executada Regras de Decisão 30 Trata-se de um sistema especialista O especialista detém conhecimento aprofundado e grande experiência prática no domínio do problema Emula a estratégia de tomada de decisão de especialistas humanos Atuam em um domínio restrito Tem dificuldade de lidar com ambiguidades, pela presença de regras conflitantes 15
16 Regras de Decisão 31 Componentes de um sistema especialista Conjunto de regras: a base de conhecimento Máquina de inferência: Infere conclusões a partir dos dados de entrada e da base de conhecimento. Regras de Decisão 32 Conjunto de regras: Tabela de Decisão São fáceis de criar e de interpretar Qual o resultado a operação A ou B para A = 1? E para B = 0? A B A ou B
17 Árvores de decisão (AD) 33 São algoritmos que utilizam a estratégia de dividir para conquistar, chegando assim a classificação ou tomada de decisão sobre uma amostra Divide problemas difíceis em problemas mais simples Imita o processo de raciocínio humano Árvores de decisão (AD) 34 A idéia básica de uma AD é pegar um problema complexo e decompô-lo em subproblemas menores, de modo que os novos problemas tenham uma complexidade menor em relação ao anterior Essa estratégia é então aplicada recursivamente a cada sub-problema 17
18 Árvores de decisão (AD) 35 É um classificador baseado em um conjunto regras de decisão (ou tabela de decisão) SE (condição) ENTÃO (resultado). É uma representação de uma tabela de decisão sob a forma de uma árvore Tem a mesma utilidade da tabela de decisão. É uma representação alternativa das mesmas regras obtidas com a construção da tabela. Árvores de decisão (AD) 36 Tabela de decisão e sua árvore de decisão A B A ou B A B
19 Árvores de decisão (AD) 37 AD é uma das técnicas de classificação mais utilizadas Eficaz, eficiente e produz modelos interpretáveis As condições de uma regra, em geral, envolvem intervalos para os atributos A aplicação da sequência de regras vai classificando os objetos em classes cada vez menos abrangentes. Árvores de decisão (AD) 38 Um AD é composta por Nós Intermediários ou raiz: definem o parâmetro que será avaliado Arestas: definem a transição entre nós de acordo com os valores do atributo Nós terminais: definem a classificação final da amostra 19
20 Árvores de decisão (AD) 39 Com relação aos nós e arestas Temos apenas um nó raiz Nenhuma aresta de entrada e n >= 0 arestas de saída Vários nós intermediários Possuem 1 aresta de entrada e n > 1 arestas de saída Vários nós terminais 1 aresta de entrada e nenhuma aresta de saída Árvores de decisão (AD) 40 Algoritmo Rudimentar (1 Rule - 1R) Todas as regras usam somente um atributo Escolher o atributo com a menor taxa de erro de classificação Um ramo para cada valor do atributo Para cada ramo Atribuir a classe mais frequente Calcular a taxa de erro de classificação: 20
21 Árvores de decisão (AD) 41 Exemplo: precisamos classificar 3 tipos de flores Iris setosa Iris virginica Iris versicolor Como poderia ser sua AD? Árvores de decisão (AD) 42 Exemplo de AD usada para classificar os 3 tipos de flores: Iris setosa, Iris virginica e Iris versicolor Iris setosa (100%) Comprimento pétala? <2,6 >=2,6 Comprimento pétala? <4,85 >=4,85 Iris versicolor (91,9%) Iris virginica (97,1%) 21
22 Árvores de decisão (AD) 43 Como ficaria classificada uma amostra com comprimento de pétala igual a 3,75? 3,75: Iris versicolor Iris setosa (100%) Comprimento pétala? <2,6 >=2,6 Comprimento pétala? <4,85 >=4,85 Iris versicolor (91,9%) Iris virginica (97,1%) Árvores de decisão (AD) 44 Exemplo de árvore de decisão com mais de 1 regra 22
23 Árvores de decisão (AD) 45 Vantagens de se usar uma árvore de decisão Uma vez construída, o seu uso é imediato Em termos computacionais, é uma ferramenta muito rápida Possui fácil interpretação Árvores de decisão (AD) 46 Desvantagens A construção de uma árvore de decisão é feita por processo de indução, pode ser uma tarefa de alta demanda computacional. Cansativo quando se tem muitos atributos Bias indutivo: o processo de indução possui preferência de uma hipótese sobre outras, supondo a existência de hipóteses que são igualmente consistentes. 23
24 Árvores de decisão (AD) 47 Desvantagens A partir de um conjunto de atributos, podemos obter diversas árvores de decisão Isso torna impraticável a busca por uma árvore de decisão ótima para um determinado problema Árvores de decisão (AD) 48 Alguns algoritmos existentes para construir uma árvore de decisão Hunt s Concept Learning System Um dos primeiros Serve de base para vários outros ID3, C4.5, J4.8, C5.0 CART, Random-Forest 24
25 49 Árvores de decisão (AD) - Algoritmo de Hunt Considere D t o conjunto de objetos que atingem o nó t Esses objetos ainda não foram classificados em um nó folha acima na árvore Passo 1 Se todos os objetos de D t pertencem à mesma classe c t, então t é um nó folha rotulado como c t 50 Árvores de decisão (AD) - Algoritmo de Hunt Passo 2: Se D t contém objetos que pertencem a mais de uma classe, então t deve ser um nó interno Escolher uma condição de teste sobre algum dos atributos que não houverem sido selecionados nos nós acima na árvore Criar um nó filho para cada possível saída da condição de teste (valor do atributo). Os objetos em D t são distribuídos neles Aplicar o algoritmo recursivamente para cada nó filho criado 25
26 51 Árvores de decisão (AD) - Critério de Parada Podemos finalizar a indução da árvore quando Os dados do nó atual têm o mesmo rótulo Os dados do nó atual têm os mesmos valores para os atributos de entrada, mas rótulos de classes diferentes Todos os atributos já foram utilizados no caminho 52 Avaliar a qualidade de um classificador não é uma tarefa fácil O que devemos avaliar? Exatidão? Reproducividade? Robustez? Capacidade em utilizar toda a informação disponível? Aplicabilidade? Objetividade? Nenhum classificador satisfaz tudo isso 26
27 53 De modo geral, espera-se que um classificador apresente desempenho adequado para dados não vistos Acurácia Pouca sensibilidade ao uso de diferentes amostras de dados 54 Podemos avaliar o desempenho dele usando conjuntos distintos de treinamento e teste Treinamento Usado para estimar os parâmetros do classificador. Teste (ou validação) Usado para validar o classificador Vantagens Estima a capacidade de generalização do classificador Avalia a variância (estabilidade) do classificador 27
28 55 Como obter os conjuntos de treinamento e teste? Particionar o conjunto de dados conhecidos em subconjuntos mutualmente exclusivos Utilizar alguns destes subconjuntos para treinamento e o restante dos subconjuntos para o teste ou validação do modelo. 56 Hold out (ou Split-Sample) Uma das técnica mais simples. Faz uma única partição da amostra A maior parte dos dados é usada como dados de treinamento, e o restante é usado como dados de teste Divisão dos dados Treinamento: 2/3 (por exemplo) Teste: dados restantes 28
29 57 Exemplo Hold out Treinamento Teste 58 Hold out (ou Split-Sample) Indicado para uma grande quantidade de dados. Problemas em pequena quantidade de dados Poucos dados de treinamento Menor o conjunto de treinamento, maior a variância do classificador (instabilidade) Menor o conjunto de teste, menos confiável Treinamento e teste podem não ser independentes Classe sub-representada ou super-representada 29
30 59 Random Subsampling Múltiplas execuções de Holdout, com diferentes partições treinamento-teste escolhidas de forma aleatória Não pode haver interseção entre os conjuntos de teste e treinamento Permite uma estimativa de erro mais precisa Erro de classificação Média da taxa de erro de classificação obtida para cada execução 60 Random Subsampling (2 execuções) Teste Treinamento 30
31 61 Validação cruzada (ou cross validation) Classe de métodos de particionamento de dados Usado para estimativa da taxa de erro verdadeira É comumente usado quando a quantidade de dados disponível é pequena 62 Validação cruzada (ou cross validation) Consiste em particionar o conjunto de dados em subconjuntos mutualmente exclusivos Utiliza-se alguns subconjuntos para treinamento e o restante para teste Métodos k-fold leave-one-out 31
32 63 Validação cruzada: método k-fold consiste em dividir o conjunto total de dados em k subconjuntos mutualmente exclusivos do mesmo tamanho A cada iteração, uma das k partições é usada para testar o modelo As outras k-1 são usadas para treinar o modelo 64 Exemplo k-fold (k = 4) 1º Iteração Teste Treinamento 2º Iteração 3º Iteração 4º Iteração 32
33 65 Validação cruzada: método k-fold Cada objeto participa o mesmo número de vezes do treinamento k-1 vezes Cada objeto participa o mesmo número de vezes do teste 1 vez Taxa de erro é tomada como a média dos erros de validação das k partições 66 Validação cruzada: método leave-one-out Trata-se de um caso específico do k-fold Nesse caso, o valor de k é igual ao número total de dados N 10-fold se aproxima do leave-one-out 33
34 67 Exemplo leave-one-out (N = 4) 1º Iteração Teste Treinamento 2º Iteração 3º Iteração 4º Iteração 68 Validação cruzada: método leave-one-out Cada objeto participa o mesmo número de vezes do treinamento N-1 vezes Cada objeto participa o mesmo número de vezes do teste 1 vez Taxa de erro é obtida dividindo por N o número total de erros de validação observados 34
35 69 Validação cruzada: método leave-one-out Vantagem Investigação completa sobre a variação do modelo em relação aos dados utilizados Estimativa de erro é não tendenciosa, ou seja, tende à taxa verdadeira Desvantagem Alto custo computacional Indicado para uma quantidade pequena de dados 70 Bootstrap É uma técnica de reamostragem Visa a obtenção de um novo conjunto de dados, por reamostragem do conjunto de dados original Ao invés de usar sub-conjuntos dos dados, usa-se sub-amostras Funciona melhor que cross-validation para conjuntos muito pequenos Existem diversas variações: Bootstrap.632, etc. 35
36 71 Bootstrap A amostragem é feita com reposição Dado um conjunto com N objetos Sorteia-se um objeto para compor a sub-amostra Devolve-se o objeto sorteado ao conjunto de dados Repete-se esse processo até compor uma subamostra de tamanho N 72 Bootstrap Conjuntos de Treinamento e Teste A sub-amostra gerada será o conjunto de treinamento Os objetos restantes (que não fazem parte do treinamento) são o conjunto de teste De modo geral, a sub-amostra tem 63,2% de objetos não repetidos Processo é repetido b vezes O resultado é a média dos experimentos 36
37 Agradecimentos 73 Agradeço aos professores Guilherme de Alencar Barreto - Universidade Federal do Ceará (UFC) Prof. Ricardo J. G. B. Campello ICMC/USP pelo material disponibilizado 37
DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar
Aprendizagem de Máquina
Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem
e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os
Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser
Combinação de Classificadores (fusão)
Combinação de Classificadores (fusão) André Tavares da Silva [email protected] Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado
Tutorial básico de classificação em RapidMiner
Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.
Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia
Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto [email protected]
Aprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:
Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Paradigmas de Aprendizagem
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Aprendizagem Redes Neurais Artificiais Site: http://jeiks.net E-mail: [email protected]
Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Aprendizagem de Máquina
Plano de Aula Aprendizagem de Máquina Bagging,, Support Vector Machines e Combinação de Classificadores Alessandro L. Koerich Uma visão geral de diversos tópicos relacionados à Aprendizagem de Máquina:
A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos.
84 5 Estudos de Caso A seguir serão apresentados três estudos de caso. Os dois primeiros estudos de caso têm por objetivo demonstrar a facilidade de uso do aplicativo, e o último estudo de caso é focado
SCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
Metodologia Aplicada a Computação.
Metodologia Aplicada a Computação [email protected] Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,
4 Construção dos Classificadores
4 Construção dos Classificadores 4.1. Modelagem O aprendizado supervisionado contém a etapa de modelagem, nessa etapa definimos quais serão as características encaminhadas ao classificador para o treinamento.
ANÁLISE DE AGRUPAMENTOS
ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos
Uma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law
Uma Introdução a SVM Support Vector Machines Obs: Baseada nos slides de Martin Law Sumário Historia das SVMs Duas classes, linearmente separáveis O que é um bom limite para a decisão? Duas classes, não
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação de Árvores
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta ([email protected]) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
CLASSIFICADORES ELEMENTARES -II
CLASSIFICADORES ELEMENTARES -II Estimando a densidade 2 A função densidade de probabilidade é um conceito fundamental em estatística Permite associar probabilidades a uma variável aleatória x Especificar
Mineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior [email protected] 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
Classificação de imagens de Sensoriamento Remoto. Disciplina: Geoprocessamento Profª. Agnes Silva de Araujo
Classificação de imagens de Sensoriamento Remoto Disciplina: Geoprocessamento Profª. Agnes Silva de Araujo Conteúdo programático e Objetivos Conceito de classificação e fotointerpretação Classificações
ALGORITMOS DE ORDENAÇÃO
ALGORITMOS DE ORDENAÇÃO Prof. André Backes Conceitos básicos 2 Ordenação Ato de colocar um conjunto de dados em uma determinada ordem predefinida Fora de ordem 5, 2, 1, 3, 4 Ordenado 1, 2, 3, 4, 5 OU 5,
Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos
Aula 2 ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos 1. DEFINIÇÕES FENÔMENO Toda modificação que se processa nos corpos pela ação de agentes físicos ou químicos. 2. Tudo o que pode ser percebido
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Redes Neurais e Sistemas Fuzzy
1. Inteligência Computacional Redes Neurais e Sistemas Fuzzy Apresentação da disciplina Conceitos básicos A chamada Inteligência Computacional (IC) reúne uma série de abordagens e técnicas que tentam modelar
Inteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Reconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva [email protected] Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção
Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística
Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística José Edson Rodrigues Guedes Gondim 1 Joab de Oliveira Lima 2 1 Introdução
Estruturas de Dados 2
Estruturas de Dados 2 Técnicas de Projeto de Algoritmos Dividir e Conquistar IF64C Estruturas de Dados 2 Engenharia da Computação Prof. João Alberto Fabro - Slide 1/83 Projeto de Algoritmos por Divisão
F- Classificação. Banda A
F- Classificação Classificação Digital é associar determinado pixel a determinada categoria por meio de critérios estatísticos Banda B? da d b dc Espaço dos Atributos Classes Banda A Classificação: ordenar,
Aprendizado de Máquina
Aprendizado de Máquina Sistemas de Informação Inteligente Prof. Leandro C. Fernandes Adaptação dos materiais de: Thiago A. S. Pardo, Daniel Honorato e Bianca Zadrozny APRENDIZADO SIMBÓLICO: ÁRVORES DE
TÉCNICAS DE AMOSTRAGEM
TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Definições e Notação Estimação Amostra Aleatória
Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior
Introdução ao Reconhecimento Prof. Dr. Geraldo Braz Junior O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos Vários 4 Pergunta:
Fundamentos de Inteligência Artificial [5COP099]
Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Saulo Martiello Mastelini Departamento de Computação - UEL 1 o Semestre Assunto Aula 11 Modelos Preditivos - Árvore de Decisão
TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS:
TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Técnicas de amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos
K-Nearest Neighbours & RSTUDIO
K-Nearest Neighbours & RSTUDIO Rodrigo Augusto Igawa Universidade Estadual de Londrina [email protected] 17 de novembro de 2015 Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de 2015 1 / 16 Sumário
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva [email protected] Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição
Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions
Redes RBF: Função de Base Radial Redes Neurais A Rede RBF O LP é baseado em unidades que calculam uma função não-linear do produto escalar do vetor de entrada e um vetor de peso. A rede RBF pertence a
Planejamento e Otimização de Experimentos
Planejamento e Otimização de Experimentos Um Pouco de Estatística Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br [email protected] Populações, Amostras e Distribuições População Amostra
PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano
PROBABILIDADE E ESTATÍSTICA Profa. Dra. Yara de Souza Tadano [email protected] Aula 7 11/2014 Variáveis Aleatórias Variáveis Aleatórias Probabilidade e Estatística 3/41 Variáveis Aleatórias Colete
Aprendizado de Máquina
Aprendizado de Máquina Template Matching Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net October 25, 2012 Luiz S. Oliveira (UFPR) Aprendizado
Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov
Plano Esta apresentação é para pessoas sem conhecimento prévio de HMMs Introdução aos Modelos Escondidos de Markov 2004 Objetivos: Ensinar alguma coisa, não tudo (Visão geral, sem muitos detalhes). Tentar
Noções de Amostragem
Noções de Amostragem AMOSTRAGEM Amostragem: é a área da estatística que estuda técnicas e procedimentos para retirar e analisar uma amostra com o objetivo de fazer inferência a respeito da população de
Rede RBF (Radial Basis Function)
Rede RBF (Radial Basis Function) André Tavares da Silva [email protected] Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação
Seminário de Robótica Bruno de Abreu Silva
Seminário de Robótica Bruno de Abreu Silva 1 Introdução Conceitos gerais Métodos de planejamento de rotas 2 Dadas as configurações inicial e final de um robô, descobrir uma sequência de movimentos a ser
3 Técnicas de agrupamento
3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta
Análise estatística multivariada
Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser
Arvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1)
O que é a árvore de decisão? Arvores de decisão Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Victor Lobo Nós (testes, ou conceitos)
Capítulo 1 Conceitos de Marketing e Marketing Research
Índice Prefácio 21 Introdução 25 PARTE I Capítulo 1 Conceitos de Marketing e Marketing Research 1. Evolução do Marketing 33 2. Evolução do conceito de Marketing 35 3. Modelo do sistema de Marketing 38
Métodos Não Paramétricos
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Métodos não Paramétricos Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Métodos Não Paramétricos Introduzir
Aprendizado de Máquina
Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de
Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta
Processamento digital de imagens
Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 6 de outubro de 2016 Segmentação de imagens A segmentação
Algoritmos de Ordenação. Profº Carlos Alberto T. Batista
Algoritmos de Ordenação Profº Carlos Alberto T. Batista E-mail: [email protected] [email protected] Por que ordenar os dados? Encontrar elementos em uma lista torna-se algo simples e
Descritores de Imagem (introdução)
Descritores de Imagem (introdução) André Tavares da Silva [email protected] Roteiro da aula Definição de descritor de imagem Extração de Característica Tipos Geral x Específico Global (cor, textura,
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas [email protected] Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida
Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM
Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM Noções básicasb de Inferência Estatística descritiva inferencial População - Parâmetros desconhecidos (reais) Amostra
CC-226 Aula 05 - Teoria da Decisão Bayesiana
CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos
SUMÁRIO. Fundamentos Árvores Binárias Árvores Binárias de Busca
ÁRVORES SUMÁRIO Fundamentos Árvores Binárias Árvores Binárias de Busca 2 ÁRVORES Utilizadas em muitas aplicações Modelam uma hierarquia entre elementos árvore genealógica Diagrama hierárquico de uma organização
Conceito de Estatística
Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir
Redes Neurais não Supervisionadas: SOM
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos
