Aprendizagem de Máquina



Documentos relacionados
Aprendizagem de Máquina

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

MLP (Multi Layer Perceptron)

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Complemento II Noções Introdutória em Redes Neurais

FUNDAÇÃO DE APOIO AO ENSINO TÉCNICO DO ESTADO DO RIO DE JANEIRO FAETERJ Petrópolis Área de Extensão PLANO DE CURSO

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS

Introdução. Capítulo 1

Data, Text and Web Mining

Aula 2 RNA Arquiteturas e Treinamento

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Paradigmas da IA. Eixos centrais (das diferenças)

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

Web Data mining com R: aprendizagem de máquina

Revisão Inteligência Artificial ENADE. Prof a Fabiana Lorenzi Outubro/2011

Aplicações Práticas com Redes Neurais Artificiais em Java

Redes Neurais. Profa. Flavia Cristina Bernardini

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Algoritmos Indutores de Árvores de

INF 1771 Inteligência Artificial

INTELIGÊNCIA ARTIFICIAL

Inteligência Computacional [2COP229]

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Avaliando o que foi Aprendido

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE

Projeto de Redes Neurais e MATLAB

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade

IC Inteligência Computacional Redes Neurais. Redes Neurais

Inteligência Artificial. Redes Neurais Artificiais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

Introdução a Datamining (previsão e agrupamento)

3 Metodologia de Previsão de Padrões de Falha

Aprendizagem de Máquina

Introdução a Datamining (previsão e agrupamento)

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

NOTA À 2ª EDIÇÃO... VII PREFÁCIO... IX. No Renascimento de uma Nova Era... IX PREÂMBULO... XIII. Organização do livro... xiii. Destinatários...

Do neurônio biológico ao neurônio das redes neurais artificiais

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Banco do Brasil S.A. Consulta ao Mercado - RFP - Request for Proposa Aquisição de Ferramenta de Gestão de Limites Dúvida de Fornecedor

Extração de Conhecimento & Mineração de Dados

Exemplo de Aplicação do DataMinig

GERENCIAMENTO DO CONHECIMENTO NA EMPRESA DIGITAL

Aula 02: Conceitos Fundamentais

Modelos Pioneiros de Aprendizado

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br 04/08/2012. Aula 7. Prof. Rafael Dias Ribeiro.

O Que é Data Warehouse

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

Apresentação final do Trabalho de Conclusão -Novembro Autenticação On-line de assinaturas utilizando Redes Neurais. Milton Roberto Heinen

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

UTILIZANDO O SOFTWARE WEKA

Prof. Msc. Paulo Muniz de Ávila

Projeto Supervisionado

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Aprendizagem de Máquina

UNIVERSIDADE FEDERAL DE SANTA CATARINA

Web Data Mining com R

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

MEDIÇÃO VIRTUAL DE PRESSÃO POR MEIO DE REDES NEURAIS ATRAVÉS DO PI ACE

Radar de Penetração no Solo e Meio- Ambiente

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

INF 1771 Inteligência Artificial

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Mestrado em Informática, tendo Inteligência Artificial como área de pesquisa.

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas.

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

Relatório de uma Aplicação de Redes Neurais

Aprendizagem de Máquina

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

Relatório da Aula Prática sobre Redes Neurais Artificiais

TÍTULO: PROPOSTA DE METODOLOGIA BASEADA EM REDES NEURAIS ARTIFICIAIS MLP PARA A PROTEÇÃO DIFERENCIAL DE TRANSFORMADORES DE POTÊNCIA

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS - Grupo 550 INFORMÁTICA Planificação Anual /Critérios de avaliação

PLANO DE ENSINO E ESTRATÉGIAS

Módulo 4: Gerenciamento de Dados

Análise Exploratória de Dados

Ferramenta computacional para implementação de redes neuronais optimização das capacidades gráficas

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

KDD UMA VISAL GERAL DO PROCESSO

Inteligência Artificial

GERENCIAMENTO DO CONHECIMENTO NA EMPRESA DIGITAL

Hierarquia de modelos e Aprendizagem de Máquina

Atividade extra. Questão 1. Questão 2. Ciências da Natureza e suas Tecnologias Biologia. A diversidade biológica é o fruto da variação genética.

Computação BioInspirada

Revisão de Estatística Básica:

Diagrama de Classes. Um diagrama de classes descreve a visão estática do sistema em termos de classes e relacionamentos entre as classes.

Algoritmos Genéticos

Sistema Tutor Inteligente baseado em Agentes. Pedagógicas da Universidade Aberta do Piauí. Prof. Dr. Vinicius Ponte Machado

Complemento IV Introdução aos Algoritmos Genéticos

Prof. Marcelo Henrique dos Santos

Aprendizado de Máquina

3 Aprendizado de Máquina em Jogos Eletrônicos

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

Transcrição:

Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial

Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem 5. Medida de desempenho 6. Conceitos Importantes 7. Exemplo

Indução Um processo de raciocínio indutivo de maneira geral, é um raciocínio que parte do particular para o geral, da parte para o todo Por exemplo, se notamos que: Todos os pacientes com Déficit de Atenção atendidos em 2006 sofriam de Ansiedade Todos os pacientes com Déficit de Atenção atendidos em 2007 sofriam de Ansiedade... Podemos inferir logicamente, que Todos os pacientes que sofrem de Déficit de Atenção também sofrem de Ansiedade Isto pode ser ou não verdade, mas propicia uma boa generalização

Aprendizado Indutivo O objetivo do aprendizado indutivo é encontrar uma hipótese (h) que concorde com um conjunto de exemplos. Uma hipótese é considerada satisfatória quando possui uma boa capacidade de generalização.

Aprendizado de Máquina - uma definição "Um programa aprende a partir da experiência E, em relação a uma classe de tarefas T, com medida de desempenho P, se seu desempenho em T, medido por P, melhora com E". Mitchell, 1997

Aprendizado de Máquina - Exemplo Ex.: Detecção de bons clientes para um cartão de crédito Tarefa T: classificar potenciais novos clientes como bons ou maus pagadores Medida de Desempenho P: porcentagem de clientes classificados corretamente Experiência de Treinamento E: uma base de dados histórica em que os clientes já conhecidos são previamente classificados como bons ou maus pagadores

Aprendizado de Máquina - Exemplo Ex.: Diagnóstico de gravidez de risco Tarefa T: classificar novas gestantes com potenciais riscos na gravidez Medida de Desempenho classificadas corretamente P: porcentagem de pacientes Experiência de Treinamento E: base de dados histórica contendo exemplos de gestantes com ou sem gravidez de risco

Tipos de Aprendizado de Máquina Supervisionado Não Supervisionado

Tipos de Aprendizado de Máquina Aprendizado Supervisionado O algoritmo de aprendizado (indutor) recebe um conjunto de exemplos de treinamento para os quais os rótulos da classe associada são conhecidos Cada exemplo (instância ou padrão) é descrito por um vetor de valores (atributos) e pelo rótulo da classe associada O objetivo do indutor é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados

Tipos de Aprendizado de Máquina Aprendizado Não Supervisionado O indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o que cada agrupamento significa no contexto do problema que está sendo analisado

Paradigmas de Aprendizado de Máquina Simbólico Estatístico Baseado em Exemplos Conexionista Evolutivo

Paradigmas de Aprendizado de Máquina Simbólico Neste paradigma um conceito é representado em uma estrutura simbólica, e o aprendizado é realizado através da apresentação de exemplos e contraexemplos deste conceito. As estruturas simbólicas estão tipicamente representadas em alguma expressão lógica, como por exemplo: regras de produção. Exemplos de técnicas que utilizam este paradigma são: Agentes Inteligentes e Arvores de Decisão.

Paradigmas de Aprendizado de Máquina Simbólico

Paradigmas de Aprendizado de Máquina Estatístico No paradigma estatístico é utilizado um modelo estatístico que encontre uma hipótese que possua uma boa aproximação do conceito a ser induzido. O aprendizado consiste em encontrar os melhores parâmetros para o modelo. Estes modelo podem ser paramétricos (quando fazem alguma suposição sobre a distribuição dos dados, ou podem ser não paramétricos, quando não fazem suposição sobre a distribuição dos dados. Dentre os modelos estatísticos utilizados em aprendizagem de máquina podemos destacar os modelos de Regressão Logística.

Paradigmas de Aprendizado de Máquina Estatístico

Paradigmas de Aprendizado de Máquina Baseado em Exemplos Uma forma de classificar um novo padrão é lembrar-se de exemplos parecidos classificados anteriormente, e assim atribuir ao novo exemplo uma classe de um padrão parecido. Esta é a idéia central deste paradigma. A técnica de k nearest neighbour é um exemplo de técnica que utiliza este paradigma.

Paradigmas de Aprendizado de Máquina Baseado em Exemplos

Paradigmas de Aprendizado de Máquina Conexionista O nome conexionista vem da área de pesquisa de Redes Neurais Artificiais (RNA). Uma rede neural artificial é um modelo computacional inspirado no funcionamento do cérebro humano. Uma RNA possui três componentes principais: unidade de processamento os neurônios, conexões sinapses e uma topologia. As redes neurais possuem como principal característica aprender através de exemplos e poder de generalização. As redes Multi Layer Perceptron (MLP) e Self Organing Map (SOM) são exemplos de técnicas que utilizam este paradigma de aprendizado.

Paradigmas de Aprendizado de Máquina Conexionista

Paradigmas de Aprendizado de Máquina Evolutivo Este paradigma foi inspirado na teoria da evolução das espécies de Charles Darwing. O algoritmo inicia com uma população de indivíduos, onde cada individuo representa uma possível solução. Os indivíduos competem entre si, os indivíduos com menor desempenho são descartados, e os indivíduos com melhores desempenho são selecionados para reprodução (Crossover), os novos indivíduos gerados podem ou não sofrer mutação. A população evolui através de várias gerações, até que uma solução ótima seja encontrada. Algoritmos genéticos e Programação genética são exemplo de técnicas que utilizam este paradigma.

Modos de Aprendizado de Máquina Incremental (On-Line) A hipótese é atualizada a medida que cada exemplo é apresentado ao indutor. Não Incremental (Batch) A hipótese só é atualizada após a apresentação de todos os exemplos ao indutor.

Medida de Desempenho A medida de desempenho natural de um indutor é sua taxa de erro global, porém é otimista! Solução: Treinamento Teste

Conceitos Importantes Exemplo (caso, registro ou padrão) é uma tupla de valores de atributos Um cliente, uma paciente Atributo: descreve uma característica ou um aspecto de um exemplo. Nominal: sexo, estado civil Contínuo: peso, altura, idade Classe: atributo especial (aprendizado supervisionado), denominado rótulo ou classe.

Conceitos Importantes Conjunto de exemplos: Um conjunto de exemplos é composto por exemplos contendo valores de atributos bem como a classe associada. Sexo Idade Renda Estado Civil Classe Masculino 18 R$ 1.000,00 Solteira MAU Feminino 21 R$ 800,00 Solteira MAU Masculino 50 R$ 2.000,00 Casado BOM Feminino 60 R$ 8.000,00 Casado BOM

Conceitos Importantes Missing Values Em geral, indicados por valores ausentes; Tipos: Desconhecidos Não registrados Razões Erro de funcionamento Mudanças na definição do escopo

Conceitos Importantes Outliers (Pontos aberrantes) Em geral, indicados por valores fora do padrão. Exemplo rendas com valores R$ 1,00 ou R$ 1.000.000,00

Exemplo

Referências RUSSEL, S.; NOVIG, P. Inteligência Artificial. Elsevier, 2004 - Capítulo 18 18.1 Formas de aprendizagem 18.2 Aprendizagem indutiva 18.4 Aprendizagem por agrupamento Inteligência Artificial. Estruturas e Estratégias para a Solução de Problemas Complexos - capítulo 9 - capítulo 10 Witten, I. H. and Frank, E. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann Series in Data Management Sys. Morgan Kaufmann, 2005. Capitulo 1 1.4 Machine learning and statistics 1.5 Generalization - Capitulo 2- Input: Concepts, instances, and attributes