Aprendizado de Máquina

Documentos relacionados
com Big Data Fabrício Olivetti de França Universidade Federal do ABC

Mineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC

Aprendizado Não-Supervisionado

Aprendizado de Máquina (Machine Learning)

Reconhecimento de Padrões

Aprendizado de Máquina

INF 1771 Inteligência Artificial

Aprendizado de Supervisionado

Aprendizado de Máquina

EEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução

Agentes Inteligentes. Inteligência Artificial

Aprendizado por Reforço usando Aproximação

Visão Computacional. Prof. Leandro Augusto Frata Fernandes TCC Introdução à Ciência da Computação (2012.

Determinação de vícios refrativos oculares utilizando Support Vector Machines

INF 1771 Inteligência Artificial

Informática. Aprendizado de Máquina. Professor Márcio Hunecke.

Aprendizagem de Máquinas

Aprendizado de Máquina

Informática Parte 19 Prof. Márcio Hunecke

Agentes Inteligentes. CAPÍTULO 2 - Russell

Aprendizagem de Máquina

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Aprendizado de Máquina

Redução de Dimensionalidade, DCDistance, e CARFRE

Aprendizagem de Máquina

Clustering: k-means e Agglomerative

Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

INF 1771 Inteligência Artificial

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

INF 1771 Inteligência Artificial

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Redes Neurais (Inteligência Artificial)

Aprendizado Bayesiano Anteriormente...

Aprendizado de Máquina

Descoberta de conhecimento em redes sociais e bases de dados públicas

Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística

Redes Neurais. Motivação. Componentes do neurônio. Cérebro humano. Criar máquinas capazes de operar independentemente do homem:

Reconhecimento de Padrões

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR

Aprendizado de Máquina

Elementos de Estatística. Michel H. Montoril Departamento de Estatística - UFJF

Prof. Júlio Cesar Nievola PPGIa PUCPR APRENDIZAGEM DE MÁQUINA - I

Evandro Deliberal Aula 01

2COP229 Inteligência Computacional. Aula 3. Clusterização.

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

2284-ELE/5, 3316-IE/3. Universidade da Beira Interior, Departamento de Informática

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Aplicações de Sistemas Inteligentes

Introdução a Ciência de Dados Com Linguagem R

Aprendizado de Máquina

Mapeamento robótico. Mapeamento semântico. Metodologia. Maquinas de vetores de suporte. Maquinas de vetores de suporte. Modelos ocultos de Markov

Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Reconhecimento de Padrões/Objetos

INTELIGÊNCIA ARTIFICIAL. Prof. Cedric Luiz de Carvalho

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Aprendizagem de Máquina

Sistemas de Informação e Decisão. Douglas Farias Cordeiro

Extração de Conhecimento & Mineração de Dados

3 Redes Neurais Artificiais

Aprendizado de Máquina

8.1 Principais Resultados

Sobre o curso. Fabrício Olivetti de França. Universidade Federal do ABC

KDD E MINERAÇÃO DE DADOS

IA - Planejamento II

KDD E MINERAÇÃO DE DADOS:

Descoberta de Conhecimento em Bancos de Dados - KDD

Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016

A Evolução da Inteligência Artificial Fabio G. Cozman Escola Politécnica, USP

INF 1771 Inteligência Artificial

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.

RECONHECIMENTO DE PADRÕES - RP

Inteligência Artificial

Aprendizado por Reforço

serotonina (humor) dopamina (Parkinson) serotonina (humor) dopamina (Parkinson) Prozac inibe a recaptação da serotonina

Árvores de Decisão. Fabrício Olivetti de França. Universidade Federal do ABC

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

Inteligência Artificial Agentes Inteligentes

Inteligência Artificial

Operações com vetores

FINITY AGORA É SPREAD SAP STUDIO. SmartBuyer. AI for SAP

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

Conteúdo da Apresentação

Aula 01. Prof. Diemesleno Souza Carvalho

Renato Martins Assunção

SBC - Sistemas Baseados em Conhecimento

Agentes inteligentes. Capítulo 2 Inteligência Artificial Sistemas de Informação

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

3 Aprendizado por reforço

Seleção e Otimização de Fontes

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Transcrição:

Aprendizado de Máquina Fabrício Olivetti de França Universidade Federal do ABC

Tópicos 1. Introdução 1

Introdução

Aprendizado de Máquina Extração de conhecimento. Automatização de tarefas. Tomada de Decisões. 2

Descoberta e Extração de Conhecimento Extração de informações escondidas a partir de dados coletados. Padrões de comportamento de usuários de uma rede social. Detecção de Fraudes. Que sintomas caracterizam determinada doença? 3

Automatização de Tarefas Tarefas que necessitam de muita mão de obra ou são inviáveis de serem feitas por humanos. Estacionar um carro sem motorista. Classificar tweets em críticas ou elogios. Estimar limites de crédito para clientes de banco. 4

Tomada de Decisões Automatizar o processo de tomar decisões acertadas e/ou que maximizam uma certa função de recompensa. Próxima jogada no Xadrez. Quais ações investir. Detecção de possíveis ameaças em vôos. 5

Aprendizado de Máquina O Aprendizado de Máquina consiste em um modelo matemático representável por uma função f (x) que transforma as entradas sensoriais do problema em uma resposta. As entradas podem ser: Uma sequência de texto. Uma imagem. Resultados de exames médicos. Medições de sensores de um robô. Estado atual do tabuleiro de Xadrez. 6

Aprendizado de Máquina O Aprendizado de Máquina consiste em um modelo matemático representável por uma função f (x) que transforma as entradas sensoriais do problema em uma resposta. A saída seria: Se é uma crítica ou um elogio. A que grupo de imagens ela pertence. Possíveis doenças do paciente. A próxima ação do robô. A próxima jogada. 7

Tipos de Aprendizado Existem três tipos principais de Aprendizado de Máquina: Aprendizado Supervisionado Aprendizado Não-Supervisionado Aprendizado por Reforço Além desses existem outras formas que não serão cobertas nesse curso por limitações de tempo. 8

Aprendizado Supervisionado Quando o objetivo do aprendizado está bem definido: Quero saber se o texto faz uma crítica ou um elogio. Quero saber o preço de um imóvel. Quero saber o diagnóstico entre as doenças conhecidas. Dividido entre problema de regressão e classificação. 9

Regressão Na regressão desejamos obter uma função f : R d R, ou seja, dado um conjunto de variáveis de medição, desejo obter uma saída de valor real. Modelo matemático descritivo: o que faz com que um dado sistema se comporte de certa maneira? Se eu alterar um valor de entrada, o que acontecerá? Entender fenômenos: quais leis governam um certo fenômeno observável? 10

Classificação Na classificação buscamos por f : R d C, ou seja, dado um conjunto de variáveis de medição, desejo obter um valor do conjunto finito C. Rotular dados em classes: em qual categoria esse objeto em particular pertence? Automatizar tarefa: que ação, dentre as possíveis ações, devo realizar nesse instante? 11

Aprendizado Não-Supervisionado Quando queremos entender melhor nossos dados ou agrupá-los. Quero transformar meus atributos em combinações de variáveis que façam mais sentido. Quero visualizar meus dados n-dimensionais em um plano 2D. Quero segmentar meus clientes em grupos de perfis similares. Compreende as tarefas de agrupamento, aprendizado de representação, e redução de dimensionalidade. 12

Agrupamento No agrupamento buscamos dividir nossos dados amostrados em diferentes grupos, similar com a tarefa de classificação desejamos uma função f : R d C em que C é o conjunto de possíveis grupos formados. 13

Aprendizado de Representação Para o aprendizado de representação, desejamos encontrar uma função f : R d R d que transforma nossas variáveis. As variáveis transformadas pertence a outro espaço de dimensão d d que faz mais sentido para as tarefas de classificação ou regressão. 14

Redução de Dimensionalidade Na redução de dimensionalidade, queremos encontrar f : R d R d, mas com d < d. Dessa forma os dados podem ser representados e classificados em um espaço de dimensão menor, isso tanto pode ajudar na tarefa de aprendizado supervisionado como também pode nos permitir visualizar melhor nossos dados para os casos de d 3. 15

Agrupamento Descobrir padrões similares: que conjunto de objetos se comportam de forma similar? Descobrir pontos representativos: que objetos são bons representantes de um certo grupo? Descobrir como os dados são gerados: qual a função que gera esses dados? 16

Aprendizado de Representação Transformar atributos para a máquina: como os atributos originais podem ser combinados para facilitar tarefas de Aprendizado de Máquina? Transformar atributos para o humano: como os atributos podem ser combinados e transformados para ajudar o entendimento pelo ser humano? 17

Redução de Dimensionalidade Visualizar meus dados: como projetar os dados em um plano 2D? Facilitar o trabalho de aprendizado: eliminar variáveis ruidosas, combinar variáveis que agregam informação. 18

Aprendizado por Reforço Quando não sabemos exatamente a resposta correta que o sistema deve fazer ou a resposta só pode ser mensurada após uma sequência de respostas do sistema. Dadas as últimas jogadas, qual a próxima peça de Xadrez que devo mover? Qual sequência de ações o robô deve fazer para desarmar uma bomba? 19

Pipeline A pesquisa, desenvolvimento e aplicação de tarefas de Aprendizado de Máquina seguem um pipeline comum para todas as tarefas: Obtenção de dados. Tratamento dos atributos para uma forma computacional. Rotulação dos dados. Escolha do modelo da tarefa e modelo de aprendizado. Otimização dos parâmetros do algoritmo. Validação. Interpretação. 20

Pipeline Raw Data Select and Join Export Labeling Transformation Feature Selection Normalization Feature Reduction Feature Engineering Model Selection Parameters Optimization Model Validation 21

Obtenção dos Dados Coleta dos dados da tarefa a ser realizada: Transações de compras na internet Dados de navegação (Google, Facebook) Dados de satélite Experimentos com genes 22

Tratamento dos Dados Maior parte dos algoritmos de Aprendizado de Máquina assumem uma entrada de dados bem definida. Geralmente um vetor multidimensional. 23

Tratamento dos Dados Muitas bases de dados de interesse não possuem esse formato: Textos Imagens Som Vídeos 24

Pré-processamento Necessidade de transformar tipos desestruturados em uma estrutura vetorial. Cuidado para não perder informação no meio do caminho! 25

Rotulação dos Dados Nas tarefas de Aprendizado Supervisionado, é necessário rotular uma parte dos dados obtidos para a construção de um modelo de classificação/regressão baseado em exemplos. Regra dos 10 para estimar a quantidade mínima de dados rotulados necessário para um bom modelo de predição: número de atributos multiplicados por 10. Idealmente teremos um número suficiente para entrar exemplos de combinações diferentes de valores de atributos. 27

Escolha do modelo De posse dos dados e com eles já tratados, precisamos escolher o que queremos extrair de informação. Após essa escolha, precisamos escolher o algoritmo a ser utilizado 1. 1 Existem algoritmos para escolher algoritmos! 29

Otimização dos parâmetros Uma vez que o algoritmo foi escolhido, dependendo da escolha existem diversos parâmetros que o usuário deve ajustar para obter o melhor resultado. Em muitos desses algoritmos a escolha desses parâmetros pode fazer muita diferença 2. 2 Existem algoritmos para escolher esses parâmetros! 30

Validação do modelo Uma vez que o modelo foi construído, é necessário verificar se ele está respondendo corretamente ou qual a taxa de acerto que obtemos com tal modelo. Para isso separamos parte da nossa base rotulada e calculamos o erro. O erro deve ser comparado com um baseline para ter certeza que o modelo funciona! 31

Interpretação dos resultados Em muitas tarefas pode ser necessário interpretar ou entender o que o modelo aprendeu: O carro autônomo não vai entrar em modo GTA? Por que ele recomendou determinada vaga de emprego para uma pessoa? Que tipo de produto maximizará minhas vendas? Essa é uma área de pesquisa atual e de grande interesse das empresas que trabalham com Inteligência Artificial. 32

Conclusão A área de Aprendizado de Máquina é de grande interessa prático para empresas de diversas áreas. Embora existam diversos algoritmos que apresentam boa performance, o recente aumento na capacidade de obtenção de dados requer aprimoramento destes. Apesar de esses algoritmos existirem em diversos pacotes prontos para serem utilizados, o passo-a-passo desde a obtenção dos dados até os resultados não é trivial. 33