Aprendizagem a partir de observações. Capítulo 18 (Secções 1-3)

Tamanho: px
Começar a partir da página:

Download "Aprendizagem a partir de observações. Capítulo 18 (Secções 1-3)"

Transcrição

1 Aprendizagem a partir de observações Capítulo 18 (Secções 1-3)

2 Sumário Agentes aprendizes Aprendizagem indutiva Aprendizagem com árvores de decisão

3 Aprendizagem Aprendizagem é essencial em ambientes desconhecidos i.e., quando não há omnisciência Aprendizagem é útil como método construtivo i.e., o agente é exposto à realidade em vez de ser completamente definido Aprendizagem modifica o mecanismo de decisão dos agentes de modo a melhorar o seu desempenho

4 Agentes aprendizes

5 Elemento de aprendizagem O desenho de um agente de aprendizagem depende de: Componentes do desempenho que devem ser aprendidos Feedback disponível para aprender estes componentes Representação usada para os componentes Tipos de feedback Aprendizagem supervisionada: para cada exemplo é dado input e output (e.g. travar para agente taxista) Aprendizagem não supervisionada: para cada exemplo só é dado input (e.g. agente infere se é um bom/mau dia de tráfego) Aprendizagem com reforço: prémios ocasionais (e.g. gorjeta é consequência de um bom serviço)

6 Aprendizagem indutiva Forma mais simples: aprender uma função a partir de exemplos f é a função alvo Um exemplo é um par (x, f(x)) Problema: encontrar uma hipótese h que é uma função Tal que h f Dado um conjunto de treino de exemplos Representa um modelo muito simplificado da aprendizagem real: Ignora conhecimento à priori Assume que são dados exemplos

7 Aprendizagem indutiva: método Construir/ajustar h de acordo com f para um dado conjunto de treino h é consistente se está de acordo com f em todos os exemplos E.g., obter h para:

8 Aprendizagem indutiva: h

9 Aprendizagem indutiva: h

10 Aprendizagem indutiva: h Regra de Ockham: dar preferência à hipótese mais simples que seja consistente com os dados disponíveis (e.g. polinómio de grau 1 é preferível vs. polinómio de grau 12)

11 Aprendizagem com árvores de decisão Problema: decidir se esperamos por uma mesa num restaurante, com base nos seguintes atributos: 1. Alternativa: existe um restaurante alternativo próximo? 2. Bar: existe uma área de bar confortável para esperar? 3. Sexta/Sábado: hoje é Sexta ou Sábado? 4. Fome: temos fome? 5. Clientes: número de pessoas no restaurante (Nenhum, Algum, Cheio) 6. Preço: gama de preços ($, $$, $$$) 7. Chuva: está a chover lá fora? 8. Reserva: fizemos uma reserva? 9. Tipo de restaurante: Francês, Italiano, Tailandês, Burger, 10. Estimativa do tempo de espera: 0-10, 10-30, 30-60, >60

12 Representação baseada em atributos Exemplos descritos por valores de atributos (Booleanos, discretos, contínuos) E.g., situações em que esperamos (ou não) por uma mesa: Classificação de exemplos é positiva (T) ou negativa (F) Objectivo: aprender função objectivo (Target Wait)

13 Árvores de decisão Representação possível para hipóteses E.g., árvore para decidir se esperamos ou não:

14 Expressividade Árvores de decisão podem expressar qualquer função com base nos valores dos atributos E.g., para funções Booleanas, linha da tabela caminho até uma folha: Existe uma árvore de decisão consistente para qualquer conjunto de treino em que cada exemplo corresponde a uma caminho até uma folha (a não ser que f seja não-determinística em x) mas provavelmente não será possível generalizá-la para novos exemplos Preferência dada a árvores de decisão compactas

15 Espaços de hipóteses Quantas funções distintas existem para n atributos Booleanos? = número de tabelas distintas com 2 n linhas = 2 2n E.g., para 6 atributos Booleanos existem 18,446,744,073,709,551,616 funções Booleanas Necessidade de um algoritmo eficiente para encontrar hipóteses consistentes

16 Espaços de hipóteses Quantas hipóteses puramente conjuntivas (e.g., Hungry Rain)? Cada atributo pode aparecer positivo ou negativo ou não aparecer 3 n hipóteses conjuntivas distintas Maior expressividade do espaço de estados Aumenta a possibilidade da função alvo ser expressa Aumenta o número de hipóteses consistentes com o conjunto de treino pode dar origem a previsões piores

17 Aprendizagem com árvores de decisão Objectivo: encontrar uma árvore pequena consistente com os exemplos de treino Ideia: (recursivamente) escolher o atributo "mais significativo" como raiz da (sub-)árvore Se há exemplos positivos e negativos escolher o melhor atributo para os separar Se todos os exemplos são positivos ou negativos podemos terminar Se não restam exemplos, então tal situação nunca foi observada e devolvemos um valor de defeito Se não restam atributos e ainda temos exemplos positivos e negativos então temos um problema ruído nos dados (tipicamente devolve-se valor em maioria)

18 Aprendizagem com árvores de decisão Função DLT (ex os,atributos,defeito) devolve árvore de decisão se ex os vazio então devolve defeito senão se todos os ex os têm a mesma classificação então devolve classificação senão se atributos está vazio então devolve Maioria(ex os ) senão melhor EscolheAtributo(atributos, ex os ) árvore nova árvore com melhor na raiz m Maioria(ex os ) paracada valor v i de melhor ex os {elementos de ex os com melhor=v i } sub-árvore DTL(ex os,atributos-melhor,m) adiciona um ramo à árvore com etiqueta v i e sub-árvore devolve verdadeiro

19 Escolha de atributo Ideia: um bom atributo separa exemplos em subconjuntos que são (idealmente) todos positivos ou todos negativos Clientes? É uma boa escolha!

20 Teoria de informação Usada para implementar EscolheAtributo no algoritmo DTL Considere-se um conjunto de S elementos log 2 ( S ) corresponde ao número mínimo de vezes que temos de dividir um conjunto ao meio para identificar um elemento log 2 (1) = 0, log 2 (2) = 1, log 2 (3) = 1, log 2 (4) = 2, log 2 (5) = 2, log 2 (6) = 2, log 2 (7) = 2, log 2 (8) = 3, Podemos considerar que o número de divisões corresponde ao número de questões

21 Teoria de informação Considere-se um conjunto de P+N elementos, sendo P/N os elementos classificados positivamente/negativamente log 2 ( P ) questões no caso do elemento pertencer a P log 2 ( N ) questões no caso do elemento pertencer a N Número de questões: p P log 2 ( P ) + p N log 2 ( N ) P P/N é a probabilidade do elemento pertencer a P/N Para uma amostra de dimensão S=12, com P P = P N = 0.5 vem 2*0.5 log 2 (6)=2 Para S=12, P P = 0.75 e P N = 0.25 vem 0.75*log 2 (9)+0.25*log 2 (3)=1.75

22 Teoria de informação Conteúdo de informação (entropia): I(P(v 1 ),, P(v n )) = Σ i=1 -P(v i ) log 2 P(v i ) Para um conjunto de treino com p exemplos positivos e n exemplos negativos: Número de perguntas que se poupa por saber que o conjunto está dividido em P e N I( p, p n n ) p n p p n log 2 log 2 p n p n p n n p n Para o caso do restaurante: P=N= I(, ) log log2 2*( 0.5)*( 1)

23 Ganho de informação Um dado atributo A divide o conjunto de treino E em sub-conjuntos E 1,, E v de acordo com os valores para A, em que A tem v valores distintos Entropia depois da separação em função de A dada por: Ganho de informação (GI) ou redução de entropia para o atributo A: Escolher o atributo com o maior GI v i i i i i i i i i n p n n p p I n p n p A resto 1 ), ( ) ( ) ( ), ( ) ( A resto n p n n p p I A GI

24 Ganho de informação Para o conjunto de treino, p = n = 6, I(6/12, 6/12) = 1 bit Considerar os atributos Clientes e Tipo (e também os outros): GI( Clientes) 1 [ I(0,1) I(1,0) GI( Tipo) 1 [ I(, ) I(, ) I(, 6 2 I(, 4 4 )] 6 2 ) bits I(, )] bits Clientes tem o GI mais elevado entre todos os atributos e portanto é escolhido pelo algoritmo DTL como raiz

25 Exemplo (cont.) Árvore de decisão aprendida a partir dos 12 exemplos: Substancialmente mais simples do que a árvore inicial a pouca quantidade de informação disponível não justifica uma hipótese mais complexa

26 Medida de desempenho Como é que sabemos se h f? Idealmente, verificando se a classificação prevista coincide com a classificação real para um conjunto de teste de exemplos Na prática é adoptado um procedimento iterativo 1. Obter um conjunto de exemplos 2. Dividir o conjunto em 2 conjuntos disjuntos: conjunto de treino e conjunto de teste 3. Aplicar o algoritmo de aprendizagem ao conjunto de treino, e obter uma hipótese h 4. Medir a percentagem de exemplos do conjunto de teste correctamente classificados por h 5. Repetir os passos 2-4 para diferentes conjuntos de treino de diferentes dimensões (obtidos aleatoriamente)

27 Medida de desempenho Curva de aprendizagem = % h f no conjunto de teste em função da dimensão do conjunto de treino

28 DLTs: problemas Falhas de dados Atributos com inúmeros valores Atributos com domínios contínuos ou contínuos mas ilimitados Classificações não discretas Aplicações no mundo real têm de considerar estes aspectos

29 Sumário Aprendizagem necessária para ambientes desconhecidos, desenho de agentes incompleto Agente aprendiz = desempenho + aprendizagem Para aprendizagem supervisionada, o objectivo é encontrar uma hipótese simples aproximadamente consistente com os exemplos de treino Aprendizagem com árvores de decisão usa ganho de informação Desempenho de aprendizagem = precisão da previsão medida com um conjunto de teste

Aprendizagem a partir de observações. Inteligência Artificial. Aprendizagem Indutiva Clássica. Aprendizagem Indutiva. Aprendizagem indutiva

Aprendizagem a partir de observações. Inteligência Artificial. Aprendizagem Indutiva Clássica. Aprendizagem Indutiva. Aprendizagem indutiva Inteligência Artificial Aula 19 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia Aprendizagem a partir de observações Capítulo 18 Russell & Norvig Seções 18.1 a 18.3 Aprendizagem Indutiva Clássica

Leia mais

Árvore de Decisão. Capítulo 18 Russell & Norvig Seções 18.1 a 18.3

Árvore de Decisão. Capítulo 18 Russell & Norvig Seções 18.1 a 18.3 Árvore de Decisão Capítulo 18 Russell & Norvig Seções 18.1 a 18.3 Aprendizagem Indutiva Clássica Recebe como entrada o valor correto de uma função desconhecida para entradas específicas e tenta recuperar

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 15 Árvores de Decisão Árvores de Decisão Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso.

Leia mais

Inteligência Artificial

Inteligência Artificial https://www.pinterest.com/carlymundo/decision-tree-infographics/ Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial

Leia mais

Aprendizagem de Máquina. May 29, 2014

Aprendizagem de Máquina. May 29, 2014 Aprendizagem de Máquina May 29, 2014 Componentes de um Agente Performance standard Critic Sensors feedback learning goals Learning element changes knowledge Performance element Environment Problem generator

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Sistemas de Informação Inteligente Prof. Leandro C. Fernandes Adaptação dos materiais de: Thiago A. S. Pardo, Daniel Honorato e Bianca Zadrozny APRENDIZADO SIMBÓLICO: ÁRVORES DE

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Redes Neuronais e Aprendizagem Automática 1

Redes Neuronais e Aprendizagem Automática 1 Redes Neuronais e Aprendizagem Automática 2005/2006 18 a aula Fernando.Silva@ist.utl.pt Instituto Superior Técnico Redes Neuronais e Aprendizagem Automática 1 Sumário Árvores de decisão (continuação) Redes

Leia mais

Aprendizado indutivo. Marcelo K. Albertini. 17 de Abril de 2014

Aprendizado indutivo. Marcelo K. Albertini. 17 de Abril de 2014 Aprendizado indutivo Marcelo K. Albertini 17 de Abril de 2014 2/22 Aprendizado indutivo O que é? Porque é difícil? Como podemos resolver problemas de indução? 3/22 Aprendizado supervisionado Temos: exemplos

Leia mais

Aprendizado por Árvores de Decisão

Aprendizado por Árvores de Decisão Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: pozzer@inf.ufsm.br Período: 2006/01 Aprendizado por Árvores

Leia mais

2284-ELE/5, 3316-IE/3. Universidade da Beira Interior, Departamento de Informática

2284-ELE/5, 3316-IE/3. Universidade da Beira Interior, Departamento de Informática INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem A aprendizagem é um aspecto crucial da Inteligência

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 14 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

Aprendizado. O que é Aprendizado? Capítulo 5

Aprendizado. O que é Aprendizado? Capítulo 5 Aprendizado Capítulo 5 309 O que é Aprendizado?...mudanças que tornam sistemas capazes de adaptar-se e realizar tarefas semelhantes de maneira mais eficiente [Simon] 310 1 Tipos de Aprendizado Refinamento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendizagem de Máquina Aprendizagem de Árvores de Decisão Aula 3 Alessandro L. Koerich Introdução Representação de Árvores de Decisão Algoritmo de Aprendizagem ID3 Entropia e Ganho de Informação

Leia mais

Otimização de horários Seminário. Clarisse Resende 25/01/2013

Otimização de horários Seminário. Clarisse Resende 25/01/2013 Otimização de horários Seminário Clarisse Resende 25/01/2013 O problema dos horários consiste numa sequência de atividades de programação, satisfazendo um conjunto de restrições de recursos. Pretende-se

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação de Árvores

Leia mais

Seleção de Atributos 1

Seleção de Atributos 1 Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

Algoritmos 3/17/ Algoritmos como área de estudo e investigação

Algoritmos 3/17/ Algoritmos como área de estudo e investigação Algoritmos e Complexidade Ana Teresa Freitas INESC-ID/IST ID/IST 3/17/2005 1 O que é um algoritmo? Algoritmos: Sequência de instruções necessárias para a resolução de um problema bem formulado [passíveis

Leia mais

Estruturas de Dados 2

Estruturas de Dados 2 Estruturas de Dados 2 Técnicas de Projeto de Algoritmos Dividir e Conquistar IF64C Estruturas de Dados 2 Engenharia da Computação Prof. João Alberto Fabro - Slide 1/83 Projeto de Algoritmos por Divisão

Leia mais

Inteligência Artificial

Inteligência Artificial https://www.pinterest.com/carlymundo/decision-tree-infographics/ Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial

Leia mais

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore.

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore. Árvores de Decisão João Gama Jgama@ncc.up.pt Sumario Árvores de decisão Motivação Construção de uma árvore de decisão Critérios para seleccionar atributos Entropia Podar a árvore Estimativas de erro Extensões

Leia mais

Saída: Representação de conhecimento

Saída: Representação de conhecimento Saída: Representação de conhecimento Kate Revoredo katerevoredo@uniriotec.br 1 Saída: Representando padrões estruturais Existem muitas maneiras diferentes de representar padrões: Árvores de decisão, regras,

Leia mais

Amostragem. Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem

Amostragem. Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem Amostragem Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem 1 Muito Importante!! Em relação às amostras, deve assegurar-se a sua representatividade relativamente à população

Leia mais

Inteligência Artificial

Inteligência Artificial UFRGS 2 Inteligência Artificial Técnicas de Mineração de Dados Árvores de Decisão Regras de Associação Árvores de Decisão As árvores de decisão (AD) são ferramentas poderosas para classificação cuja maior

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 6 Algoritmos Genéticos M.e Guylerme Velasco Roteiro Introdução Otimização Algoritmos Genéticos Representação Seleção Operadores Geneticos Aplicação Caixeiro Viajante Introdução

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Aprendizado Bayesiano

Aprendizado Bayesiano Aprendizado Bayesiano Marcelo K. Albertini 3 de Julho de 2014 2/1 Conteúdo Aprendizado Naive Bayes Exemplo: classificação de texto Redes Bayesiana Algoritmo EM Regressão probabiĺıstica 3/1 Classificador

Leia mais

Aprendizado Bayesiano

Aprendizado Bayesiano Aprendizado Bayesiano Marcelo K. Albertini 26 de Junho de 2014 2/20 Conteúdo Teorema de Bayes Aprendizado MAP Classificador ótimo de Bayes 3/20 Dois papéis para métodos bayesianos Algoritmos de aprendizado

Leia mais

INTELIGÊNCIA ARTIFICIAL 2008/09

INTELIGÊNCIA ARTIFICIAL 2008/09 INTELIGÊNI RTIFIIL 2008/09 PROUR 1) onsidere o problema da torre de Hanoi com discos. Neste problema, existem três pinos, e e discos de diâmetros diferentes, estando no início todos os discos colocados

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

Pré-Processamento de Documentos

Pré-Processamento de Documentos Pré-Processamento de Documentos Introdução Pré-Processamento : Análise léxica; Stopwords; Stemming; Vocabulário; Thesaurus Compressão: Fundamentos; Método Estatístico; Método Dicionário; Arquivos Invertidos

Leia mais

Aula 3 Representação do Conhecimento

Aula 3 Representação do Conhecimento Aula 3 Representação do Conhecimento Sumário (Representação do Conhecimento) - Introdução - Tabelas - Modelos Lineares - Árvores - Regras - Baseada em Instância - Clusters (Aglomerado) - Prática: Árvore

Leia mais

Aula 10: Tratabilidade

Aula 10: Tratabilidade Teoria da Computação DAINF-UTFPR Aula 10: Tratabilidade Prof. Ricardo Dutra da Silva Na aula anterior discutimos problemas que podem e que não podem ser computados. Nesta aula vamos considerar apenas problemas

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Inteligência Artificial Aprendizado de Máquina Prof. Cedric Luiz de Carvalho Instituto de Informática UFG 2006 2/85 Tópicos O que é aprendizado Formas de aprendizado Aprendizagem indutivo Árvores de decisão

Leia mais

CAL ( ) MIEIC/FEUP Estruturas de Dados ( )

CAL ( ) MIEIC/FEUP Estruturas de Dados ( ) Conjuntos Disjuntos R. Rossetti, A.P. Rocha, A. Pereira, P.B. Silva, T. Fernandes FEUP, MIEIC, CPAL, 2010/2011 1 Conjuntos Disjuntos Objectivo resolver eficientemente o problema da equivalência estrutura

Leia mais

Métodos de Ordenação Parte 3

Métodos de Ordenação Parte 3 Estrutura de Dados II Métodos de Ordenação Parte 3 Prof a Márcio Bueno ed2tarde@marciobueno.com / ed2noite@marciobueno.com Material baseado nos materiais do Prof. Robson Lins Classificação em Memória Primária

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Taguspark Segundo Teste 14 de Junho de 006 9H00-10H30 Nome: Número: Este teste tem 8 perguntas e 11 páginas. Escreva o número em todas as páginas. Deve ter na mesa apenas o enunciado

Leia mais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas

Leia mais

INTELIGÊNCIA ARTIFICIAL

INTELIGÊNCIA ARTIFICIAL INTELIGÊNCIA ARTIFICIAL Primeiro Teste 29 de Outubro de 2011 17:00-18:30 Este teste é composto por 9 páginas contendo 11 perguntas. Para perguntas com resposta de escolha múltipla, respostas erradas com

Leia mais

Busca Competitiva. Inteligência Artificial. Até aqui... Jogos vs. busca. Decisões ótimas em jogos 9/22/2010

Busca Competitiva. Inteligência Artificial. Até aqui... Jogos vs. busca. Decisões ótimas em jogos 9/22/2010 Inteligência Artificial Busca Competitiva Aula 5 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia-pos Capítulo 6 Russell & Norvig Seção 6.1 a 6.5 2 Até aqui... Problemas sem interação com outro agente.

Leia mais

MINERAÇÃO DE DADOS. Thiago Marzagão CLUSTERIZAÇÃO. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9

MINERAÇÃO DE DADOS. Thiago Marzagão CLUSTERIZAÇÃO. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9 MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu CLUSTERIZAÇÃO Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9 regressão/classificação vs clusterização Regressão/classificação: temos x 1, x 2,...,

Leia mais

Lógica Computacional Aula 4

Lógica Computacional Aula 4 Lógica Computacional Aula 4 DCC/FCUP 2017/18 Conteúdo 1 Lógica proposicional 1 1.1 Fórmulas de Horn.......................................... 1 1.2 Satisfazibilidade............................................

Leia mais

Exemplo de Aplicação de Algoritmos Genéticos. Prof. Juan Moisés Mauricio Villanueva cear.ufpb.br/juan

Exemplo de Aplicação de Algoritmos Genéticos. Prof. Juan Moisés Mauricio Villanueva cear.ufpb.br/juan Exemplo de Aplicação de Algoritmos Genéticos Prof. Juan Moisés Mauricio Villanueva jmauricio@cear.ufpb.br cear.ufpb.br/juan Estrutura do Algoritmo Genético Algoritmo genético Inicio t = 0 inicializar P(t)

Leia mais

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis: Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização

Leia mais

Arvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1)

Arvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1) O que é a árvore de decisão? Arvores de decisão Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Victor Lobo Nós (testes, ou conceitos)

Leia mais

Algoritmos Indutores de Árvores de

Algoritmos Indutores de Árvores de Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

Variáveis Aleatórias Discretas e Distribuição de Probabilidade

Variáveis Aleatórias Discretas e Distribuição de Probabilidade Variáveis Aleatórias Discretas e Distribuição de Probabilidades - parte IV 2012/02 1 Distribuição Poisson Objetivos Ao final deste capítulo você deve ser capaz de: Ententer suposições para cada uma das

Leia mais

Compressão Sem Perdas: Codificações Huffman e Aritmética. Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré

Compressão Sem Perdas: Codificações Huffman e Aritmética. Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré Compressão Sem Perdas: Codificações Huffman e Aritmética Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré Compressão Sem Perdas (Lossless Data Compression) Refere-se a métodos de compressão

Leia mais

Paradigmas de Aprendizagem

Paradigmas de Aprendizagem Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Aprendizagem Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23 Noções de Simulação Ciências Contábeis - FEA - Noturno 2 o Semestre 2013 MAE0219 (IME-USP) Noções de Simulação 2 o Semestre 2013 1 / 23 Objetivos da Aula Sumário 1 Objetivos da Aula 2 Motivação 3 Geração

Leia mais

Detecção de um decaimento raro em CMS

Detecção de um decaimento raro em CMS Detecção de um decaimento raro em CMS Colaboração CMS, CERN 19 Julho 2013 CMS detectou um importante e raro decaimento previsto pelo Modelo Padrão da física de partículas. A medida do decaimento de mesões

Leia mais

Satisfação de Restrições. Capítulo 5 (disponível online)

Satisfação de Restrições. Capítulo 5 (disponível online) Satisfação de Restrições Capítulo 5 (disponível online) Sumário Problemas de Satisfação de Restrições (CSPs, do Inglês Constraint Satisfaction Problems ) Procura com Retrocesso para CSPs Procura Local

Leia mais

Análise de complexidade

Análise de complexidade Introdução Algoritmo: sequência de instruções necessárias para a resolução de um problema bem formulado (passíveis de implementação em computador) Estratégia: especificar (definir propriedades) arquitectura

Leia mais

Unidade I Conjunto dos Números Inteiros.

Unidade I Conjunto dos Números Inteiros. A A Unidade I Conjunto dos Números Inteiros. A A Aula 8.2 Conteúdo: Problemas com divisão de inteiros. A A Habilidade: Resolver problemas que envolvam números inteiros. A A Agora iremos aprender uma forma

Leia mais

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS:

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS: TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Técnicas de amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade

Leia mais

Algoritmos Greedy. Pedro Ribeiro 2014/2015 DCC/FCUP. Pedro Ribeiro (DCC/FCUP) Algoritmos Greedy 2014/ / 40

Algoritmos Greedy. Pedro Ribeiro 2014/2015 DCC/FCUP. Pedro Ribeiro (DCC/FCUP) Algoritmos Greedy 2014/ / 40 Algoritmos Greedy Pedro Ribeiro DCC/FCUP 2014/2015 Pedro Ribeiro (DCC/FCUP) Algoritmos Greedy 2014/2015 1 / 40 Algoritmos Greedy Vamos falar de algoritmos greedy. Em português são conhecidos como: Algoritmos

Leia mais

PROBABILIDADE E ESTATÍSTICA EM HIDROLOGIA

PROBABILIDADE E ESTATÍSTICA EM HIDROLOGIA Introdução 1 PROBABILIDADE E ESTATÍSTICA EM HIDROLOGIA Fenômeno - MODELO MATEMÁTICO Q = L.H 3/2 F= γ.h.a Ênfase: forma da expressão relação entre : L e H Q γ, h e A F Aula 1 Introdução 2 HIDROLOGIA " É

Leia mais

SUMÁRIO. Fundamentos Árvores Binárias Árvores Binárias de Busca

SUMÁRIO. Fundamentos Árvores Binárias Árvores Binárias de Busca ÁRVORES SUMÁRIO Fundamentos Árvores Binárias Árvores Binárias de Busca 2 ÁRVORES Utilizadas em muitas aplicações Modelam uma hierarquia entre elementos árvore genealógica Diagrama hierárquico de uma organização

Leia mais

Noções de Exatidão, Precisão e Resolução

Noções de Exatidão, Precisão e Resolução Noções de Exatidão, Precisão e Resolução Exatidão: está relacionada com o desvio do valor medido em relação ao valor padrão ou valor exato. Ex : padrão = 1,000 Ω ; medida (a) = 1,010 Ω ; medida (b)= 1,100

Leia mais

Sistemas de Apoio à Decisão. Guia de Exercícios

Sistemas de Apoio à Decisão. Guia de Exercícios Sistemas de Apoio à Decisão Guia de Exercícios Pedro Campos Departamento de Matemática e Engenharias Normalização de Dados e Operações OLAP 1. Usando os dados para o atributo idade, (13, 15, 16, 16, 19,

Leia mais

Probabilidade - aula II

Probabilidade - aula II 25 de Março de 2014 Interpretações de Probabilidade Amostras Aleatórias e Objetivos Ao final deste capítulo você deve ser capaz de: Calcular probabilidades de eventos conjuntos. Interpretar e calcular

Leia mais

Conjuntos disjuntos. Relações de equivalência

Conjuntos disjuntos. Relações de equivalência Conjuntos disjuntos Objectivo resolver eficientemente o problema da equivalência estrutura de dados simples (vector) implementação rápida análise complicada Uso problemas de grafos equivalência de tipos

Leia mais

Universidade Estadual de Mato Grosso do Sul Bacharelado em Ciência da Computação Algoritmos e Estruturas de Dados II Prof. Fabrício Sérgio de Paula

Universidade Estadual de Mato Grosso do Sul Bacharelado em Ciência da Computação Algoritmos e Estruturas de Dados II Prof. Fabrício Sérgio de Paula Universidade Estadual de Mato Grosso do Sul Bacharelado em Ciência da Computação Algoritmos e Estruturas de Dados II Prof. Fabrício Sérgio de Paula Tópicos Introdução Ordenação por bolha (bubble sort)

Leia mais

Relatório de Inteligência Artificial

Relatório de Inteligência Artificial Relatório de Inteligência Artificial Hidato Grupo 4 Diogo Simões - 63558 Inês Almeida - 63556 Miguel Diogo - 63567 Introdução O objectivo deste projecto é resolver automaticamente um tabuleiro de Hidato

Leia mais

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore.

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore. Árvores de Decisão João Gama Jgama@liacc.up.pt Sumario Árvores de decisão Motivação Construção de uma árvore de decisão Critérios para seleccionar atributos Entropia Podar a árvore Estimativas de erro

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Conceito de Estatística

Conceito de Estatística Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir

Leia mais

PROCURA E PLANEAMENTO

PROCURA E PLANEAMENTO PROCURA E PLANEAMENTO Primeiro Exame 13 de Janeiro de 2007 11:00-13:30 Este exame é composto por 13 páginas contendo 6 grupos de perguntas. Identifique já todas as folhas do exame com o seu nome e número.

Leia mais

CC-226 Aula 07 - Estimação de Parâmetros

CC-226 Aula 07 - Estimação de Parâmetros CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições

Leia mais

2 Erro comum da indução. 3 Corretude de Algoritmos. > Indução Forte X Indução Fraca Erro comum da indução Corretude de Algoritmos 0/17

2 Erro comum da indução. 3 Corretude de Algoritmos. > Indução Forte X Indução Fraca Erro comum da indução Corretude de Algoritmos 0/17 Conteúdo 1 Indução Forte X Indução Fraca 2 Erro comum da indução 3 Corretude de Algoritmos > Indução Forte X Indução Fraca Erro comum da indução Corretude de Algoritmos 0/17 Indução Forte X Indução Fraca

Leia mais

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos

Leia mais

3 Aprendizado por reforço

3 Aprendizado por reforço 3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina

Leia mais

Ordenação e Pesquisa

Ordenação e Pesquisa Ordenação e Pesquisa Luís Lopes DCC-FCUP Estruturas de Dados Pesquisa de Informação A pesquisa eficiente de informação é extremamente relevante, seja: num catálogo indexado por uma relação de ordem, e.g.

Leia mais

Python: Recursão. Claudio Esperança

Python: Recursão. Claudio Esperança Python: Recursão Claudio Esperança Recursão É um princípio muito poderoso para construção de algoritmos A solução de um problema é dividido em Casos simples: São aqueles que podem ser resolvidos trivialmente

Leia mais

PMR2560 Visão Computacional Quantização de cores. Prof. Eduardo L. L. Cabral

PMR2560 Visão Computacional Quantização de cores. Prof. Eduardo L. L. Cabral PMR2560 Visão Computacional Quantização de cores Prof. Eduardo L. L. Cabral Objetivos Quantização de cores redução do números de cores presentes na imagem: Métodos: Quantização uniforme; Quantização adaptativa;

Leia mais

Tópicos em Mineração de Dados

Tópicos em Mineração de Dados Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores

Leia mais

Filtros de Média Movente

Filtros de Média Movente Processamento Digital de Sinais Filtros de Média Movente Prof. Dr. Carlos Alberto Ynoguti Características É o filtro ótimo para a tarefa de remover ruído aleatório de um sinal, e manter uma resposta a

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendizagem de Máquina Aprendizagem de Conceito Aula 2 Alessandro L. Koerich Mestrado em Informática Aplicada Introdução Tarefa de Aprendizagem de Conceito Aprendizagem de Conceito como

Leia mais

Avaliação Quantitativa de Sistemas

Avaliação Quantitativa de Sistemas Avaliação Quantitativa de Sistemas Contexto A Avaliação Quantitativa de Sistemas permite a avaliação de sistemas antes mesmo da sua implementação física. Dessa forma, é possível avaliar um sistema projetado

Leia mais

Fundamentos da Programação

Fundamentos da Programação Fundamentos da Programação Segundo Teste 10 de Janeiro de 2014 09:00 10:30 Nome: Número: Esta prova, individual e sem consulta, tem 8 páginas com 12 perguntas. A cotação de cada pergunta está assinalada

Leia mais

Refinamentos de Equilíbrios de Nash

Refinamentos de Equilíbrios de Nash Refinamentos de Equilíbrios de Nash Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 06 de Outubro de 2014 Equilíbrio

Leia mais

MAC 0425/ Inteligência Artificial

MAC 0425/ Inteligência Artificial MAC 0425/5739 - Inteligência Artificial Exercício-Programa 4 - Clasificação Prazo limite de entrega: 23:59 07/12/2016 1 Introdução Neste exercício-programa estudaremos o problema de aprendizagem supervisionado

Leia mais

RECORTE (CLIPPING) por janelas rectangulares

RECORTE (CLIPPING) por janelas rectangulares RECORTE (CLIPPING) por janelas rectangulares y max y min x min x max i. PONTOS P(x,y) é visível se não for exterior à janela x x max x x min y y max y y min ii. LINHAS (segmentos de recta) PQ é visível

Leia mais

TEORIA DE COMPLEXIDADE

TEORIA DE COMPLEXIDADE TEORIA DE COMPLEXIDADE Fundamentos: classes P e N P Mauricio Ayala-Rincón Grupo de Teoria da Computaç~ao http://ayala.mat.unb.br/tcgroup Instituto de Ciências Exatas Universidade de Brasília, Brasília

Leia mais

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva Computação Evolutiva Algoritmos Genéticos A computação evolutiva (CE) é uma área da ciência da computação que abrange modelos computacionais inspirados na Teoria da Evolução das Espécies, essencialmente

Leia mais

Matriz da Prova Final de Recuperação dos Cursos Profissionais

Matriz da Prova Final de Recuperação dos Cursos Profissionais MINISTÉRIO DA EDUCAÇÃO E CIÊNCIA AGRUPAMENTO DE ESCOLAS DR. ANTÓNIO GRANJO Matriz da Prova Final de Recuperação dos Cursos Profissionais 2012/2013 Cursos: Técnico de Informática de Gestão Disciplina: Matemática

Leia mais

Modelos Probabilísticos Teóricos Discretos e Contínuos. Bernoulli, Binomial, Poisson, Uniforme, Exponencial, Normal

Modelos Probabilísticos Teóricos Discretos e Contínuos. Bernoulli, Binomial, Poisson, Uniforme, Exponencial, Normal Modelos Probabilísticos Teóricos Discretos e Contínuos Bernoulli, Binomial, Poisson, Uniforme, Exponencial, Normal Distribuição de Probabilidades A distribuição de probabilidades de uma variável aleatória:

Leia mais

ESTRUTURA DE DADOS. Arvore Binária Jose. Arvore Ternaria Direção

ESTRUTURA DE DADOS. Arvore Binária Jose. Arvore Ternaria Direção ESTRUTURA DE DADOS 1. Árvores: Uma das mais importantes classes de estruturas de dados em computação são as árvores. Aproveitando-se de sua organização hierárquica, muitas aplicações são realizadas usando-se

Leia mais

Árvores-B (Parte IV) Leandro C. Cintra M.C.F. de Oliveira Fonte: Folk & Zoelick, File Structures

Árvores-B (Parte IV) Leandro C. Cintra M.C.F. de Oliveira Fonte: Folk & Zoelick, File Structures Árvores-B (Parte IV) Leandro C. Cintra M.C.F. de Oliveira 2004 Fonte: Folk & Zoelick, File Structures http://www.icmc.sc.usp.br/~sce183 Definição e Propriedades de árvores-b Ordem A ordem de uma árvore-b

Leia mais

Redes Neurais Artificiais. Everton Gago

Redes Neurais Artificiais. Everton Gago Redes Neurais Artificiais Everton Gago Como vai ser? O que é RNA? Conglomerado de neurônios!?!? Neurônio: Neurônio: Entradas: X0 = 0 X1 = 1 X2 = 1 Neurônio: Entradas: X0 = 0 X1 = 1 X2 = 1 Pesos: W0 = 0.3

Leia mais

Intervalos de Confiança

Intervalos de Confiança Intervalos de Confiança Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques e Nuno Bastos (DepMAT) Intervalos de Confiança 2010/2011 1 / 33 Introdução

Leia mais

Lista de Exercícios 6: Soluções Funções

Lista de Exercícios 6: Soluções Funções UFMG/ICEx/DCC DCC Matemática Discreta Lista de Exercícios 6: Soluções Funções Ciências Exatas & Engenharias o Semestre de 06 Conceitos. Determine e justifique se a seguinte afirmação é verdadeira ou não

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Redes Complexas: teoria, algoritmos e aplicações em computação. Virgilio A. F. Almeida DCC UFMG 02/ /10/2009. SOLUÇÕES Propostas

Redes Complexas: teoria, algoritmos e aplicações em computação. Virgilio A. F. Almeida DCC UFMG 02/ /10/2009. SOLUÇÕES Propostas Redes Complexas: teoria, algoritmos e aplicações em computação Virgilio A. F. Almeida DCC UFMG 02/2009 14/10/2009 SOLUÇÕES Propostas Leia e responda precisa e sucintamente as questões. Deixe a memória

Leia mais

3 NOÇÕES DE PROBABILIDADE

3 NOÇÕES DE PROBABILIDADE 3 NOÇÕES DE PROILIDDE 3.1 Conjuntos Um conjunto pode ser considerado como uma coleção de objetos chamados elementos do conjunto. Em geral denota-se conjunto por letras maiúsculas,, C,... e a sua representação

Leia mais