O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

Tamanho: px
Começar a partir da página:

Download "O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados"

Transcrição

1 SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento Dados Consolidados Fontes de dados

2 SUMÁRIO - Aula 2 Algoritmo ID3 usando Medida de Entropia e Medida de Ganho

3 SUMÁRIO - Aula 3 Aprendizagem Indutiva Definição de Hipótese Representação da Hipótese por Árvore de Decisão Expressividade das Árvores de Decisão Avaliação da Eficiência de um Algoritmo

4 SUMÁRIO - Aula 4 Problemas Apropriados Diferença entre lógica proposicional e lógica e primeira ordem Aplicações Questões Práticas: - Overfitting - Atributos com valores contínuos - Dados ausentes - Atributos multivalorados

5 PROBLEMAS APROPRIADOS para aprendizado com árvores de decisão * As exemplos(instâncias) são representados por pares atributo-valor. - Situação mais fácil é quando cada atributo assume um número pequeno de valores possíveis disjunto. Ex. quente, médio,frio. * A função objetivo(predicado meta) tem valores de saída discretos. - Ex. Sim ou Não. Ex. Diferentes diagnósticos. * Onde se aplicam descrições disjuntivas. * Dados de treino contendo erros - métodos robustos a erros. - Erros na classificação dos exemplos de treino, - Erros nos valores dos atributos que descrevem os exemplos. * Dados de treino em que falta o valor de algum atributo em algum exemplo.

6 Exemplo 2: Exemplos de treino para o conceito objetivo Jogar Tênis

7

8 Expressividade Árvores de Decisão representam uma disjunção de conjunções de restrições sobre os valores dos atributos dos exemplos. ( Céu = Sol Humidade = Normal) ( Céu = Nublado) ( Céu = Chuva Vento = Fraco)

9 Diferença entre Lógica Proposicional e Lógica de Primeira Ordem. Exemplo 1: Duas regras de primeira ordem que descrevem conjuntamente o conceito objetivo Antepassado. IF Pai(x,y) THEN Antepassado(x,y) IF Pai(x,z) Ancestral(z,y) THEN Antepassado(x,y) Exemplo de Aplicações: Descobrir conhecimento na área de Química e Física. Obs: Escrevendo na sintaxe adequada estas regras formam um programa PROLOG válido para calcular a relação de Antepassado.

10 Exemplo 2: Três regras proposicionais para definir o conceito objetivo JogarTênis. SE Céu = Sol Humidade = baixa ENTÃO JogarTênis = Sim SE Céu = Chuva Vento = Não ENTÃO JogarTênis = Sim SE Céu = Nublado ENTÃO JogarTênis = Sim

11 Árvore de Decisão representa conhecimento proposicional. Pode ser usada para tomar decisões e classificar objetos. Aplicações: Equipamento de Plataforma Aprender a Voar

12 Questões Práticas no Aprendizado com Árvore de Decisão - Quão profunda deve ser a árvore? - Como manusear atributos contínuos? - Qual medida de seleção de atributo é apropriada? - Como manusear dados de treino sem valores de algum atributo. - Como manusear atributos com custos diferentes? - Como melhorar a eficiência computacional?

13 Overfitting x Generalização x Memorização Se considerarmos o ajuste de curva: Ov. Ge. - Exemplos de treinamento. 1. Com o ajuste overfitting, pontos fora do conjunto de treino dão erros bem maiores do que com o ajuste generalizado. 2. Se a curva não responde bem para o conjunto de teste então o algoritmo de aprendizado memorizou o conjunto de treinamento.

14 Voltando ao caso da representação com árvores de decisão! Lembre-se: No caso da árvore mais simples que consideramos em que se formava um caminho para cada exemplo, ocorria memorização. Ela não extraia qualquer padrão dos dados. O algoritmo ID3 faz crescer cada ramo da árvore o suficiente para classificar perfeitamente os exemplos de treino. Isto pode dar problemas quando existe ruídos ou erros aleatórios nos dados ou quando o número de exemplos de treino é muito pequeno não constituindo uma amostra representativa da verdadeira função objetivo - nestes casos ID3 pode produzir árvores que overfit (sobreadaptación) os exemplos de treino - isto é, aprende inclusive os ruídos e os erros.

15 Definição de overfit Dado um espaço de hipóteses H. Uma hipótese h H overfit os dados de treino se existe alguma hipótese alternativa h H, tal que h tenha menor erro do que h sobre os exemplos de treino, mas h tem menor erro do que h sobre toda a distribuição dos exemplos (i.é. Incluindo exemplos fora do conjunto de treinamento). Obs: Espaço de hipótese H é o conjunto de todas as árvores possíveis consistente ou não com os exemplos de treino.

16 Exemplo de Ruído Aleatório Considere que o seguinte exemplo seja adicionado a tabela de exemplos (corretos) para aprender o conceito objetivo JogarTênis: [Céu = Sol, Temperatura = Quente, Humidade = Normal, Vento = Sim JogarTênis = Não] Mas, consideremos que na verdade este exemplo é positivo, mas foi erroneamente rotulado como negativo. Isto é, aconteceu a introdução de um ruído aleatório nos exemplos de treino. Se este exemplo estivesse na tabela, quando foi aplicado o ID3, a árvore seria diferente. ID3 dará como saída uma árvore h que é mais complexa do que a original h. h não vai ajustar todos os exemplos de treino da nova tabela, mas h sim. h provavelmente terá menor erro para exemplos retirados da mesma distribuição.

17 Exemplos de treino para o conceito objetivo Jogar Tênis-sem ruído

18 Hipótese h

19 P r e c i s ã o 0,9 0,85 0,8 0,75 0,7 0,65 0,6 0,55 0,5 - exemplos de treino - exemplos de teste Tamanho da árvore em número de nós

20 Como Evitar o Overfitting - Fazer a árvore parar de crescer antes que ela alcance o ponto onde ela classifique perfeitamente os exemplos de treino, - Permitir que a árvore sobreajuste os dados, e depois podar a árvore. Duas Técnicas de Poda: 1. Reduced-Error Pruning 2. Rule Post-Pruning *

21 1. Reduced-Error Pruning

22 Como Incorporar atributos com Valores Continuos? A definição inicial do ID3 é restrita a atributos que assumem um conjunto discreto de valores inclusive o atributo objetivo cujo valor é predito pela árvore de decisão Altura, peso, temperatura são atributos contínuos. Eles têm muitos ou infinitos valores possíveis. Para tratar este problema é preciso discretizar o atributo. Por exemplo, o atributo Preço para o domínio do restaurante foi discretizado nos valores $, $$, $$$. O atributo Temperatura foi discretizado nos valores frio, médio, quente.

23 Como Tratar Atributos Multivalorados Quando um atributo tem um grande número de valores possíveis, a medida de ganho dará uma indicação não apropriada da utilidade do atributo. Considere o caso extremo onde para todo os exemplos o valor do atributo seja diferente. Por exemplo, no domínio do restaurante se tivéssemos o atributo MomeDoRestaurante. Neste caso, cada exemplo é um caso único e portanto tem uma só classificação. Portanto a medida do ganho assume o valor máximo para este atributo. Entretanto, o atributo pode ser irrelevante ou inútil. Uma solução seria usar a proporção de ganho. Ver exercício de Russel e Norvig.

24 Dados Ausentes Em muitos domínios nem sempre se conhece todos os valores dos atributos para todos os exemplos. Os valores podem não terem sido registrados, ou pode ser muitos caro obtê-los. Isto dá origem a dois problemas: 1- Dada um árvore de decisão completa, como classificar um objeto que não tem valor registrado para um atributo? 2- Como modificar a fórmula de ganho? Ver exercício em Russel e Norvig.

25 Exemplos com Mesma Descrição mas Diferentes Classificações Se existe dois ou mais exemplos com a mesma descrição (em termos dos atributos) mas diferentes classificações, então o algoritmo de aprendizagem deve falhar em encontrar uma árvore consistente com todos os exemplos de treino. Solução: Fazer com que cada nó folha registre ou a classificação da maioria para seu conjunto de exemplos ou registre as estimativas de probabilidade de cada classificação usando as freqüências relativas.

Algoritmos Indutores de Árvores de

Algoritmos Indutores de Árvores de Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade 1) Explique o termo probabilidade subjetiva no contexto de um agente que raciocina sobre incerteza baseando em probabilidade. 2) Explique

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

MLP (Multi Layer Perceptron)

MLP (Multi Layer Perceptron) MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

CRM e Prospecção de Dados

CRM e Prospecção de Dados CRM e Prospecção de Dados Marília Antunes aula de 4 de Maio 09 5 Modelos preditivos para classificação (continuação) 5.6 Modelos naive Bayes - classificador bayesiano simples O método ganha a designação

Leia mais

Universidade Estadual do Ceará Laboratório de Redes de Computadores e Segurança - LARCES

Universidade Estadual do Ceará Laboratório de Redes de Computadores e Segurança - LARCES Universidade Estadual do Ceará Laboratório de Redes de Computadores e Segurança - LARCES Máquinas de Aprendizagem Árvores de Decisão Felipe de Almeida Xavier João Gonçalves Filho FORTALEZA 2011 1 Sumário

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

I.3 Indução de Árvores de Decisão

I.3 Indução de Árvores de Decisão I.3 Indução de Árvores de Decisão Nesta seção serão apresentados alguns conceitos básicos da técnica de indução de árvores de decisão a partir de um exemplo sobre o efeito dos raios solares sobre algumas

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

Sistemas Híbridos Inteligentes

Sistemas Híbridos Inteligentes Sistemas Híbridos Inteligentes Congresso da SBC - ENIA 99 Autores: Prof. Dr. Fernando Osório Prof.ª Dr.ª Renata Vieira Rio de Janeiro - Julho 1999 UNISINOS - Centro de Ciências Exatas e Tecnológicas -

Leia mais

Lógica e Raciocínio. Decisão sob Risco Probabilidade. Universidade da Madeira. http://dme.uma.pt/edu/ler/

Lógica e Raciocínio. Decisão sob Risco Probabilidade. Universidade da Madeira. http://dme.uma.pt/edu/ler/ Lógica e Raciocínio Universidade da Madeira http://dme.uma.pt/edu/ler/ Decisão sob Risco Probabilidade 1 Probabilidade Em decisões sob ignorância a probabilidade dos diferentes resultados e consequências

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Matemática Discreta - 03

Matemática Discreta - 03 Universidade Federal do Vale do São Francisco Curso de Engenharia da Computação Matemática Discreta - 03 Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti www.twitter.com/jorgecav

Leia mais

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Laboratório de Pesquisa e Desenvolvimento Universidade Federal de Alfenas versão

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Introdução O que é Estatística? É a parte da matemática aplicada que

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Segurança e Higiene no Trabalho

Segurança e Higiene no Trabalho Guia Técnico Segurança e Higiene no Trabalho Volume III Análise de Riscos um Guia Técnico de Copyright, todos os direitos reservados. Este Guia Técnico não pode ser reproduzido ou distribuído sem a expressa

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

PROBABILIDADE. Aula 5

PROBABILIDADE. Aula 5 Curso: Psicologia Disciplina: Métodos Quantitativos Profa. Valdinéia Data: 28/10/15 PROBABILIDADE Aula 5 Geralmente a cada experimento aparecem vários resultados possíveis. Por exemplo ao jogar uma moeda,

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Aula 1 Estatística e Probabilidade

Aula 1 Estatística e Probabilidade Aula 1 Estatística e Probabilidade Anamaria Teodora Coelho Rios da Silva O QUE É ESTATÍSTICA? No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. A Estatística fornece métodos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

ESCOLA SECUNDÁRIA MANUEL DA FONSECA, SANTIAGO DO CACÉM GRUPO DISCIPLINAR: 500 Matemática Aplicada às Ciências Sociais

ESCOLA SECUNDÁRIA MANUEL DA FONSECA, SANTIAGO DO CACÉM GRUPO DISCIPLINAR: 500 Matemática Aplicada às Ciências Sociais ANO: 11º ANO LECTIVO : 008/009 p.1/7 CONTEÚDOS MODELOS MATEMÁTICOS COMPETÊNCIAS A DESENVOLVER - Compreender a importância dos modelos matemáticos na resolução de problemas de problemas concretos. Nº. AULAS

Leia mais

SISTEMA INTELIGENTE PARA AVALIAÇÃO DE RISCOS EM VIAS DE TRANSPORTE TERRESTRE. Custódio Gouvêa Lopes da Motta

SISTEMA INTELIGENTE PARA AVALIAÇÃO DE RISCOS EM VIAS DE TRANSPORTE TERRESTRE. Custódio Gouvêa Lopes da Motta SISTEMA INTELIGENTE PARA AVALIAÇÃO DE RISCOS EM VIAS DE TRANSPORTE TERRESTRE Custódio Gouvêa Lopes da Motta TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

Classificação - avaliação de resultados - 1. Mineração de Dados 2013

Classificação - avaliação de resultados - 1. Mineração de Dados 2013 Classificação - avaliação de resultados - 1 Mineração de Dados 2013 Luís Rato (Capítulo 4 do livro Introduction to Data Mining ) Universidade de Évora, Mineração de dados / Data Mining 1 Desempenho Desempenho

Leia mais

Correlação e Regressão Linear

Correlação e Regressão Linear Correlação e Regressão Linear A medida de correlação é o tipo de medida que se usa quando se quer saber se duas variáveis possuem algum tipo de relação, de maneira que quando uma varia a outra varia também.

Leia mais

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder Comentário Geral: Prova muito difícil, muito fora dos padrões das provas do TCE administração e Economia, praticamente só caiu teoria. Existem três questões (4, 45 e 47) que devem ser anuladas, por tratarem

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Engenharia de Requisitos

Engenharia de Requisitos Engenharia de Requisitos Introdução a Engenharia de Requisitos Professor: Ricardo Argenton Ramos Aula 08 Slide 1 Objetivos Introduzir a noção de requisitos do sistema e o processo da engenharia de requisitos.

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR 6LPXODomR GH6LVWHPDV )HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR #5,6. Simulador voltado para análise de risco financeiro 3RQWRV IRUWHV Fácil de usar. Funciona integrado a ferramentas já bastante conhecidas,

Leia mais

Do neurônio biológico ao neurônio das redes neurais artificiais

Do neurônio biológico ao neurônio das redes neurais artificiais Do neurônio biológico ao neurônio das redes neurais artificiais O objetivo desta aula é procurar justificar o modelo de neurônio usado pelas redes neurais artificiais em termos das propriedades essenciais

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Regressão Linear Multivariada

Regressão Linear Multivariada Regressão Linear Multivariada Prof. Dr. Leandro Balby Marinho Inteligência Artificial Prof. Leandro Balby Marinho / 37 UFCG DSC Roteiro. Introdução 2. Modelo de Regressão Multivariada 3. Equações Normais

Leia mais

DISTRIBUIÇÃO NORMAL 1

DISTRIBUIÇÃO NORMAL 1 DISTRIBUIÇÃO NORMAL 1 D ensid ade Introdução Exemplo : Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma população. O histograma por densidade é o seguinte: 0.04 0.03 0.02

Leia mais

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas.

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas. UNIVERSIDADE FEDERAL DA PARAÍBA INTRODUÇÃO Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/ CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística significa para você? Pesquisas

Leia mais

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação Classificação: Definição Mineração de dados Classificação: conceitos básicos e árvores de decisão Apresentação adaptada do material de apoio do livro: Introduction to Data Mining Tan, Steinbach, Kumar

Leia mais

QUALITATIVA VARIÁVEL QUANTITATIVA

QUALITATIVA VARIÁVEL QUANTITATIVA NOMINAL ORDINAL QUALITATIVA VARIÁVEL QUANTITATIVA DISCRETA CONTÍNUA - Variável qualitativa nominal = valores que expressam atributos, sem nenhum tipo de ordem. Ex: cor dos olhos, sexo, estado civil, presença

Leia mais

Algoritmo. Prof. Anderson Almeida Ferreira. Agradeço ao prof. Guilherme Tavares de Assis por fornecer slides que fazem parte desta apresentação

Algoritmo. Prof. Anderson Almeida Ferreira. Agradeço ao prof. Guilherme Tavares de Assis por fornecer slides que fazem parte desta apresentação 1 Algoritmo Prof. Anderson Almeida Ferreira Agradeço ao prof. Guilherme Tavares de Assis por fornecer slides que fazem parte desta apresentação Desenvolvimento de programas 2 Análise do problema Desenvolvimento

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Aprendizado Bayesiano. Disciplina: Agentes Adaptativos e Cognitivos

Aprendizado Bayesiano. Disciplina: Agentes Adaptativos e Cognitivos Aprendizado Bayesiano Disciplina: Agentes Adaptativos e Cognitivos Conhecimento com Incerteza Exemplo: sistema de diagnóstico odontológico Regra de diagnóstico " p sintoma (p,dor de dente) doença (p,cárie)

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

BRINCANDO COM GRÁFICOS E MEDINDO A SORTE

BRINCANDO COM GRÁFICOS E MEDINDO A SORTE BRINCANDO COM GRÁFICOS E MEDINDO A SORTE Elizabeth Pastor Garnier SEE/RJ Pedro Carlos Pereira - FAETEC Projeto Fundão IM/UFRJ Os Parâmetros Curriculares Nacionais propõem a introdução do tópico Tratamento

Leia mais

2 Pesquisa Bibliográfica

2 Pesquisa Bibliográfica 2 Pesquisa Bibliográfica As estratégias para detecção de conteúdo relevante podem ser divididas em duas abordagens: orientada a site e orientada a página. A primeira técnica utiliza várias páginas de um

Leia mais

Redes Neuronais e Aprendizagem Automática 1

Redes Neuronais e Aprendizagem Automática 1 Redes Neuronais e Aprendizagem Automática 2005/2006 17 a aula Fernando.Silva@ist.utl.pt Instituto Superior Técnico Redes Neuronais e Aprendizagem Automática 1 Sumário Árvores de decisão (continuação) Entropia.

Leia mais

Knowledge Discovery and Data Mining Extensão-UFMS-DCT

Knowledge Discovery and Data Mining Extensão-UFMS-DCT Knowledge Discovery and Data Mining Extensão-UFMS-DCT Introdução ao Processo de KDD Esta introdução se baseou quase que integralmente nas transparências produzidas por: Daniel L. Silver (dsilver@mgmt.dal.ca)

Leia mais

Reconhecimento de Padrões. Reconhecimento de Padrões

Reconhecimento de Padrões. Reconhecimento de Padrões Reconhecimento de Padrões 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Escola Superior de Tecnologia Engenharia Informática Reconhecimento de Padrões Prof. João Ascenso e Prof.

Leia mais

Objetivos. Requisitos de Software. Tipos de Requisitos. O que é um requisito? Requisitos Funcionais e Não- Funcionais. Requisitos Funcionais

Objetivos. Requisitos de Software. Tipos de Requisitos. O que é um requisito? Requisitos Funcionais e Não- Funcionais. Requisitos Funcionais Objetivos de Software Gidevaldo Novais (gidevaldo.vic@ftc.br) Introduzir os conceitos do usuário e do Descrever requisitos funcionais e nãofuncionais (domínio) Apresentar um esqueleto de documento e notas

Leia mais

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Resoluções comentadas das questões de Estatística da prova para ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Realizada pela Fundação João Goulart em 06/10/2013 41. A idade média de todos

Leia mais

Bioestatística Aula 3

Bioestatística Aula 3 Aula 3 Castro Soares de Oliveira Probabilidade Probabilidade é o ramo da matemática que estuda fenômenos aleatórios. Probabilidade é uma medida que quantifica a sua incerteza frente a um possível acontecimento

Leia mais

Aula 5 Metodologias de avaliação de impacto

Aula 5 Metodologias de avaliação de impacto Aula 5 Metodologias de avaliação de impacto Metodologias de Avaliação de Impacto Objetiva quantificar as mudanças que o projeto causou na vida dos beneficiários. Plano de Aula Método experimental: regressão

Leia mais

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE INE 5 LISTA DE EERCÍCIOS DE PROBABILIDADE INE 5 Gabarito da Lista de Exercícios de Probabilidade ) Em um sistema de transmissão de dados existe uma probabilidade igual a 5 de um dado ser transmitido erroneamente.

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Introdução Aprendizagem de Máquina Alessandro L. Koerich Introdução Desde que os computadores foram inventados temos nos perguntado: Eles são capazes de aprender? Se pudéssemos programá-los para aprender

Leia mais

CONCEITOS. Evento: qualquer subconjunto do espaço amostral. Uma primeira idéia do cálculo de probabilidade. Eventos Teoria de conjuntos

CONCEITOS. Evento: qualquer subconjunto do espaço amostral. Uma primeira idéia do cálculo de probabilidade. Eventos Teoria de conjuntos INTRODUÇÃO À PROAILIDADE Exemplos: O problema da coincidência de datas de aniversário O problema da mega sena A teoria das probabilidade nada mais é do que o bom senso transformado em cálculo A probabilidade

Leia mais

Controle II. Estudo e sintonia de controladores industriais

Controle II. Estudo e sintonia de controladores industriais Controle II Estudo e sintonia de controladores industriais Introdução A introdução de controladores visa modificar o comportamento de um dado sistema, o objetivo é, normalmente, fazer com que a resposta

Leia mais

MINISTÉRIO DA EDUCAÇÃO DEPARTAMENTO DO ENSINO SECUNDÁRIO MATEMÁTICA B 12º ANO

MINISTÉRIO DA EDUCAÇÃO DEPARTAMENTO DO ENSINO SECUNDÁRIO MATEMÁTICA B 12º ANO MINISTÉRIO DA EDUCAÇÃO DEPARTAMENTO DO ENSINO SECUNDÁRIO MATEMÁTICA B 12º ANO Curso Científico-Humanístico de Artes Visuais 1 Cursos Tecnológicos de Construção Civil e Edificações, de Electrotecnia e Electrónica,

Leia mais

3 Aprendizado de Máquina em Jogos Eletrônicos

3 Aprendizado de Máquina em Jogos Eletrônicos 3 Aprendizado de Máquina em Jogos Eletrônicos Jogos populares como xadrez e dama foram um dos pioneiros a utilizarem técnicas de Aprendizado de Máquina (AM), também denominada na literatura como Machine

Leia mais

A educadora avalia a formação de nossos professores para o ensino da Matemática e os caminhos para trabalhar a disciplina na Educação Infantil.

A educadora avalia a formação de nossos professores para o ensino da Matemática e os caminhos para trabalhar a disciplina na Educação Infantil. Matemática na Educação Infantil: é possível A educadora avalia a formação de nossos professores para o ensino da Matemática e os caminhos para trabalhar a disciplina na Educação Infantil. Nas avaliações

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Algoritmo. Iniciação do Sistema e Estimativa do consumo. Perfil do utilizador. Recolha de dados

Algoritmo. Iniciação do Sistema e Estimativa do consumo. Perfil do utilizador. Recolha de dados Algoritmo Iniciação do Sistema e Estimativa do consumo Recolha de dados O algoritmo do sistema de gestão, necessita obrigatoriamente de conhecer todos (ou grande maioria) os aparelhos ligados numa habitação

Leia mais

TIPOGRAFIA. Seguem-se alguns exemplos de tipografia forte, fraca, de oportunidade e e ameaçadoras para as respectivas empresas.

TIPOGRAFIA. Seguem-se alguns exemplos de tipografia forte, fraca, de oportunidade e e ameaçadoras para as respectivas empresas. TIPOGRAFIA As letras, tal como as árvores aparecem por elas próprias e quando as letras se juntam, lutam por espaço, pelo direito de serem reconhecidas, de serem lidas - Erik Spiekermann A tipografia é

Leia mais

Problemas de Satisfação de Restrições

Problemas de Satisfação de Restrições Computação Inteligente Problemas de Satisfação de Restrições Lucas Augusto Carvalho Mestrado em Ciência da Computação 2011.1 DCOMP - Universidade Federal de Sergipe 1 Conteúdo Problemas de Satisfação de

Leia mais

Estatística e Probabilidade

Estatística e Probabilidade Correlação Estatística e Probabilidade Uma correlação é uma relação entre duas variáveis. Os dados podem ser representados por pares ordenados (x,y), onde x é a variável independente ou variável explanatória

Leia mais

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Uma Introdução à Mineração de Informações Fabrício J. Barth Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Outubro de 2010 Objetivo Apresentar

Leia mais

Distribuição de probabilidades

Distribuição de probabilidades Luiz Carlos Terra Para que você possa compreender a parte da estatística que trata de estimação de valores, é necessário que tenha uma boa noção sobre o conceito de distribuição de probabilidades e curva

Leia mais

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo UNIVERSIDADE DE SÃO PAULO Faculdade de Arquitetura e Urbanismo DISTRIBUIÇÃO AMOSTRAL ESTIMAÇÃO AUT 516 Estatística Aplicada a Arquitetura e Urbanismo 2 DISTRIBUIÇÃO AMOSTRAL Na aula anterior analisamos

Leia mais

O conceito de probabilidade

O conceito de probabilidade A UA UL LA O conceito de probabilidade Introdução Nesta aula daremos início ao estudo da probabilidades. Quando usamos probabilidades? Ouvimos falar desse assunto em situações como: a probabilidade de

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS Definições Variáveis Aleatórias Uma variável aleatória representa um valor numérico possível de um evento incerto. Variáveis aleatórias

Leia mais

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes Para ampliar sua compreensão sobre probabilidade total e Teorema de Bayes, estude este conjunto de exercícios resolvidos sobre o tema.

Leia mais

AULAS 04 E 05 Estatísticas Descritivas

AULAS 04 E 05 Estatísticas Descritivas 1 AULAS 04 E 05 Estatísticas Descritivas Ernesto F. L. Amaral 19 e 28 de agosto de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro:

Leia mais

3. Engenharia de Requisitos

3. Engenharia de Requisitos Engenharia de Software 3. Engenharia de Requisitos Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt Fases do desenvolvimento de software que mais erros originam (fonte: "Software Testing", Ron Patton)

Leia mais

Insígnia Mundial do Meio Ambiente IMMA

Insígnia Mundial do Meio Ambiente IMMA Ficha técnica no. 2.1 Atividade Principal 2.1 SENTINDO A NATUREZA Objetivo da 2 Os escoteiros estão trabalhando por um mundo onde o habitat natural seja suficiente para suportar as espécies nativas. Objetivos

Leia mais

Hierarquia de modelos e Aprendizagem de Máquina

Hierarquia de modelos e Aprendizagem de Máquina Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia

Leia mais

Estatística I Aula 1. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística I Aula 1. Prof.: Patricia Maria Bortolon, D. Sc. Estatística I Aula 1 Prof.: Patricia Maria Bortolon, D. Sc. Estatística Estatística

Leia mais

Sistemas de Apoio à Decisão Árvores de decisão V 1.2, V.Lobo, EN/ISEGI, 2010

Sistemas de Apoio à Decisão Árvores de decisão V 1.2, V.Lobo, EN/ISEGI, 2010 V., V.Lobo, EN/ISEGI, O que é a árvore de decisão? Arvores de decisão Victor Lobo Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Nós (testes, ou conceitos) Comprimento

Leia mais

A lista abaixo é indicada para treino pessoal e será utilizada para exercícios em sala de aula, inclusive para revisão, SEM caráter obrigatório.

A lista abaixo é indicada para treino pessoal e será utilizada para exercícios em sala de aula, inclusive para revisão, SEM caráter obrigatório. 1 A lista abaixo é indicada para treino pessoal e será utilizada para exercícios em sala de aula, inclusive para revisão, SEM caráter obrigatório. 1. ara analisar os dados de uma folha de pagamento, qual(is)

Leia mais

CRM e Prospecção de Dados

CRM e Prospecção de Dados CRM e Prospecção de Dados Marília Antunes aula de 6 Abril 09 5 Modelos preditivos para classificação 5. Introdução Os modelos descritivos, tal como apresentados atrás, limitam-se à sumarização dos dados

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Satisfação de Restrições. Capítulo 5 (disponível online)

Satisfação de Restrições. Capítulo 5 (disponível online) Satisfação de Restrições Capítulo 5 (disponível online) Sumário Problemas de Satisfação de Restrições (CSPs) Procura com Retrocesso para CSPs Procura Local para CSPs Estrutura dos CSPs Problemas de Satisfação

Leia mais

CENTRO UNIVERSITÁRIO DA FEI Julio André Sgarbi DOMÓTICA INTELIGENTE: AUTOMAÇÃO RESIDENCIAL BASEADA EM COMPORTAMENTO

CENTRO UNIVERSITÁRIO DA FEI Julio André Sgarbi DOMÓTICA INTELIGENTE: AUTOMAÇÃO RESIDENCIAL BASEADA EM COMPORTAMENTO CENTRO UNIVERSITÁRIO DA FEI Julio André Sgarbi DOMÓTICA INTELIGENTE: AUTOMAÇÃO RESIDENCIAL BASEADA EM COMPORTAMENTO São Bernardo do Campo 2007 Julio André Sgarbi DOMÓTICA INTELIGENTE: AUTOMAÇÃO RESIDENCIAL

Leia mais

Inteligência Artificial

Inteligência Artificial https://www.pinterest.com/carlymundo/decision-tree-infographics/ Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial

Leia mais

O ABC da gestão do desempenho

O ABC da gestão do desempenho Por Peter Barth O ABC da gestão do desempenho Uma ferramenta útil e prática para aprimorar o desempenho de pessoas e organizações 32 T&D INTELIGÊNCIA CORPORATIVA ED. 170 / 2011 Peter Barth é psicólogo

Leia mais

Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo

Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo Tema/Subtema Conteúdos Metas Nº de Aulas Previstas Org.Trat.Dados / Planeamento Estatístico Especificação do problema Recolha de dados População

Leia mais

Universidade Gama Filho Campus Piedade Departamento de Engenharia de Controle e Automação

Universidade Gama Filho Campus Piedade Departamento de Engenharia de Controle e Automação Universidade Gama Filho Campus Piedade Departamento de Engenharia de Controle e Automação Laboratório da Disciplina CTA-147 Controle I Análise da Resposta Transitória (Este laboratório foi uma adaptação

Leia mais