Processo de Descoberta de Conhecimento em Base de Dados para Previsão de Ocorrências de Espécimes de Peixe-Boi Marinho

Tamanho: px
Começar a partir da página:

Download "Processo de Descoberta de Conhecimento em Base de Dados para Previsão de Ocorrências de Espécimes de Peixe-Boi Marinho"

Transcrição

1 Processo de Descoberta de Conhecimento em Base de Dados para Previsão de Ocorrências de Espécimes de Peixe-Boi Marinho Malena Caroline de M. Assunção 1, Jailson Nunes Leocadio 1, Vinicius Ponte Machado 1 1 Departamento de Computação Universidade Federal do Piauí (UFPI) Teresina, PI Brasil malenacaroline@hotmail.com, jailsonleocadio@gmail.com, vinicius@ufpi.edu.br Resumo. Atualmente, o aprendizado de máquina é um dos grandes ápices da inteligência artificial e propõe soluções práticas de problemas do cotidiano, sendo eles, técnicos, sociais ou biológicos. Este trabalho propõe a utilização de um algoritmo de aprendizado de máquina, o J48, executado em uma base de dados com informações abióticas sobre o peixe-boi marinho. O objetivo principal do trabalho é extrair informações necessárias sobre as ocorrências dos espécimes do peixe-boi, que está ameaçado de extinção, no estuário dos rios Timonha e Ubatuba. Neste estudo, o J48, apresentou boas métricas de desempenho e uma ótima taxa de acerto referente as informações da base de dados analisada. Com o desempenho do classificador, foi possível prever quais os locais da aparição do peixe-boi marinho no estuário e quais os fatores que influenciam para o aparecimento do mesmo. 1. Introdução A aprendizagem de máquina é uma área da inteligência artificial que consiste no desenvolvimento de algoritmos e técnicas em que a máquina toma decisões baseada em experiências acumuladas através da solução bem sucedida de problemas anteriores. Os diversos sistemas de aprendizado de máquina possuem características particulares e comuns que possibilitam sua classificação quanto à descrição, modo, paradigma e forma de aprendizado utilizado. Métodos por aprendizagem supervisionada consistem na aprendizagem feita a partir de exemplos, em que o agente ajuda o sistema a construir o modelo, através da definição das classes e dos exemplos em cada classe. O sistema tem que determinar a descrição para cada classe, ou seja, o conjunto de propriedades comuns nos exemplos que lhe são fornecidos. Estando a descrição determinada, é possível formular a regra de classificação que pode ser utilizada para prever a classe de um objeto que não tenha sido considerado aquando da aprendizagem. Este trabalho apresenta um estudo do desempenho de um algoritmo de aprendizagem supervisionada em um problema biológico. O estudo é feito baseado na análise das ocorrências do peixe- boi no estuário dos rios Timonha e Ubatuba registrados em uma base de dados. Com o processo de aprendizagem e a extração do conhecimento da base analisada foi possível saber qual a taxa de acerto do algoritmo, conseguir prever as ocorrências do peixe-boi sob as condições existentes e saber quais fatores abióticos influenciam para o aparecimento destes animais em determinados locais.

2 2. Referencial Teórico 2.1. Base de Dados de Ocorrências do Peixe- Boi (BDOPB) O peixe-boi-marinho, Trichechus manatus manatus [ Linnaeus 1758], é um mamífero marinho encontrado em águas oceânicas e estuarinas. Considerado criticamente em perigo, situação ocasionada pela morte intencional e acidental dos indivíduos como: o encalhe de filhotes, a captura acidental em redes de emalhe, tapagem, arrasto e currais de pesca, seguidos de morte intencional [IBAMA 2001]. Este espécime está na lista de animais ameaçados de extinção do IBAMA [IBAMA 2001] e da IUCN [IUCN 2000]. Atualmente, localiza-se em Cajueiro da Praia (PI), na região do estuário dos rios Timonha e Ubatuba, a primeira torre de observação construída no mar no Brasil para acompanhamento da espécie e uma base avançada do Projeto Peixe-Boi. Além dos trabalhos desenvolvidos diretamente pelo Instituto Chico Mendes de Conservação da Biodiversidade (ICMBio) e pela Área de Proteção Ambiental (APA) Delta do Parnaíba, diversas instituições (públicas, governamentais, privadas e do terceiro setor) executam projetos que visam a conservação do estuário e a preservação de sua biodiversidade. A Base de Dados de Ocorrência do Peixe-Boi (BDOPB), fornecida pela Organização Não Governamental (ONG) Comissão Ilha Ativa (CIA), instituição que possui sede no município piauiense de Ilha Grande e atua com projetos socioambientais em toda a APA Delta do Parnaíba, é composta por 864 instâncias e com 09 atributos. Os atributos sãos: data de aparição, latitude, longitude, temperatura, profundidade, salinidade, interação, distância e aparecimento. Devido a variabilidade dos dados da BPOPB foram feitos ajustes nos dados para se obter uma boa classificação,estes ajustes serão discutidos em outros tópicos no decorer deste trabalho Algoritmo J48 Como a classificação é um processo de aprendizado supervisionado, o modelo construído baseia-se na análise prévia de um conjunto de dados de amostragem ou dados de treinamento, contendo objetos corretamente classificados [Han e Kamber 2006]. O algoritmo J48 permite a criação de modelos de decisão em árvore. O classificador, J48, utiliza uma tecnologia gulosa (tecnologia que segue a resolução de problemas com a heurística de fazer a escolha localmente ótima em cada fase com a esperança de encontrar um ótimo global) para induzir árvores de decisão para posterior classificação. O modelo de árvore de decisão é construído pela análise dos dados de treino e o modelo utilizado para classificar dados ainda não classificados. O J48 gera árvores de decisão, em que cada nó da árvore avalia a existência ou significância de cada atributo individual. As árvores de decisão são construídas do topo para a base, através da escolha do atributo mais apropriado para cada situação (Martins, Marques, & Costa, 2009) Métricas de avaliação do classificador As métricas utilizadas para a análise do desempenho do classificador denotadas dos conceitos de [HSU, CHANG e LIN 2010], elas são: Verdadeiro Positivo (número de instâncias corretamente classificadas com o aparecimento sendo verdadeiro, ou seja, aparecimento é verdadeiro), Falso Positivo (número de instâncias classificadas com aparecimento sendo falso quando, na realidade, é verdadeiro), Falso Negativo (número de instâncias classificadas com o aparecimento sendo verdadeiro quando, na realidade, era falso) e Verdadeiro Negativo (número de instâncias classificadas corretamente com o aparecimento sendo verdadeiro).

3 A partir os valores dessas métricas é possível calcular também para avaliar o desempenho dos classificadores: Acurácia (reflete a porcentagem de amostras positivas e negativas classificadas corretamente sobre o total de instâncias), Precision (proporção de verdadeiros positivos em relação a todas as predições positivas), Recall (proporção de verdadeiros positivos em relação a suas predições positivas e as suas incorretas predições negativas), F-Measure (proporção de verdadeiros positivos em relação às predições positivas e todas as suas predições negativas) e Taxa de Erro (porcentagem de instâncias que o classificador classificou errado em relação ao total de instâncias). 3. Metodologia Os procedimentos de aprendizagem utilizados para o processo de classificação e previsão das ocorrências do peixe-boi, consistiu em: Preparação dos dados (Levantamento dos dados, estudo da base de dados e alterações nos dados), Testes (execução do treinamento e resultados obtidos) e Avaliação dos resultados obtidos. Estas fases são obrigatórias e essenciais para o bom desempenho do algoritmo Preparação dos dados Como o algoritmo utilizado se refere a um classificador, foi preciso determinar uma classe a partir dos atributos analisados. O atributo escolhido para ser a classe foi o atributo aparecimento, o qual possui os seguintes valores: SIM, NÃO ou TALVEZ. Em que dadas as condições, quando o atributo aparecimento possui valor igual a SIM, significa que o peixe-boi foi visto sob as condições fornecidas. Quando aparecimento possui valor igual a NÃO, o peixe-boi não pode ser visto sob as condições fornecidas. E quando o atributo aparecimento tiver valor TALVEZ, significa que há uma possibilidade do peixe-boi ter sido visto sob as condições fornecidas. A partir da base BDOPB, houve uma divisão da mesma em 03 bases diferentes: Bd1, Bd2 e Bd3. Onde Bd1 é a base original sem alterações, Bd2 foi criada com as mesmas instâncias e os mesmos atributos que a base Bd1, porém nesta base algumas instâncias sofreram alterações. As bases Bd2 e Bd3 são semelhantes à base Bd1 em relação às instâncias e atributos, divergendo-se em relação ao atributo classe,o aparecimento. Em Bd2, as instâncias com a classe igual à TALVEZ, seus valores foram mudados para SIM. Em Bd3, as instâncias com a classe igual à TALVEZ, seus valores foram mudados para NÃO. Após estas alterações feitas, as bases Bd1, Bd2 e Bd3 foram divididas em 06 subbases com 800, 600, 500, 432,200 e 100 instâncias, respectivamente. As instâncias de cada sub-base foram selecionadas de maneira aleatoriamente, este processo foi necessário para verificar melhor o desempenho do algoritmo na classificação Testes Para determinar o desempenho de um classificador é preciso obter uma hipótese válida para outros objetos do mesmo domínio ou problemas que não fazem parte do conjunto de treinamento de aprendizagem. Para isso, o algoritmo precisa ter uma hipótese que apresente uma baixa capacidade de generalização, para que consequentemente não haja nem overffiting (Superajustamento dos dados de treinamento, ou seja, o a l g o r i t m o classifique apenas os dados do conjunto de treinamento) ou underfitting (Subajustamento dos dados, ou seja, o algoritmo apresenta uma baixa taxa de acerto). Os processos de treinamento e aprendizagem foram executados através da ferramenta WEKA [Markov 2006]. A ferramenta analisava os arquivos no formato ARFF (formato aceito pela ferramenta) e estes arquivos possuiam os dados de cada base. O treinamento do algoritmo sob as bases de dados foi feito repetidas vezes para que fosse possível gerar uma hipótese com boa capacidade de generalização e uma alta taxa de

4 acerto. E com isso, conseq u en tement e, o algori tmo f osse capaz de classificar corretamente as ocorrências do peixe- boi marinho. Para evitar problemas na classificação das instâncias, que o classificador fosse capaz de classificar instâncias fora do seu escopo de treinamento e obtivesse uma alta taxa de acerto, o algoritmo foi treinado com cross-validation (particionamento do conjunto de dados em subconjuntos mutualmente exclusivos, e posteriormente, utilizando alguns destes subconjuntos para a estimação dos parâmetros de um modelo matemático (dados de treinamento) e o restante dos subconjuntos (dados de validação ou de teste) são empregados na validação do modelo) [Teufel e Moens 2002]. Em cada execução, o treinamento foi feito com cross- validation de 10% do total de instâncias e 90% para a classificação. O J48 calculou o ganho de informação de cada um dos atributos, os índices das métricas de avaliação do classificador, as matrizes de confusão baseadas em outras métricas de desempenho e gerou árvores de decisão a partir dos dados analisados. 4. Resultados Com os processos descritos nas seções anteriores feitos e os resultados da aprendizagem gerados. Será discutido neste tópico os resultados das execuções analisando a descoberta da base, o desempenho do algoritmo e o melhor resultado de classificação Descoberta do conhecimento da base de dados Para a avaliação do desempenho do J48, foram utilizados as métricas de Verdadeiros Positivos e Falsos Positivos. E a partir delas foram calculadas: a Precision, o Recall, o F- Measure, a Acurácia e a Taxa de Erro. Com a analise dos resultados, foi possível notar que o classificador apresentou boas taxas de desempenho em relação a todas as bases de dados testadas, tendo sua melhor classificação na base Bd2, apresentando uma ótima Acurácia de aproximadamente 99,3% e as outras métricas também com valores elevados. O desempenho mais baixo do algoritmo comparado as outras bases ocorreu com a base Bd1 6 com Acurácia de apenas 76% e com Taxa de Erro de 24%. As outras métricas que mostram o bom desempenho do classificador (VP, Precision, Recall e F- Measure) foram entre 74 a 76%. Esta base trata-se de uma sub-base de Bd1, constituída de 100 instâncias e com atributo classe aparecimento com três valores: SIM, NÃO ou TALVEZ, que são fatores que podem ter influenciado no baixo valor da taxa de acerto Desempenho geral do classificador Outra análise do classificador que pode ser feita é em relação a todas as informações analisadas. Os resultados ger ados podem s er vistos na Tabela 1, e a partir dos mesmos, extrair padrões a respeito do desempenho classificador na classificação. Não é em todas as bases que o J48 apresenta um bom desempenho, isso ocorre nas sub-bases, devido a pouca quantidade de instâncias para reforçar uma boa classificação. Outra analise que pode ser feita do conjunto de dados é em relação a quantidade de instâncias, em que quanto maior o número de instâncias, maior é a Acurácia e desempenho do classificador. O mesmo acontece quando o atributo classe possui apenas dois valores de classificação. Com os resultados da Tabela 1, podemos ver que o classificador mostra seus melhores resultados na base Bd2, apresentando ótimos valores nos avaliadores positivos de desempenho. E sobre todas as informações de classificação, temos como valores gerais no desempenho de classificação do J48: VP de 90,3%, FP de 5% Precision de 94,6%, Recall de 91,3%, F-Measure de 91% e Acurácia de 91,7% e Taxa de Erro de 8,3%.

5 Tabela 1. Resultados do algoritmo sobre as bases de testes BD VP FP PRECISION RECALL F- MEASURE ACURÁCIA Bd % (816) Bd % (756) Bd % (549) Bd % (451) Bd % (397) Bd % (164) Bd % (76) Bd % (858) Bd % (778) Bd % (568) Bd % (480) Bd % (404) Bd % (196) Bd % (97) Bd % (817) Bd % (752) Bd % (550) Bd % (470) Bd % (393) Bd % (184) Bd % (83) TAXA DE ERRO 5.6% (48) 5.5% (44) 8.5% (51) 9.8% (49) 8.1% (35) 18% (36) 24% (24) 7% (7) 2.7% (22) 5.3% (32) 4% (20) 6.5% (28) 1.5% (4) 3% (3) 5.4% (47) 6% (48) 8.3% (50) 6% (30) 9% (39) 8.5% (17) 17% (17) 4.3. Análise do melhor resultado Com base nos resultados vistos na Tabela 1, podemos perceber que entre todas as bases analisadas, houve uma base em que o classificador J48 obteve seu melhor resultado na descoberta do conhecimento das ocorrências do peixe-boi marinho, este melhor resultado encontra-se na base Bd2, constituída por 864 instâncias e nove atributos, possuindo seu atributo classe apenas dois valores, SIM ou NÃO. O algoritmo J48 obteve seu melhor resultado na base de dados Bd2 t a n t o na taxa de A curácia, c o m o também em todas as outras medidas de desempenho analisadas. Tanto nas medidas positivas com altas taxas de acertos, quanto nas taxas negativas, sendo estas com valores bem baixos, resultando em uma ótima classificação, chegando a quase 100% da descoberta do conhecimento da base testada. Em relação à base Bd2, o classificador conseguiu classificar corretamente 858 instâncias, resultando em na Acurácia de 99,3% e apenas 06 incorretamente. 5. Conclusão Devido ao problema das ocorrências do aparecimento do peixe-boi marinho, foi visto uma solução através do aprendizado de máquina para detectar condições favoráveis ao aparecimento deste animal, sendo aplicado no estuário dos rios Timonha e Ubatuba, mas podendo alcançar futuramente outros ambientes e outros animais. Vimos através deste trabalho que através de um algoritmo supervisionado, o J48, f o i possível extrair um determinado conhecimento e padrões de uma base de dados. Com a execução do J48 na mineração dos dados da BDOPB, foi possível fazer a previsão do aparecimento do

6 peixe-boi m a r i n h o e relatar quando houve sua presença sob as condições analisadas, como pode ser visto na Tabela 2. O algoritmo J48 obteve uma média geral em relação à classificação dos dados de aproximadamente 92%, ou seja, o algoritmo conseguiu de modo geral absorver 92% do conhecimento da base de dados das ocorrências do peixe-boi marinho entre todas as diferentes bases de dados e suas sub-bases, testadas e analisadas em todo o experimento, gerando sob sua classificação um grau de confiabilidade razoável nesta pesquisa. O classificador nos permitiu também, através do ganho de informação dos atributos referente às ocorrências do peixe-boi marinho, saber quais entre os fatores abióticos analisados são influentes no aparecimento dos peixes-boi, foram eles: a salinidade da água, a temperatura da água e a data de aparição. Tabela 2. Resultado Geral de Desempenho do Classificador AVALIADORES 6. Referências Bibliográficas RESULTADOS VP FP Precision Recall F- Measure Acurácia Taxa de Erro Coppin, Ben. Inteligência artificial. Rio de Janeiro: LTC, Han, J.; Kamber, M. Data Mining - Concepts and Techniques. San Francisco - USA: Morgan Kaufmann, 2006.INSTITUTO BRASILEIRO DO CAFÉ.. Rio de Janeiro: IBC/GERCA, p Hsu, Chih-wei; CHANG, Chih-chung; LIN, Chih-jen. A Practical Guide to Support Vector Classification. Bioinformatics, v. 1, p.1-16, Iucn. International Union for the Conservation of Nature and Natural Resources. Red List of Threatened Species, Lima, R.P. Peixe-boi-marinho (Trichechus manatus): distribuição, status de conservação e aspectos tradicionais ao longo do litoral nordeste do Brasil. Série Meio Ambiente em Debate, n. 30, 76p. Brasília: Edições IBAMA, Markov, Z. Russell,I. An Introduction to the WEKA Data Mining System. Proceedings of the 11th annual SIGCSE conference on Innovation and technology in computer science education. P Bologna, Italy, Martins, A.C.; Marques, J.M.; Costa, P.D. Estudo comparativo de três algoritmos de machine learning na classificação de dados electrocardiográficos. Faculdade de Medicina da Universidade do Porto, Porto, POR, Teufel, S.; Moens, M. (2002). Summarising Scientific Articles Experiments with Relevance and Rhetorical Status. In: Computational Linguistics, 28(4), p Witten, I.H. and Frank, E. (2005) Data Mining: Practical machine learning tools and techniques. In 2nd edition Morgan Kaufmann, San Francisco.

2. Referencial Teórico

2. Referencial Teórico III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos, v. 1, n. 1, p. 242-247, jun, 2017. www.eripi.com.br/2017 - ISBN: 978-85-7669-395-6 Abstract. Nowadays machine learning is

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

Técnicas de Mineração de Dados aplicado na Universidade Federal Rural do Semi Árido (UFERSA) Campus Angicos 1*

Técnicas de Mineração de Dados aplicado na Universidade Federal Rural do Semi Árido (UFERSA) Campus Angicos 1* Técnicas de Mineração de Dados aplicado na Universidade Federal Rural do Semi Árido (UFERSA) Campus Angicos 1* Julio Cartier Maia Gomes 1, Paulo Henrique de Morais 1, Cynthia Moreira Maia¹, Walter Martins

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

Boas Maneiras em Aprendizado de Máquinas

Boas Maneiras em Aprendizado de Máquinas Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

MESTRADO EM INFORMÁTICA MÉDICA UNIDADE CURRICULAR DE SISTEMAS DE ESTUDO COMPARATIVO O DE 2009

MESTRADO EM INFORMÁTICA MÉDICA UNIDADE CURRICULAR DE SISTEMAS DE ESTUDO COMPARATIVO O DE 2009 FACULDADE DE MEDICINA DA UNIVERSIDADEE DO PORTOO M MESTRADO EM INFORMÁTICA MÉDICA UNIDADE CURRICULAR DE SISTEMAS DE APOIO À DECISÃO CLÍNICA ESTUDO COMPARATIVO DE TRÊS ALGORITMOS DE MACHINE LEARNING NA

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados

Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Silvani Weber da Silva Borges 1 (PIBIC/CNPq/Unioeste), Renato B. Machado (Orientador), Newton Spolaôr

Leia mais

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar

Leia mais

PLANO DE ENSINO DA DISCIPLINA BLOCO I IDENTIFICAÇÃO

PLANO DE ENSINO DA DISCIPLINA BLOCO I IDENTIFICAÇÃO CURSO DE GRADUAÇÃO: SÉRIE: SEMESTRE LETIVO DO ANO: ( ) 1º SEMESTRE ( X ) 2º SEMESTRE ( ) 1º e 2º SEMESTRES ANO: PLANO DE ENSINO DA DISCIPLINA BLOCO I IDENTIFICAÇÃO Código da Disciplina: Nome da Disciplina:

Leia mais

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar Introdução Comidas podem apresentar deformações e variações em sua forma, além de conter muitos ingredientes, nem todos visíveis; Métodos tradicionais de reconhecimento requerem a detecção de características

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Alternativas para construção de classificadores de solos brasileiros

Alternativas para construção de classificadores de solos brasileiros 48 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Alternativas para construção de classificadores de solos brasileiros Matheus Agostini Ferraciolli¹ Luiz Manoel Silva Cunha² Resumo: Este

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..

Leia mais

Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba

Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Thaís Barros Nascimento 1, Maria das Graças J. M. Tomazela 1 1 Faculdade

Leia mais

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a 1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA. APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.NET Heloína Alves Arnaldo (bolsista do PIBIC/UFPI), Vinicius Ponte

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina écnicas de Classificação Árvores de Decisão Prof. Paulo Martins Engel UFRGS Árvores de Decisão As árvores de decisão (AD) são ferramentas poderosas para classificação cuja maior

Leia mais

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos Carla Fernandes da SILVA 1 ; Clayton Silva MENDES 2. RESUMO A evasão escolar é um dos principais desafios a ser superado

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Análise Automática de Coerência Textual em Resumos Científicos: Avaliando Quebras de Linearidade

Análise Automática de Coerência Textual em Resumos Científicos: Avaliando Quebras de Linearidade Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4 7, 2015. c 2015 Sociedade Brasileira de Computação. Análise Automática de Coerência Textual em Resumos

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education Data Science Data Stream Mining: trabalhando com dados massivos André Luís Nunes Porto Alegre, 2018 Globalcode Open4education Data Stream Mining trabalhando com dados massivos 2018 agenda andré luís nunes

Leia mais

Aula 9. Prof. Adilson Gonzaga

Aula 9. Prof. Adilson Gonzaga Aula 9 Prof. Adilson Gonzaga Mapeamento Atribuir uma Instância a uma classe. Cada Instância é mapeada para um elemento do conjunto de Rótulos de Classe {p,n} p positivo n negativo Atribui uma Instância

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 15 Árvores de Decisão Árvores de Decisão Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso.

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação

Leia mais

INTELIGÊNCIA ARTIFICIAL

INTELIGÊNCIA ARTIFICIAL INTELIGÊNCIA ARTIFICIAL Engenharia da Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto Dr. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Kuncheva pg. 8 a 25 (seções 1.3 e 1.4) Roteiro da aula Cálculo do erro de um classificador Técnicas de treinamento, avaliação e teste

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos

Leia mais

MODELO DE CLASSIFICAÇÃO AUTOMÁTICA DE QUESTÕES NA LÍNGUA PORTUGUESA Henrique Maia Braum 1, Sandro José Rigo 1, Jorge L. V.

MODELO DE CLASSIFICAÇÃO AUTOMÁTICA DE QUESTÕES NA LÍNGUA PORTUGUESA Henrique Maia Braum 1, Sandro José Rigo 1, Jorge L. V. CINTED- Novas Tecnologias na Educação 1 MODELO DE CLASSIFICAÇÃO AUTOMÁTICA DE QUESTÕES NA LÍNGUA PORTUGUESA Henrique Maia Braum 1, Sandro José Rigo 1, Jorge L. V. Barbosa 1 1 UNISINOS Universidade do Vale

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Inteligência Artificial

Inteligência Artificial Aprendizagem por que? lnteligência Artificial Aprendizagem em IA Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Implementação de um sistema de validação estatística configurável de dados

Implementação de um sistema de validação estatística configurável de dados Implementação de um sistema de validação estatística configurável de dados Eduardo Dias Filho Supervisores: João Eduardo Ferreira e Pedro Losco Takecian 16 de novembro de 2014 Introdução Table of Contents

Leia mais

Aprendizagem a partir de observações

Aprendizagem a partir de observações Aprendizagem a partir de observações Aprendizagem é essencial para ambientes desconhecidos, i.e., quando o projetista não prevê tudo Útil como um método de construção de sistemas i.e., expor o agente à

Leia mais

1ª JORNADA CIENTÍFICA DA UNIOESTE 24 a 26/10/2001 CASCAVEL/PR

1ª JORNADA CIENTÍFICA DA UNIOESTE 24 a 26/10/2001 CASCAVEL/PR APLICAÇÃO DE TÉCNICAS DE APRENDIZADO DE MÁQUINA PARA EXTRAÇÃO DE CONHECIMENTO E CONSTRUÇÃO DE CLASSIFICADORES: ESTUDO DE CASO DE BASES DE DADOS MÉDICAS Ferro, M; Lee, H.D; Chung, W.F. Universidade Estadual

Leia mais

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Aprendizado em IA Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Tópicos Agentes baseados em aprendizado Aprendizado indutivo Árvores de decisão Método ID3 Aprendizado em redes neurais

Leia mais

Curso de Data Mining

Curso de Data Mining Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Classificação de áreas algodoeiras utilizando séries temporais de imagens Modis

Classificação de áreas algodoeiras utilizando séries temporais de imagens Modis 34 Classificação de áreas algodoeiras utilizando séries temporais de imagens Modis João Paulo Sampaio Werner¹ Stanley Robson de Medeiros Oliveira² Júlio César Dalla Mora Esquerdo³ Resumo: O objetivo deste

Leia mais

6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA

6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA Universidade Federal do ABC Rua Santa Adélia, 166 - Bairro Bangu - Santo André - SP - Brasil CEP 09.210-170 - Telefone/Fax: +55 11 4996-3166 1. CÓDIGO E NOME DA DISCIPLINA MC5004 - APRENDIZADO DE MÁQUINA

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Aluno: Fabricio Aparecido Breve Prof.: Dr. André Ponce

Leia mais

lnteligência Artificial Aprendizagem em IA

lnteligência Artificial Aprendizagem em IA lnteligência Artificial Aprendizagem em IA 1 Aprendizagem por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Estrutura de Dados e Algoritmos

Estrutura de Dados e Algoritmos Mestrado Integrado em Engenharia Biomédica http://www.fe.up.pt/ rcamacho/cadeiras/eda FEUP Universidade do Porto rcamacho@fe.up.pt 14 de Setembro de 2009 Objectivos da disciplina A disciplina tem por

Leia mais

5 Experimentos Corpus

5 Experimentos Corpus 5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.

Leia mais

Seleção de Atributos 1

Seleção de Atributos 1 Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas

Leia mais

4 Construção dos Classificadores

4 Construção dos Classificadores 4 Construção dos Classificadores 4.1. Modelagem O aprendizado supervisionado contém a etapa de modelagem, nessa etapa definimos quais serão as características encaminhadas ao classificador para o treinamento.

Leia mais

7 Resultados e Discussão

7 Resultados e Discussão 114 7 Resultados e Discussão A fim de avaliar a importância da utilização de imagens polarizadas em medidas de textura, cujo processamento necessita de imagens nos dois modos de captura (campo claro e

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28

Leia mais

Análise comparativa dos algoritmos de clusterização k-means e fuzzy c-fuzzy com uso de dados oriundos do plantio de canade-açucar

Análise comparativa dos algoritmos de clusterização k-means e fuzzy c-fuzzy com uso de dados oriundos do plantio de canade-açucar Análise comparativa dos algoritmos de clusterização k-means e fuzzy c-fuzzy com uso de dados oriundos do plantio de canade-açucar Ramon Pansonato 1, Maria das Graças J. M. Tomazela 1 1 Faculdade de Tecnologia

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003 UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO 102 5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO Conforme detalhado na seção 4.3, foram criados três conjuntos de dados: clientes BT com 382 padrões, clientes comerciais MT com 866 padrões e clientes industriais

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Oi, Ficou curioso? Então conheça nosso universo.

Oi, Ficou curioso? Então conheça nosso universo. Oi, Somos do curso de Sistemas de Informação da Universidade Franciscana, e esse ebook é um produto exclusivo criado pra você. Nele, você pode ter um gostinho de como é uma das primeiras aulas do seu futuro

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina A necessidade de inserir aprendizado nas máquinas surgiu após a construção dos Sistemas Especialistas (SEs). Os primeiros SEs não possuíam mecanismo de aprendizado e tornavam-se

Leia mais

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 12 Árvores de Decisão Prof. Augusto Baffa Árvores de Decisão Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso. Uma

Leia mais

Identificação de alertas de segurança virtual veiculados no Twitter

Identificação de alertas de segurança virtual veiculados no Twitter Identificação de alertas de segurança virtual veiculados no Twitter Orientador: Daniel M. Batista Coorientadora: Elisabeti Kira Instituto de Matemática e Estatística IME-USP 27 de Janeiro de 2015 Introdução

Leia mais

Minerando regras de associação

Minerando regras de associação Minerando regras de associação Proposto por Rakesh Agrawal em 1993. É o modelo de mineração de dados mais estudado pela comunidade de banco de dados. Utiliza dados categóricos. Não há bons algoritmos para

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani O que é Machine Learning? Estatística Machine Learning

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

INTELIGÊNCIA ARTIFICIAL APLICADA À SUPERVISÃO DA QUALIDADE DE ENERGIA

INTELIGÊNCIA ARTIFICIAL APLICADA À SUPERVISÃO DA QUALIDADE DE ENERGIA INTELIGÊNCIA ARTIFICIAL APLICADA À SUPERVISÃO DA QUALIDADE DE ENERGIA José Borges (Bolsista PIBIC/CNPQ), Aldebaro Klautau (Orientador) Laboratório de Processamento de Sinais Departamento de Engenharia

Leia mais

A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe

A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe Leopoldo Ramos de Oliveira 1, Fausto Bernard Melo Soares 2, José Acácio de Jesus

Leia mais

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Ana Carolina Bras Costa 1, Êmile Cunha Lopes 1 1 Departamento de Informática Universidade Federal do Maranhão (UFMA)

Leia mais