Análise comparativa dos algoritmos de clusterização k-means e fuzzy c-fuzzy com uso de dados oriundos do plantio de canade-açucar

Tamanho: px
Começar a partir da página:

Download "Análise comparativa dos algoritmos de clusterização k-means e fuzzy c-fuzzy com uso de dados oriundos do plantio de canade-açucar"

Transcrição

1 Análise comparativa dos algoritmos de clusterização k-means e fuzzy c-fuzzy com uso de dados oriundos do plantio de canade-açucar Ramon Pansonato 1, Maria das Graças J. M. Tomazela 1 1 Faculdade de Tecnologia de Indaiatuba (FATEC-ID) Indaiatuba, SP Brasil ramon_pansonato@hotmail.com, gtomazela@fatecindaiatuba.edu.br Resumo. O objetivo desse trabalho foi pesquisar os algoritmos de clusterização de dados k- means e fuzzy c-means e aplicá-los em uma base contendo dados sobre cana-de-açúcar de uma usina do estado de São Paulo, com a finalidade de verificar qual deles traz um melhor resultado. O suporte metodológico baseou-se, inicialmente, em um levantamento bibliográfico sobre as tarefas de Mineração de Dados focando a parte de clusterização, sobre lógica fuzzy e de como ocorre a clusterização fuzzy. Em seguida foi utilizada a ferramenta MATLAB, para a criação de classes para os dados por meio da técnica KNN K-nearest neighbor, bem como para o processo de clusterização. Os resultados obtidos com os algoritmos de clusterização foram analisados e comparados com os resultados da classificação e foi possível identificar que, para o cenário estudado, o k-means mostrou-se mais eficaz, trazendo melhores resultados do que o algoritmo fuzzy c-means. O k-means teve um acerto de 19% na maior classe criada, Muito Baixa, e o fuzzy c-means teve 4% de acerto na mesma classe. Abstract The aim of this study was to investigate the clustering algorithms of k -means and fuzzy c -means data and apply them in a sugar cane database from a plant in the state of São Paulo, in order to find which one would bring better results. Methodological support was based initially on a literature survey about the tasks of data mining, focusing on fuzzy logic clustering and how fuzzy clustering occurs. Then MATLAB tool was used to create classes for the data, through the KNN - K- nearest neighbor technique, and for the clustering process. The results obtained with the clustering algorithms were analyzed and compared with the results of the classification and it was found that, for the scenario studied, the k -means algorithm was more effective, bringing better results than the fuzzy c -means algorithm. The k -means algorithm had an accuracy of 19 % in the highest class created, " Very Low ", and the fuzzy c -means was 4 % accuracy in the same class... 1.Introdução Com o passar do tempo nota-se que a quantidade de dados produzidos diariamente dentro das organizações é maior do que a capacidade humana de analisar e extrair conhecimento a partir desses dados. Por essa razão novas técnicas e ferramentas têm sido desenvolvidas para extrair conhecimento das bases de dados de modo eficaz e automatizado. A Mineração de Dados é uma das mais importantes etapas do processo de descoberta de conhecimento em bases de dados, o KDD. O processo KDD pode ser dividido em três etapas operacionais (Han e Kamber, 2006) 1) Pré - Processamento: Consiste em coletar, organizar e limpar os dados, fazendo assim a preparação dos mesmos para a execução dos algoritmos na etapa de mineração.

2 2) Mineração de Dados: Consiste na execução de algoritmos com o objetivo de encontrar novos padrões de conhecimento dentro de grandes bases de dados, para gerar uma previsão futura, baseando-se em descobertas passadas. A Mineração de Dados pode ser feita por meio de diversas tarefas, as tarefas mais citadas na literatura são: Classificação: Tem como objetivo classificar automaticamente novos itens de acordo com análises previamente realizadas. Associação: Consiste em comparar a semelhança que existe entre os dados, observando as afinidades durante as transações nas bases. Clusterização: Consiste em separar os dados em vários grupos (clusters), de acordo com a similaridade destes dados, ou seja dados muito similares vão para um grupo, dados com uma similaridade baixa vão para outro grupo. 3) Pós - Processamento é o tratamento das informações recolhidas através da mineração dos dados, para que haja uma melhor compreensão das informações extraídas. Neste trabalho foram aplicados dois algoritmos de clusterização: o k-means e o fuzzy c-means.o algoritmo K-means particiona um conjunto de n objetos, em k clusters, e busca obter similaridade intra cluster elevada, e baixa similaridade inter cluster. O centroide do cluster, ou a média dos objetos dentro de cada cluster, é utilizado para calcular a similaridade entre esses objetos. Inicialmente são escolhidos K centroides aleatoriamente, então os objetos são atribuídos aos seus clusters de acordo com uma medida de similaridade. Em seguida, para cada cluster, o centroide é recalculado e os objetos são atribuídos aos clusters novamente, este processo se repete até que não haja alteração dos objetos entre um cluster e outro (Han e Kamber, 2006). O fuzzy c-means é uma versão fuzzy do próprio k-means. Um algoritmo fuzzy trabalha com a lógica fuzzy e, diferente da lógica convencional, tem a capacidade de se aproximar do mundo real, não trabalhando apenas com respostas extremas, mas tendo um equilíbrio entre essas respostas. Klir e Yan (1995) afirmam que a principal diferença entre a lógica clássica e a lógica fuzzy é que a lógica clássica trabalha com questões de verdadeiro ou falso, já a lógica fuzzy propõe isso como uma questão de grau. Um exemplo da lógica clássica é que definimos uma pessoa como alta ou baixa, já a lógica fuzzy diz que esta mesma pessoa é muito alta e pouco baixa, ou ao contrário. Este trabalho teve como objetivo comparar os algoritmos k-means e o fuzzy c- means e verificar qual dos dois tem um resultado mais exato no agrupamento dos dados. O estudo apresentado se iniciou com um levantamento bibliográfico em diversos títulos e artigos acadêmicos como Braga (2005), Carlantonio (2001), Han e Kamber (2006) entre outros, e a comparação dos algoritmos foi feita com base no trabalho de Quinteiro (2001). Os algoritmos foram aplicados, testados e comparados por meio de uma classe criada nos dados da cana-de-açúcar de uma usina do estado de São Paulo das safras 06/07 e 08/09, disponibilizada por um grupo sucroenergético sediado na cidade de Ribeirão Preto. 2. Materiais e métodos Neste trabalho foi utilizada uma base de dados do censo varietal qualitativo contendo informações das safras 06/07, 08/09. Esta base foi disponibilizada por um grupo sucroenergético sediado na cidade de Ribeirão Preto.

3 A planilha com os dados contém os seguintes atributos: código da gleba, código do talhão, data de plantio, data de corte atual, estágio de corte, produtividade, vinhaça, adubação, ambiente, fertilidade e textura. Sendo assim a base contém 11 atributos e instâncias. No Quadro 1 são apresentados os atributos utilizados na base e seus respectivos tipos de dados: Quadro 1 - Atributos utilizados na base de dados Atributo Gleba Talhão Plantio Corte Atual Estágio de Corte Produtividade Vinhaça Adubação Ambiente Fertilidade Textura Tipo Data Data Para a realização da pesquisa, inicialmente, os dados foram tratados no Microsoft Office Excel 2007 para a padronização, como por exemplo, no atributo adubação algumas instâncias não estavam preenchidas e outras estavam com valores 0, ambas informando que não havia adubação para aquele período, por este motivo, o Excel foi utilizado para preencher as instâncias em branco com o valor 0. As demais tarefas realizadas nos dados foram feitas com o software MATLAB R2012 (versão de avaliação para estudantes), um software matemático utilizado em diversas áreas como engenharia, computação e matemática, dispondo das técnicas e algoritmos utilizados neste trabalho. O próximo passo da pesquisa foi criar classes para os dados, para, posteriormente, fazer a clusterização dos mesmos e usar as classes criadas para comparar o quão correto foi a clusterização. Para a criação das classes foi escolhido o atributo produtividade como o atributo alvo, contendo no mesmo, valores entre 0 e 615,61. Após a escolha do atributo,o mesmo foi discretizado pelo método de distância (Equi-width) que segundo Han e Kamber(2006) divide os valores de um determinado atributo em um número de intervalos definidos pelo usuário com tamanhos iguais. Foram definidos 5 intervalos, classificando a produtividade como: muito baixa, baixa, média, alta e muito alta. Esta classificação foi feita com base no trabalho de Tomazela e Daniel (2010). Abaixo na Tabela 1 serão mostradas as distribuições das instâncias nas classes:

4 Tabela 1 - Distribuição das instâncias nas classes Classes Quantidade de Instâncias Muito Baixa Baixa 2508 Média 8 Alta 4 Muito Alta 1 Antes de realizar a clusterização dos dados foi feita uma classificação por meio do método K-vizinhos mais próximos (K-NN) para verificar qual era o nível de acerto dessa classificação, para, posteriormente, verificar o acerto da clusterização. Para a realização da clusterização, foram utilizados 2 métodos de agrupamento por particionamento, o k-means e o fuzzy c-means, como citado, o fuzzy c-means é uma versão fuzzyficada do k-means. Como na criação das classes os dados foram divididos em 5 classes, para os dois algoritmos foram definidos 5 clusters, como dito anteriormente o fuzzy c-means distribui os dados em diversos clusters por meio de similaridade, ou seja um mesmo dado pode ter similaridade com mais de um cluster. Para este trabalho foi definida uma porcentagem mínima de 70% de grau de pertinência ao cluster, ou seja, quando o dado tiver esse percentual ou mais de similaridade com um determinado cluster, esse cluster é considerado o predominante. O algoritmo fuzzy c-means utiliza como distância de similaridade a distância euclidiana, por este motivo o k-means também foi testado com essa medida. Para analisar os resultados obtidos por meio da clusterização, foi utilizado o Microsoft Office Excel. Os resultados desse experimento são apresentados na próxima seção. 3. Resultados e Discussões A análise dos resultados dos segmentos k-means e fuzzy c-means foi utilizado como base no trabalho de Quinteiro (2001), que faz uma análise dos resultados da clusterização de dados de uma pesquisa sobre música realizada no facebook. Este estudo foi realizado em duas etapas. Na primeira etapa foram criadas classes para o conjunto de dados e utilizado o método k-vizinhos mais próximos (K- NN) para determinar a acurácia da classificação, conforme apresentado na Tabela 2. Posteriormente os dados foram clusterizados com os algoritmos k-means e fuzzy c- means.

5 Tabela 2 - Acurácia KNN Técnica Classificador Acurácia K-Vizinhos mais próximos (K-NN) IBK K = % A Tabela 3 mostra a porcentagem de acertos por classe e a Figura 1 mostra a matriz de confusão gerada pelo classificador. Tabela 3 - Acerto por classe algoritmo KNN Classe % Muito Baixa 97 Baixa 76 Média 0 Alta 0 Muito Alta 0 Figura 1 - Matriz de confusão Analisando a matriz, é possível observar que as linhas mostram as classes reais dos dados e as colunas, como eles foram classificados, ou seja, apenas os dados na diagonal estão classificados corretamente, a maioria dos acertos ocorreu nas classes Muito Baixa e Baixa. Isso ocorre pelo fato das classes estarem muito desbalanceadas, tendo uma distribuição muito maior nestas duas classes, por esse motivo é possível ver que os erros ocorreram nas demais classes. Foram utilizados métodos para balanceamento de classes, porém, os mesmos não foram satisfatórios neste caso. O acerto na classificação foi significativamente alto, então concluiu-se que o modelo de classificação gerado é adequado Algoritmo K-means Na Tabela 4, são mostrados em porcentagem os acertos e os erros do algoritmo k- means, de acordo com as classes. Na sequência, na Figura 2, pode-se visualizar a distribuição nos clusters em um gráfico criado no Microsoft Office Excel.

6 Tabela 4 - Resultados obtidos k-means Classe Instâncias Totais Instâncias clusterizadas corretamente % acerto % erro Muito Baixa Baixa Média Alta Muito Alta Figura 1 - Acertos k-means A partir da tabela e do gráfico é possível observar que o maior acerto no agrupamento dos dados, comparando com a classificação mostrada anteriormente, foi obtido pela classe Baixa. Comparando este agrupamento com a matriz de confusão, nota-se que foi uma boa clusterização acertando quase 50% dos dados, as classes Média e Alta ficaram com uma porcentagem que pode ser considerada elevada em função das mesmas terem poucos dados. Pode-se observar também que o acerto nas classes Média e Alta foram superiores aos da classe Muito Baixa, essa informação pode ser desconsiderada, pelo fato de existirem poucos dados nas classes Média e Alta, ou seja, os 19% de acertos na classe Muito Baixa é muito mais significativo do que os 25% nas classes Média e Alta. 3.2.Algoritmo fuzzy c-means Como dito anteriormente, o algoritmo fuzzy c-means estipula um grau de similaridade entre os clusters, sendo assim, na Tabela 5 são mostrados os acertos do algoritmo com porcentagem superior a 70% e, na Figura 3, um gráfico mostrando esses resultados.

7 Posteriormente, na Tabela 6 e na Figura 4, são apresentados os dados que foram agrupados nos clusters corretos, porém, com porcentagem inferior a 70%. Tabela 5 - Resultados obtidos fuzzy c-means Classe Instâncias Totais Instâncias clusterizadas corretamente % acerto % erro Muito Baixa Baixa Média Alta Muito Alta Figura 3 - Acertos fuzzy c-means

8 Tabela 6 - Resultados obtidos fuzzy c-means inferiores a 70% Classe Instâncias Totais Instâncias clusterizadas corretamente % acerto % erro Muito Baixa Baixa Média Alta Muito Alta Considerações Finais Figura 2 - Acertos fuzzy c-means inferiores a 70% Pode-se afirmar que o algoritmo fuzzy c-means teve um nível alto de acertos, porém, a grande maioria dos agrupamentos ocorreu fora dos 70%, sendo assim considerados errados no contexto deste trabalho. Outro fator a ser destacado é que a grande parte dos dados teve uma similaridade grande com diversos clusters, sendo que a maior não era com o devido cluster.neste cenário, o correto é não utilizar graus de similaridade, já que foram criadas 5 faixas de classificação, não podendo a produtividade da cana ser alta e baixa ao mesmo tempo. Neste estudo foi possível observar que há uma grande diferença em se utilizar os métodos k-means e fuzzy c-means, apesar dos dois algoritmos serem muito parecidos. As informações extraídas são diferentes, já que com o fuzzy c-means é possível definir vários graus de pertinência entre os clusters e com o k-means o dado pertence a um e somente um cluster. Para o cenário estipulado verificou-se que o uso do algoritmo fuzzy c-means foi menos apropriado, sendo melhores os resultados apresentados pelo k-means. Mas não

9 pode ser desconsiderado que o fuzzy c-means pode ser de grande utilidade em outros cenários, como por exemplo, em uma base que armazene informações sobre preferência em esportes. Com o k-means cada pessoa pode ser designada a apenas um cluster, indicando que gosta de apenas um esporte, não sendo uma informação muito adequada, já que essa pessoa pode gostar de vários esportes simultaneamente, em graus diferentes de preferência. Referencias Bibliográficas BRAGA, P. Introdução a Mineração de Dados 2ª Edição revisada e ampliada. E- papers, 2005 CARLANTONIO, L. M. Novas Metodologias para Clusterização de Dados, Coordenação de Programas de Pós-Graduação em Engenharia, COPPE/UFRJ, 2001 HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. San Francisco: Morgan Kaufmann, KLIR, G. J.; YUAN, B.Fuzzy Sets and Fuzzy Logic: Theory and Applications. New Jersey: Prentice Hall PTR, QUINTEIRO, J. A. T.Segmentação de indivíduos no facebook que gostam de música: Abordagem exploratória, recorrendo à comparação entre dois algoritmos, k-means e fuzzy c-means. Universidade técnica de Lisboa Instituto superior de economia e gestão: Lisboa, TOMAZELA,M. G. J. M., e DANIEL, L.A., Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Canade-Açúcar.Faculdade de Tecnologia de Indaiatuba,2010.

Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar

Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar Maria das Graças J.M. Tomazela¹, Luiz Antônio Daniel¹ ¹Faculdade de Tecnologia

Leia mais

Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba

Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Thaís Barros Nascimento 1, Maria das Graças J. M. Tomazela 1 1 Faculdade

Leia mais

¹Faculdade de Tecnologia de Indaituba FATEC-ID, Rua D.Pedro I, 65, Cidade Nova, Indaiatuba, SP

¹Faculdade de Tecnologia de Indaituba FATEC-ID, Rua D.Pedro I, 65, Cidade Nova, Indaiatuba, SP Aplicação de Técnicas de Mineração de Dados para Caracterização de Grupos de Cidades Produtoras de Cana-De- Acúcar do Estado de São Paulo e Definição de Políticas Especificas Maria das Graças J.M. Tomazela

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO 102 5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO Conforme detalhado na seção 4.3, foram criados três conjuntos de dados: clientes BT com 382 padrões, clientes comerciais MT com 866 padrões e clientes industriais

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que

Leia mais

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução 19 Congresso de Iniciação Científica IMPLEMENTAÇÃO DE GUIAS E ALGORITMOS PARA REGRAS DE ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es)

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel

Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel 19 a 21 de mar o de 2010 157 Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel José Márcio Cassettari Junior 1, Merisandra Côrtes de Mattos 1, João Manuel M. De Carlo 1, Priscyla

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

News Clipping. Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro. Willian Gigliotti

News Clipping. Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro. Willian Gigliotti News Clipping Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro Willian Gigliotti wgigliotti@gmail.com Departamento de Ciências da Computação Instituto de Matemática e

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos

Leia mais

K-Nearest Neighbours & RSTUDIO

K-Nearest Neighbours & RSTUDIO K-Nearest Neighbours & RSTUDIO Rodrigo Augusto Igawa Universidade Estadual de Londrina igawa@uel.br 17 de novembro de 2015 Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de 2015 1 / 16 Sumário

Leia mais

7 Resultados e Discussão

7 Resultados e Discussão 114 7 Resultados e Discussão A fim de avaliar a importância da utilização de imagens polarizadas em medidas de textura, cujo processamento necessita de imagens nos dois modos de captura (campo claro e

Leia mais

CLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão

CLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão Resumo CLARANS Diego Raphael Amancio Introdução PAM CLARA CLARANS Comparação de eficiência Conclusão 2 Artigo de Referência [1] Introdução Imagem do artigo original entitulado Efficient and Effective Clustering

Leia mais

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013 Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?

Leia mais

Projected Clustering Algorithm

Projected Clustering Algorithm Projected Clustering Algorithm Emanuel Matos 5560105 Disciplina : Análise de Agrupamentos Prof. Dr. Ricardo Campello Dez/2010 View Problema Objetivo Definições/Premissas Algoritmo Acurácia Escalabilidade

Leia mais

Implementação dos Algoritmos e Resultados

Implementação dos Algoritmos e Resultados Capítulo 6 Implementação dos Algoritmos e Resultados 6.1 Considerações Iniciais Diversas situações foram exploradas neste trabalho visando analisar qual seria a wavelet mais adequada para sistemas de extração

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Reconhecimento das cores do MSX por Lógica Fuzzy

Reconhecimento das cores do MSX por Lógica Fuzzy Reconhecimento das cores do MSX por Lógica Fuzzy Resumo O objetivo deste artigo é demonstrar como é possível reconhecer as cores nativas do MSX 1 a partir de imagens de 24 bits do PC. 1- Introdução A redução

Leia mais

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos.

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos. 84 5 Estudos de Caso A seguir serão apresentados três estudos de caso. Os dois primeiros estudos de caso têm por objetivo demonstrar a facilidade de uso do aplicativo, e o último estudo de caso é focado

Leia mais

4. RESULTADOS Resultados Gerais da Amostra

4. RESULTADOS Resultados Gerais da Amostra 4. RESULTADOS 4.1. Resultados Gerais da Amostra Para a análise dos dados da pesquisa foi utilizado o método da análise conjunta. Como descrito no capítulo anterior, o método permite que sejam estimadas

Leia mais

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Reconhecimento de texturas utilizando padrão binário local e classificador knn. Reconhecimento de texturas utilizando padrão binário local e classificador knn. Vinicius Santos Andrade 1 Resumo. Através de uma imagem é possível obter inúmeras informações. Portanto, é cada vez mais

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

5 Estudo de Casos. Tabela 5 - Características dos Banco de Dados

5 Estudo de Casos. Tabela 5 - Características dos Banco de Dados 5 Estudo de Casos O principal objetivo desse estudo de casos é a avaliação do desempenho do modelo FREx_SVM em problemas envolvendo duas ou mais classes. São estudados quatro problemas, dois de classificação

Leia mais

Tópicos em Mineração de Dados

Tópicos em Mineração de Dados Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

Informática. Aprendizado de Máquina. Professor Márcio Hunecke.

Informática. Aprendizado de Máquina. Professor Márcio Hunecke. Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:

Leia mais

A Tarefa de Clusterização por meio do Método de Lógica Fuzzy no Processo de Data Mining

A Tarefa de Clusterização por meio do Método de Lógica Fuzzy no Processo de Data Mining A Tarefa de Clusterização por meio do Método de Lógica Fuzzy no Processo de Data Mining José Márcio Cassettari Junior, Merisandra Côrtes de Mattos 2, Priscyla Waleska Targino de Azevedo Simões 2, Cristian

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

Mapeamento do uso do solo

Mapeamento do uso do solo Multidisciplinar Mapeamento do uso do solo para manejo de propriedades rurais Allan Arnesen Frederico T. Genofre Marcelo Pedroso Curtarelli CAPÍTULO 4 Técnicas de classificação de imagens e processamento

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

6 Aplicação da Metodologia Proposta

6 Aplicação da Metodologia Proposta 6 Aplicação da Metodologia Proposta 6.1 Introdução A utilização da metodologia Box & Jenkins para a identificação da estrutura adequada é tarefa difícil para um usuário sem conhecimento prévio. Por isso,

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

Informática Parte 19 Prof. Márcio Hunecke

Informática Parte 19 Prof. Márcio Hunecke Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem

Leia mais

Mineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth -

Mineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth - Mineração de Dados - Contextualização Fonte: Prof. Fabrício J. Barth - http://fbarth.net.br/ Mineração de Dados - Contextualização Uso da informação Síntese do conhecimento; Manter, disseminar, organizar,

Leia mais

4 SISTEMA DE CLASSIFICAÇÃO DE UNIDADES CONSUMIDORAS DE ENERGIA ELÉTRICA

4 SISTEMA DE CLASSIFICAÇÃO DE UNIDADES CONSUMIDORAS DE ENERGIA ELÉTRICA 94 4 SISTEMA DE CLASSIFICAÇÃO DE UNIDADES CONSUMIDORAS DE ENERGIA ELÉTRICA 4.1 INTRODUÇÃO Conforme dito no capítulo 1, a diminuição das perdas técnicas e comerciais é uma das principais prioridades das

Leia mais

Tipos de gráficos disponíveis

Tipos de gráficos disponíveis Página 1 de 18 Excel > Gráficos > Criando gráficos Tipos de gráficos disponíveis Mostrar tudo O Microsoft Excel dá suporte a vários tipos de gráficos para ajudar a exibir dados de maneiras que sejam significativas

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Mateus Curcino de Lima, Maria Camila Nardini Barioni, Humberto Luiz Razente mateuscurcino@mestrado.ufu.br, {camila.barioni,humberto.razente}@ufu.br

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 2: 1 /59 Programa Dia 1: Apresentação

Leia mais

CONTRIBUIÇÃO DA ANÁLISE MULTIVARIADA PARA OS INDICADORES DE AVALIAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO: uma análise na área de Matemática

CONTRIBUIÇÃO DA ANÁLISE MULTIVARIADA PARA OS INDICADORES DE AVALIAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO: uma análise na área de Matemática CONTRIBUIÇÃO DA ANÁLISE MULTIVARIADA PARA OS INDICADORES DE AVALIAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO: uma análise na área de Matemática Renata Cristina Gutierres Castanha (UNESP) regutierres@gmail.com

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

RECONHECIMENTO VISUAL DE NINFAS DE MOSCA BRANCA UTILIZANDO UM MÉTODO HÍBRIDO BASEADO EM CLASSIFICADOR EM CASCASTA E K-NEAREST-NEIGHBOR

RECONHECIMENTO VISUAL DE NINFAS DE MOSCA BRANCA UTILIZANDO UM MÉTODO HÍBRIDO BASEADO EM CLASSIFICADOR EM CASCASTA E K-NEAREST-NEIGHBOR RECONHECIMENTO VISUAL DE NINFAS DE MOSCA BRANCA UTILIZANDO UM MÉTODO HÍBRIDO BASEADO EM CLASSIFICADOR EM CASCASTA E K-NEAREST-NEIGHBOR Vinicius Araújo Santos viniciusdt191@hotmail.com Escola de Engenharia

Leia mais

Rede complexa probabilística baseada em similaridade na classificação de dados com ruídos

Rede complexa probabilística baseada em similaridade na classificação de dados com ruídos Rede complexa probabilística baseada em similaridade na classificação de dados com ruídos Robson C. da Motta, e Alneu de A. Lopes Instituto de Ciências Matemáticas e de Computação - ICMC Universidade de

Leia mais

Realimentação de Relevância

Realimentação de Relevância Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Ciclo de realimentação onde uma consulta q recebida do usuário é transformada em uma consulta modificada

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster

Leia mais

Tipos de gráficos disponíveis

Tipos de gráficos disponíveis Tipos de gráficos disponíveis Mostrar tudo O Microsoft Office Excel 2007 oferece suporte para vários tipos de gráficos com a finalidade de ajudar a exibir dados de maneiras que sejam significativas para

Leia mais

COMPARATIVO ENTRE MÉTODOS DE TRATAMENTO DE MAPAS DE PRODUTIVIDADE. Favoni, VA 1, Tedesco, DO 2, Tanaka, EM, 3

COMPARATIVO ENTRE MÉTODOS DE TRATAMENTO DE MAPAS DE PRODUTIVIDADE. Favoni, VA 1, Tedesco, DO 2, Tanaka, EM, 3 COMPARATIVO ENTRE MÉTODOS DE TRATAMENTO DE MAPAS DE PRODUTIVIDADE Favoni, VA 1, Tedesco, DO 2, Tanaka, EM, 3 1 Discente do curso em Mecanização em Agricultura de precisão na FATEC Pompeia Shunji Nishimura,

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

Clustering - c-means e Self Organizing Maps

Clustering - c-means e Self Organizing Maps - c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Reconhecimento de Padrões aplicado à Bioinformática

Reconhecimento de Padrões aplicado à Bioinformática Reconhecimento de Padrões aplicado à Bioinformática Dr. Leandro Carrijo Cintra CNPTIA Embrapa Informática Agropecuária Curso de Verão 2010 Bioinformática USP CNPTIA - Centro Nacional de Pesquisas Tecnológicas

Leia mais

2COP229 Inteligência Computacional. Aula 3. Clusterização.

2COP229 Inteligência Computacional. Aula 3. Clusterização. Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância

Leia mais

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Mateus Luiz Gamba 1, Giana da Silva Bernardino 2 1 Universidade Federal

Leia mais

Comparação de métodos de classificação da cobertura do solo urbano utilizando imagens IKONOS II com e sem o auxílio de dados LiDAR

Comparação de métodos de classificação da cobertura do solo urbano utilizando imagens IKONOS II com e sem o auxílio de dados LiDAR Comparação de métodos de classificação da cobertura do solo urbano utilizando imagens IKONOS II com e sem o auxílio de dados LiDAR Leonardo Rodrigues de Deus 1 Rafael Santos 1 Leila Maria G. Fonseca 1

Leia mais

Paulo Roberto Quícoli - Raul Peres de Góes - Faculdade de Tecnologia de Taquaritinga (FATEC) SP Brasil

Paulo Roberto Quícoli - Raul Peres de Góes - Faculdade de Tecnologia de Taquaritinga (FATEC) SP Brasil 1 ESTUDO COMPARATIVO DOS MÉTODOS DE BUSCA POR LARGURA, PROFUNDIDADE, A* HAMMING E MANHATTAN PARA SOLUÇÃO DO 8-PUZZLE COMPARATIVE STUDY OF THE METHODS BFS, DFS, A* HAMMING AND MANHATTAN FOR THE 8-PUZZLE

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

REPRESENTAÇÃO DE FOLHAS DE PLANTAS COM REDES COMPLEXAS

REPRESENTAÇÃO DE FOLHAS DE PLANTAS COM REDES COMPLEXAS REPRESENTAÇÃO DE FOLHAS DE PLANTAS COM REDES COMPLEXAS OLIVEIRA, Cintia Carvalho 1 ; DORNELES, Jaqueline Neves 2 ; BEZERRA, Maria Aparecida Serafim 3 RESUMO: É notório que a utilização de técnicas no meio

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

Chapter 4: Unsupervised Learning

Chapter 4: Unsupervised Learning Chapter 4: Unsupervised Learning Road map Basic concepts K-means algorithm Representation of clusters Hierarchical clustering Distance functions Data standardization Handling mixed attributes Which clustering

Leia mais

Algoritmo CLIQUE (Clustering In QUEst)

Algoritmo CLIQUE (Clustering In QUEst) Algoritmo CLIQUE (Clustering In QUEst) Marcelo Camacho de Souza Nº USP: 3199616 Roteiro Algoritmo CLIQUE Exemplo Prático Complexidade Computacional Vantagens e Desvantagens Autores (IBM Almaden Research

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 13 Algoritmo k-means Clusterização Max Pereira Algoritmo k-means 1. Para um determinado cluster de dados C precisamos calcular sua média m k : m k i i: C(

Leia mais

Análise Quantitativa de Tecidos em Úlceras de Perna

Análise Quantitativa de Tecidos em Úlceras de Perna 49 5 Análise Quantitativa de Tecidos em Úlceras de Perna A avaliação das áreas proporcionais de cada tecido interno das úlceras fornece informações importantes sobre seu estado patológico [BERRISS, 2000],

Leia mais

DAGER: UMA FERRAMENTA PARA MINERAÇÃO DE DADOS GEORREFERENCIADOS DAGER: A TOOL FOR GEOREFERENCED DATA MINING

DAGER: UMA FERRAMENTA PARA MINERAÇÃO DE DADOS GEORREFERENCIADOS DAGER: A TOOL FOR GEOREFERENCED DATA MINING DAGER: UMA FERRAMENTA PARA MINERAÇÃO DE DADOS GEORREFERENCIADOS Ronan Assumpção Silva (UEPG) E-mail: ronan.ras@gmail.com Prof Dr Petraq J. Papajorgji (UEPG) E-mail: petraq@gmail.com Profa Dra Alaine M.

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de

Leia mais

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto Rodrigo Rodrigues Antunes e Israel Rodrigues Gonçalves Resumo: O objetivo

Leia mais

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos Carla Fernandes da SILVA 1 ; Clayton Silva MENDES 2. RESUMO A evasão escolar é um dos principais desafios a ser superado

Leia mais