Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI
|
|
- Mateus Ferreira
- 5 Há anos
- Visualizações:
Transcrição
1 Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI Brasil netoaraujjo@gmail.com, vinicius@ufpi.edu.br Abstract. In order to allow better management of the university, this paper presents the development of Knowledge Discovery processes in database. The process used enables automatic learning of user profiles of the Integrated Academic Activities Management System (SIGAA) and was applied to the database of the Federal University of Piauí (UFPI). The discovery of patterns can provide the development of academic and pedagogical strategies according to the similarity of profiles, through the definition of labels for different groups of students. Resumo. Visando possibilitar uma melhor gestão da universidade, o presente trabalho apresenta o desenvolvimento de processos de Descoberta de Conhecimento em Base de Dados. O processo utilizado permite o aprendizado automático dos perfis de usuários do Sistema Integrado de Gestão de Atividades Acadêmicas (SIGAA) e foi aplicado sobre a base de dados da Universidade Federal do Piauí (UFPI). A descoberta de padrões pode proporcionar o desenvolvimento de estratégias acadêmico-pedagógicas de acordo com a semelhança de perfis, pela definição de rótulos para os diferentes grupos de alunos. 1. Introdução O presente trabalho apresenta o desenvolvimento de processos de Descoberta de Conhecimento em Base de Dados (DCBD) para o aprendizado automático dos perfis de usuários do SIGAA. Para isso foram criados clusters (grupos) de acordo com a semelhança desses perfis, permitindo a descoberta de padrões. Isto facilita o desenvolvimento de estratégias de negócio para uma melhor gestão da universidade. Tão importante quanto a criação dos clusters é sua compreensão. Uma boa definição de um cluster representa um entendimento significativo e pode ajudar o especialista ao estudar ou interpretar os dados. O problema de compreender clusters isto é, de encontrar uma definição ou em outras palavras, um rótulo é conhecido como problema da rotulação [Lopes et al. 2014]. Para isso, métodos de aprendizagem não-supervisionada foram estudados e aplicados ao problema de clustering (agrupamento) e então algoritmos de aprendizagem supervisionada detectaram quais atributos são relevantes para definir cada cluster. Dessa forma busca-se o aprendizado dos perfis dos usuários, permitindo que se tomem decisões que tragam melhorias à comunidade assistida pelo SIGAA-UFPI, definindo cada cluster a partir de um rótulo.
2 2. Referencial Teórico A seguir é apresentado um levantamento bibliográfico sobre as ferramentas e conceitos utilizados neste trabalho Descoberta de Conhecimento O processo de descoberta de conhecimento é uma atividade complexa onde se busca a identificação de padrões, revelando novas informações com potencialidade de uso e compreensão. A interpretação de um grande volume de dados pelo ser humano é uma tarefa impraticável, devendo-se recorrer a ferramentas de Data Mining (Mineração de dados) [Fayyad et al. 1996]. Na Figura 1 temos uma visão geral da etapas que compõem o processo. Figura 1. Fases do processo de descoberta de conhecimento [Fayyad et al. 1996]. Na fase de seleção é escolhido o conjunto de dados que será analisado. Na etapa de pré-processamento é realizada a remoção de ruídos (dados inconsistentes) que podem comprometer a eficiência dos algoritmos. A fase de transformação compreende a formatação dos dados para a aplicação dos algoritmos. Na etapa de mineração de dados ocorre a aplicação de algoritmos de Aprendizagem de Máquina para extração de padrões. Por fim, na fase de avaliação, ou interpretação, ocorre o processo de tratamento dos conhecimentos adquiridos na etapa anterior Aprendizagem de Máquina Aprendizado de Máquina (AM) é o ramo da Inteligência Artificial que estuda o desenvolvimento de sistemas, que são capazes de aprender com a experiência [Mitchell 1997]. Existem dois principais paradigmas: Aprendizado Supervisionado: implica a existência de dados de entrada e a indicação de uma saída que possa ser aprendida para ocorrer o processo de aprendizagem [Braga et al. 2007]. Aprendizado Não-Supervisionado: envolve a aprendizagem de padrões na entrada, quando não são fornecidos valores de saídas específicas [Norving e Russell 2004].
3 2.3. Weka Weka é uma ferramenta que possui uma coleção de algoritmos de AM projetada para o rápido experimento dos métodos existentes em novos conjuntos de dados de forma flexível. O Weka é escrito em Java e distribuído sobre os termos da GNU General Public License. Fornece uma interface uniforme para muitos algoritmos de aprendizagem diferentes. Inclui os métodos de mineração de dados padrão: regressão, classificação, clustering, mineração de regras de associação e seleção de atributos [Bouckaert et al. 2015]. 3. Metodologia A metodologia empregada consistiu na aplicação de algoritmos de AM nãosupervisionados para a formação de clusters, com posterior aplicação de algoritmos de AM supervisionados para extração de regras de produção que permitissem rotular cada cluster formado. Procedimentos de pré-processamento foram realizados para facilitar a análise dos resultados obtidos, são eles: a normalização dos valores para o atributos cidade natal para capital e interior, e a discretização dos valores do atributo IRA (Índice de Rendimento Acadêmico) conforme a Tabela 1, dando origem ao atributo faixa ira. Tabela 1. Discretização do atributo IRA. IRA faixa ira [0,0;4,0[ 1 [4,0;7,0[ 2 [7,0;9,0[ 3 [9,0;10,0] 4 Durante os testes foram utilizadas duas amostras, que de agora em diante serão chamadas de A1 (12785 instâncias) e A2 (42619 instâncias). As amostras foram obtidas por consultas randômicas à base de dados, significando que os arquivos gerados possuem conteúdo totalmente aleatório. O algoritmo utilizado para o agrupamento dos perfis foi o K-means, que tem por objetivo criar partições de uma população n-dimensional em uma dada base de dados, maximizando a similaridade intra-grupo e minimizando a similaridade inter-grupo [Pimentel et al. 2003]. O treinamento do K-means ocorreu de duas maneiras: usando o método training set, onde o mesmo conjunto de dados a ser classificado é utilizado no treinamento, portanto as bases de treinamento e testes são idênticas; e utilizando o método percentage split, no qual um fragmento da base (no caso em questão, 30%) é utilizado para o treinamento, sendo as demais instâncias classificadas com base nos padrões detectados pelo algoritmo. Para obtenção das regras de produção foram utilizados os algoritmos J48 e RandomTree, ambos não-supervisionados. O primeiro decide o valor de destino (variável dependente) de uma nova amostra com base em vários valores de atributos dos dados disponíveis [Kiamarzpour et al. 2013]. O segundo considera apenas alguns atributos escolhidos aleatoriamente para cada nó da árvore [Pina et al. 2010]. Os dois fornecem como
4 saída uma árvore de decisão e foram selecionados devidos à facilidade de interpretação dos resultados. Nesta etapa foi utilizado como atributo classe o cluster atribuído pelo K-means, objetivando compreender o agrupamento realizado. Para avaliar a qualidade da classificação foram utilizadas duas métricas. A acurária, para medir a quantidade de instâncias corretamente classificadas (taxa de acerto). E a estatística Kappa para determinação da confiabilidade da classificação de acordo com a Tabela 2. Tabela 2. Interpretação dos valores da estatística Kappa [Landis e Koch 1977] Valores de Kappa Interpretação <0 Sem concordância 0-0,20 Pobre 0,20-0,39 Ligeira 0,40-0,59 Moderada 0,60-0,79 Substancial 0,80-1,0 Excelente 4. Resultados As instâncias da amostra A1 foram agrupadas inicialmente utilizando o método training set e posteriormente submetidas aos algoritmos J48 e RandomTree, utilizando o atributo cluster como classe. Os resultados detalhados na Tabela 3 revelam que o J48 apresentou melhor desempenho, com acurácia aproximadamente 13,5% superior à obtida pelo RandomTree, classificando corretamente quase a totalidade das instâncias apresentadas. Outro indicativo da melhor classificação do J48 é a estatística Kappa, que neste se encontra em uma faixa considerada excelente, enquanto que para o RandomTree, se encontra em uma faixa de concordância substancial. Além dos fatores estatísticos, o J48 também foi capaz de gerar uma árvore compreensível e de fácil análise, enquanto o RandomTree criou uma árvore com um número muito elevado de nós, dificultando sua análise para uma aplicação prática. Tabela 3. Resultados dos testes realizados com a amostra A1 utilizando training set. J48 RandomTree Instâncias corretamente classificadas Instâncias incorretamente classificadas Estatística Kappa 0,9612 0,7697 Acurácia 97,2546% 83,8874% A seguir, na Tabela 4, estão os resultados para a amostra A1 utilizando o método percentage split, no qual 30% das instâncias foram utilizadas para treinamento e as demais foram agrupadas a partir dos padrões aprendidos pelo K-means. Novamente a superioridade do J48 se mantém perante o RandomTree e ambos obtiveram um aumento de aproximadamente 2% na acurácia com relação ao método de treinamento training set. Mais uma vez a árvore criada pelo J48 apresenta-se de fácil análise. Em contrapartida a árvore gerada pelo RandomTree apresenta um elevado número de nós (mais de
5 Tabela 4. Resultados dos testes realizados com a amostra A1 utilizando percentage split. J48 RandomTree Instâncias corretamente classificadas Instâncias incorretamente classificadas Estatística Kappa 0,995 0,8011 Acurácia 99,6425% 85,7654% um milhão), o que torna sua análise impraticável para o problema em questão. Quanto ao método de treinamento o percentage split foi capaz de produzir melhores resultados tanto em acurácia quanto em termos da estatística Kappa, para os dois algoritmos testados. Devido à sobrecarga de memória não foi possível utilizar o algoritmo RandomTree com a amostra A2. Entretanto o J48 se manteve capaz de obter as regras de produção. Os resultados estão detalhados na Tabela 5. É perceptível a inversão do desempenho relacionado ao método de treinamento. realizando o treinamento do K-means utilizando training set a acurácia alcançada pelo J48 superou substancialmente a obtida quando utilizando percentage split. O resultado superior se repete para a estatística Kappa, que se aproxima bastante do valor máximo (1,0) no primeiro caso. Tabela 5. Resultados dos testes realizados com o J48 e a amostra A2 utilizando training set e percentage split. training set percentage split Instâncias corretamente classificadas Instâncias incorretamente classificadas Estatística Kappa 0,9969 0,8813 Acurácia 99,7865% 91,6873% 5. Conclusões Em todos os testes realizados o J48 apresentou melhor desempenho que o Random- Tree, classificando corretamente quase a totalidade das instâncias apresentadas e gerando árvores facilmente compreensíveis. Além destes fatores o J48 exige menos recursos computacionais,sendo o algoritmo mais adequado para obtenção de padrões na base de dados do SIGAA. Quanto ao método de treinamento utilizado pelo K-means, o percentage split levando os algoritmos de classificação a alcançar uma acurácia levemente superior para a amostra A1. Entretanto o método training set proporcionou melhores resultados para a amostra A2 com se tornando o mais indicado para grandes massas de dados. Dentro do contexto do SIGAA-UFPI pode-se, por exemplo, apontar a relação socioeconômica dos alunos com o seu desempenho acadêmico, como exemplifica a Tabela 6, obtida dos testes executados. Com isso, políticas ou processos de decisões preventivos ou corretivos, como a adoção de uma nova postura pedagógica da universidade, podem ser utilizados para promover ou evitar a ocorrência de padrões de interesse da instituição.
6 Tabela 6. Regras de produção de clusters extraídas da árvore de decisão. cluster0 cluster1 cluster2 cluster3 nota redacao > <faixa ira <= 3 faixa ira <= 2 faixa ira = 4 nota linguagem >1856,5 idade >26 idade <= 26 Referências Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemanm, P., Seewald, A., e Scuse, D. (2015). WEKA Manual for Version Braga, A. P., de Leon Ferreira de Carvalho, A. P., e Ludemir, T. B. (2007). Redes Neurais Artificiais. LTC, 2 ed. Fayyad, U., Piatetsky-Shapiro, G., e Smyth, P. (1996). From data mining to knowledge discovery in databases. In Advances in Knowledge Discovery and Data Mining, AAAI Press, p Kiamarzpour, F., Dianat, R., Bahrani, M., e Sadeghzadeh, M. (2013). Improving the methods of classification based on words ontology. International Journal of computer Science Issues, 10(1): Landis, J. R. e Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1): Lopes, L. A., Machado, V. P., e de Andrade Lira Rabêlo, R. (2014). Automatic cluster labeling through artificial neural networks. In International Joint Conference on Neural Networks, p Mitchell, T. M. (1997). Machine Learning. McGraw-Hill, 1 ed. Norving, P. e Russell, S. (2004). Inteligência Artificial. Campus, 2 ed. Pimentel, E. P., de França, V. F., e Omar, N. (2003). A identificação de grupos de aprendizes no ensino presencial utilizando técnicas de clusterização. In XIV Simpósio brasileiro de Informática na educação, p Pina, A. C., de Souza Colimodio, V., da Silva, A. A., e de Pina Filho, A. C. (2010). projeto de pontes usando algoritmos de aprendizagem de máquina. In VI Congresso Nacional de Engenharia Mecânica.
Alternativas para construção de classificadores de solos brasileiros
48 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Alternativas para construção de classificadores de solos brasileiros Matheus Agostini Ferraciolli¹ Luiz Manoel Silva Cunha² Resumo: Este
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisAPLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.
APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.NET Heloína Alves Arnaldo (bolsista do PIBIC/UFPI), Vinicius Ponte
Leia mais18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA
18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio
Leia maisMineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisFigura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC
Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios
Leia mais19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA
19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ
Leia maisAprendizado de Máquina
Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisImplementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
Leia maisTópicos Especiais em Informática Fatec Indaiatuba 13/07/2017
Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas
Leia maisDescoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisMineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra
Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação
Leia maisTCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados
Leia maisANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS
ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Abrantes Diniz 1, Fabiano Rosemberg de Moura Silva 2, Roberto Douglas da Costa 3, Thiago
Leia maisAprendizagem de Máquina
Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários
Leia maisAprendizado de Máquina
Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos
Leia maisData Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education
Data Science Data Stream Mining: trabalhando com dados massivos André Luís Nunes Porto Alegre, 2018 Globalcode Open4education Data Stream Mining trabalhando com dados massivos 2018 agenda andré luís nunes
Leia maisDESCOBERTA DE CONHECIMENTO ATRAVÉS DE MÉTODOS DE APRENDIZAGEM DE MÁQUINA SUPERVISIONADOS APLICADOS AO AMBIENTE VIRTUAL DE APRENDIZAGEM SIGAA/UFPI
DESCOBERTA DE CONHECIMENTO ATRAVÉS DE MÉTODOS DE APRENDIZAGEM DE MÁQUINA SUPERVISIONADOS APLICADOS AO AMBIENTE VIRTUAL DE APRENDIZAGEM SIGAA/UFPI TERESINA/PI MAIO/2017 ALINE MONTENEGRO LEAL SILVA - UNIVERSIDADE
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisAprendizagem de Máquinas
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM
Leia mais2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados
2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia mais7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS
7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução
Leia maisINTELIGÊNCIA ARTIFICIAL
INTELIGÊNCIA ARTIFICIAL Engenharia da Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto Dr. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisMineração de Textos na Web
Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na
Leia maisAprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Leia maisClassificação de Sentença
Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Aluno: Pablo Freire Matos Orientador: Dr. Ricardo Rodrigues Ciferri
Leia maisSBC - Sistemas Baseados em Conhecimento
Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O
Leia maisA contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe
A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe Leopoldo Ramos de Oliveira 1, Fausto Bernard Melo Soares 2, José Acácio de Jesus
Leia maisRevista hospedada em: Forma de avaliação: double blind review
Revista hospedada em: http://www.periodicosibepes.org.br Forma de avaliação: double blind review Esta revista é (e sempre foi) eletrônica para ajudar a proteger o meio ambiente, mas, caso deseje imprimir
Leia maisI. INTRODUÇÃO As transformações mais marcantes ocorridas na Educação a Distância (EaD) refletem a mudança de um ambiente
DESCOBERTA DE CONHECIMENTO ATRAVÉS DE MÉTODOS DE APRENDIZAGEM DE MÁQUINA SUPERVISIONADOS APLICADOS AO SIGAA/UFPI KNOWLEDGE DISCOVERY THROUGH SUPERVISED MACHINE LEARNING METHODS APPLIED TO SIGAA/UFPI Aline
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Leia maisAnálise do Desempenho Acadêmico Utilizando Redes Bayesianas: um estudo de caso
Análise do Desempenho Acadêmico Utilizando Redes Bayesianas: um estudo de caso Danilo Raniery Alves Coutinho, Thereza Padilha Departamento de Ciências Exatas - Universidade Federal da Paraíba (UFPB) Campus
Leia maisMineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio
Mineração de Dados Eduardo Raul Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Introdução: motivação, aplicações, conceitos básicos. Agrupamento
Leia maisInteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013
Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Leia maisEstudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública
Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública Autor: Gercely da Silva e Silva 1 1 Universidade Luterana do Brasil ULBRA Canoas, RS Brasil Resumo do Trabalho
Leia mais18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA
18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) JONAS RAFAEL ONOFRE Orientador(es) MARINA TERESA PIRES VIEIRA
Leia maisSQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina
Susana Rosich Soares Velloso SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção
Leia maisProfessor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;
Leia maisAbordagem Semi-supervisionada para Rotulação de Dados
Abordagem Semi-supervisionada para Rotulação de Dados Bruno Vicente Alves de Lima Universidade Federal do Piaui Email: brunovicente@ufpi.edu.br Vinicius Ponte Machado Universidade Federal do Piauí Email:
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina
Leia maisFACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.1. Introdução às Redes Neurais Artificiais (RNAs) 2.1.1. Motivação
Leia maisMineração de Dados Aplicada no Contexto Educacional
Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações
Leia maisMáquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino
Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,
Leia maisAprendizado de Máquina
Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisUtilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba
Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Thaís Barros Nascimento 1, Maria das Graças J. M. Tomazela 1 1 Faculdade
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados. Cenário
Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas
Leia maisDescoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes
Descoberta de conhecimento em textos - Análise semântica Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Introdução Diversidade de textos não padronizados; Emails, artigos,
Leia mais3 Aprendizado por reforço
3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina
Leia maisMáquinas de suporte vetorial e sua aplicação na detecção de spam
e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura
Leia maisKDD, Mineração de Dados e Algoritmo Apriori
Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.
Leia maisPREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO
PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos Carla Fernandes da SILVA 1 ; Clayton Silva MENDES 2. RESUMO A evasão escolar é um dos principais desafios a ser superado
Leia maisMINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO
5ª Jornada Científica e Tecnológica e 2º Simpósio de Pós-Graduação do IFSULDEMINAS 06 a 09 de novembro de 2013, Inconfidentes/MG MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de
Leia maisCLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão
Resumo CLARANS Diego Raphael Amancio Introdução PAM CLARA CLARANS Comparação de eficiência Conclusão 2 Artigo de Referência [1] Introdução Imagem do artigo original entitulado Efficient and Effective Clustering
Leia maisProf. Heitor Silvério Lopes
Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto
Leia maisAnálise de Risco de Crédito Bancário
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UFCG Curso de Mestrado em Informática Aluno: Francisco Fabian de Macedo Almeida Disciplina: Mineração de Dados Professor: Marcos Sampaio Data: 20 de dezembro de 2007
Leia maisSEMINÁRIO DOS ARTIGOS:
SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene
Leia maisUm Estudo sobre Técnicas de Aprendizado de Máquina aplicadas à Mineração de Dados
Um Estudo sobre Técnicas de Aprendizado de Máquina aplicadas à Mineração de Dados Maicon de Brito do Amarante 1, Denise Regina Pechmann 1 1 Departamento de Engenharias e Ciência da Computação Universidade
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Leia maisData Mining. Felipe E. Barletta Mendes. 21 de maio de 2008
21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é
Leia maisUm Método para Melhoria de Dados Estruturados de Imóveis
Universidade Federal de Pernambuco Centro de Informática Graduação em Ciência da Computação Um Método para Melhoria de Dados Estruturados de Imóveis Lucas Nunes de Souza Proposta de Trabalho de Graduação
Leia maisA MINERAÇÃO DE DADOS APLICADA A AVALIAÇÃO DA INFLUENCIA DA MEDIAÇÃO DO TUTOR NOS CURSOS DE GRADUAÇÃO EM EAD DO CEAR/ UEG
A MINERAÇÃO DE DADOS APLICADA A AVALIAÇÃO DA INFLUENCIA DA MEDIAÇÃO DO TUTOR NOS CURSOS DE GRADUAÇÃO EM EAD DO CEAR/ UEG Noeli Antônia Pimental Vaz 1, Pollyana dos Reis Fanstone 2, Neyde Maria da Silva
Leia maisInformática. Aprendizado de Máquina. Professor Márcio Hunecke.
Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:
Leia maisOrganização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
Leia maisInformática Parte 19 Prof. Márcio Hunecke
Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem
Leia mais5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO
102 5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO Conforme detalhado na seção 4.3, foram criados três conjuntos de dados: clientes BT com 382 padrões, clientes comerciais MT com 866 padrões e clientes industriais
Leia maisAgregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
Leia mais2COP229 Inteligência Computacional. Aula 3. Clusterização.
Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância
Leia mais6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA
Universidade Federal do ABC Rua Santa Adélia, 166 - Bairro Bangu - Santo André - SP - Brasil CEP 09.210-170 - Telefone/Fax: +55 11 4996-3166 1. CÓDIGO E NOME DA DISCIPLINA MC5004 - APRENDIZADO DE MÁQUINA
Leia maisEvaluation of Classifiers Based on Decision Tree for Learning Medical Claim Process
Evaluation of Classifiers Based on Decision Tree for Learning Medical Claim Process F. H. D. Araújo, A. M. Santana and P. Santos Neto Abstract Brazil has one of the largest private healthcare markets in
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Apresentação da Disciplina Edirlei Soares de Lima O que é Inteligência Artificial? O que é Inteligência Artificial? Área de pesquisa que tem
Leia maisProcesso de Descoberta de Conhecimento em Base de Dados para Previsão de Ocorrências de Espécimes de Peixe-Boi Marinho
Processo de Descoberta de Conhecimento em Base de Dados para Previsão de Ocorrências de Espécimes de Peixe-Boi Marinho Malena Caroline de M. Assunção 1, Jailson Nunes Leocadio 1, Vinicius Ponte Machado
Leia maisMineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará
Universidade Federal do Pará Centro de Ciências Exatas e Naturais Departamento de Informática Mineração de Dados Profa. MSc. Miriam Lúcia Domingues Curso de Especialização em Sistemas de Banco de Dados
Leia maisDESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias
DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos
Leia maisMétodos de Análise de Dados (AO-802)
Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados
Leia maisPentaho IoT Analytics Open Source Trilha IoT
Pentaho IoT Analytics Open Source Trilha IoT Marcio Junior Vieira CEO & Data Scientist, Ambiente Livre Marcio Junior Vieira Mini-cv 18 anos de experiência em informática, vivência em desenvolvimento e
Leia maisSistema Tutor Inteligente baseado em Agentes na plataforma MOODLE para Apoio as Atividades Pedagógicas da Universidade Aberta do Piauí
Sistema Tutor Inteligente baseado em Agentes na plataforma MOODLE para Apoio as Atividades Pedagógicas da Universidade Aberta do Piauí Samuel B. J. Silva, Vinicius Ponte Machado, Francisco N. C. Araújo
Leia maisAlgoritmo CLIQUE (Clustering In QUEst)
Algoritmo CLIQUE (Clustering In QUEst) Marcelo Camacho de Souza Nº USP: 3199616 Roteiro Algoritmo CLIQUE Exemplo Prático Complexidade Computacional Vantagens e Desvantagens Autores (IBM Almaden Research
Leia maisIdentificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais
Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente
Leia maisMineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.
Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos
Leia maisIN Redes Neurais
IN0997 - Redes Neurais Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática - CIn Departamento de Sistemas da Computação aluizioa@cin.ufpe.br Conteúdo Objetivos Quem usa
Leia maisA Mineração de Dados Educacionais como Apoio na Análise e Compreensão do Processo de Aprendizagem
Sánchez, J. (2018) Editor. Nuevas Ideas en Informática Educativa, Volumen 14, p. 545-550. Santiago de Chile. A Mineração de Dados Educacionais como Apoio na Análise e Compreensão do Processo de Aprendizagem
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia mais