Classificação de Sentença

Tamanho: px
Começar a partir da página:

Download "Classificação de Sentença"

Transcrição

1 Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Aluno: Pablo Freire Matos Orientador: Dr. Ricardo Rodrigues Ciferri Coorientador: Dr. Thiago Alexandre S. Pardo Área: Banco de Dados

2 Objetivo Identificar e extrair informações novas, úteis e interessantes em artigos científicos no domínio biomédico Foco: efeitos positivos e negativos (do tratamento) Anemia Falciforme Organização e armazenamento de informação em um BD para posterior mineração 2/15

3 O que é Anemia Falciforme? Hemácias Normais Hemácias Falciformes bloqueando o fluxo sanguíneo Hemácias passam livremente pelos vasos sanguíneos Hemácias Falciformes 3/15

4 Ambiente para Análise de Dados 4/15

5 Extração de Informação Seções processadas: Abstract, Results, Discussion (Results and Discussion) 5/15

6 Classes Classificação Supervisionada Treinamento Efeito Positivo Diversos arquivos com sentenças de efeito positivo Efeito Negativo Diversos arquivos com sentenças de efeito negativo Teste Novo texto TXT Efeito Positvo: The use of Hydroxyurea instead of transfusion for stroke prevention will avoid the risk of iron overload and the need of iron chelation Efeito Negativo: She died during the second year of therapy from acute severe anemia during an episode of splenic sequestration Outros Diversos arquivos com sentenças de outros Outros: Pregnancies occurred in 10 patients or their partners Saída Conjunto de sentenças classificadas em classes 6/15

7 Experimento: 1. Classificação manual pelos humanos? 2. É possível automatizar a classificação? 3. Se sim, qual o melhor algoritmo de AM? 7/15

8 1 - Classificação manual pelos humanos? Concordância em 50 sentenças K P( A) P( E) Fleiss (1971) 1 P( E) 8/15

9 2 - É possível automatizar a classificação? Annotator All the classes 3 experts naïve subjects 0.71 experts + naïve subjects 0.65 Agreement Poor Under 0 Slight 0 a 0.2 Scale Fair 0.21 a 0.4 Moderate 0.41 a 0.60 Substantial 0.61 a 0.80 Almost Perfect Between 0.81 and 1 Landis e Koch (1977) 9/15

10 3 - Sim, qual o melhor algoritmo de AM? Aprendizado Estatístico 1. SVM 2. NB Algoritmos de AM Aprendizado Simbólico Árvore de Decisão 3. ID3 4. J48 Regras 5. Prism 6. OneR Preprocessamento 1. No Filter (NF) 2. Randomize (RD) 3. Remove Misclassification (RM) 4. Resample (RS) 5. RM followed by RS 6. RS followed by RM Matriz Atributo-Valor 1. Frequência mínima = 2 2. Atributos de 1 a 3 gramas 1 (presente), 0 (ausente) 3. Não utilizado Remoção de Stopword Stemming 10/15

11 3 - Sim, qual o melhor algoritmo de AM? Distribuição das sentenças por classe 11/15

12 3 - Sim, qual o melhor algoritmo de AM? Melhores Resultados 12/15

13 - WEKA 13/15

14 Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Obrigado! Aluno: Pablo Freire Matos Orientador: Dr. Ricardo Rodrigues Ciferri Coorientador: Dr. Thiago Alexandre S. Pardo Área: Banco de Dados

15 Referências ANTHONY, L.; LASHKIA, G. V. Mover: a machine learning tool to assist in the reading and writing of technical papers. IEEE Transactions on Professional Communication, v. 46, n. 3, p , FLEISS, J. L. Measuring nominal scale agreement among many raters. Psychological Bulletin, v. 76, n. 5, p , LANDIS, J. R.; KOCH, G. G. The measurement of observer agreement for categorical data. Biometrics, v. 33, n. 1, p , MATOS, P. F. et al. An environment for data analysis in biomedical domain: information extraction for decision support systems. In: International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE), 23th, 2010, Proceedings... Springer, p /15

Extração de Informação Téc1 (Verbo e POS) e Téc2 (POS)

Extração de Informação Téc1 (Verbo e POS) e Téc2 (POS) Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Téc1 (Verbo e POS) e Téc2 (POS) Aluno: Pablo Freire Matos Orientador:

Leia mais

Ambiente Weka Waikato Environment for Knowledge Analysis

Ambiente Weka Waikato Environment for Knowledge Analysis Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Ambiente Weka Waikato Environment for Knowledge Analysis Classificação

Leia mais

EndNote X2 ( ) Organizador de Referências

EndNote X2 ( ) Organizador de Referências Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC X2 (1988-2008) Organizador de Referências Aluno: Pablo Freire Matos

Leia mais

Metodologia de Pré-processamento Textual para Extração de Informação sobre Efeitos de Doenças em Artigos Científicos do Domínio Biomédico

Metodologia de Pré-processamento Textual para Extração de Informação sobre Efeitos de Doenças em Artigos Científicos do Domínio Biomédico Metodologia de Pré-processamento Textual para Extração de Informação sobre Efeitos de Doenças em Artigos Científicos do Domínio Biomédico Pablo Freire Matos Ricardo Rodrigues Ciferri Orientador (DC/UFSCar)

Leia mais

Alternativas para construção de classificadores de solos brasileiros

Alternativas para construção de classificadores de solos brasileiros 48 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Alternativas para construção de classificadores de solos brasileiros Matheus Agostini Ferraciolli¹ Luiz Manoel Silva Cunha² Resumo: Este

Leia mais

Universidade de São Paulo (USP) Universidade Federal de São Carlos (UFSCar) Universidade Metodista de Piracicaba (Unimep)

Universidade de São Paulo (USP) Universidade Federal de São Carlos (UFSCar) Universidade Metodista de Piracicaba (Unimep) Universidade de São Paulo (USP) Universidade Federal de São Carlos (UFSCar) Universidade Metodista de Piracicaba (Unimep) Relatório Técnico Métricas de Avaliação http://gbd.dc.ufscar.br Projeto Um Ambiente

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

Um Processo Baseado em Parágrafos para a Extração de Tratamentos em Artigos Científicos do Domínio Biomédico

Um Processo Baseado em Parágrafos para a Extração de Tratamentos em Artigos Científicos do Domínio Biomédico Um Processo Baseado em Parágrafos para a Extração de Tratamentos em Artigos Científicos do Domínio Biomédico Juliana Lilian Duque 1, Pablo Freire Matos 1, Cristina Dutra de Aguiar Ciferri 2, Thiago Alexandre

Leia mais

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS

ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Abrantes Diniz 1, Fabiano Rosemberg de Moura Silva 2, Roberto Douglas da Costa 3, Thiago

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

Aprendizado por imitação usando Redes Neurais

Aprendizado por imitação usando Redes Neurais Universidade de São Paulo Instituto de Ciências Matemáticas e Computação Aprendizado por imitação usando Redes Neurais Aluna: Valéria de Carvalho Santos Profª. Dra. Roseli A. F. Romero 2 Sumário Introdução

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Ana Carolina Bras Costa 1, Êmile Cunha Lopes 1 1 Departamento de Informática Universidade Federal do Maranhão (UFMA)

Leia mais

UNIVERSIDADE FEDERAL DE SÃO CARLOS

UNIVERSIDADE FEDERAL DE SÃO CARLOS UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO INSTANCIAÇÃO, VALIDAÇÃO E EXTENSÃO DE UMA METODOLOGIA DE EXTRAÇÃO DE INFORMAÇÃO

Leia mais

UNIVERSIDADE FEDERAL DE SÃO CARLOS. Um Processo Baseado em Parágrafos para a Extração de Tratamentos de Artigos Científicos do Domínio Biomédico

UNIVERSIDADE FEDERAL DE SÃO CARLOS. Um Processo Baseado em Parágrafos para a Extração de Tratamentos de Artigos Científicos do Domínio Biomédico UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Um Processo Baseado em Parágrafos para a Extração de Tratamentos de Artigos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

O uso da Inteligência Articial no auxílio à tomada de decisões para alocação dinâmica de recursos. F. C. Xavier

O uso da Inteligência Articial no auxílio à tomada de decisões para alocação dinâmica de recursos. F. C. Xavier O uso da Inteligência Articial no auxílio à tomada de decisões para alocação dinâmica de recursos F. C. Xavier Technical Report - RT-INF_001-11 - Relatório Técnico June - 2011 - Junho The contents of this

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

1ª JORNADA CIENTÍFICA DA UNIOESTE 24 a 26/10/2001 CASCAVEL/PR

1ª JORNADA CIENTÍFICA DA UNIOESTE 24 a 26/10/2001 CASCAVEL/PR APLICAÇÃO DE TÉCNICAS DE APRENDIZADO DE MÁQUINA PARA EXTRAÇÃO DE CONHECIMENTO E CONSTRUÇÃO DE CLASSIFICADORES: ESTUDO DE CASO DE BASES DE DADOS MÉDICAS Ferro, M; Lee, H.D; Chung, W.F. Universidade Estadual

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Autoescalonamento de máquinas virtuais baseado em séries temporais e thresholds.

Autoescalonamento de máquinas virtuais baseado em séries temporais e thresholds. Autoescalonamento de máquinas virtuais baseado em séries temporais e thresholds. Paulo Roberto Pereira da Silva Orientador: Prof. Paulo Maciel Coorientador: Prof. Jean Teixeira Introdução A computação

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Um Método para Melhoria de Dados Estruturados de Imóveis

Um Método para Melhoria de Dados Estruturados de Imóveis Universidade Federal de Pernambuco Centro de Informática Graduação em Ciência da Computação Um Método para Melhoria de Dados Estruturados de Imóveis Lucas Nunes de Souza Proposta de Trabalho de Graduação

Leia mais

Métodos Quantitativos e Qualitativos na Engenharia (M2QE) Quantitative and Qualitative Methods in Engineering (QQME)

Métodos Quantitativos e Qualitativos na Engenharia (M2QE) Quantitative and Qualitative Methods in Engineering (QQME) Métodos Quantitativos e Qualitativos na Engenharia (M2QE) ------- Quantitative and Qualitative Methods in Engineering (QQME) Guimarães, 3 de outubro de 2013 Escola de Engenharia, Campus de Azurém Some

Leia mais

Mineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC

Mineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC Mineração de Dados com Big Data Prof. Fabrício Olivetti de França Universidade Federal do ABC Sobre mim Formado em Engenharia Elétrica com ênfase em Computação pela Universidade Católica de Santos. Mestrado

Leia mais

Aprendizado de Máquina para o Problema de Sentiment Classification

Aprendizado de Máquina para o Problema de Sentiment Classification Pedro Oguri Aprendizado de Máquina para o Problema de Sentiment Classification Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós

Leia mais

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos 17 I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos Renan Gomes Pereira 1 Maria Fernanda Moura 2 Resumo: O objetivo deste trabalho é apresentar a ferramenta I-Preproc,

Leia mais

com Big Data Fabrício Olivetti de França Universidade Federal do ABC

com Big Data Fabrício Olivetti de França Universidade Federal do ABC Mineração de Dados com Big Data Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Sobre mim 2. Sobre a Disciplina 1 Sobre mim Sobre mim Formado em Engenharia Elétrica com ênfase em Computação

Leia mais

UNIVERSIDADE FEDERAL DE SÃO CARLOS

UNIVERSIDADE FEDERAL DE SÃO CARLOS UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Metodologia de Pré-processamento Textual para Extração de Informação sobre

Leia mais

Recuperação de Informação em Bases de Texto

Recuperação de Informação em Bases de Texto Recuperação de Informação em Bases de Texto Mestrado em Engenharia Informática Universidade de Évora 2010/2011 Paulo Quaresma pq@di.uevora.pt http://www.moodle.uevora.pt 1 Objectivos Programa Avaliação

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

Sobre o curso. Fabrício Olivetti de França. Universidade Federal do ABC

Sobre o curso. Fabrício Olivetti de França. Universidade Federal do ABC Sobre o curso Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Sobre mim 2. Sobre a Disciplina 1 Sobre mim Sobre mim Formado em Engenharia Elétrica com ênfase em Computação pela Universidade

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Sumário. Trabalho que foi desenvolvido. Introdução

Sumário. Trabalho que foi desenvolvido. Introdução Proposta de um sistema de Classificação de Notícias utilizando técnicas de Aprendizagem de Máquina integrado com o ClippingBr Bruno Campagnolo de Paula PROJETO FINAL DA DISCIPLINA DE MACHINE LEARNING Mestrado

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

Data Science A ciência de dados em redes sociais: uma análise sobre o Facebook Leonardo Sápiras

Data Science A ciência de dados em redes sociais: uma análise sobre o Facebook Leonardo Sápiras Data Science A ciência de dados em redes sociais: uma análise sobre o Facebook Leonardo Sápiras Mestre em Ciência da Computação Apresentação Bacharel em Sistemas de Informação (FACCAT) Mestre em Ciência

Leia mais

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Susana Rosich Soares Velloso SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção

Leia mais

Uma Investigação sobre Algoritmos de Diferentes Abordagens de Aprendizado Supervisionado na Classificação de Papéis Retóricos em Resumos Científicos

Uma Investigação sobre Algoritmos de Diferentes Abordagens de Aprendizado Supervisionado na Classificação de Papéis Retóricos em Resumos Científicos Uma Investigação sobre Algoritmos de Diferentes Abordagens de Aprendizado Supervisionado na Classificação de Papéis Retóricos em Resumos Científicos Vinícius M. A. de Souza 1 e Valéria D. Feltrim 2 1 Instituto

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática

Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2015.1 Análise de dados públicos de saúde com redes SOM Proposta de Trabalho de Graduação Aluno: Vítor Hugo Antero

Leia mais

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Luiz Henrique Dutra da Costa (PIBIC/Unioeste), Carlos Andres Ferrero, Cláudio Saddy Rodrigues

Leia mais

Uma Abordagem de Gerenciamento Contextual de Recursos Dinâmicos em Ambientes Pervasivos: Estudo de Caso em Aplicações de Home Care

Uma Abordagem de Gerenciamento Contextual de Recursos Dinâmicos em Ambientes Pervasivos: Estudo de Caso em Aplicações de Home Care Uma Abordagem de Gerenciamento Contextual de Recursos Dinâmicos em Ambientes Pervasivos: Estudo de Caso em Aplicações de Home Care LORAYNE PINHEIRO DORNELLES LEANDRO KRUG WIVES 2016 Sumário 01 Introdução

Leia mais

Mathematical Morphology An Overview

Mathematical Morphology An Overview Universidade Federal Fluminense Instituto de Computação Mathematical Morphology An Overview Jacó Júlio de Souza Costa jacojulio@gmail.com jacojulio@id.uff.br March 29, 2019 Sumário 1 Definição do Tema

Leia mais

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho Reconhecimento de palma de mão Peterson Wagner Kava de Carvalho 1 Sumário 1. Introdução 2. Artigo 1: Palmprint Recognition a. Pré-Processamento b. Extração de Features c. Classificação d. Resultados 3.

Leia mais

A MINERAÇÃO DE DADOS APLICADA A AVALIAÇÃO DA INFLUENCIA DA MEDIAÇÃO DO TUTOR NOS CURSOS DE GRADUAÇÃO EM EAD DO CEAR/ UEG

A MINERAÇÃO DE DADOS APLICADA A AVALIAÇÃO DA INFLUENCIA DA MEDIAÇÃO DO TUTOR NOS CURSOS DE GRADUAÇÃO EM EAD DO CEAR/ UEG A MINERAÇÃO DE DADOS APLICADA A AVALIAÇÃO DA INFLUENCIA DA MEDIAÇÃO DO TUTOR NOS CURSOS DE GRADUAÇÃO EM EAD DO CEAR/ UEG Noeli Antônia Pimental Vaz 1, Pollyana dos Reis Fanstone 2, Neyde Maria da Silva

Leia mais

PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY

PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY Especial Innovation Day 2015 PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY FORECASTING IN TIME SERIES COMBINING STATISTICAL MODELS AND FUZZY CONCEPTS Data de entrega dos

Leia mais

Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados

Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Silvani Weber da Silva Borges 1 (PIBIC/CNPq/Unioeste), Renato B. Machado (Orientador), Newton Spolaôr

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words

Leia mais

Caracterização de Imagens via Redes Neurais Artificiais

Caracterização de Imagens via Redes Neurais Artificiais Caracterização de Imagens via Redes Neurais Artificiais Autor: Eduardo Ferreira Ribeiro 1, Orientadora: Celia Zorzo Barcelos 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal

Leia mais

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Reconhecimento de texturas utilizando padrão binário local e classificador knn. Reconhecimento de texturas utilizando padrão binário local e classificador knn. Vinicius Santos Andrade 1 Resumo. Através de uma imagem é possível obter inúmeras informações. Portanto, é cada vez mais

Leia mais

6º Congresso de Pós-Graduação AUTOMATIZAÇÃO DO PROCESSO DE CRIAÇÃO DE VISÕES PARA MODELAGEM DE DW

6º Congresso de Pós-Graduação AUTOMATIZAÇÃO DO PROCESSO DE CRIAÇÃO DE VISÕES PARA MODELAGEM DE DW 6º Congresso de Pós-Graduação AUTOMATIZAÇÃO DO PROCESSO DE CRIAÇÃO DE VISÕES PARA MODELAGEM DE DW Autor(es) RICARDO ALEXANDRE NEVES Orientador(es) MARINA TERESA PIRES VIEIRA 1. Introdução Um data warehouse

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

Visualização de Informação Parte III. Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities.

Visualização de Informação Parte III. Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities. Visualização de Informação Parte III Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities. Rosane Minghim + The team Instituto de Ciências Matemáticas e de

Leia mais

UTILIZAÇÃO DE TÉCNICAS DE APRENDIZADO DE MÁQUINA NO RECONHECIMENTO DE ENTIDADES NOMEADAS NO PORTUGUÊS

UTILIZAÇÃO DE TÉCNICAS DE APRENDIZADO DE MÁQUINA NO RECONHECIMENTO DE ENTIDADES NOMEADAS NO PORTUGUÊS 73 UTILIZAÇÃO DE TÉCNICAS DE APRENDIZADO DE MÁQUINA NO RECONHECIMENTO DE ENTIDADES NOMEADAS NO PORTUGUÊS ISSN: 1984-3151 USE OF MACHINE LEARNING TECHNIQUES IN RECOGNITION OF PORTUGUESE NAMED ENTITIES Paulo

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Extração de Atributos para Reconhecimento de Expressões Faciais

Extração de Atributos para Reconhecimento de Expressões Faciais Extração de Atributos para Reconhecimento de Expressões Faciais Vinícius Assis Saueia da Silva 1 1. Introdução Interação Homem-Computador é uma das áreas da computação que procuram fazer com que o ser

Leia mais

Universidade de Lisboa University of Lisbon. Instituto Superior de Ciências Sociais e Políticas School of Social and Political Sciences

Universidade de Lisboa University of Lisbon. Instituto Superior de Ciências Sociais e Políticas School of Social and Political Sciences Estabelecimento Unidade Orgânica Plano de Estudos Study Plan Tipo (diurno ou pós-laboral) Type Universidade de Lisboa University of Lisbon Instituto Superior de Ciências Sociais e Políticas School of Social

Leia mais

Pesquisadora: Flávia Maria Santoro Instituição: Universidade do Rio de Janeiro UNIRIO Período previsto: Janeiro 2004 Dezembro 2007.

Pesquisadora: Flávia Maria Santoro Instituição: Universidade do Rio de Janeiro UNIRIO Período previsto: Janeiro 2004 Dezembro 2007. Projeto de Pesquisa: Suporte à Aprendizagem Organizacional e Gestão de Conhecimento através de Ambientes de Aprendizagem Cooperativa Apoiada por Computador Pesquisadora: Flávia Maria Santoro Instituição:

Leia mais

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO Fernanda Maria Sirlene Pio SUMARIO Introdução Trabalhos Relacionados Metodologia Experimentos Conclusão Referências 2 INTRODUÇÃO Reconhecimento de Padrões

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais

Diagnóstico do Glaucoma em Imagens de Fundo de Olho Usando Matriz de Coocorrência e SVM

Diagnóstico do Glaucoma em Imagens de Fundo de Olho Usando Matriz de Coocorrência e SVM Diagnóstico do Glaucoma em Imagens de Fundo de Olho Usando Matriz de Coocorrência e SVM Mayara Gomes Silva 1, Nelia Cantanhede Reis 1, João Dallyson Sousa de Almeida 1 1 Núcleo de Computação Aplicada (NCA),

Leia mais

Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos

Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos Introdução * Método supervisionado de aprendizagem de máquina * Empregado em classificação de dados Classificação binária

Leia mais

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Máquinas de suporte vetorial e sua aplicação na detecção de spam e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

Descoberta de Conhecimento através de Métodos de Aprendizado de Máquina em Sistemas de Gerenciamento de Aprendizagem: um mapeamento sistemático

Descoberta de Conhecimento através de Métodos de Aprendizado de Máquina em Sistemas de Gerenciamento de Aprendizagem: um mapeamento sistemático III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos, v. 1, n. 1, p. 182-188, jun, 2017. www.eripi.com.br/2017 - ISBN: 978-85-7669-395-6 Descoberta de Conhecimento através de

Leia mais

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education Data Science Data Stream Mining: trabalhando com dados massivos André Luís Nunes Porto Alegre, 2018 Globalcode Open4education Data Stream Mining trabalhando com dados massivos 2018 agenda andré luís nunes

Leia mais

Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática

Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática DETECÇÃO DE BORDAS DE IMAGENS UTILIZANDO ELEMENTOS DE MORFOLOGIA MATEMÁTICA PROPOSTA DE TRABALHO DE GRADUAÇÃO

Leia mais

Um Estudo sobre Métodos de Classificação Multirrótulo

Um Estudo sobre Métodos de Classificação Multirrótulo Um Estudo sobre Métodos de Classificação Multirrótulo Everton Alvares Cherman 1, Maria Carolina Monard 1 1 Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Laboratório de Inteligência

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO. Análise da Eficiência da Codificação de Huffman em Extensões de Fontes de Informação

UNIVERSIDADE FEDERAL DE PERNAMBUCO. Análise da Eficiência da Codificação de Huffman em Extensões de Fontes de Informação UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2012.2 Análise da Eficiência da Codificação de Huffman em Extensões de Fontes de Informação PROPOSTA DE TRABALHO

Leia mais

Computação Evolucionária Aplicada ao Problema de Seleção de Características em Text Mining

Computação Evolucionária Aplicada ao Problema de Seleção de Características em Text Mining Computação Evolucionária Aplicada ao Problema de Seleção de Características em Text Mining João R. Carrilho Jr., Marco Aurélio C. Pacheco ICA: Applied Computational Intelligence Laboratory Department of

Leia mais

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Dissertação de Mestrado em Informática Sídnei Augusto Drovetto Jr.

Leia mais

Análise do Prontuário médico para a utilização com KDD

Análise do Prontuário médico para a utilização com KDD Análise do Prontuário médico para a utilização com KDD Kathya Collazos L. 1, Jorge Muniz Barreto 2, Gisele F. Pellegrini 3 1,3 Grupo de Pesquisas em Engenharia Biomédica (GPEB), Departamento de Engenharia

Leia mais

Índice Bitmap e Indexação de Ambientes de Data Warehousing

Índice Bitmap e Indexação de Ambientes de Data Warehousing Índice itmap e Indexação de Ambientes de Data Warehousing Jaqueline Joice rito jjbrito@icmc.usp.br 3 de Junho de 23 Roteiro Índice itmap Técnicas de otimização Adaptação da apresentação de Sérgio L. Díscola

Leia mais

UMA ARQUITETURA PARA SISTEMA DE INFORMAÇÃO SOBRE SOLOS VOLTADA PARA O ZONEAMENTO AGRÍCOLA

UMA ARQUITETURA PARA SISTEMA DE INFORMAÇÃO SOBRE SOLOS VOLTADA PARA O ZONEAMENTO AGRÍCOLA UMA ARQUITETURA PARA SISTEMA DE INFORMAÇÃO SOBRE SOLOS VOLTADA PARA O ZONEAMENTO AGRÍCOLA RENATO FILETO 1 MARIA LEONOR RIBEIRO CASIMIRO LOPES ASSAD 2 JOÃO DOS SANTOS VILLA DA SILVA 1 AMARINDO FAUSTO SOARES

Leia mais

Identificação de alertas de segurança virtual veiculados no Twitter

Identificação de alertas de segurança virtual veiculados no Twitter Identificação de alertas de segurança virtual veiculados no Twitter Orientador: Daniel M. Batista Coorientadora: Elisabeti Kira Instituto de Matemática e Estatística IME-USP 27 de Janeiro de 2015 Introdução

Leia mais

NEPaLE: Uma ferramenta computacional de suporte à avaliação de paráfrases

NEPaLE: Uma ferramenta computacional de suporte à avaliação de paráfrases NEPaLE: Uma ferramenta computacional de suporte à avaliação de paráfrases Rafael de Oliveira Teixeira 1, Eloize Rossi Marques Seno 1, Helena de Medeiros Caseli 2 1 Instituto Federal de São Paulo câmpus

Leia mais

Métodos para Classificação: - Naïve Bayes.

Métodos para Classificação: - Naïve Bayes. Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo

Leia mais

Uma Solução Baseada em Software Livre para Detecção e Avaliação de Cola em Provas Escolares

Uma Solução Baseada em Software Livre para Detecção e Avaliação de Cola em Provas Escolares Uma Solução Baseada em Software Livre para Detecção e Avaliação de Cola em Provas Escolares Elmano R. Cavalcanti, Carlos Eduardo Pires Departamento de Sistemas e Computação Universidade Federal de Campina

Leia mais

Predição de Utilização de Recursos Computacionais Usando Séries Temporais

Predição de Utilização de Recursos Computacionais Usando Séries Temporais Predição de Utilização de Recursos Computacionais Usando Séries Temporais Aluno: Paulo Roberto Pereira da Silva Orientador: Paulo Romero Martins Maciel Coorientador: Jean Carlos Teixeira de Araujo de Garanhuns

Leia mais

UNIVERSIDADE FEDERAL DA BAHIA

UNIVERSIDADE FEDERAL DA BAHIA UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO RECUPERAÇÃO DE ARQUITETURA DE SOFTWARE UTILIZANDO ALGORITMOS DE AGRUPAMENTO ALUNO: DENNIS LESSA

Leia mais

Redução de falsos positivos em imagens de mamografias digitais usando os índices phylogenetic species variability, phylogenetic species richness

Redução de falsos positivos em imagens de mamografias digitais usando os índices phylogenetic species variability, phylogenetic species richness Redução de falsos positivos em imagens de mamografias digitais usando os índices phylogenetic species variability, phylogenetic species richness e classificador MVS Laércio N. Mesquita 1, Antônio O. de

Leia mais

UNIVERSIDADE FEDERAL DE SÃO CARLOS

UNIVERSIDADE FEDERAL DE SÃO CARLOS UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Metodologia de Pré-processamento Textual para Extração de Informação sobre

Leia mais

Método Supervisionado para Identificação de Dúvidas em Fóruns Educacionais

Método Supervisionado para Identificação de Dúvidas em Fóruns Educacionais Método Supervisionado para Identificação de Dúvidas em Fóruns Educacionais Vitor B. Rolim 1, Rafael Ferreira 1, Evandro Costa 2 1 DEINFO Universidade Federal Rural de Pernambuco (UFRPE) Caixa Postal s/n

Leia mais

Estudo Comparativo de Estratégias de Classificação de Páginas Web

Estudo Comparativo de Estratégias de Classificação de Páginas Web Thoran Araguez Rodrigues Estudo Comparativo de Estratégias de Classificação de Páginas Web Dissertação de Mestrado Dissertação apresentada ao Programa de Pós-Graduação em Informática da Pontifícia Universidade

Leia mais