Aplicação de Mineração de Textos na Indicação de Palavras-chave em Artigos Científicos

Tamanho: px
Começar a partir da página:

Download "Aplicação de Mineração de Textos na Indicação de Palavras-chave em Artigos Científicos"

Transcrição

1 Aplicação de Mineração de Textos na Indicação de Palavras-chave em Artigos Científicos Mariane Regina Sponchiado Cassenote 1, Adriel Secco 1, Rodrigo Luiz Antoniazzi 1, Patricia Mariotto Mozzaquatro Chicon 1 1 Curso de Ciência da Computação Universidade de Cruz Alta Cruz Alta, RS Brasil {mariane.sponchiado,adsecco}@gmail.com, {rantoniazzi,pmozzaquatro}@unicruz.edu.br Abstract. This study aims to minimize the effects of the scarce precision of results obtained through research on search engines related to the academic field. For this, we used Text Mining techniques to qualitatively analyze the efficiency of Keyphrase Extraction Algorithm method. From this, it has proven tool efficiency while extracting keywords of scientific papers. Moreover, it became possible to add greater quality and accuracy to the recommendation of materials to scholars and professionals. Resumo. Este estudo visa minimizar os reflexos da escassa precisão de resultados obtidos por meio de pesquisas em motores de buscas relacionados à área acadêmica. Para tanto, foram utilizadas técnicas de Mineração de Textos a fim de analisar qualitativamente a eficiência do método Keyphrase Extraction Algorithm. A partir disso, comprovou-se a eficiência da ferramenta enquanto extratora de palavras-chave de documentos científicos. Ademais, tornou-se possível agregar maior qualidade e precisão à recomendação de materiais a acadêmicos e profissionais. 1. Introdução Diante da constante expansão tecnológica observada em todos os segmentos da sociedade contemporânea, é notável o emprego de recursos computacionais enquanto facilitadores do processo de ensino-aprendizagem. Tal fenômeno permite que o educando desempenhe um papel ativo na construção de seu próprio conhecimento. Todavia, é de fundamental importância que o aluno saiba interpretar e analisar as informações que chegam até ele, assim como classificá-las quanto à sua pertinência para o contexto desejado. Segundo Silva (2009), encontrar um documento relevante pode se tornar uma atividade trabalhosa e demorada, desestimulante para a maioria dos acadêmicos, os quais acabam por não recorrer a materiais complementares para enriquecer seu aprendizado. Nesse contexto, existem inúmeros mecanismos de buscas que permitem a seleção de materiais a partir de palavras-chave ou catálogos de assuntos. Entretanto, essas ferramentas apresentam limitações relacionadas à compreensão dos termos utilizados como delimitadores de pesquisas, recuperando materiais relacionados somente a esses vocábulos.

2 De acordo com Silva (2009), a recuperação de material relevante, direcionado aos objetivos de aprendizagem, de forma simples e rápida é desejável. Neste sentido, a utilização de ferramentas que identificam automaticamente materiais relevantes às necessidades dos alunos é extremamente importante para minimizar o tempo gasto na localização de material didático adequado e, sobretudo, maximizar as chances de sucesso no processo de assimilação de conteúdo. Frente ao exposto, este estudo visa apresentar uma análise sobre Processamento de Linguagem Natural (PLN) englobando técnicas de Mineração de Textos por meio do método de extração de palavras-chave Keyphrase Extraction Algorithm (KEA). A partir dos resultados obtidos, espera-se agregar maior qualidade e precisão à recomendação de materiais científicos à alunos e docentes, contribuindo para a fluência do processo de construção do conhecimento. 2. Descoberta de Conhecimento em Textos Mineração de Textos ou Knowledge Discovery from Texts (KDT) é o processo de descoberta de conhecimento potencialmente relevante e previamente desconhecido em bases de dados desestruturadas, ou seja, extração de conhecimento útil para o usuário em bases textuais (SOUZA, 2011). O processo de KDT é iterativo e interativo, sendo que transforma dados de baixo nível em conhecimento de alto nível, preocupa-se em extrair informações valiosas para o usuário a partir da recuperação de informações e faz com que o mesmo procure o que lhe interessa em um conjunto de textos pré-selecionados. Conforme Beppler e Fernandes (2005), KDT engloba técnicas e ferramentas inteligentes e automáticas que auxiliam na análise de grandes volumes de dados com o intuito de garimpar, beneficiando não somente usuários de documentos eletrônicos da internet, mas qualquer domínio que utiliza textos não estruturados. Em seu estudo, Beppler e Fernandes (2005) apontam que a forma mais comum de armazenamento de informação é a abrangida pelo KDT, visto que cerca de 80% das informações de grandes empresas e organizações estão contidas em documentos textuais. Esses arquivos podem estar armazenados como textos livres (escritos em alguma linguagem natural sem organização nenhuma), textos semiestruturados (contendo alguma estrutura), textos em linguagem restrita (um subconjunto de linguagem natural com formatos específicos), dicionários e campos tipo texto em sistemas estruturados (como o resumo de um livro em um sistema bibliográfico) (FURTADO, 2004). O processo de KDT tem sido aplicado em diversos meios e situações. No entanto, Moura (2004) afirma que as principais contribuições desta área estão relacionadas à busca de informações específicas em documentos, a análise qualitativa e quantitativa de grandes volumes de textos, além da melhor compreesão de informações. Esses materiais podem estar representados nas mais diversas formas, dentre elas: s; arquivos de diferentes formatos (.pdf,.doc,.txt, por exemplo); páginas Web; campos textuais em bancos de dados; textos eletrônicos digitalizados a partir de papéis.

3 3. Etapas do processo de Descoberta de Conhecimento em Textos Apesar da falta de consenso na literatura atual, o KDT é um processo que tem como objetivo a obtenção de conhecimento e pode ser segmentado em etapas. Aranha, Vellasco e Passos (2007) propõem um modelo dividido em cinco fases, sendo elas: Coleta, Pré-processamento, Indexação, Mineração de Texto e Análise. O método KEA, o qual foi utilizado na validação deste estudo, baseia-se nesse paradigma, conforme pode ser observado na Figura 1. Figura 1. Etapas do processo de KDT (ARANHA; VELASCO; PASSOS, 2007) A seguir apresenta-se uma breve descrição de cada uma das etapas do processo de KDT: Coleta de Dados: A primeira etapa do processo é a coleta de documentos, que consiste na busca de textos relevantes ao domínio da aplicação do conhecimento a ser extraído. Segundo Fayyad, Piatetsky-Shapiro e Smyth (1996), o sucesso da atividade de coleta de documentos depende, em parte, da intervenção de um especialista. Segundo os autores, ele não só fornece conhecimento sobre o domínio, como também apoia a tarefa de encontrar os objetos almejados. Basicamente, são três os principais ambientes de localização de fontes de dados: pastas de arquivos encontrados no disco rígido de usuários, tabelas de diversos bancos de dados e a internet (ARANHA, VELLASCO e PASSOS, 2007). Pré-processamento: Após a coleta é necessário formatar os documentos selecionados, pois serão submetidos aos algoritmos de Mineração de Textos. O principal objetivo do pré-processamento é aumentar a qualidade inicial dos dados, nos quais diversas técnicas podem ser aplicadas e até mesmo combinadas. De acordo com Carrilho (2007), a etapa de pré-processamento faz uso de técnicas de PLN e consiste nas seguintes fases: tokenização (análise léxica), eliminação de termos considerados irrelevantes, ou stopwords, assim como a normalização morfológica dos termos. Indexação: Pode-se afirmar que Indexação é o processo que organiza todos os termos adquiridos a partir de fontes de dados, facilitando seu acesso e recuperação. Uma boa estrutura de índices garante rapidez e agilidade ao processo, tal como funciona o índice de um livro. Para Filho (2009), indexar é criar uma estrutura de dados capaz de

4 armazenar os termos presentes nos documentos de forma a permitir o acesso eficiente ao conteúdo dos mesmos. Soares (2013) ressalta que a fase de Indexação é diretamente influenciada pela etapa de Pré-processamento, visto que todo o conteúdo que será indexado, ou não, foi determinado por esse estágio. Desta forma, quando a etapa de Préprocessamento faz uso de recursos de PLN e, com isso, fornece características linguísticas do texto processado, a etapa de Indexação utiliza esses dados ricos em semântica na construção do índice. Mineração de Texto: O objetivo da Mineração de Texto é a descoberta de conhecimento útil, novo e relevante a partir de dados não estruturados. Contudo, Filho (2009) afirma que, com a aplicação das etapas anteriores de KDT (Coleta, Pré- Processamento e Indexação), tem-se neste momento não mais dados não estruturados, mas sim dados estruturados, organizados com base na estrutura escolhida no processo de indexação. Soares (2013) comenta que a escolha do algoritmo a ser utilizado nesta etapa está relacionada com o propósito da tarefa de Mineração de Textos. Esse objetivo, definido no início do processo, irá determinar quais as opções possíveis de Aprendizado de Máquina que se aplicam ao problema. Além disso, outros detalhes devem ser considerados. Por exemplo, a necessidade ou não de que o conhecimento aprendido seja facilmente interpretável, o que pode descartar da lista de opções possíveis algoritmos de Aprendizado de Máquina do tipo caixa preta, como Redes Neurais. Isso se deve ao fato de que a compreensão da Rede Neural resultante de um processo de aprendizado não é uma tarefa trivial e requer esforço adicional para a extração das regras aprendidas por essa técnica. Análise da Informação: Esta fase do processo de KDT também pode ser chamada de Pós-processamento e diz respeito à verificação da eficiência da aplicação dos algoritmos da etapa anterior. Em outras palavras, é o momento de se avaliar se o objetivo de descobrir conhecimento novo e inovador a partir de grandes quantidades de documentos não estruturados foi cumprido da melhor forma possível (FILHO, 2009). 4. Metodologia A etapa inicial da validação deste estudo deu-se a partir da coleta dos materiais a serem analisados. Neste caso, optou-se pela utilização dos artigos científicos pertencentes aos anais do XVII Seminário Internacional de Educação do Mercosul 1, evento realizado na Universidade de Cruz Alta no ano de Ao todo foram elencados 132 (cento e trinta e dois) trabalhos que abrangem as mais diversas áreas do conhecimento. Logo após, foi realizado o pré-processamento dos textos a fim de formatar os documentos selecionados. Para tanto, eliminou-se manualmente as seções resumo e palavras-chave tanto na língua inglesa quanto no Português. Esse procedimento se fez necessário para que fosse possível fazer o levantamento de palavras-chave dos textos de forma pura, sem a interferência dos termos considerados importantes pelos autores dos artigos. Retirou-se também os segmentos dos textos que continham as referências bibliográficas, tendo em vista que as mesmas costumam conter hiperlinks e caracteres especiais que poderiam interferir na atividade de mineração. 1 Disponível em: <

5 A aplicação do algoritmo KEA 2 deu-se na terceira etapa de validação deste estudo a partir da plataforma Eclipse 3.8, executada na versão do Sistema Operacional Ubuntu. O método trabalhado, proposto por Witten et al. (1999) e projetado originalmente para a língua inglesa, foi adaptado para o Português em Dias (2004). Constatou-se, após as modificações efetuadas pela autora, que o recurso apresentou resultados satisfatórios e qualitativamente similares aos obtidos pela ferramenta original quando aplicada ao Inglês. A técnica de Aprendizado de Máquina envolvida no KEA constrói um modelo de predição usando documentos de Treinamento com palavras-chave conhecidas e então utiliza o modelo construído para encontrar termos importantes em novos textos, ou seja, em documentos cujas palavras-chave não são conhecidas. Assim, 32 (trinta e dois) artigos foram escolhidos aleatoriamente a fim de servirem como base para a etapa de Treinamento do algoritmo. O restante da massa de documentos levantada foi aplicada no estágio de Teste, cuja execução torna acessíveis os resultados do processo de mineração. Para este estudo definiu-se como 15 (quinze) o número de palavras-chave limite levantadas pelo KEA, tendo em vista que essa quantia foi considerada ideal nos experimentos realizados por Dias (2004). Por fim, a partir dos resultados obtidos pela fase de Teste do método KEA foram selecionados aleatoriamente cinco artigos. Assim, realizou-se um comparativo entre as palavras-chave apontadas pelos autores e aquelas descobertas pelo algoritmo, além de uma análise da pertinência dos termos processados frente ao assunto geral de cada um dos trabalhos. 5. Resultados e Discussões No decorrer do processo de validação deste estudo, objetivou-se analisar a qualidade das palavras-chave extraídas automaticamente pelo algoritmo KEA, tanto em relação aos termos associados pelos próprios autores, quanto em uma inspeção manual do conteúdo dos textos. Conforme descrito na seção anterior, foram utilizados 32 (trinta e dois) documentos para a etapa de Treinamento e 100 (cem) para a fase de Teste. A partir disso, selecionou-se aleatoriamente os seguintes artigos para análise de resultados: Oportunidades de Experiências Motoras em Crianças de Dez Anos (FORTES; PEDROSO; PANDA, 2015): Neste caso, é possível concluir que o método KEA conseguiu encontrar todos os termos eleitos pelos autores como palavras-chave, conforme pode ser observado na Tabela 1. O artigo traz uma pesquisa acerca das oportunidades de experiências motoras de alunos de escolas do centro e da periferia da cidade na faixa dos dez anos, objetivando analisar o espaço onde elas brincam, o tipo de atividade que realizam e a influência das mesmas em seu desenvolvimento motor. Assim, considera-se que as palavras-chave encontradas após o processo de mineração são condizentes com o conteúdo do texto. 2 Disponível em: <

6 Palavras-chave indicadas pelos autores Crianças desenvolvimento motor experiências motoras Tabela 1. Primeiro artigo avaliado crianças motoras brincadeiras periferia centro da cidade residem centro desenvolvimento motor alunos do centro alunos da periferia gráfico motoras em crianças fina dez anos experiências motoras Problema do Caixeiro Viajante Utilizando Algoritmo Genético no Ambiente em Nuvem (HAAS; PADILHA; MONTEIRO; BECK, 2015): Assim como no resultado anterior, foi possível localizar por meio do método KEA todas as palavras-chave eleitas pelos autores (Tabela 2). Observa-se, no entanto, que alguns termos simples se repetem em mais de uma palavra-chave, como em problema do caixeiro e problema do caixeiro viajante. No que tange a pertinência dos termos apontados em relação ao conteúdo geral do texto, acredita-se que a busca tenha obtido resultados satisfatórios, tendo em vista que o trabalho traz uma reflexão sobre o problema do caixeiro viajante associado à computação em nuvem. Tabela 2. Segundo artigo avaliado Palavras-chave indicadas pelos autores computação em nuvem algoritmo genético caixeiro viajante nuvem algoritmo algoritmo genético ambiente em nuvem genético caixeiro viajante computação

7 Palavras-chave indicadas pelos autores problema do caixeiro problema do caixeiro viajante computação em nuvem viajante caixeiro hardwares ambiente armazenamento Formação dos Tratados Internacionais e Importância da Aplicabilidade no Âmbito Comercial (NOGUEIRA; FALCONI, 2015): Neste documento o método KEA também encontrou todas as palavras-chave apontadas pelos autores, segundo a Tabela 3. Além disso, destacou termos que elucidam claramente o conteúdo do texto, sendo que o mesmo é constituído por uma análise dos tratados internacionais no âmbito do Direito Internacional Público e da importância de alguns dos principais tratados pertinentes a esse escopo para o comércio entre os Estados Membros. Palavras-chave indicadas pelos autores direito internacional tratados comércio Tabela 3. Terceiro artigo avaliado Internacionais comercial tratados âmbito comercial formação poder comércio direito internacional países pactuar relações de comércio comércio entre os estados estados partícipes advento âmbito As Fontes Constitucionais de Recursos Tributários Destinados à Educação no Brasil e os Respectivos Critérios de Distribuição (SANTOS; BARCELLOS; CASTRO;

8 LORENZI; PUHL, 2015): No decorrer do processo de mineração deste material, como pode-se visualizar na Tabela 4, o método KEA conseguiu localizar somente três das quatro palavras-chave indicadas pelos autores. Essa falha é resultante da forma de representação desse termo pelos pesquisadores, os quais por vezes utilizam Constituição Federal e em outras o vocábulo abreviado CF. Com relação ao conteúdo textual, acredita-se que as palavras-chave eleitas pelo algoritmo KEA representam adequadamente a ideia central do artigo. Palavras-chave indicadas pelos autores educação impostos recursos constituição federal Tabela 4. Quarto artigo avaliado Tributários constitucionais estado educação forma financiamento impostos financeira CF/88 distribuição respectivos destinados fontes recursos constitucionais de recursos Aplicação do Data Mining na Descoberta de Perfis de Risco de Câncer (MATHEUS; CHICON; ANTONIAZZI, 2015): Por fim, no último material escolhido para análise foi possível constatar que somente duas das três palavras apontadas pelos autores foram retornadas pelo KEA (Tabela 5). Isso se deve ao fato de que o vocábulo oncologia aparece somente duas vezes na extensão do texto, sendo por vezes substituído pela palavra câncer, comumente utilizada em referências a esse tipo de patologia. Tabela 5. Quinto artigo avaliado Palavras-chave indicadas pelos autores mineração de dados Dbscan oncologia Câncer perfis de risco data mining

9 Palavras-chave indicadas pelos autores mining mineração bases de dados mineração de dados algoritmos Dbscan dados formas KDD aplicações de técnicas conjunto de dados banco Com relação à correspondência entre as ideias representadas no texto e os termos determinados pelo KEA, observa-se a eficiência do método no apontamento de vocábulos importantes no escopo do trabalho. 6. Considerações Finais Estima-se que o presente trabalho tenha atingido os objetivos a que se propôs, tendo em vista que foi comprovada a eficiência do algoritmo KEA enquanto extrator de palavraschave de documentos científicos. Acredita-se que este estudo possa ser considerado relevante nas áreas de Processamento de Linguagem Natural e Mineração de Textos, visto que as pesquisas existentes ainda são insuficientes para que se possa apontar um método capaz de retornar um resultado ideal se comparado aos termos escolhidos pelos autores. Futuramente, espera-se buscar alternativas capazes de eliminar a redundância de termos simples em mais de uma palavra-chave, contribuindo para a otimização dos resultados apontados pelo algoritmo. Referências Aranha, C. N., Vellasco, M. M. B. R. e Passos, E. P. L. (2007) Uma abordagem de préprocessamento automático para mineração de textos em português: Sob o enfoque da inteligência computacional. Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro. Beppler, M. e Fernandes, A. (2005) Aplicação de text mining para a extração de conhecimento jurisprudencial. Primeiro Congresso Sul-Catarinense de Educação. Carrilho, J. R. (2007) Desenvolvimento de uma metodologia para mineração de textos. Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro.

10 Dias, M. A. L. (2004) Extração Automática de Palavras-Chave na Língua Portuguesa Aplicada a Dissertações e Teses da Área das Engenharias. Dissertação de Mestrado em Engenharia Elétrica e de Computação, Campinas. Fayyad, U.; Piatetsky-Shapiro, G.; Smyth, P. (1996) Advances in knowledge discovery and data mining. Menlo Park: AAAI Press. Filho, L. A. D. S. (2009) Mineração de Regras de Associação Utilizando KDD e KDT: Uma Aplicação na Segurança Pública. Dissertação de Mestrado em Ciência da Computação - Universidade Federal do Pará, Belém. Fortes, R. O.; Pedroso, M. L.; Panda, M. D. J. (2015) Oportunidades de Experiências Motoras em Crianças de Dez Anos. XVII Seminário Internacional de Educação no Mercosul, Cruz Alta. Furtado, M. I. V. (2004) Inteligência Competitiva para o Ensino Superior Privado: Uma Abordagem Através da Mineração de Textos. Tese de Doutorado em Ciências em Engenharia Civil - Universidade Federal do Rio de Janeiro, Rio de Janeiro. Haas, A.; Padilha, R. J.; Monteiro, T. B.; Beck, M. B. (2015) Problema do Caixeiro Viajante Utilizando Algoritmo Genético no Ambiente em Nuvem. XVII Seminário Internacional de Educação no Mercosul, Cruz Alta. Matheus, V. Q.; Chicon, P. M. M.; Antoniazzi, R. L. (2015) Aplicação do Data Mining na Descoberta de Perfis de Risco de Câncer. XVII Seminário Internacional de Educação no Mercosul, Cruz Alta. Moura, M. F. (2004) Proposta de utilização de mineração de textos para seleção, classificação e qualificação de documentos. Embrapa Informática Agropecuária. Nogueira, F. M.; Falconi, A. (2015) Formação dos Tratados Internacionais e Importância da Aplicabilidade no Âmbito Comercial. XVII Seminário Internacional de Educação no Mercosul, Cruz Alta. Santos, J. R. L.; Barcellos, M. N.; Castro, L. H. N.; Lorenzi, B. C. F.; Puhl, P. O. (2015) As Fontes Constitucionais de Recursos Tributários Destinados à Educação no Brasil e os Respectivos Critérios de Distribuição. XVII Seminário Internacional de Educação no Mercosul, Cruz Alta. Silva, L. O. E. (2009) BOOKISH - Uma ferramenta para contextualização de documentos utilizando mineração de textos e expansão de consulta. Dissertação de Mestrado em Computação da Universidade Federal de Goiás, Goiânia. Soares, F. D. A. (2013) Categorização Automática de Textos Baseada em Mineração de Textos. Tese de Doutorado em Engenharia Elétrica - Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro. Souza, J. G. D. (2011) Uma aplicação de Mineração de Texto para Descoberta de Características Psicológicas de Indivíduos. UFS, Itabaiana. Witten, I. H. et al. (1999) KEA: Practical Automatic Keyphrase Extraction. Proceedings of the fourth ACM conference in digital libraries, p

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Luiz Henrique Dutra da Costa (PIBIC/Unioeste), Carlos Andres Ferrero, Cláudio Saddy Rodrigues

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

Uma ferramenta para expansão do vocabulário com base em coocorrência

Uma ferramenta para expansão do vocabulário com base em coocorrência Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira

Leia mais

1 Introdução Motivação

1 Introdução Motivação 1 Introdução 1.1. Motivação Informações podem ser armazenadas das mais variadas maneiras. O modo mais clássico de armazenamento de informação é através da palavra escrita, impressa. O acesso à informação

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais

Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais 72 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais Renan Gomes Pereira¹ Maria Fernanda Moura²

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Descoberta de conhecimento em textos - Análise semântica Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Introdução Diversidade de textos não padronizados; Emails, artigos,

Leia mais

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

João Ribeiro Carrilho Junior. Desenvolvimento de uma Metodologia para Mineração de Textos. Dissertação de Mestrado

João Ribeiro Carrilho Junior. Desenvolvimento de uma Metodologia para Mineração de Textos. Dissertação de Mestrado João Ribeiro Carrilho Junior Desenvolvimento de uma Metodologia para Mineração de Textos Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa

Leia mais

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos 17 I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos Renan Gomes Pereira 1 Maria Fernanda Moura 2 Resumo: O objetivo deste trabalho é apresentar a ferramenta I-Preproc,

Leia mais

INTELIGÊNCIA ARTIFICIAL

INTELIGÊNCIA ARTIFICIAL INTELIGÊNCIA ARTIFICIAL Engenharia da Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto Dr. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br

Leia mais

APLICAÇÃO DA TÉCNICA TEXT MINING PARA AUXÍLIO NA CLASSIFICAÇÃO DE INCIDENTES DE SERVICE DESK

APLICAÇÃO DA TÉCNICA TEXT MINING PARA AUXÍLIO NA CLASSIFICAÇÃO DE INCIDENTES DE SERVICE DESK APLICAÇÃO DA TÉCNICA TEXT MINING PARA AUXÍLIO NA CLASSIFICAÇÃO DE INCIDENTES DE SERVICE DESK Carla Adriéli Fink Orientador: Professor Dr. Oscar Dalfovo Roteiro da Apresentação Introdução Objetivos Fundamentação

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com Coleta de dados em vários

Leia mais

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

Pré-processamento textual para a extração de informação em bases de patentes

Pré-processamento textual para a extração de informação em bases de patentes Pré-processamento textual para a extração de informação em bases de patentes Bruno Silva Sette, Claudia Aparecida Martins Instituto de Computação Universidade Federal de Mato Grosso (UFMT) Av. Fernando

Leia mais

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) JONAS RAFAEL ONOFRE Orientador(es) MARINA TERESA PIRES VIEIRA

Leia mais

REGRAS PARA SUBMISSÃO ATENÇÃO! 1 Áreas Temáticas

REGRAS PARA SUBMISSÃO ATENÇÃO! 1 Áreas Temáticas REGRAS PARA SUBMISSÃO Para enviar seu Resumo Expandido você deverá preencher todos os Dados do Trabalho, selecionar a modalidade de apresentação, Área temática, inserir o título do trabalho, Palavras-chave

Leia mais

6 Estudos de Casos Porta Lógica OU de 4 Entradas

6 Estudos de Casos Porta Lógica OU de 4 Entradas 6 Estudos de Casos Com o objetivo de avaliar a síntese automática de circuitos de QCA usando técnicas de Hardware Evolucionário (EHW), alguns circuitos foram sintetizados e serão apresentados a seguir.

Leia mais

Computação Evolucionária Aplicada ao Problema de Seleção de Características em Text Mining

Computação Evolucionária Aplicada ao Problema de Seleção de Características em Text Mining Computação Evolucionária Aplicada ao Problema de Seleção de Características em Text Mining João R. Carrilho Jr., Marco Aurélio C. Pacheco ICA: Applied Computational Intelligence Laboratory Department of

Leia mais

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a 1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações

Leia mais

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida GESTÃO DE DADOS NAS ORGANIZAÇÕES Prof. Robson Almeida INFRA-ESTRUTURA DE SISTEMAS DE INFORMAÇÃO 3 CONCEITOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único

Leia mais

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Susana Rosich Soares Velloso SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção

Leia mais

Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas

Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Daniel de F. Honorato 1, Huei D. Lee 1, Renato B. Machado 1,4,

Leia mais

Categorização Automática de Textos Baseada em Mineração de Textos

Categorização Automática de Textos Baseada em Mineração de Textos Fábio de Azevedo Soares Categorização Automática de Textos Baseada em Mineração de Textos Tese de Doutorado Tese apresentada como requisito parcial para obtenção do grau de Doutor pelo Programa de Pós-graduação

Leia mais

PEP: Prontuário Eletrônico do Paciente

PEP: Prontuário Eletrônico do Paciente PEP: Prontuário Eletrônico do Paciente Revisando... O Prontuário Eletrônico é... um repositório onde todas as informações de saúde, clínicas e administrativas, ao longo da vida de um indivíduo estão armazenadas,

Leia mais

Indexação automática. CBD/ECA Indexação: teoria e prática

Indexação automática. CBD/ECA Indexação: teoria e prática Indexação automática CBD/ECA Indexação: teoria e prática Indexação documentária Identificar pela análise dos documentos, os seus assuntos extrair os conceitos que indicam o seu conteúdo traduzir os conceitos

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

Desenvolvimento do Sistema de Intermediação para Prestadores de Serviço KLEITON STIVEN FINGER ORIENTADOR: PROF. OSCAR DALFOVO, DOUTOR

Desenvolvimento do Sistema de Intermediação para Prestadores de Serviço KLEITON STIVEN FINGER ORIENTADOR: PROF. OSCAR DALFOVO, DOUTOR FURB UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE SISTEMAS DE INFORMAÇÃO BACHARELADO Desenvolvimento do Sistema de Intermediação para Prestadores de Serviço Utilizando

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com

Leia mais

Mineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC

Mineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC Mineração de Dados com Big Data Prof. Fabrício Olivetti de França Universidade Federal do ABC Sobre mim Formado em Engenharia Elétrica com ênfase em Computação pela Universidade Católica de Santos. Mestrado

Leia mais

FACILITANDO A AVALIAÇÃO DE TAXONOMIAS DE TÓPICOS AUTOMATICAMENTE GERADAS NO DOMÍNIO DO AGRONEGÓCIO

FACILITANDO A AVALIAÇÃO DE TAXONOMIAS DE TÓPICOS AUTOMATICAMENTE GERADAS NO DOMÍNIO DO AGRONEGÓCIO FACILITANDO A AVALIAÇÃO DE TAXONOMIAS DE TÓPICOS AUTOMATICAMENTE GERADAS NO DOMÍNIO DO AGRONEGÓCIO MERLEY DA SILVA CONRADO 1 MARIA FERNANDA MOURA 2 SOLANGE OLIVEIRA REZENDE 3 RESUMO: O custo de avaliação

Leia mais

Estudo Comparativo de Estratégias de Classificação de Páginas Web

Estudo Comparativo de Estratégias de Classificação de Páginas Web Thoran Araguez Rodrigues Estudo Comparativo de Estratégias de Classificação de Páginas Web Dissertação de Mestrado Dissertação apresentada ao Programa de Pós-Graduação em Informática da Pontifícia Universidade

Leia mais

Análise do Desempenho Acadêmico Utilizando Redes Bayesianas: um estudo de caso

Análise do Desempenho Acadêmico Utilizando Redes Bayesianas: um estudo de caso Análise do Desempenho Acadêmico Utilizando Redes Bayesianas: um estudo de caso Danilo Raniery Alves Coutinho, Thereza Padilha Departamento de Ciências Exatas - Universidade Federal da Paraíba (UFPB) Campus

Leia mais

com Big Data Fabrício Olivetti de França Universidade Federal do ABC

com Big Data Fabrício Olivetti de França Universidade Federal do ABC Mineração de Dados com Big Data Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Sobre mim 2. Sobre a Disciplina 1 Sobre mim Sobre mim Formado em Engenharia Elétrica com ênfase em Computação

Leia mais

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar

Leia mais

Extração de hierarquias de tópicos em textos para apoiar a construção de portfólios tecnológicos

Extração de hierarquias de tópicos em textos para apoiar a construção de portfólios tecnológicos 24 Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... Extração de hierarquias de tópicos em textos para apoiar a construção de portfólios tecnológicos Carolina Tavares de Oliveira 1 Luisa Miyashiro

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Mineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará

Mineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará Universidade Federal do Pará Centro de Ciências Exatas e Naturais Departamento de Informática Mineração de Dados Profa. MSc. Miriam Lúcia Domingues Curso de Especialização em Sistemas de Banco de Dados

Leia mais

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade Universidade de São Paulo - USP Instituto de Ciências Matemáticas e de Computação - ICMC Programa de Pós-Graduação em Ciências da Computação e Matemática Computacional Ambiente de Data Warehouse Para Imagens

Leia mais

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DE PERNAMBUCO Centro de Informática Departamento de Sistemas de Computação

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DE PERNAMBUCO Centro de Informática Departamento de Sistemas de Computação SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DE PERNAMBUCO Centro de Informática Departamento de Sistemas de Computação CONCURSO PÚBLICO PARA DOCENTES DO MAGISTÉRIO SUPERIOR Edital nº 42, de 27 de maio

Leia mais

Oferta de disciplinas para o período 2014/2

Oferta de disciplinas para o período 2014/2 PINF-6000 Projeto e Análise de Algoritmos 14:00-18:00 PINF-6013 Elementos Finitos PINF-6020 Otimização em Grafos PINF-6038 Tópicos Especiais em Informática: Computação Natural - PINF-6038 Tópicos Especiais

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

O ENSINO-APRENDIZAGEM DO CONCEITO FUNÇÃO COM FOCO NAS TEORIAS DE DAVYDOV E MAJMUTOV

O ENSINO-APRENDIZAGEM DO CONCEITO FUNÇÃO COM FOCO NAS TEORIAS DE DAVYDOV E MAJMUTOV O ENSINO-APRENDIZAGEM DO CONCEITO FUNÇÃO COM FOCO NAS TEORIAS DE DAVYDOV E MAJMUTOV Autora (1): Simone Ariomar de Souza; Co-Autor (2): Leandro de Jesus Dueli; Orientador (3) Raquel Aparecida Marra da Madeira

Leia mais

3 Trabalhos Relacionados

3 Trabalhos Relacionados Trabalhos Relacionados 31 3 Trabalhos Relacionados Nesta seção, são descritos alguns trabalhos relacionados, a relação entre eles e o trabalho proposto, além da relação com os desafios mencionados na subseção

Leia mais

Indexação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília

Indexação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Indexação Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília 1 Penso, logo existo. Brincadeira feita por Fernando Modesto MODESTIKUS, Bibliotecário Grego René Descartes

Leia mais

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+ Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo

Leia mais

Francisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO

Francisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO Francisco Benjamim Filho XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO DEPARTAMENTO DE INFORMÁTICA Programa de Pós-Graduação em Informática Rio de Janeiro,

Leia mais

INFORMÁTICA NA EDUCAÇÃO. A Informática e a Era do Conhecimento INFORMÁTICA NA EDUCAÇÃO

INFORMÁTICA NA EDUCAÇÃO. A Informática e a Era do Conhecimento INFORMÁTICA NA EDUCAÇÃO INFORMÁTICA NA EDUCAÇÃO A Informática e a Era do Conhecimento Prof. Gláucya Carreiro Boechat E-mail:glaucyacboechat@yahoo.com.br Disciplina: Informática Aplicada à Educação Segundo MEC: é a integração

Leia mais

Text Mining realiza várias funções de busca, análise lingüística e categorização. Mecanismos de busca se restringem à Internet. (Chen, H.

Text Mining realiza várias funções de busca, análise lingüística e categorização. Mecanismos de busca se restringem à Internet. (Chen, H. 1 Introdução Métodos de recuperação de textos sempre foram utilizados para organizar documentos, porém, com o aumento do volume de textos que vem ocorrendo, principalmente, pela digitalização do conteúdo

Leia mais

Linguagens de Programação

Linguagens de Programação Universidade Federal do Rio Grande do Norte Centro de Tecnologia Departamento de Computação e Automação Linguagens de Programação Professor Responsável: Luiz Affonso Henderson Guedes de Oliveira Prof.

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

MODOS DE ENDEREÇAMENTO E CONJUNTO DE INSTRUÇÕES

MODOS DE ENDEREÇAMENTO E CONJUNTO DE INSTRUÇÕES MODOS DE ENDEREÇAMENTO E CONJUNTO DE INSTRUÇÕES Alexandre Lucas Chichosz Graduando em Engenharia da Computação, Faculdades Integradas de Três Lagoas FITL/AEMS Calwann de Souza Freire Graduando em Engenharia

Leia mais

MODOS DE ENDEREÇAMENTO E CONJUNTO DE INSTRUÇÕES

MODOS DE ENDEREÇAMENTO E CONJUNTO DE INSTRUÇÕES MODOS DE ENDEREÇAMENTO E CONJUNTO DE INSTRUÇÕES Alexandre Lucas Chichosz Discente do curso Engenharia da Computação Calwann de Souza Freire Discente do curso Engenharia da Computação Myke Albuquerque Pinto

Leia mais

Organização e Arquitetura de Computadores. Professor Airton Ribeiro de Sousa

Organização e Arquitetura de Computadores. Professor Airton Ribeiro de Sousa Organização e Arquitetura de Computadores Professor Airton Ribeiro de Sousa airton.ribeiro@faciplac.edu.br Apresentação Nesta disciplina, você estudará os principais conceitos de arquitetura de computadores.

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

1.1. Trabalhos Realizados na Área

1.1. Trabalhos Realizados na Área 1 1 Introdução Várias formas de tratamento de lesões de úlceras de perna têm sido empregadas hoje em dia. O método de tratamento dependerá da origem da úlcera bem como de seu estado patológico. Com o objetivo

Leia mais

Aula 16. Tópicos Especiais II Banco de Dados. Prof. Dr. Dilermando Piva Jr.

Aula 16. Tópicos Especiais II Banco de Dados. Prof. Dr. Dilermando Piva Jr. 16 Aula 16 Tópicos Especiais II Banco de Dados Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Sistemas de Arquivos O computador tem facilitado bastante a vida dos seres

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Porto Alegre, v.15, n.1, jan./jun ISSN impresso X ISSN digital INFORMÁTICA NA EDUCAÇÃO: teoria & prática.

Porto Alegre, v.15, n.1, jan./jun ISSN impresso X ISSN digital INFORMÁTICA NA EDUCAÇÃO: teoria & prática. Porto Alegre, v.15, n.1, jan./jun. 2012. INFORMÁTICA NA EDUCAÇÃO: teoria & prática Resumos 187 Porto Alegre, v.15, n.1, jan./jun. 2012. INFORMÁTICA NA EDUCAÇÃO: teoria & prática O uso de tecnologias modernas

Leia mais

Profa. Sheila Morais de Almeida. março

Profa. Sheila Morais de Almeida. março Classificação das Ciências Profa. Sheila Morais de Almeida DAINF-UTFPR-PG março - 2019 Sheila Almeida (DAINF-UTFPR-PG) Classificação das Ciências março - 2019 1 / 23 Este material é preparado usando como

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Introdução 1 Introdução Aprendizado de Máquina Extração de conhecimento. Automatização de tarefas. Tomada de Decisões.

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO 5ª Jornada Científica e Tecnológica e 2º Simpósio de Pós-Graduação do IFSULDEMINAS 06 a 09 de novembro de 2013, Inconfidentes/MG MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO

Leia mais

Felix da Cunha 412, Pelotas RS Home-Page: s: Bolsista BIC/FAPERGS

Felix da Cunha 412, Pelotas RS Home-Page:    s: Bolsista BIC/FAPERGS UTILIZAÇÃO DE REDES NEURAIS PARA PREVISÕES EM SÉRIES TEMPORAIS 1 A. T. Gonçalez, A. C. R. Costa, G. P. Dimuro UCPEL Universidade Católica de Pelotas, ESIN Escola de Informática GMFC Grupo de Matemática

Leia mais

Aula 2: Planejamento da RS

Aula 2: Planejamento da RS Universidade de São Paulo Instituto de Ciências Matemática e de Computação SSC 5905 - Revisão Sistemática Aula 2: da RS Profa. Dra. Elisa Yumi Nakagawa 1. Semestre de 2013 Processo de Revisão Sistemática

Leia mais

Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública

Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública Autor: Gercely da Silva e Silva 1 1 Universidade Luterana do Brasil ULBRA Canoas, RS Brasil Resumo do Trabalho

Leia mais

4 Processo de Transformação

4 Processo de Transformação Tecnologias Relacionadas 43 4 Processo de Transformação Com a constante mudança nos requisitos (funcionais e não funcionais) do domínio da aplicação, há uma grande necessidade de que os sistemas estejam

Leia mais

A Computação e as Classificações da Ciência

A Computação e as Classificações da Ciência A Computação e as Classificações da Ciência Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Classificações da Ciência A Computação

Leia mais

6 Conclusões Limitações ao estudo

6 Conclusões Limitações ao estudo 6 Conclusões Ainda existem poucos trabalhos acadêmicos dedicados à disciplina de risco operacional, porém esse número tende a aumentar, principalmente com a implementação do Novo Acordo da Basiléia. Os

Leia mais

A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe

A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe Leopoldo Ramos de Oliveira 1, Fausto Bernard Melo Soares 2, José Acácio de Jesus

Leia mais

Sistemas de Recomendação Uma abordagem geral

Sistemas de Recomendação Uma abordagem geral Sistemas de Recomendação Uma abordagem geral Universidade Estadual de Maringá Departamento de Informática Programa de Pós-Graduação Mestrado em Ciência da Computação Disciplina: Seminários II Aluna: Késsia

Leia mais

Extração de associações entre itens de um portfólio de tecnologias agrícolas

Extração de associações entre itens de um portfólio de tecnologias agrícolas 78 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Extração de associações entre itens de um portfólio de tecnologias agrícolas Luisa Miyashiro Tápias¹ Maria Fernanda Moura² Stanley Robson

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

Organização e Arquitetura de Computadores. Professor Airton Ribeiro de Sousa

Organização e Arquitetura de Computadores. Professor Airton Ribeiro de Sousa Organização e Arquitetura de Computadores Professor Airton Ribeiro de Sousa airton.ribeiro@faciplac.edu.br Apresentação Nesta disciplina, você estudará os principais conceitos de arquitetura de computadores.

Leia mais

Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso

Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso Detecção de Réplicas de Sítios Web em Máquinas de Busca Usando Aprendizado de Máquina Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso Universidade Federal de Minas Gerais LATIN

Leia mais

Técnicas de recuperação de informação: filtragem, agrupamento

Técnicas de recuperação de informação: filtragem, agrupamento Técnicas de recuperação de informação: filtragem, agrupamento 1 Nome usado para descrever uma variedade de processos envolvendo a entrega de informação para pessoas que precisam dela; Compreende um método

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

Leitura de Documentos. Priscila Engiel

Leitura de Documentos. Priscila Engiel Leitura de Documentos Priscila Engiel pengiel@inf.puc-rio.br Leitura de documentos Leitura de documentos formais que regulam ou descrevem o sistema ou aspectos que interferem em sua execução Quais documentos?

Leia mais

Oferta de disciplinas para o período 2013/2

Oferta de disciplinas para o período 2013/2 PINF-6000 Projeto e Análise de Algoritmos - 21:00 PINF-6002 Arquitetura de Computadores PINF-6011 Desenvolvimento Orientado a Modelos 09:00- PINF-6012 Inteligência Artificial 13:00-15:00 PINF-6013 Elementos

Leia mais

CINEMATECA (EN)CENA: A LINGUAGEM CINEMATOGRÁFICA COMO FERRAMENTA DE ENSINO E APRENDIZAGEM NA FORMAÇÃO EM PSICOLOGIA¹

CINEMATECA (EN)CENA: A LINGUAGEM CINEMATOGRÁFICA COMO FERRAMENTA DE ENSINO E APRENDIZAGEM NA FORMAÇÃO EM PSICOLOGIA¹ CINEMATECA (EN)CENA: A LINGUAGEM CINEMATOGRÁFICA COMO FERRAMENTA DE ENSINO E APRENDIZAGEM NA FORMAÇÃO EM PSICOLOGIA¹ SILVA, E. S.²; TEIXEIRA, I.³ ¹Parte do Projeto Análise Inteligente de Dados em Mídias

Leia mais

Data Mining. O Processo de KDD. Mauricio Reis

Data Mining. O Processo de KDD. Mauricio Reis 1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico

Leia mais

Fabrício Jailson Barth BandTec

Fabrício Jailson Barth BandTec Introdução à Inteligência Artificial Fabrício Jailson Barth fabricio.barth@bandtec.com.br BandTec 1 o semestre de 2012 Objetivos e Sumário O que é Inteligência Artificial (IA)? Objetivos da IA. Influência

Leia mais

7 Conclusões. 7.1 Visão Geral dos Trabalhos Desenvolvidos

7 Conclusões. 7.1 Visão Geral dos Trabalhos Desenvolvidos 7 Conclusões Este capítulo apresenta as conclusões da Tese e descreve como os objetivos propostos foram alcançados. Nele também são discutidas as recomendações para continuação da pesquisa e alterações

Leia mais

4 SISTEMA DE CLASSIFICAÇÃO DE UNIDADES CONSUMIDORAS DE ENERGIA ELÉTRICA

4 SISTEMA DE CLASSIFICAÇÃO DE UNIDADES CONSUMIDORAS DE ENERGIA ELÉTRICA 94 4 SISTEMA DE CLASSIFICAÇÃO DE UNIDADES CONSUMIDORAS DE ENERGIA ELÉTRICA 4.1 INTRODUÇÃO Conforme dito no capítulo 1, a diminuição das perdas técnicas e comerciais é uma das principais prioridades das

Leia mais

TCE Informática Dados Estruturados e Não-Estruturados Prof. Marcelo Ribeiro

TCE Informática Dados Estruturados e Não-Estruturados Prof. Marcelo Ribeiro TCE Informática Dados Estruturados e Não-Estruturados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática DADOS ESTRUTURADOS E NÃO-ESTRUTURADOS Esses termos referem-se à forma como um conjunto

Leia mais

Morfologia Matemática: algumas aplicações. Rosana Gomes Bernardo Universidade Federal Fluminense

Morfologia Matemática: algumas aplicações. Rosana Gomes Bernardo Universidade Federal Fluminense Morfologia Matemática: algumas aplicações Rosana Gomes Bernardo Universidade Federal Fluminense Introdução Aplicações Motivadoras - Consumo de Gás Natural Roteiro - Placas de Veículos Referências - Cartografia

Leia mais

Abordando os desafios do Big Data. Justificativa do curso. Objetivo Geral. Benefícios do Programa

Abordando os desafios do Big Data. Justificativa do curso. Objetivo Geral. Benefícios do Programa Abordando os desafios do Big Data. Justificativa do curso. Neste curso virtual abordaremos temas pioneiros na área do Big Data com ênfase na recompilação de dados (telefones inteligentes, sensores, a Web),

Leia mais

Raciocínio Baseado em Casos

Raciocínio Baseado em Casos Raciocínio Baseado em Casos Augusto Cesar Castoldi, Marcos de Oliveira dos Santos. Bacharéis em Ciências da Computação 2º Semestre, 2002. Departamento de Informática e Estatística (INE) Universidade Federal

Leia mais

2011 Profits Consulting. Inteligência Computacional

2011 Profits Consulting. Inteligência Computacional Inteligência Computacional Quem Somos Excelência em Soluções Tecnológicas A Profits Consulting é uma empresa composta por consultores com ampla experiência em Tecnologia que desenvolve soluções inovadoras,

Leia mais

Identificação em Documentos

Identificação em Documentos Identificação de Contexto Geográfico em Documentos Marcos Henrique Fonseca Ribeiro Bancos de Dados Geográficos Marcos Henrique Fonseca Ribeiro Slide 1 Roteiro Motivação e contexto Cenários a serem explorados

Leia mais

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO AULA 06 Algoritmos Genéticos Sumário Introdução Inteligência Artificial (IA) Algoritmos Genéticos Aplicações de

Leia mais