Descoberta de Domínio Conceitual de Páginas Web

Tamanho: px
Começar a partir da página:

Download "Descoberta de Domínio Conceitual de Páginas Web"

Transcrição

1 paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva Orientadora: Carina Friedrich Dorneles Nível: Mestrado Ingresso: Março de 2013 Conclusão prevista: Março de 2015 Etapas realizadas: Levantamento do estado da arte em extração de conceitos, classificação de páginas web e classificação de documentos. Definição do algoritmo proposto, implementação de protótipo, testes iniciais. Etapas futuras: Avaliação e evolução do algoritmo proposto, comparação com outros algoritmos. Programa de Pós Graduação em Ciência da Computação Universidade Federal de Santa Catarina Resumo. O aumento exponencial no número de documentos e dados na web demanda formas mais precisas para busca de informações e a classificação de páginas pode ser um grande aliado. Nesse contexto, o uso de informação semântica pode ser considerado essencial para a precisão da classificação. Sendo assim, este artigo propõe uma abordagem não supervisionada para a descoberta do domínio conceitual de páginas web. O algoritmo utiliza conceitos extraídos da página e de uma base de conhecimento afim de montar hierarquias de conceitos que são utilizadas para eleger um conceito mais representativo como domínio. Para avaliar o algoritmo foram realizados testes preliminares sobre conjuntos de páginas da Wikipedia. Os resultados e o potencial uso do algoritmo são apresentados e discutidos. Palavras chave: classificação de páginas web, base de conhecimento, generalização de conceitos 311

2 1. Introdução A classificação de documentos é comumente tratada como um problema de aprendizagem supervisionada, em que um conjunto predeterminado de dados é usado para treinar um classificador que atribui um ou mais rótulos de classe para cada documento [Tao et al. 2012]. Nesse contexto, as classes utilizadas são diretamente relacionadas com a capacidade de cobertura de termos pelo classificador, e a precisão de classificação é dada pela capacidade do classificador em encontrar uma ou mais classes corretas para os documentos. Quando se trata de classificação no contexto de páginas web, a abordagem supervisionada se torna pouco eficiente, uma vez que os algoritmos devem ser capazes de trabalhar com o volume crescente de informações, e o uso de dados para treino pode se tornar inviável. Além disso, é necessário observar que o escopo semântico da web é irrestrito. Sendo assim, existe a necessidade de enriquecer o conhecimento utilizado pelo classificador com informações relevantes, afim de aumentar o poder de precisão e cobertura do processo de classificação. Nesse sentido, trabalhos recentes exploram diferentes recursos com vistas à adição de semântica, considerada essencial para o avanço em algoritmos de classificação [Wang et al. 2008]. Em um deles, [Bleik et al. 2013] utiliza uma ontologia de domínio limitado para a classificação de documentos. Outros trabalhos utilizam recursos de domínio aberto como a Wikipedia [Yun et al. 2010] e a Wordnet [Luo et al. 2011] para obtenção de conceitos e relacionamentos. O grande problema de tais propostas é que necessitam de uma etapa de pré processamento supervisionada sobre o corpus utilizado. Desta forma, verifica se a necessidade de uma proposta a fim de trabalhar com dados disponíveis online, tal como uma base de conhecimento de domínio aberto. Essa alternativa fornece uma fonte de informação semântica em tempo de execução, sem que haja necessidade de treinamento. Também possibilita a adição de conhecimento novo de forma independente. Sendo assim, este trabalho de mestrado apresenta um algoritmo para a descoberta de domínio conceitual de páginas web, tendo como entrada um conjunto de conceitos extraídos da página e uma base de conhecimento online de domínio aberto. Inicialmente, os conceitos são generalizados com a utilização de uma base de conhecimento. Por fim, o algoritmo elege um conceito como domínio. Para apresentar o algoritmo proposto, o restante deste artigo está organizado da seguinte forma: a segunda seção aborda os fundamentos utilizados para a elaboração do algoritmo, apresentando também os trabalhos relacionados à proposta. Na terceira seção é apresentado em detalhes o algoritmo desenvolvido, em seguida são apresentados os testes realizados para avalização da proposta, discutindo os resultados obtidos. Por fim, são expostas considerações finais e trabalhos futuros. 312

3 2. Trabalhos relacionados Recentemente, trabalhos vêm apresentando soluções alternativas à representação do conteúdo de documentos por palavras chave com vistas à adição de semântica. Em um desses trabalhos [Barla et al. 2013] apresenta uma técnica para extração dos conceitos chave a partir de texto livre utilizando a WordNet e um corpus disponibilizado pela Google. Por meio de estudos comparativos, o autor conclui que a representação utilizando conceitos chave é mais eficiente que as técnicas convencionais de representação de conteúdo de documentos. De forma similar, porém no âmbito da classificação de documentos, [Tao et al. 2012] apresenta um método para classificar livros sem a necessidade de treinar um classificador. Inicialmente o método minera o documento em busca de padrões de características, em um segundo momento, seleciona características a serem usadas na classificação. O método então utiliza uma ontologia de domínio aberto para, com o uso das entidades e relacionamentos presentes na ontologia, generalizar os termos adquiridos e utilizar os conceitos obtidos como classes para a classificação. Essas abordagens trazem características muito importantes para um método de classificação de páginas web, como a independência de domínio e a ausência da etapa de treinamento. Entretanto, a classificação de páginas web difere em alguns aspectos da classificação de documentos [Qi et al. 2009]. Em primeiro lugar, a classificação de texto tradicional é normalmente realizada em documentos estruturados escritos com estilos consistentes (por exemplo, artigos de notícias), já páginas web normalmente não possuem essa característica. Em segundo, páginas web normalmente possuem conteúdo com assuntos diversificados (por exemplo, anúncios em blogs), enquanto documentos focam em assuntos específicos. A terceira e talvez mais importante característica, refere se ao volume de texto, que varia muito em páginas web, e é abundante em documentos (se considerarmos livros por exemplo). 3. Abordagem Proposta Neste trabalho, é definido um algoritmo não supervisionado, para a descoberta do domínio conceitual de páginas web. Para tal, assume se que o domínio de um determinado conteúdo pode ser descrito por um único conceito de maior nível semântico que seja relacionado com conceitos que melhor representam o conteúdo obtido da página. Por exemplo, suponha que alguns dos principais termos candidatos a conceitos obtidos do processo de extração sejam: presidente, estado e país; o algoritmo proposto deve ser capaz de obter algum conceito mais generalista como governo. O algoritmo se apóia na existência de conceitos mais abrangentes (que possam representar mais do que um conceito) entre aqueles que foram extraídos da página, dentre os quais alguns são mais relevantes dentro do escopo da página (que possuem maior semelhança entre si). Após encontrar o grupo dos conceitos mais relevantes e seus relacionamentos, é assumido que um conceito de maior nível hierárquico possa ser considerado o domínio. A proposta consiste em duas etapas principais expressas na Figura 1 e detalhadas a seguir. 313

4 3.1 Generalização de Conceitos Figura 1. Etapas do algoritmo proposto. O módulo de Generalização de Conceitos tem como objetivo a construção de uma lista de conceitos de maior generalidade para cada conceito extraído da página. Conforme exemplificado na Figura 2, o módulo recebe como entrada uma lista de conceitos extraídos de uma página. Para cada conceito extraído, é obtida uma lista de conceitos de maior generalidade. A obtenção dessa lista é realizada com o uso de uma base de conhecimento. Primeiro, para cada conceito extraído, são consultados conceitos ligados por relacionamento IS A, depois é realizada repetidamente a mesma consulta à base de conhecimento para cada conceito obtido na consulta anterior, até que a consulta não obtenha mais resultados. Os conceitos de maior nível na hierarquia construída compõem uma lista de conceitos candidatos a domínio para cada conceito extraído. Figura 2. Exemplo de construção da lista de conceitos candidatos a domínio. Após a geração das listas, estas devem ser ordenadas de acordo com a medida de relevância de cada conceito obtido em relação ao universo conhecido pela base consultada. No exemplo da Figura 2, a lista dos conceitos candidatos a domínio para o conceito presidente possui como conceito mais relevante Música, em seguida Política e assim em diante. Essa medida pode ser fornecida pela 314

5 própria base de conhecimento, ou calculada com uso de algoritmos como por exemplo PageRank, onde conceitos representam vértices e relacionamentos arestas. 3.2 Definição do Domínio Para eleger um domínio, são considerados dois critérios: (i) o número de conceitos extraídos da página relacionados a cada conceito candidato a domínio; e (ii) a posição de conceitos candidatos nas listas de conceitos generalizados de cada conceito extraído. O primeiro critério expressa o quão comum pode ser o emprego de cada conceito candidato com relação ao escopo semântico da página. O segundo denota a probabilidade de conceito candidato ser mais importante que os outros dentro do contexto. Esses critérios são aplicados sobre um conjunto de listas de conceitos extraídos com suas respectivas listas de conceitos candidatos, como exemplificado na Figura 3. A escolha do domínio é feita através de um algoritmo que possui os seguintes passos: Figura 3. Exemplo de lista de conceitos extraídos com respectivas listas de conceitos elegíveis. Passo 1: Para cada conceito elegível, é verificado o número de vezes (frequência) que ele se faz presente nas listas de conceitos elegíveis de cada conceito extraído. Na Tabela 1, esses valores para os conceitos da Figura 3 estão discriminado na coluna Frequência, de acordo com essa figura o conceito candidato Música está presente nos três conceitos extraídos, desta forma sua frequência correspondente será 3. Tabela 1. Exemplo de valores calculados de acordo com o algoritmo proposto Passo 2: Para cada conceito elegível, é realizado o somatório de suas respectivas posições nas lista de conceitos extraídos. Observando a Figura 3, é verificado que o conceito candidato Localização está presente nas listas dos conceitos extraídos Estado e País, nas posições 1 e 3 respectivamente. Desta forma, a soma de seus índices será igual a 4. Na Tabela 1, esses valores para os conceitos da Figura 3 estão discriminado na coluna Soma Índices. Passo 3: É construída uma lista com os conceitos candidatos, essa lista é então ordenada em ordem decrescente de acordo com a frequência desses conceitos. Em seguida para cada conceito é atribuído um valor de classificação de acordo com sua frequência. O valor de classificação da frequência é dado pela posição do valor do conceito na lista. Se observada a Tabela 1, pode se verificar que a frequência de Música, Organização e Governo é 3, esse também é o maior valor de frequência do conjunto, então a classificação de frequência é

6 Passo 4: É construída uma lista com os conceitos candidatos respeitando a ordem com que esses conceitos aparecem nas listas dos conceitos extraídos. Em seguida essa lista é ordenada em ordem crescente de acordo com a soma dos índices dos conceitos. Em caso de empate durante essa ordenação, a ordem inicial é mantida. Posteriormente, para cada conceito candidato é atribuído um valor de classificação de acordo com sua posição na lista recém criada, esse valor está presente na Tabela 1, na coluna Classificação Soma Índices. Como exemplo tomamos o conceito Política na Tabela 1, como seu valor na soma dos índices é 2 e esse valor corresponde ao menor do conjunto, então sua classificação de soma de índices é 1. Passo 3: Para cada conceito candidato, é calculado o valor de classificação final para cada conceito candidato dado por: classificação final = (CF + CSI) / F onde: CF corresponde à classificação frequência; CSI é classificação de soma de índices e F equivale à frequência. Passo 4: O conceito candidato com menor valor de classificação final é eleito como domínio, caso o valor de classificação final seja zero ou igual ao valor do segundo conceito candidato, o conceito com maior classificação de frequência. Se ambos possuírem valores iguais para classificação de frequência então o conceito com menor valor de classificação de soma de índices entre eles é adotado como domínio. 4. Avaliação do Algoritmo Para avaliar o desempenho do algoritmo foi implementado um protótipo em Java utilizando 1 2 AlchemyAPI para extração de conceitos das páginas e a API do Freebase para consulta à base de conhecimento. Com a implementação do algoritmo foi possível realizar testes em páginas da Web. 3 Inicialmente foram realizados testes com 150 páginas da Wikipedia, para avaliar diferentes domínios, foram selecionadas aleatoriamente 50 páginas de Filmes, 50 sobre Videogames e outras 50 se referindo a Localidades. De 150 páginas, 103 tiveram o domínio eleito corretamente, o que representa 69% de precisão e 1 página não obteve resultados suficientes para execução do algoritmo. Apesar de preliminares, os resultados obtidos já demonstram como o comportamento do algoritmo depende da base de conhecimento e da qualidade dos conceitos fornecidos como entrada. 5. Considerações finais Este trabalho apresenta uma proposta para a descoberta do domínio conceitual de páginas web. A informação sobre o domínio pode ser utilizada de forma a beneficiar o processo de classificação de páginas web. O algoritmo assume que para cada documento existe um conceito de maior generalizada

7 Para encontrar esse conceito são extraídos os conceitos principais da página e, a partir destes conceitos, é montada uma lista de conceitos de maior generalidade com o auxílio de uma base de conhecimento de domínio aberto. A partir dos conceitos de nível mais alto na hierarquia, o algoritmo elege um conceito que represente semanticamente o maior número de conceitos extraídos da página e o assume como domínio. Os próximos passos envolvem a avaliação de algoritmos de classificação com e sem a utilização do algoritmo proposto, afim de avaliar sua influência nos resultados em algoritmos já existentes. Além de uma avaliação mais profunda sobre algoritmo desenvolvido e possíveis ajustes e aperfeiçoamentos. Referências Barla, Michal, and Maria Bielikova. (2013). From Ambiguous Words to Key Concept Extraction. Database and Expert Systems Applications (DEXA), th International Workshop on. IEEE. Bleik, S., Mishra, M., Huan, J., & Song, M. (2013). Text Categorization of Biomedical Data Sets Using Graph Kernels and a Controlled Vocabulary. Computational Biology and Bioinformatics, IEEE/ACM Transactions on, 10(5), Luo, Q., Chen, E., & Xiong, H. (2011). A semantic term weighting scheme for text categorization. Expert Systems with Applications, 38(10), Qi, X., & Davison, B. D. (2009). Web page classification: Features and algorithms. ACM Computing Surveys (CSUR), 41(2), 12. Tao, X., Li, Y., Lau, R. Y., & Wang, H. (2012). Unsupervised multi label text classification using a world knowledge ontology. In Advances in Knowledge Discovery and Data Mining (pp ). Springer Berlin Heidelberg. Wang, P., & Domeniconi, C. (2008). Building semantic kernels for text classification using wikipedia. In Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining (pp ). ACM. Yun, J., Jing, L., Yu, J., & Huang, H. (2010). Semantics based representation model for multi layer text classification. In Knowledge Based and Intelligent Information and Engineering Systems (pp. 1 10). Springer Berlin Heidelberg. 317

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO Renan de Oliveira Yamaguti Faculdade de Engenharia de Computação / CEATEC renan.yamaguti@terra.com.br

Leia mais

Declaração de Pesquisa: Extração Automática de Ontologias da Wikipédia

Declaração de Pesquisa: Extração Automática de Ontologias da Wikipédia Declaração de Pesquisa: Extração Automática de Ontologias da Wikipédia Clarissa Castellã Xavier 1, Vera Lúcia Strube de Lima 1 1 Faculdade de Informática PUCRS, Av. Ipiranga, 6681 Prédio 32, Porto Alegre,

Leia mais

Palavras-chave: Sistema neuro-fuzzy, Sistemas de avaliação, Sistemas Adaptativos.

Palavras-chave: Sistema neuro-fuzzy, Sistemas de avaliação, Sistemas Adaptativos. ANÁLISE DO CURSO DE ENGENHARIA ELÉTRICA NA UERJ A PARTIR DE INDICADORES CONSTRUÍDOS BASEADOS NO EXAME NACIONAL DE CURSOS: UM SISTEMA NEBULOSO DE AVALIAÇÃO Maria Luiza F. Velloso mlfv@centroin.com.br Universidade

Leia mais

Análise de rede de termos em Sistemas Embarcados através de análise da rede de termos em títulos de trabalhos científicos

Análise de rede de termos em Sistemas Embarcados através de análise da rede de termos em títulos de trabalhos científicos Análise de rede de termos em Sistemas Embarcados através de análise da rede de termos em títulos de trabalhos científicos Jansen Souza, Moacir L. Mendonça Júnior, Alisson V. Brito e Alexandre N. Duarte

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

Identificando a Formação de Ilhas de Conhecimento em Projetos de Software

Identificando a Formação de Ilhas de Conhecimento em Projetos de Software Identificando a Formação de Ilhas de Conhecimento em Projetos de Software Francisco Vanderson de Moura Alves 1, Pedro de Alcântara dos Santos Neto 1, Werney Ayala Luz Lira 1, Ricardo de Andrade Lira Rabêlo

Leia mais

8º Congresso de Pós-Graduação MINERAÇÃO BASEADA EM GRAFOS APLICADA À ÁREA BIOMÉDICA

8º Congresso de Pós-Graduação MINERAÇÃO BASEADA EM GRAFOS APLICADA À ÁREA BIOMÉDICA 8º Congresso de Pós-Graduação MINERAÇÃO BASEADA EM GRAFOS APLICADA À ÁREA BIOMÉDICA Autor(es) RODRIGO DE SOUSA GOMIDE Co-Autor(es) MARINA TERESA PIRES VIEIRA Orientador(es) MARINA TERESA PIRES VIEIRA 1.

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:

Leia mais

WebOnto: Anotação Semântica com Ontologias de Domínio

WebOnto: Anotação Semântica com Ontologias de Domínio WebOnto: Anotação Semântica com Ontologias de Domínio Stainam Brandão (COPPE/UFRJ) stainam@cos.ufrj.br Arthur Siqueira (COPPE/UFRJ) arthur@cos.ufrj.br Jano Moreira de Souza (COPPE/UFRJ) jano@cos.ufrj.br

Leia mais

Reconhecimento de entidades nomeadas em textos em português do Brasil no domínio do e-commerce

Reconhecimento de entidades nomeadas em textos em português do Brasil no domínio do e-commerce Reconhecimento de entidades nomeadas em textos em português do Brasil no domínio do e-commerce Lucas Hochleitner da Silva 1,2, Helena de Medeiros Caseli 1 1 Departamento de Computação Universidade Federal

Leia mais

Uma Análise de Comentários Sobre Produtos e Empresas, Usando o Corpus do Reclame Aqui

Uma Análise de Comentários Sobre Produtos e Empresas, Usando o Corpus do Reclame Aqui Uma Análise de Comentários Sobre Produtos e Empresas, Usando o Corpus do Reclame Aqui Roney L. de S. Santos 1, João P. A. Vieira 1, Jardeson L. N. Barbosa 1, Carlos A. de Sá 1, Raimundo S. Moura 1 1 Departamento

Leia mais

Métodos Estatísticos para Segmentação de Listas Web

Métodos Estatísticos para Segmentação de Listas Web Métodos Estatísticos para Segmentação de Listas Web William Marx 1, Sergio L. S. Mergen 1 1 Campus Alegrete - Universidade Federal do Pampa (UNIPAMPA) CEP 97.546-550 Alegrete RS Brasil william.f.marx@gmail.com,

Leia mais

Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br

Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNOS: PREVISÃO DO DESEMPENHO DE ESTUDANTES A PARTIR DE SUA INTERAÇÃO COM UM SISTEMA TUTOR. Luiz Henrique Marino Cerqueira

Leia mais

SciProvMiner: Arquitetura para Captura de Proveniência de dados de Workflows Científicos utilizando o Modelo OPM

SciProvMiner: Arquitetura para Captura de Proveniência de dados de Workflows Científicos utilizando o Modelo OPM SciProvMiner: Arquitetura para Captura de Proveniência de dados de Workflows Científicos utilizando o Modelo OPM Tatiane O. M. Alves Regina M. M. Braga Departamento de Ciência da Computação Universidade

Leia mais

Uma Linguagem Específica de Domínio com Geração de Código Paralelo para Visualização de Grandes Volumes de Dados

Uma Linguagem Específica de Domínio com Geração de Código Paralelo para Visualização de Grandes Volumes de Dados Uma Linguagem Específica de Domínio com Geração de Código Paralelo para Visualização de Grandes Volumes de Dados Cleverson Ledur, Dalvan Griebler, Luiz Gustavo Fernandes, Isabel Manssour Pontifícia Universidade

Leia mais

Sintonia fina baseada em ontologia: o caso de visões materializadas

Sintonia fina baseada em ontologia: o caso de visões materializadas paper:11 Sintonia fina baseada em ontologia: o caso de visões materializadas Aluno - Rafael Pereira de Oliveira 1 Orientador - Sérgio Lifschitz 1 1 Departamento de Informática Programa de Pós-graduação

Leia mais

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

Recuperação parcial de imagens: Abordagem baseada em topologia hierárquica e similaridade de cor

Recuperação parcial de imagens: Abordagem baseada em topologia hierárquica e similaridade de cor Recuperação parcial de imagens: Abordagem baseada em topologia hierárquica e similaridade de cor Autor: Dalí Freire Dias dos Santos Orientadora: Denise Guliato Programa de Pós-Graduação em Ciência da Computação

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

UMA METODOLOGIA DE AVALIAÇÃO DE FERRAMENTAS PARA GESTÃO DE ONTOLOGIAS A METHODOLOGY FOR EVALUATING ONTOLOGY MANAGEMENT TOOLS

UMA METODOLOGIA DE AVALIAÇÃO DE FERRAMENTAS PARA GESTÃO DE ONTOLOGIAS A METHODOLOGY FOR EVALUATING ONTOLOGY MANAGEMENT TOOLS SEMINÁRIO DE PESQUISA EM ONTOLOGIA NO BRASIL 11 E 12 de Julho Universidade Federal Fluminense Departamento de Ciência da Informação Niterói Rio de Janeiro Brasil Esta comunicação está sendo submetida sob

Leia mais

Table 1. Dados do trabalho

Table 1. Dados do trabalho Título: Desenvolvimento de geradores de aplicação configuráveis por linguagens de padrões Aluno: Edison Kicho Shimabukuro Junior Orientador: Prof. Dr. Paulo Cesar Masiero Co-Orientadora: Prof a. Dr. Rosana

Leia mais

3 Ferramentas de busca

3 Ferramentas de busca 3 Ferramentas de busca A Internet se transformou em um vasto repositório de informações. Podemos encontrar sites sobre qualquer assunto, de futebol a religião. O difícil, porém é conseguir encontrar a

Leia mais

ESIMILYONTO: UM MÉTODO EFICIENTE PARA OBTENÇÃO DA SIMILARIDADE ENTRE DOCUMENTOS DA WEB SEMÂNTICA

ESIMILYONTO: UM MÉTODO EFICIENTE PARA OBTENÇÃO DA SIMILARIDADE ENTRE DOCUMENTOS DA WEB SEMÂNTICA ESIMILYONTO: UM MÉTODO EFICIENTE PARA OBTENÇÃO DA SIMILARIDADE ENTRE DOCUMENTOS DA WEB SEMÂNTICA Andréia Dal Ponte Novelli Doutoranda da área de Informática do ITA Professora da área de informática da

Leia mais

Web Semântica e Matching de Ontologias: Uma Visão Geral

Web Semântica e Matching de Ontologias: Uma Visão Geral Web Semântica e Matching de Ontologias: Uma Visão Geral Hélio Rodrigues de Oliveira Departamento de Computação Universidade Federal do Ceará heliorodrigues@lia.ufc.br Bernadette Farias Lóscio Departamento

Leia mais

Esta comunicação está sendo submetida sob o [x] Tema 1 Aspectos teóricos e metodológicos nos estudos em ontologias

Esta comunicação está sendo submetida sob o [x] Tema 1 Aspectos teóricos e metodológicos nos estudos em ontologias SEMINÁRIO DE PESQUISA EM ONTOLOGIA NO BRASIL 11 e 12 de Agosto Universidade Federal Fluminense Departamento de Ciência da Informação Niterói Rio de Janeiro Brasil Esta comunicação está sendo submetida

Leia mais

INSTITUTO VIANNA JÚNIOR LTDA FACULDADES INTEGRADAS DO INSTITUTO VIANNA JUNIOR O TEXT MINING PARA APOIO A TOMADA DE DECISÃO

INSTITUTO VIANNA JÚNIOR LTDA FACULDADES INTEGRADAS DO INSTITUTO VIANNA JUNIOR O TEXT MINING PARA APOIO A TOMADA DE DECISÃO INSTITUTO VIANNA JÚNIOR LTDA FACULDADES INTEGRADAS DO INSTITUTO VIANNA JUNIOR O TEXT MINING PARA APOIO A TOMADA DE DECISÃO Lúcia Helena de Magalhães 1 Márcio Aarestrup Arbex 2 Resumo Este artigo tem como

Leia mais

Uma Ferramenta para Geração Automática de Testes Funcionais e Protótipos de Interface a partir de Casos de Uso

Uma Ferramenta para Geração Automática de Testes Funcionais e Protótipos de Interface a partir de Casos de Uso Uma Ferramenta para Geração Automática de Testes Funcionais e Protótipos de Interface a partir de Casos de Uso Ernesto C. Brasil 1, Thiago C. de Sousa 2 1 Centro de Ensino Unificado de Teresina (CEUT)

Leia mais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais UNIVERSIDADE ESTADUAL DE PONTA GROSSA PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA CRISTIAN COSMOSKI RANGEL DE ABREU TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

Engenharia de Ontologias Seminário UPON

Engenharia de Ontologias Seminário UPON Engenharia de Ontologias Seminário UPON Núcleo de Estudos em Modelagem Conceitual e Ontologias Bruno Nandolpho Machado Vinícius Soares Fonseca Professor: Ricardo de Almeida Falbo Agenda RUP Método UPON

Leia mais

OntoDig: Um sistema multi-agente para reutilização de ontologias

OntoDig: Um sistema multi-agente para reutilização de ontologias OntoDig: Um sistema multi-agente para reutilização de ontologias Pedro Oliveira Departamento de Engenharia Informática Faculdade de Ciências e Tecnologia Universidade de Coimbra Resumo. A reutilização

Leia mais

TPref-SQL: uma linguagem de consultas para bancos de dados com suporte a preferências temporais

TPref-SQL: uma linguagem de consultas para bancos de dados com suporte a preferências temporais TPref-SQL: uma linguagem de consultas para bancos de dados com suporte a preferências temporais Autor: Marcos Roberto Ribeiro 1, Orientadora: Sandra Aparecida de Amo 1 1 Programa de Pós-Graduação em Ciência

Leia mais

Um Método Probabilístico para o Preenchimento Automático de Formulários Web a partir de Textos Ricos em Dados

Um Método Probabilístico para o Preenchimento Automático de Formulários Web a partir de Textos Ricos em Dados Um Método Probabilístico para o Preenchimento Automático de Formulários Web a partir de Textos Ricos em Dados Guilherme Alves Toda 1, Altigran Soares da Silva (Orientador) 1 1 Departamento de Ciência da

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Identificação de padrões de itinerários e de pontos intermediários em dados espaço-temporais utilizando busca por similaridade

Identificação de padrões de itinerários e de pontos intermediários em dados espaço-temporais utilizando busca por similaridade Identificação de padrões de itinerários e de pontos intermediários em dados espaço-temporais utilizando busca por similaridade Breno Naodi Kusunoki 1, Daniel dos Santos Kaster 1 1 Departamento de Computação

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA ANÁLISE DE AGENTES CLASSIFICADORES PARA CATEGORIZAÇÃO AUTOMÁTICA DE DOCUMENTOS DIGITAIS PROPOSTA DE TRABALHO

Leia mais

Revisando o Método de Análise da Semântica Latente para Propósitos de Mineração de Opiniões sobre Produtos

Revisando o Método de Análise da Semântica Latente para Propósitos de Mineração de Opiniões sobre Produtos Revisando o Método de Análise da Semântica Latente para Propósitos de Mineração de Opiniões sobre Produtos Wilson Pires Gavião Neto 1, Sidnei Renato Silveira 1 1 Sistemas de Informação: Ciência e Tecnologia

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Uma Proposta para o Uso de Folksonomias como Conceitualizações Compartilhadas na Especificação de Modelos Conceituais

Uma Proposta para o Uso de Folksonomias como Conceitualizações Compartilhadas na Especificação de Modelos Conceituais Uma Proposta para o Uso de Folksonomias como Conceitualizações Compartilhadas na Especificação de Modelos Conceituais Josiane M. P. Ferreira 1,2, Cesar Augusto Tacla 1, Sérgio R. P. da Silva 2 1 CPGEI

Leia mais

Análise de Web Reviews Sobre Produtos ou Serviços Usando um Léxico de Sentimentos

Análise de Web Reviews Sobre Produtos ou Serviços Usando um Léxico de Sentimentos Análise de Web Reviews Sobre Produtos ou Serviços Usando um Léxico de Sentimentos João Paulo A. Vieira 1, Jardeson L. N. Barbosa¹, Roney L. de S. Santos¹, Carlos A. de Sá¹, Raimundo S. Moura 1 1 Departamento

Leia mais

Reconhecendo Padrões em Planilhas no domínio de uso da Biologia

Reconhecendo Padrões em Planilhas no domínio de uso da Biologia Reconhecendo Padrões em Planilhas no domínio de uso da Biologia Ivelize Rocha Bernardo, André Santanchè, Maria Cecília Calani Baranauskas Instituto de Computação Universidade Estadual de Campinas (UNICAMP)

Leia mais

RESUMO. Palavras-Chaves: Índice Invertido, Recuperação de Imagens, CBIR. Nos últimos anos, o crescimento do número de imagens produzidas em meio

RESUMO. Palavras-Chaves: Índice Invertido, Recuperação de Imagens, CBIR. Nos últimos anos, o crescimento do número de imagens produzidas em meio UMA PROPOSTA DE MELHORIA NO PROCESSO DE RECUPERAÇÃO DE IMAGENS DIGITAIS COM BASE NA DISTRIBUIÇÃO DE CARACTERÍSTICAS DE BAIXO NÍVEL EM SUAS REGIÕES UTILIZANDO ÍNDICE INVERTIDO Patrícia Aparecida Proença

Leia mais

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA Daniel Mandelli Martins Faculdade de Engenharia de Computação CEATEC danielmartins@puc-campinas.edu.br Juan Manuel Adán Coello

Leia mais

Similaridade entre Objetos Localizados em Fontes de Dados Heterogêneas

Similaridade entre Objetos Localizados em Fontes de Dados Heterogêneas Similaridade entre Objetos Localizados em Fontes de Dados Heterogêneas Rubens Guimarães 1, Gustavo Zanini Kantorski 1 1 Curso de Sistemas de Informação Universidade Luterana do Brasil (ULBRA) Campus Santa

Leia mais

Controle de métricas no processo de desenvolvimento de software através de uma ferramenta de workflow

Controle de métricas no processo de desenvolvimento de software através de uma ferramenta de workflow Controle de métricas no processo de desenvolvimento de software através de uma ferramenta de workflow Gustavo Zanini Kantorski, Marcelo Lopes Kroth Centro de Processamento de Dados Universidade Federal

Leia mais

PLANO DE ESTUDOS PARA DOUTORAMENTO EM ENGENHARIA INFORMÁTICA E DE COMPUTADORES CLÁUDIA M. ANTUNES

PLANO DE ESTUDOS PARA DOUTORAMENTO EM ENGENHARIA INFORMÁTICA E DE COMPUTADORES CLÁUDIA M. ANTUNES UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO PLANO DE ESTUDOS PARA DOUTORAMENTO EM ENGENHARIA INFORMÁTICA E DE COMPUTADORES CLÁUDIA M. ANTUNES Orientação Professor Doutor Arlindo L. Oliveira

Leia mais

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback Relevance Feedback Expansão de Consulta Relevance Feedback 1 Relevance Feedback Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois métodos: Explicit Relevance Feedback a informação para a reformulação

Leia mais

Análise de Redes Sociais

Análise de Redes Sociais UFRJ COPPE PESC Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Projeto de Pesquisa: Análise

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

Sistema SeRELeP para o reconhecimento de relações

Sistema SeRELeP para o reconhecimento de relações Segundo HAREM Workshop PROPOR 2008: International Conference on Computational Processing of Portuguese Language para o reconhecimento de relações Mírian Bruckschen mirian.bruckschen@gmail.com Renata Vieira

Leia mais

Ambiente de workflow para controle de métricas no processo de desenvolvimento de software

Ambiente de workflow para controle de métricas no processo de desenvolvimento de software Ambiente de workflow para controle de métricas no processo de desenvolvimento de software Gustavo Zanini Kantorski, Marcelo Lopes Kroth Universidade Federal de Santa Maria (UFSM) 97100-000 Santa Maria

Leia mais

Utilizando Texto Livre

Utilizando Texto Livre Preenchimento Automático de Formulários Web Utilizando Texto Livre Aluno: Guilherme A. Toda Orientador: Altigran S. da Silva 1 Departamento de Ciência da Computação Universidade Federal do Amazonas (UFAM)

Leia mais

Gerenciamento de Workflows Científicos em Bioinformática

Gerenciamento de Workflows Científicos em Bioinformática Gerenciamento de Workflows Científicos em Bioinformática Agosto de 2007 Estudante: Orientador: Co-orientadora: Luciano Antonio Digiampietri João Carlos Setubal Claudia Bauzer Medeiros Roteiro Introdução

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

Uma Ontologia para Gestão de Segurança da Informação

Uma Ontologia para Gestão de Segurança da Informação Uma Ontologia para Gestão de Segurança da Informação Paulo Fernando da Silva, Henrique Otte, José Leomar Todesco, Fernando A. O. Gauthier Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento

Leia mais

Uma arquitetura de Cloud Computing para análise de Big Data proveniente da Internet of Things

Uma arquitetura de Cloud Computing para análise de Big Data proveniente da Internet of Things UNIVERSIDADE FEDERAL DE PERNAMBUCO Graduação em Engenharia da Computação Centro de Informática Uma arquitetura de Cloud Computing para análise de Big Data proveniente da Internet of Things Aluno: Diogo

Leia mais

Arquitetura de um Sistema de Recomendação Baseado em Ontologia para Anúncios de Carros

Arquitetura de um Sistema de Recomendação Baseado em Ontologia para Anúncios de Carros Arquitetura de um Sistema de Recomendação Baseado em Ontologia para Anúncios de Carros Fábio A. P. de Paiva 1, José A. F. Costa 2, Cláudio R. M. Silva 3, Ricardo S. França 4 1, 2, 4 Departamento de Eng.

Leia mais

Figura 1.1: Exemplo de links patrocinados no Google

Figura 1.1: Exemplo de links patrocinados no Google 1 Links Patrocinados 1.1 Introdução Links patrocinados são aqueles que aparecem em destaque nos resultados de uma pesquisa na Internet; em geral, no alto ou à direita da página, como na Figura 1.1. Figura

Leia mais

Seleção Baseada em Preço dos Melhores e Piores Provedores de Serviço em Rede de Sobreposição de Serviços Par-a-Par

Seleção Baseada em Preço dos Melhores e Piores Provedores de Serviço em Rede de Sobreposição de Serviços Par-a-Par Seleção Baseada em Preço dos Melhores e Piores Provedores de Serviço em Rede de Sobreposição de Serviços Par-a-Par Renato Balestrin Júnior 1, Adriano Fiorese 1 1 Departamento de Ciência da Computação (DCC)

Leia mais

Palavras Chave: Rede social, Grafo, Digrafo, Relação de amizade, Caminho 1 INTRODUÇÃO

Palavras Chave: Rede social, Grafo, Digrafo, Relação de amizade, Caminho 1 INTRODUÇÃO USANDO O FACEBOOK E APRENDENDO SOBRE GRAFOS Vinicius Schmidt Monego - viniciussm@rocketmail.com Monique Rubenich Nascimento - moniquee.rn@gmail.com Alice de Jesus Kozakevicius - alicek@ufsm.br Resumo.

Leia mais

3 Market Basket Analysis - MBA

3 Market Basket Analysis - MBA 2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar

Leia mais

Algoritmo de Recomendação Baseado em Passeios Aleatórios num Grafo Bipartido

Algoritmo de Recomendação Baseado em Passeios Aleatórios num Grafo Bipartido Recebido / Recibido: 08/10/2011 Aceitação / Aceptación: 09/12/2011 Algoritmo de Recomendação Baseado em Passeios Aleatórios num Grafo Bipartido Ricardo Gama 1, Nuno André, César Pereira, Luís Almeida,

Leia mais

TWITKNOWLEDGE - OBTENDO CONHECIMENTO A PARTIR DOS TWITTES PESSOAIS

TWITKNOWLEDGE - OBTENDO CONHECIMENTO A PARTIR DOS TWITTES PESSOAIS TWITKNOWLEDGE - OBTENDO CONHECIMENTO A PARTIR DOS TWITTES PESSOAIS Miguel Airton Frantz 1 ; Angelo Augusto Frozza 2 RESUMO A proposta básica desse projeto consiste em criar uma base de conhecimento a partir

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Busca Estocástica Baseada em Planejamento para Maximizar Metas em Jogos de RTS

Busca Estocástica Baseada em Planejamento para Maximizar Metas em Jogos de RTS Busca Estocástica Baseada em Planejamento para Maximizar Metas em Jogos de RTS Autor:Thiago França Naves 1, Orientador: Carlos Roberto Lopes 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade

Leia mais

MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes

MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes MARACATU A component search tool Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes Vinicius Cardoso Garcia July 29, 2005 Agenda Introdução Especificação

Leia mais

Virtual Museum Ontology: uma descrição ontológica de objetos virtuais 3D em Museus Virtuais

Virtual Museum Ontology: uma descrição ontológica de objetos virtuais 3D em Museus Virtuais Virtual Museum Ontology: uma descrição ontológica de objetos virtuais 3D em Museus Virtuais Felipe S. da Costa 1, Rafael G. de Oliveira 1, Everton F. C. de Almeida 1, Clézio L. Azevedo 1, Claudia M. F.

Leia mais

8 Bibliografia. ACEAUME, E. et al. On The Formal Specification of Group Membership Services. INRIA, 1995, 15 p. Relatório Técnico TR95-1534.

8 Bibliografia. ACEAUME, E. et al. On The Formal Specification of Group Membership Services. INRIA, 1995, 15 p. Relatório Técnico TR95-1534. Bibliografia 88 8 Bibliografia ACEAUME, E. et al. On The Formal Specification of Group Membership Services. INRIA, 1995, 15 p. Relatório Técnico TR95-1534. AMBRIOLA, V.; TORTORA, G. Advances in Software

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Verificação de Impressões Digitais usando Algoritmos Genéticos

Verificação de Impressões Digitais usando Algoritmos Genéticos 1. Introdução Verificação de Impressões Digitais usando Algoritmos Genéticos Matheus Giovanni Pires, Fernando Vieira Duarte, Adilson Gonzaga Escola de Engenharia de São Carlos Universidade de São Paulo

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Implantando um Programa de Melhoria de Processo: Uma Experiência Prática

Implantando um Programa de Melhoria de Processo: Uma Experiência Prática Implantando um Programa de Melhoria de Processo: Uma Experiência Prática Evandro Polese Alves Ricardo de Almeida Falbo Departamento de Informática - UFES Av. Fernando Ferrari, s/n, Vitória - ES - Brasil

Leia mais

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo.

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo. ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL Fellipe de Lima Fonseca 1 ; João Batista Rocha-Junior 2 1. Bolsista CNPq, Graduando em Engenharia de Computação, Universidade Estadual de Feira de Santana, e-mail:

Leia mais

Uma Abordagem para Detecção e Extração de Rótulos em Formulários Web

Uma Abordagem para Detecção e Extração de Rótulos em Formulários Web Uma Abordagem para Detecção e Extração de Rótulos em Formulários Web Leonardo Bres dos Santos, Carina F. Dorneles, Ronaldo dos Santos Mello Universidade Federal de Santa Catarina leonardobres@gmail.com,

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha WCGE II Workshop de Computação Aplicada em Governo Eletrônico Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini

Leia mais

Identificando Especialistas a partir da Análise dos Artigos Disponíveis em uma Biblioteca Digital

Identificando Especialistas a partir da Análise dos Artigos Disponíveis em uma Biblioteca Digital Identificando Especialistas a partir da Análise dos Artigos Disponíveis em uma Biblioteca Digital Paulo Roberto Faulstich Rego 1, Roger Granada 1, Gustavo Piltcher 1, Daniel Lichtnow 1, Stanley Loh 1,2

Leia mais

Uma Estratégia para o Alinhamento Taxonômico de Ontologias

Uma Estratégia para o Alinhamento Taxonômico de Ontologias Uma Estratégia para o Alinhamento Taxonômico de Ontologias Carolina Howard Felicíssimo, Karin Koogan Breitman Departamento de Informática PUC-RIO Rua Marquês de São Vicente, 225, CEP: 22453-900, Rio de

Leia mais

UMA ABORDAGEM PARA INTEGRAÇÃO SEMÂNTICA DE DADOS

UMA ABORDAGEM PARA INTEGRAÇÃO SEMÂNTICA DE DADOS Andréia D. P. Novelli 1 Erick de S. Carvalho 2 José M. P. de Oliveira 3 Desde o surgimento dos sistemas de informação, o problema de integração de dados tem sido alvo de pesquisas na comunidade científica

Leia mais

FORMULÁRIO PARA APRESENTAÇÃO DE PROJETO DE PESQUISA - PIBIC TÍTULO DO PROJETO Mineração de Grafos usando Ontologias COORDENADOR

FORMULÁRIO PARA APRESENTAÇÃO DE PROJETO DE PESQUISA - PIBIC TÍTULO DO PROJETO Mineração de Grafos usando Ontologias COORDENADOR Governo do Estado do Rio Grande do Norte Secretariado de Estado da Educação e Cultura - SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE - UERN Pró-Reitoria de Pesquisa e Pós-Graduação PROPEG Departamento

Leia mais

Categorização de Textos baseada em Conceitos

Categorização de Textos baseada em Conceitos Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Encontro de PLN Categorização de Textos baseada em Conceitos Silvia Maria

Leia mais

Interoperabilidade entre Bancos de Dados Relacionais e Bancos de Dados NoSQL (Parte 2)

Interoperabilidade entre Bancos de Dados Relacionais e Bancos de Dados NoSQL (Parte 2) Minicurso: Interoperabilidade entre Bancos de Dados Relacionais e Bancos de Dados NoSQL (Parte 2) Geomar A. Schreiner - schreiner.geomar@posgrad.ufsc.br Ronaldo S. Mello r.mello@ufsc.br Departamento de

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

egroup - Um Modelo para Gerenciamento de Grupos Dinâmicos de Entidades

egroup - Um Modelo para Gerenciamento de Grupos Dinâmicos de Entidades egroup - Um Modelo para Gerenciamento de Grupos Dinâmicos de Entidades Paulo Henrique Santini Universidade do Vale do Rio dos Sinos (Unisinos), Programa de Mestrado em Computação Aplicada (PIPCA). Av.

Leia mais

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS Planificação Anual da Disciplina de TIC Módulos 1,2,3-10.ºD CURSO PROFISSIONAL DE TÉCNICO DE APOIO À GESTÃO DESPORTIVA Ano Letivo 2015-2016 Manual adotado:

Leia mais

Lupa: Um Ambiente Facilitador do Desenvolvimento de Aplicações Data Mining

Lupa: Um Ambiente Facilitador do Desenvolvimento de Aplicações Data Mining Lupa: Um Ambiente Facilitador do Desenvolvimento de Aplicações Data Mining Stéfani Pires, Rafael Silva, Giuseppe Mongiovi Departamento de Informática Universidade Federal da Paraíba (UFPB) João Pessoa

Leia mais

Uma introdução à Web Semântica no domínio dos Sistemas de Informações Geográficas

Uma introdução à Web Semântica no domínio dos Sistemas de Informações Geográficas Uma introdução à Web Semântica no domínio dos Sistemas de Informações Geográficas Angelo Augusto Frozza, Rodrigo Gonçalves {frozza,rodrigog}@inf.ufsc.br Universidade Federal de Santa Catarina UFSC Florianópolis

Leia mais

PL-SCIENCE: CONECTANDO ONTOLOGIAS E MODELOS DE FEATURES EM UMA LINHA DE PRODUTO PARA APLICAÇÕES CIENTÍFICAS

PL-SCIENCE: CONECTANDO ONTOLOGIAS E MODELOS DE FEATURES EM UMA LINHA DE PRODUTO PARA APLICAÇÕES CIENTÍFICAS PL-SCIENCE: CONECTANDO ONTOLOGIAS E MODELOS DE FEATURES EM UMA LINHA DE PRODUTO PARA APLICAÇÕES CIENTÍFICAS Gabriella Castro Barbosa Costa gabriellacbc@gmail.com Orientadores Regina Maria Maciel Braga

Leia mais

Geração automática de glossários de termos específicos de um corpus de Geologia

Geração automática de glossários de termos específicos de um corpus de Geologia Geração automática de glossários de termos específicos de um corpus de Geologia Igor da Silveira Wendt (PUCRS) igor.wendt@acad.pucrs.br Lucelene Lopes (PUCRS) lucelene.lopes@pucrs.br Daniel Martins (PUCRS)

Leia mais

Geração de Base de Dados para o Teste de Aplicações de Banco de Dados pelo Emprego da Computação Evolucionária

Geração de Base de Dados para o Teste de Aplicações de Banco de Dados pelo Emprego da Computação Evolucionária 215 Geração de Base de Dados para o Teste de Aplicações de Banco de Dados pelo Emprego da Computação Evolucionária Bruno Braz Silveira 1, Plínio Sá Leitão-Júnior 1, Mariana Soller Ramada 1, Beatriz Proto

Leia mais

Fatores de Impacto para alguns Periódicos Base JCR-2003 /ISI 1

Fatores de Impacto para alguns Periódicos Base JCR-2003 /ISI 1 Fatores de Impacto para alguns Periódicos Base JCR-2003 /ISI 1 O Journal Citation Reports (JCR) publica anualmente o índice conhecido por fator de impacto de um periódico para medir a freqüência com que

Leia mais

Evitando Relatos de CRs duplicadas em Projetos Open Source de Software

Evitando Relatos de CRs duplicadas em Projetos Open Source de Software Evitando Relatos de CRs duplicadas em Projetos Open Source de Software Yguaratã C. Cavalcanti 1,2, Alexandre C. Martins 1,2, Eduardo S. Almeida 2, Silvio L. Meira 1,2 1 Centro de Informática Universidade

Leia mais

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Carla Gomes de Faria1, Ismênia Ribeiro de Oliveira1, Rosario Girardi1 1Universidade Federal do Maranhão (UFMA)

Leia mais

DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial

DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial Aluno: André Faria Ruaro Professores: Jomi F. Hubner e Ricardo J. Rabelo 29/11/2013 1. Introdução e Motivação 2.

Leia mais