Mineração na Web LEANDRO BALBY MARINHO ROSARIO GIRARDI UFMA UNIVERSIDADE FEDERAL DO MARANHÃO DEINF DEPARTAMENTO DE INFORMÁTICA
|
|
- Leonor Terra Fernandes
- 2 Há anos
- Visualizações:
Transcrição
1 Mineração na Web LEANDRO BALBY MARINHO ROSARIO GIRARDI UFMA UNIVERSIDADE FEDERAL DO MARANHÃO DEINF DEPARTAMENTO DE INFORMÁTICA GESEC/DEINF, Avenida dos Portugueses, s/n, Campus Universitário do Bacanga, São Luís - Maranhão - Brasil, CEP Resumo: A Web é hoje a maior fonte de informação eletrônica que dispomos. Entretanto, por causa da sua natureza dinâmica, a tarefa de achar informações relevantes se torna muitas vezes uma experiência frustrante. Muitos esforços de pesquisa têm sido feitos no sentido de sanar esse problema. Um deles é a utilização de técnicas de mineração de dados para a descoberta de informações na Web. Este tutorial apresenta uma visão geral da mineração na Web, as fases do processo e as categorias em que se divide. Palavras chaves: WWW, Mineração de dados, Recuperação de informação, Descoberta de conhecimento. 1. Introdução Somos testemunhas do enorme aumento de informações e recursos na Web nos últimos anos. Mais de um bilhão de páginas são indexadas pelos motores de busca [Pal, 2000] e achar a informação desejada pode algumas vezes se tornar uma tarefa penosa. Essa abundância de informações e recursos instigou a necessidade do desenvolvimento de ferramentas automáticas de mineração e descoberta de informações na Web. De forma geral, a mineração na Web pode ser conceituada como a descoberta e análise inteligente de informações úteis da Web [Cooley, 1997]. Pode-se estar interessado, por exemplo, na informação contida dentro dos documentos da Web mineração de conteúdo - na informação contida entre os documentos da Web mineração de estrutura ou na informação contida na utilização ou interação com a Web mineração de uso. Essas são as três categorias em que se divide a mineração na Web, de acordo com a parte da Web a ser minerada. Para cada classificação são desenvolvidas técnicas e metodologias distintas, muitas delas herdadas de outras áreas disciplinares como Aprendizagem de máquina, Bancos de dados, Estatística, Recuperação de informação, Inteligência artificial e Redes sociais. A mineração na Web já não é tão recente, ela vem sendo citada e estudada desde meados de 1996, mas tem realmente ganhado importância nestes últimos anos. Podemos apontar dois fatores principais que contribuíram para isso: Aumento das transações comerciais na Web, que motivaram o desenvolvimento de técnicas para a mineração de uso, pois através delas os sites de venda puderam aprender acerca dos perfis dos compradores para montarem melhores estratégias de venda e marketing; O desenvolvimento da Web semântica [Decker, 2000] e da tecnologia dos agentes da informação [Sycara, 1996], onde as técnicas de mineração na Web são utilizadas. A Web semântica poderá entre outras coisas estender a inteligência dos agentes e não apenas o seu conhecimento. Dessa forma, os serviços da Web poderão eles próprios tornar-se entidades dotadas de comportamento autônomo, que poderão entre outras coisas, comunicar-se através de uma linguagem comum. A mineração na Web será uma ferramenta crucial a ser utilizada pelos agentes e serviços nessa visão da Web, pois ela os ajudará em várias tarefas, dentre as quais estão busca por informações, personalização e talvez até como mecanismo de aprendizado. Entretanto, têm-se muitos desafios e problemas a serem contornados antes que a Web possa realmente se transformar num meio mais rico, amigável e inteligente na qual todos possamos explorar e compartilhar.
2 O objetivo deste tutorial é apresentar uma visão geral sobre a mineração na Web, as fases do processo e as categorias em que se divide. A seção 2 descreve os principais conceitos da mineração na Web e a sua divisão segundo o processo geral de descoberta de conhecimento em bases de dados, falando um pouco sobre cada fase do processo. A seção 3 apresenta as categorias em que se divide a mineração na Web e o contexto em que cada uma delas se aplica. 2. Mineração na Web A Web é uma vasta coleção de documentos heterogêneos. Possui natureza dinâmica e milhões de páginas surgem e desaparecem todos os dias. Por isso sente-se um anseio para que a Web realmente alcance todo o seu potencial e se torne uma ferramenta mais utilizável, eficaz e compreensível. Nesse contexto a mineração de dados aparece como uma possibilidade óbvia a ser explorada. Em parte pelo seu grande sucesso quando aplicada a bancos de dados tradicionais, e em parte porque a Web parece ser uma área fértil em potencial para a aplicação de suas técnicas. A mineração de dados refere-se ao processo não trivial de identificação de padrões válidos, previamente desconhecidos e potencialmente úteis dos dados [Frawley, 1992]. Entretanto, utilizar e compreender os dados disponíveis na Web não é uma tarefa simples, pois esses dados são muito mais sofisticados e dinâmicos do que os sistemas de armazenamento de bancos de dados tradicionais. Enquanto estes últimos utilizam estruturas de armazenamento bem definidas e estruturadas, a Web não possui qualquer controle sobre a estrutura ou o tipo dos documentos que virtualmente armazena. Outro aspecto que diferencia a mineração de dados tradicional da mineração na Web é a existência de vínculos de hipertexto entre os seus documentos. Os vínculos de hipertexto são uma rica fonte de informações a ser explorada, pois dentre outras coisas, ajudam no processo de ranqueamento de páginas pelos motores de busca e na identificação de micro-comunidades na Web. Apesar das diferenças e particularidades entre as duas abordagens - mineração em dados tradicionais e mineração de dados da Web -, a metodologia utilizada para a mineração na Web, segue os mesmos passos utilizados no processo geral de descoberta de conhecimento em bases de dados (KDD Knowledge Database Discovery). O processo de mineração na Web é dividido em 4 sub-tarefas [Etizione, 1996], que na verdade são análogas às fases do processo KDD. Com base nas quatro fases descritas a seguir e na representação da Figura 1, a mineração na Web pode ser vista como a utilização de técnicas de mineração de dados para a recuperação automática, extração e avaliação de informação para a descoberta de conhecimento em documentos e serviços da Web. Aqui avaliação inclui tanto generalização quanto análise [Pal, 2000]. Dados da WEB Recuperação de informação (Descobrimento de recursos) Extração da informação (Seleção/Préprocessamento) Análise (Validação / Interpretação) Generalização (Reconhecimento de padrões / aprendizagem de máquina) Figura 1 Sub-tarefas da mineração na Web 2.1. Recuperação de informação (descobrimento de recursos) A recuperação de informação ou descobrimento de recursos trata da automatização do processo de recuperação de documentos relevantes, que inclui, principalmente, representação, indexação e busca por documentos. Um índice é basicamente uma coleção de termos retirados dos documentos com ponteiros para os lugares onde as informações sobre os documentos podem ser encontradas [Pal, 2000]. A indexação de páginas Web, para facilitar o processo de recuperação, é bem mais complexa que o processo de indexação utilizado em bancos de dados tradicionais. A enorme quantidade de páginas na Web, seu dinamismo e atualizações freqüentes fazem da indexação uma tarefa aparentemente impossível. E, na verdade, esse é um dos grandes desafios dos serviços de busca atuais: indexar toda a Web. Os serviços de busca - programas destinados a consultar e recuperar informações armazenadas tanto em bancos de dados, páginas HTML ou texto - ainda estão bem longe disso e
3 isso influi na recuperação das informações desejadas, pois algumas vezes os usuários estão atrás de uma informação que está justamente na porção da Web que ainda não foi indexada. A indexação de documentos na Web pode ser humana ou manual ou automática [Pal, 2000], e está baseada nos modelos tradicionais de recuperação de informação: espaço vetorial, estatístico e lingüístico [Baeza-Yates, 1999] [Girardi, 1998] [Salton, 1983]. A indexação é essencialmente um processo de classificação onde é realizada uma análise conceitual do documento ou elemento de informação. Por exemplo, nas técnicas baseadas no modelo do espaço vetorial, a indexação envolve a atribuição de elementos de informação a certas classes, onde uma classe é o conjunto de todos os elementos de informação para o qual um termo de indexação (ou palavra-chave), em particular, tem sido atribuído. Os elementos de informação podem fazer parte de várias classes. Algumas técnicas atribuem pesos aos termos de indexação de um elemento de informação de forma a refletir sua relativa relevância [Girardi, 1998]. Nas técnicas baseadas no modelo estatístico, os termos de indexação são extraídos a partir de uma análise de freqüência das palavras ou frases em cada documento e em toda a fonte de informação. Nas técnicas lingüísticas, os termos de indexação são extraídos utilizando técnicas de processamento da linguagem natural, por exemplo, análise morfológica, lexical, sintática e semântica [Girardi, 1995] Seleção da informação / Extração e pré-processamento Uma vez tendo sido os documentos recuperados, o próximo passo é transformar ou pré-processar esses documentos de forma que algoritmos de mineração de dados e aprendizagem de máquina possam ser aplicados de forma efetiva. O campo disciplinar conhecido como extração de informação presta um grande serviço à mineração da Web, no que diz respeito à fase de extração e pré-processamento da informação. Denomina-se extração de informação à tarefa de identificar fragmentos específicos que constituem o núcleo semântico de um documento em particular e construir modelos de representação da informação (conhecimento) a partir dele [Pal 2002]. Os métodos geralmente envolvem a escrita de código específico, popularmente chamados de wrappers responsáveis pelo mapeamento do documento para algum modelo de representação do conhecimento. O problema é que para cada documento da Web temos que escrever um código específico, tornando o trabalho manual. Como os documentos da Web não possuem uma semântica agregada às informações que contém, e nem mesmo um padrão de como apresentar essas informações ao usuário, temos que aprender acerca da estrutura individual de cada documento e escrever código para essa estrutura em particular. Daí a dificuldade de estendermos ou generalizarmos esse código para outros documentos. Vários métodos foram desenvolvidos para a extração de informação tanto em documentos desestruturados quanto em semi-estruturados. [Kushmerick, 1997] por exemplo, descreve vários aspectos e técnicas da extração de informação, [Freitag, 1998] fala sobre a aplicação de algoritmos de aprendizagem de máquina para a extração de informação de documentos HTML e [Soderland, 1999] fala sobre a aprendizagem de regras para a extração de informação de documentos semi-estruturados e texto comum. É importante salientar a diferencia entre as fases de recuperação e extração de informação. As técnicas de extração de informação buscam derivar conhecimento de documentos recuperados segundo a forma como um documento está estruturado e representado enquanto as técnicas de recuperação de informação visualizam o documento apenas como um conjunto de palavras [Pal 2002]. 2.3 Generalização Após as informações terem sido extraídas e algum modelo de representação das informações ter sido construído, são utilizadas técnicas de mineração de dados e aprendizagem de máquina para descobrir novo conhecimento a partir do que já existe. É nessa fase que os algoritmos de mineração vão descobrir novo conhecimento em cima do que já existe. Um exemplo que nos daria uma idéia de como seria uma saída de um desses algoritmos é dado abaixo. a) 70% das pessoas que acessam a seção sobre natação também acessam a seção sobre artes marciais; b) 80% dos sites que abordam o tema Fórmula-1 possuem links apontando para sites que falam da vida de Ayrton Senna; No primeiro exemplo, a saída poderia dar uma indicação ao mantenedor da loja virtual sobre as preferências e perfis de seus clientes, de forma a montar estratégias de vendas que possam impelir o usuário a comprar mais. No outro exemplo, a saída descobre uma relação interessante entre os sites podendo dar novos caminhos aos usuários interessados nesses tópicos. O maior problema em aprender ou descobrir novos conhecimentos da Web é a falta de marcação semântica das informações. Muitos algoritmos de mineração de dados requerem como entrada exemplos positivos ou negativos de algum conceito. Se, por exemplo, tivéssemos um conjunto de páginas da Web marcadas como exemplos positivos e negativos do conceito portal, seria fácil modelar um algoritmo classificatório para a classificação automática de novas páginas como portais ou não portais. Embora a Web atual dificulte o
4 processamento das suas informações por parte das máquinas, a Web Semântica [Lee, 2001] fornece uma solução a este problema. Agrupamento ou clustering é uma técnica de classificação que não requer entradas com marcação semântica, e por isso tem sido aplicada com sucesso em grandes conjuntos de documentos HTML [Cutting, 1992]. No clustering, documentos são agrupados de acordo com a sua similaridade, portanto, um novo documento é classificado de acordo com a sua similaridade com algum conjunto de documentos existente. Uma boa referência para clustering no contexto da mineração na Web pode ser encontrada em [Lingras,2002]. As Regras de associação também podem ser utilizadas nessa fase do processo. Regras de associação são basicamente expressões do tipo X Y onde X e Y são conjuntos de itens. X Y expressa que toda vez que uma transação T contiver X então ela provavelmente também conterá Y. A probabilidade ou confiança da regra é a porcentagem de transações contendo Y junto a X comparado ao total de transações contendo X. A idéia de minerar regras de associação se origina nos dados de super-mercados e afins onde regras como O cliente que compra o produto x também comprará o produto y com probabilidade (confiança) de c% [Pal, 2000]. A Web em sua concepção foi construída de forma a atender as necessidades de visualização e consumo de seres humanos, onde os textos são quase sempre escritos em linguagem natural sem nenhuma semântica que facilite seu processamento. Isso instigou o desenvolvimento de um novo conceito para a Web, chamada de Web semântica onde além de outras coisas promete escrever os documentos da Web com uma semântica agregada às informações de forma que as máquinas possam compreendê-los e processá-los. Um bom trabalho para aprofundamento sobre Web Semântica está em [Lee, 2001] 2.4 Análise Uma vez os padrões tendo sido descobertos os analistas precisam de técnicas e ferramentas apropriadas de modo a entender, visualizar, interpretar e validar esses padrões. O sistema WEB-MINER [Mobasher, 1997], por exemplo, propõe uma linguagem de consulta estruturada para a consulta do conhecimento descoberto (na forma de regras de associação e padrões seqüenciais). Outros sistemas utilizam técnicas de OLAP (On-line Analytical Processing) [Girardi, 1998] R. Girardi. Main Approaches to Software Classification and Retrieval. Em: Ingeniería del Software y reutilización: Aspectos Dinámicos y Generación Automática. Editores J. L. Barros y A. Domínguez. (Universidad de Vigo Ourense, del 6 al 10 de julio de 1998). Julio, [Girardi, 1995] R. Girardi,. "Classification and Retrieval of Software through their Descriptions in Natural Language", Ph.D. dissertation, No. 2782, University of Geneva, December [Han, 2000] com o propósito de simplificar a análise de estatísticas de uso em logs de acesso. 3. Categorias da Mineração na Web Nesta seção é apresentada uma visão geral das categorias em que se divide a mineração na Web, assim como algumas das técnicas utilizadas em cada uma delas. A mineração na Web se divide em três categorias de acordo com a parte da Web a ser minerada: mineração de conteúdo, mineração de estrutura e mineração de uso. A mineração de conteúdo aborda a mineração dos dados contidos dentro dos documentos da Web. A grande quantidade de formatos que os dados podem assumir (textos comuns, páginas HTML, imagens, áudio, vídeo, etc.) acabam dirigindo as técnicas de mineração a serem utilizadas. A mineração de estrutura por outro lado, aborda a mineração das informações contidas entre os documentos da Web. Os documentos da Web se relacionam basicamente através de vínculos de hipertexto, e esses vínculos escondem informações valiosas e interessantes não só sobre a topologia da Web, mas também sobre como os documentos se relacionam. A mineração de uso por sua vez, aborda a mineração das informações de uso da Web, que em outras palavras, são as informações sobre como o usuário interage com a Web. Nessa categoria são tratadas questões como personalização, interfaces adaptativas e aprendizado de perfis de usuários. 3.1 Mineração de conteúdo A mineração de conteúdo trata do descobrimento de informações úteis do conteúdo, dados, documentos e serviços da Web [Pal, 2000]. Vale salientar que o conteúdo da Web não se constitui apenas de texto ou hipertexto, mas abrange uma ampla variação de tipos de dados, tais como áudio, vídeo, dados simbólicos, metadados e vínculos de hipertexto. Apesar de já existir uma área de pesquisa destinada ao estudo da mineração de dados multimídia, o foco ainda são os dados de texto e hipertexto, que na verdade são os que constituem o grosso da Web. Uma boa referência para pesquisa sobre mineração de dados multimídia é [Zaiane, 1998]. Os dados de texto da Web podem ser de três tipos: desestruturados, tais como textos comuns, semiestruturados, tais como documentos HTML, e estruturados, tais como as tabelas de bancos de dados. No tratamento de dados desestruturados utiliza-se KDT (Knowledge Discovery in Texts) ou mineração de dados em
5 textos. A mineração em textos é uma área bem amadurecida e a sua cobertura em detalhes está além do escopo deste tutorial, mas uma boa referência é [Mladenic, 1998]. A extração de conhecimento da Web e a sua modelagem em uma representação simbólica para a aplicação de técnicas de mineração de dados é descrito em [Ghani, 2000]. Algumas outras abordagens que tratam da mineração de dados em texto sugerem reestruturar os documentos de forma que eles se tornem legíveis para as máquinas, ou seja, técnicas para a inserção de marcas (tags) semânticas nas informações [Pal, 2000]. A mineração em hipertexto envolve a mineração de páginas HTML, as quais além de texto contém vínculos hipertexto. Um excelente tutorial apresentando esse assunto é descrito em [Chakrabarti, 2000]. A mineração em serviços da Web tais como grupos de notícia, grupos de , lista de discussão e bibliotecas digitais também é uma área que tem cada vez mais chamado a atenção dos pesquisadores, principalmente pesquisadores envolvidos na área de WI ( Web Intelligence ) [Zhong, 2002]. A WI promete, dentre outras coisas, transformar os serviços da Web em entidades inteligentes, de forma que elas possam interagir e se comunicar através de uma linguagem comum, elevando assim, a Web a um outro nível de tecnologia da informação. Em [Levy, 2000] são discutidos os sistemas de Internet inteligentes em geral, abordando temas como modelagem de usuários, descobrimento e análise em fontes de informações remotas, integração da informação e gerenciamento de sites da Web. Há uma fina linha separando a mineração de conteúdo e a recuperação de informação na Web. Não há um consenso sobre a relação entre as duas, alguns afirmam que a recuperação da informação na Web pode ser vista como uma instância da mineração de conteúdo, e outros associam a mineração de conteúdo com recuperação inteligente de informação. Isso acontece porque algumas vezes as duas acabam trabalhando juntas para alcançar determinado objetivo e uma acaba por complementar a outra. Há basicamente duas estratégias para a mineração de conteúdo: uma realiza a mineração diretamente do conteúdo dos documentos e a outra incrementa o poder de busca de outras ferramentas e serviços. Na primeira estratégia, os documentos pretendidos já foram recuperados e já estão prontos para serem minerados. Na segunda estratégia, a mineração de conteúdo presta um grande favor às ferramentas e serviços de recuperação de informação, pois ajuda a realizar o processo de indexação e categorização dos documentos. Dessa forma, percebemos que quando a mineração de conteúdo utiliza a segunda estratégia, ela complementa o processo de recuperação de informação, sendo utilizada como uma ferramenta pelos motores e serviços de busca, daí nesse caso ser descrito por alguns como recuperação inteligente de informação. A mineração de conteúdo pode seguir duas abordagens: baseada em agentes ou baseada em bancos de dados. A abordagem baseada em agentes envolve o desenvolvimento de sistemas de inteligência artificial que podem agir de forma autônoma ou semi-autônoma para a descoberta e organização de informações da Web de acordo com os interesses de um usuário em particular [Kosala, 2000]. Geralmente, a abordagem baseada em agentes pode ser dividida em três categorias: agentes de busca inteligentes, agentes de filtragem e/ou categorização da informação e agentes de interface [Cooley, 1997]. A abordagem de bancos de dados focaliza-se nas técnicas para transformar os dados semi-estruturados ou desestruturados da Web em modelos de dados estruturados onde mecanismos de consulta, como, por exemplo, a linguagem SQL, possam ser utilizados, assim como técnicas de mineração de dados para a análise. 3.2 Mineração de estrutura Enquanto que na mineração de conteúdo da Web estamos interessados no que há dentro dos documentos, na mineração de estrutura o interesse está nas informações que existem de forma implícita entre os documentos. Esta categoria envolve a mineração da estrutura que há por trás da interligação entre os documentos da Web. O que liga esses documentos são os vínculos de hipertexto, os quais são os principais objetos de estudo nesta categoria. A Web pode ser visualizada como um grafo orientado, onde os nós representam páginas, e as setas entre pares de nós representam vínculos entre as páginas. Essa representação da Web em forma de grafo apresenta uma forte semelhança com as chamadas redes sociais [Kumar, 2002] que, juntamente com a análise de citações, inspirou a pesquisa dessa categoria de mineração. A teoria moderna de redes sociais foi desenvolvida a partir do trabalho de Stanley Milgram [Kumar, 2002]. Em 1967, Milgram conduziu experimentos onde ele pedia que diversas pessoas residentes em Omaha, Nebraska, conduzissem uma carta para um associado seu que morava em Boston. As pessoas só podiam enviar a carta para outra pessoa que elas conhecessem pelo primeiro nome, e essas pessoas por sua vez só podiam retransmitir a carta para uma pessoa que elas também conhecessem pelo primeiro nome. O objetivo era de que a carta chegasse ao seu associado no menor número de passos possíveis. Milgram descobriu que o número médio de passos ao longo do caminho das cartas que conseguiam chegar com sucesso era seis, criando o folclore de que quaisquer duas pessoas residentes nos Estados Unidos estavam ligadas em uma rede social com seis graus de separação.
6 Os pesquisadores têm explorado continuamente as similaridades entre a Web e as redes sociais, desenvolvendo técnicas que incrementam o poder dos motores de busca e dos sistemas de gerenciamento do conhecimento. Nas citações bibliográficas quando um artigo é bastante citado isso indica que provavelmente este é um artigo importante e de maior autoridade perante outros que abordam o mesmo tema. Acontece o mesmo com as páginas e documentos da Web. Os vínculos de hipertexto dão indicações interessantes de como as páginas se relacionam entre si, links apontando para uma página, por exemplo, podem indicar a sua importância, enquanto links saindo de uma página podem indicar entre outras coisas a continuação ou complemento dos tópicos abordados por ela. Alguns algoritmos foram propostos para a modelagem da topologia da Web tais como o HITS ( Hyperlinked Induced Topic Search ) [Kleinberg, 1998] e o PageRank [Brin, 1998]. Esses modelos são aplicados principalmente para calcular a qualidade ou relevância das páginas da Web. Uma das regras utilizadas é que quanto mais páginas estiverem apontando para uma determinada página, mais relevante ela será. Várias medidas são tomadas para garantir que as páginas que apontam tenham credibilidade. Alguns exemplos são o sistema Clever [Chakrabarti, 1999] e o site de busca Google [Brin, 1998]. Algumas outras aplicações destes modelos são a categorização de páginas Web e a descoberta de micro-comunidades na Web [Kumar, 1999]. 3.3 Mineração de uso A mineração de uso da Web focaliza-se em técnicas que possam prever o comportamento do usuário enquanto ele interage com a Web [Kosala, 2000]. Enquanto a mineração de conteúdo e a mineração de estrutura utilizam os dados reais ou primários da Web, a mineração de uso lida com os dados secundários provenientes da interação do usuário com a Web. Os dados de uso da Web incluem dados provenientes de logs de servidores web, logs de servidores proxy, logs de browsers, perfis de usuário, cookies, seções ou transações de usuários, pasta favoritos, consultas do usuário, cliques de mouse e qualquer outro dado gerado pela interação do usuário com a Web. O processo de mineração de uso da Web pode ser classificado segundo duas abordagens [Borges, 1998]. A primeira mapeia os dados de uso do servidor Web em tabelas relacionais antes das técnicas adaptadas de mineração de dados serem aplicadas. A segunda utiliza os dados de logs diretamente utilizando técnicas especiais de pré-processamento. Assim como no KDD, a limpeza e pré-processamento dos dados, aqui, é uma parte crucial do processo, pois a qualidade desses dados vai determinar a eficiência dos algoritmos de mineração. Uma boa referência para a descrição e comparação de métodos de pré-processamento para a mineração de uso da Web pode ser encontrada em [Cooley, 1999]. As aplicações da mineração de uso da Web podem ser classificadas em duas categorias principais: aprendizado de perfil de usuário ou modelagem em interfaces adaptativas (personalização) e aprendizado de padrões de navegação de usuário. A mineração de uso da Web despertou interesse especial no comércio eletrônico, principalmente pela sua necessidade de aprender acerca do comportamento dos clientes, perfis de compra, preferências e padrões de navegação. Alguns sites populares de comércio eletrônico já utilizam estas técnicas não só para a adaptação do site de acordo com o perfil do usuário, mas como para fazer recomendações de produtos de acordo com compras anteriores, ou baseadas na similaridade entre perfis de usuários. Um bon trabalho para o aprofundamento no tema são [Srivastava, 2000], [Salton, 1983] G. Salton, An Introduction to Modern Information Retrieval. New York: McGraw-Hill, [Spilopoulon, 1999] e a tese de doutorado de Robert Coolley [Cooley, 2000] que trata da mineração de padrões de usuários. 4. Conclusão Este tutorial apresentou uma visão geral da mineração de dados da Web. Foram analisadas as diferentes fases do processo de mineração: descobrimento de recursos, extração de informação, generalização e análise. Também foi apresentada uma classificação das diferentes modalidades de mineração: mineração de conteúdo, mineração de estrutura e mineração de uso. O que dificulta o estudo da mineração da Web é a delimitação de seu escopo por se tratar de uma área multidisciplinar vinculada a outras áreas, como a recuperação de informação, a aprendizagem de máquina e os agentes da informação. Este trabalho procurou, de uma forma concisa, caracterizar e definir o alcance da mineração da Web; estabelecer seu relacionamento com outras disciplinas e oferecer indicações para o aprofundamento no estudo dos diferentes tópicos da área. 5. Referências bibliográficas [Baeza-Yates, 1999] R. Baeza-Yates, B., Ribeiro-Neto, Modern Information Retrieval. New York: ACM Press Series/Addison Wesley, 1999.
7 [Borges, 1998] J.Borges & M.Levene, Mining association rules in hypertext databases. In Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining (KDD-98). New York City, New York, USA, [Brin, 1998] S. Brin & L. Page, The anatomy of a large scale Web Search Engine. In Seventh International World Wide Web Conference, Brisbane, Australia, [Chakrabarti, 1999] S. Chakrabarti, B. Dom, D. Gibson, J. Kleinberg, S. Kumar, P. Raghavan, S. Rajagopalan, & A. Tomkins, Mining the link structure of the World Wide Web, [Chakrabarti, 2000] S. Chakrabarti, Data mining for hypertext. ACM SIGKDD Explorations, [Cooley, 1997] R.Cooley, B.Mobasher & J. Srivastava, Web mining: information and pattern Discovery on the World Wide Web. Proceedings of the 9 th IEEE International Conference on Tools with Artificial Intelligence, [Cooley, 1999] R.Cooley, B.Mobasher & J. Srivastava, Data preparation for mining world wide web browsing patterns. Knowledge and Information Systems, [Cooley, 2000] R. W. Cooley, Web usage mining: Discovery and application of Interesting Patterns from Web data. PhD thesis, Dept. of Computer Science, University of Minesota, [Cutting, 1992] D.D. Cutting, J. Karger, J. Pederson & J. Scatter, A cluster based approach to browsing large document collections. Proceedings of the Fifteenth International Conference on Research and Development in Information Retrieaval, [Decker, 2000] S. Decker, S. Melnick, F. V. Harmelen, D. Fensel, M. Klein, J. Broekstra, M. Erdmann, I.Horrocks, THE SEMANTIC WEB:The Roles of XML and RDF. IEEE Internet Computing, [Etzione, 1996] O. Etzione, The World Wide Web Quagmire or gold mine Communications of the ACM, vol.39, no.11, pp , [Frawley, 1992] W.J. Frawley, G. Piatetsky-Shapiro, and C.J. Matheus. Knowledge discovery in databases: an overview. In G. Piatetsky-Shapiro & W.J. Frawley, editors, Knowledge Discovery in Databases. AAAI / MIT Press, [Freitag, 1998] D. Freitag, Information Extraction from HTML: Application of a General Machine Learning Approach. American association for Artificial Intelligence, [Ghani, 2000] R. Ghani, R. Jones, D. Mladenic, K. Nigam, & S. Slattery, Data mining on symbolic knowledge extracted from the Web. In Proceedings of the Sixth Internaional Conference on knowledge Discovery and Data mining (KDD-2000), [Girardi, 1998] R. Girardi. Main Approaches to Software Classification and Retrieval. Em: Ingeniería del Software y reutilización: Aspectos Dinámicos y Generación Automática. Editores J. L. Barros y A. Domínguez. (Universidad de Vigo Ourense, del 6 al 10 de julio de 1998). Julio, [Girardi, 1995] R. Girardi,. "Classification and Retrieval of Software through their Descriptions in Natural Language", Ph.D. dissertation, No. 2782, University of Geneva, December [Han, 2000] J.Han, OLAP Mining: An integration of OLAP with Data Mining. School of Computing Science, Simon Fraser University, British Columbia, Canada, [Kleinberg, 1998] J.M. Kleinberg, Authoritative Sources in a Hyper-linked Enviroment. In Proc. ACM-SIAM Symposyum on Discrete Alghoritms, [Kosala, 2000] R. Kosala & H. Blockeel, Web mining research: a survey. SIG KDD Explorations, vol.2, pp. 1-15, [Kumar, 1999] S.R. Kumar, P. Raghavan, S. Rajagopalan & A. Tomkins, Trawling the web for emerging cybercommunities. In Proceedings of the Eighth WWW Conference, [Kumar, 2002] R. Kumar, P. Raghavan, S. Rajagopalan & A. Tomkins, The Web and Social Networks, IEEE Computer, vol.35, no.11, 2002, pp [Kushmerick, 1997] N. Kushmerick, Wrapper Induction for Information Extraction. Doctoral thesis. University of Washington, Department of Computer Science and Engineering, [Lee, 2001] BERNERS LEE, Tim, HENDLER, James, LASSILA, Ora. The Semantic Web. Scientifc American, May [Levy, 2000] A. Levy & D. Weld, Intelligent Internet Systems. Artificial Intelligence, vol.118, no.1-2, [Lingras, 2002] P. Lingras, Rough Set Clustering for Web Mining. Saint Mary s University, [Mladenic, 1998] M. Mladenic & M. Globelnik, Efficient text categorization. In Proceedings of Text Mining Workshop on the 10 th European Conference on Machine Learning, 1998.
8 [Mobasher, 1997] B. Mobasher, N. Jain, E.H. Han & J. Srivastava, Web Mining: Patterns from WWW transactions. Tech. Rep. TR96-050, Dept. of Computer Science, University of Minesota, [Pal, 2000] Sankar K. Pal, Varum Talwar, Pabitra Mitra, Web Mining in Soft Computing Framework: Relevant, State of the Art and Future Directions, [Salton, 1983] G. Salton, An Introduction to Modern Information Retrieval. New York: McGraw-Hill, [Spilopoulon, 1999] M. Spilopoulon, Data mining for the Web. In Principles of data mining and knowledge discovery, Second European Symposium, [Srivastava, 2000] J. Srivastava, R.Cooley, M. Deshpande & P.N.Tan., Web usage mining: Discovery and applications of usage patterns from Web data. SIG KDD Explorations, [Soderland, 1999] S. Soderland, Learning Information Extraction Rules for Semi-structured and Free Text. Machine Learning Kluwer Academic Publishers, Boston. Manufactured in The Netherlands, [Sycara, 1996] K. Sycara, K. Decker, A. Pannu, M. Williamson & D. Zeng, Distributed Intelligent Agents. The robotics institute, Carnegie Mellon University, [Zaiane, 1998] O. R. Zaiane, J. Han, Z. N. Li, S.H. Chee, & J.Chiang, Multimidia data miner: a system prototype for multimedia data miner. In Proc. ACM SIGMOD Intl. Conf. on Management of Data, pages , [Zhong, 2002] N. Zhong, J. Liu, Y. Yao, In Search of the Wisdom Web. IEEE Computer, vol.35, no.11, 2002, pp
Planejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na
RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS
ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1
Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O
3 Ferramentas de busca
3 Ferramentas de busca A Internet se transformou em um vasto repositório de informações. Podemos encontrar sites sobre qualquer assunto, de futebol a religião. O difícil, porém é conseguir encontrar a
A Estrutura da Web. Redes Sociais e Econômicas. Prof. André Vignatti
A Estrutura da Web Redes Sociais e Econômicas Prof. André Vignatti A Estrutura da Web Até agora: redes onde unidades eram pessoas ou entidades sociais, como empresas e organizações Agora (Cap 13, 14 e
Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags
Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:
PROJETO DE REDES www.projetoderedes.com.br
PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro
Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados
Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento
O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.
O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar
MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO
MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data
Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento
Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um
Descoberta de Domínio Conceitual de Páginas Web
paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL
Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso
Planejamento de Testes a partir de Casos de Uso Arilo Cláudio Dias Neto ariloclaudio@gmail.com É Bacharel em Ciência da Computação formado na Universidade Federal do Amazonas, Mestre em Engenharia de Sistemas
Aula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
2 Conceitos Gerais de Classificação de Documentos na Web
Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.
Padronização de Processos: BI e KDD
47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:
UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS
UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário
Análise comparativa sobre bases de dados para armazenamento e consulta de dados não estruturados no formato JSON.
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA Análise comparativa sobre bases de dados para armazenamento e consulta de dados não estruturados no formato JSON. Proposta de Trabalho de Graduação
MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES. MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com. URL: http://esganarel.home.sapo.
MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com URL: http://esganarel.home.sapo.pt GABINETE: 1G1 - A HORA DE ATENDIMENTO: SEG. E QUA. DAS 11H / 12H30 (MARCAÇÃO
Núcleo de Pós Graduação Pitágoras
Núcleo de Pós Graduação Pitágoras Professor: Fernando Zaidan Disciplina: Arquitetura da Informática e Automação MBA Gestão em Tecnologia 1 da Informaçao 2 Figura: Tela do IBM Mainframe Fonte: Arquivo próprio
Web Semântica e Matching de Ontologias: Uma Visão Geral
Web Semântica e Matching de Ontologias: Uma Visão Geral Hélio Rodrigues de Oliveira Departamento de Computação Universidade Federal do Ceará heliorodrigues@lia.ufc.br Bernadette Farias Lóscio Departamento
Professor: Disciplina:
Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais
PARANÁ GOVERNO DO ESTADO
PARANÁ GOVERNO DO ESTADO COLÉGIO ESTADUAL DE PARANAVAÍ ENSINO FUNDAMENTAL, MÉDIO, NORMAL E PROFISSIONAL CURSO TÉCNICO EM INFORMÁTICA DISCIPLINA: INTERNET E PROGRAMAÇÃO WEB 1º MÓDULO SUBSEQUENTE MECANISMOS
Laboratório de Mídias Sociais
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais parte I Prof. Dalton Martins dmartins@gmail.com Gestão da Informação Universidade Federal de Goiás O que é Análise Textual? Análise
Introdução! 1. Modelos de Domínio! 1. Identificação de classes conceituais! 2. Estratégia para identificar classes conceituais! 2
Modelo de domínio Introdução! 1 Modelos de Domínio! 1 Identificação de classes conceituais! 2 Estratégia para identificar classes conceituais! 2 Passos para a elaboração do modelo de domínio! 2 Passo 1
Introdução à Tecnologia Web. Tipos de Sites. Profª MSc. Elizabete Munzlinger www.elizabete.com.br
IntroduçãoàTecnologiaWeb TiposdeSites ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br TiposdeSites Índice 1 Sites... 2 2 Tipos de Sites... 2 a) Site
Proposta Revista MARES DE MINAS
SATIS 2011 Proposta Revista MARES DE MINAS 21/03/2011 A SATIS Índice 1 A Satis 1 A Proposta 1 Serviços 2 Mapa do Site 2 SEO 3 Sistema de gerenciamento de conteudo 4 Cronograma e Prazos 5 Investimento 6
Módulo 4: Gerenciamento de Dados
Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não
ADM041 / EPR806 Sistemas de Informação
ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes
Recuperação de Imagens na Web Baseada em Informações Textuais
Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br
Extração de Conhecimento a partir dos Sistemas de Informação
Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.
No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o
DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é
4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining
Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.
Fábio Magalhães RA015998
Fábio Magalhães RA015998 Exercício-7 (Track: Big Data) Considere os pontos tratados nos caps. 5 a 7. a. Escreva um texto (1 página) sobre pontos em comum e distintos entre Standards e Specifications. Cite
Nathalie Portugal Vargas
Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield
WEB MINING UM ESTUDO SOBRE WEB CONTENT MINING
UNIVERSIDADE TIRADENTES CENTRO DE CIÊNCIAS FORMAIS E TECNOLÓGICAS TECNOLOGIA EM PROCESSAMENTO DE DADOS WEB MINING UM ESTUDO SOBRE WEB CONTENT MINING BRUNO CAMPOS ALMEIDA ORIENTADOR PROF. Msc. KELLYNE MARQUES
Existem 109 questões nesta pesquisa
FASE 2: ANÁLISE DO WEBSITE INSTRUÇÕES Leia atentamente todas as questões Explore o website em avaliação, procurando pelas questões propostas Depois, responda cada questão Algumas questões precisam de informações
Prof. Msc. Paulo Muniz de Ávila
Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida
Desenvolvimento Web Usabilidade na Web aula I introdução e o design geral do site. Prof.: Bruno E. G. Gomes IFRN
Desenvolvimento Web Usabilidade na Web aula I introdução e o design geral do site Prof.: Bruno E. G. Gomes IFRN 1 Introdução A Web oferece uma enorme liberdade de escolha e movimentação Qualquer coisa
Questões sobre Web Mining e Web Warehousing
Curso de Data Warehousing PUC-Rio TecBD Prof. Rubens Melo Tendências Web Warehousing e Web Mining Questões sobre Web Mining e Web Warehousing Quais são as características da plataforma WEB Quais os tipos
Extração de conteúdo em páginas da web
Departamento de Informática Extração de conteúdo em páginas da web Aluno: Pedro Lazéra Cardoso Orientador: Eduardo Sany Laber Antecedentes Na primeira fase da Iniciação Científica, foi realizado um estudo
DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial
DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial Aluno: André Faria Ruaro Professores: Jomi F. Hubner e Ricardo J. Rabelo 29/11/2013 1. Introdução e Motivação 2.
CAPÍTULO 2. Este capítulo tratará :
1ª PARTE CAPÍTULO 2 Este capítulo tratará : 1. O que é necessário para se criar páginas para a Web. 2. A diferença entre páginas Web, Home Page e apresentação Web 3. Navegadores 4. O que é site, Host,
RSS no desenvolvimento de uma Central de Notícias
RSS no desenvolvimento de uma Central de Notícias Darley Passarin 1, Parcilene Fernandes de Brito 1 1 Sistemas de Informação Centro Universitário Luterano de Palmas (CEULP/ULBRA) Palmas TO Brasil darley@centralrss.com.br,
Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI
Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Janeiro de 2011 p2 Usuários comerciais e organizações precisam
ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI)
ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI) APARECIDA DE GOIÂNIA 2014 LISTA DE TABELAS Tabela 1 Áreas de processo por
Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente
Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Carla Gomes de Faria1, Ismênia Ribeiro de Oliveira1, Rosario Girardi1 1Universidade Federal do Maranhão (UFMA)
2 Conceitos relativos a Web services e sua composição
15 2 Conceitos relativos a Web services e sua composição A necessidade de flexibilidade na arquitetura das aplicações levou ao modelo orientado a objetos, onde os processos de negócios podem ser representados
Planejamento da disciplina: Modelagem de processos de negócio
UNIVERSIDADE FEDERAL DE MINAS GERAIS / INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO Planejamento da disciplina: Modelagem de processos de negócio Professor: Clarindo Isaías Pereira
Planejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani Data Mining Os métodos tradicionais de Data Mining são: Classificação Associa ou classifica um item a uma ou várias classes categóricas pré-definidas.
Prof. Lucas Santiago
Classificação e Tipos de Sistemas de Informação Administração de Sistemas de Informação Prof. Lucas Santiago Classificação e Tipos de Sistemas de Informação Sistemas de Informação são classificados por
Tecnologias de GED Simone de Abreu
Tecnologias de GED Simone de Abreu A rapidez na localização da informação contida no documento é hoje a prioridade das empresas e organizações, já que 95% das informações relevantes para o processo de
Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE Curso Técnico em Informática ENGENHARIA DE SOFTWARE Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br Clayton Maciel Costa
Organização e Recuperação da Informação
GSI024 Organização e Recuperação da Informação Introdução Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/ori UFU/FACOM - 2011/1 Arquivo 1a Introdução Porque RI? Problemas da solução
PEER DATA MANAGEMENT SYSTEM
PEER DATA MANAGEMENT SYSTEM INTRODUÇÃO, INFRA-ESTRUTURA E MAPEAMENTO DE ESQUEMAS AGENDA Data Management System Peer Data Management System P2P Infra-estrutura Funcionamento do PDMS Mapeamento de Esquemas
Internet. Gabriela Trevisan Bacharel em Sistemas de Infomação
Internet Gabriela Trevisan Bacharel em Sistemas de Infomação Histórico da Web World Wide Web o nosso www é o meio de comunicação mais utilizado no mundo atualmente. Através da WWW qualquer usuário conectado
Autoria Web Apresentação e Visão Geral sobre a Web
Apresentação e Visão Geral sobre a Web Apresentação Thiago Miranda Email: mirandathiago@gmail.com Site: www.thiagomiranda.net Objetivos da Disciplina Conhecer os limites de atuação profissional em Web
Resultados da Pesquisa
Resultados da Pesquisa 1. Estratégia de Mensuração 01 As organizações devem ter uma estratégia de mensuração formal e garantir que a mesma esteja alinhada com os objetivos da empresa. Assim, as iniciativas
INSTITUTO VIANNA JÚNIOR LTDA FACULDADES INTEGRADAS DO INSTITUTO VIANNA JUNIOR O TEXT MINING PARA APOIO A TOMADA DE DECISÃO
INSTITUTO VIANNA JÚNIOR LTDA FACULDADES INTEGRADAS DO INSTITUTO VIANNA JUNIOR O TEXT MINING PARA APOIO A TOMADA DE DECISÃO Lúcia Helena de Magalhães 1 Márcio Aarestrup Arbex 2 Resumo Este artigo tem como
ESTUDO DE CASO: LeCS: Ensino a Distância
ESTUDO DE CASO: LeCS: Ensino a Distância HERMOSILLA, Lígia Docente da Faculdade de Ciências Jurídicas e Gerenciais de Garça FAEG - Labienópolis - CEP 17400-000 Garça (SP) Brasil Telefone (14) 3407-8000
Abaixo você conhecerá algumas técnicas de SEO utilizadas para obter grande sucesso com as postagens no WordPress.
1 TUTORIAL PARA DEIXAR POSTAGENS E PÁGINAS BEM POSICIONADAS Abaixo você conhecerá algumas técnicas de SEO utilizadas para obter grande sucesso com as postagens no WordPress. Conhecimento básico de Html
MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes
MARACATU A component search tool Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes Vinicius Cardoso Garcia July 29, 2005 Agenda Introdução Especificação
WEB USAGE MINING APLICADA NA CONSTRUÇÃO DE UM MESSENGER
WEB USAGE MINING APLICADA NA CONSTRUÇÃO DE UM MESSENGER LIMA, Claudinei de 1 ; PASCHOAL, Leo Natan 2 ; MOZZAQUATRO, Patrícia Mariotto 3 Resumo Com o aumento da popularidade da Web, um grande volume de
IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES
Interpretador AIML alimentado com tags HTML5
2º Congresso de Pesquisa Científica : Inovação, Ética e Sustentabilidade Interpretador AIML alimentado com tags HTML5 Rafael Luiz de Macedo (Ciência da Computação - UNIVEM - Marília/SP) Email: rafaelldemacedo@gmail.com
Fone: (19) 3234-4864 E-mail: editora@komedi.com.br Site: www.komedi.com.br HTM3.0. Tutorial HTML. versão 4.01
Fone: (19) 3234-4864 E-mail: editora@komedi.com.br Site: www.komedi.com.br HTM3.0 Tutorial HTML versão 4.01 K O M Σ D I Copyright by Editora Komedi, 2007 Dados para Catalogação Rimoli, Monica Alvarez Chaves,
MINERAÇÃO DE OPINIÕES DE USUÁRIOS NA BUSCA DE CONHECIMENTO RESUMO
84 MINERAÇÃO DE OPINIÕES DE USUÁRIOS NA BUSCA DE CONHECIMENTO Rafael Guedes Derkian Afonso Lúcia Helena de Magalhães RESUMO Este trabalho visa utilizar as técnicas de Web Mining para mineração de opiniões
Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado
Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2
SISTEMAS HIPERMÍDIA E MULTIMÍDIA
SISTEMAS HIPERMÍDIA E MULTIMÍDIA Prof. Dr. Juliano Schimiguel Tutor. Msd. Rolfi C. Gomes Unidade V Engenharia de Software x Engenharia Web Propósitos de Websites Atividades da EW Categorias de Aplicações
Web Data Mining com R
Web Data Mining com R Fabrício J. Barth fabricio.barth@gmail.com VAGAS Tecnologia e Faculdade BandTec Maio de 2014 Objetivo O objetivo desta palestra é apresentar conceitos sobre Web Data Mining, fluxo
Google Site Search Pesquisa de websites do Google para sua organização
Google Site Search Folha de dados Google Site Search Pesquisa de websites do Google para sua organização Google Site Search Para mais informações, visite: http://www.google.com/enterprise/search/ Quais
Introdução à Computação
Aspectos Importantes - Desenvolvimento de Software Motivação A economia de todos países dependem do uso de software. Cada vez mais, o controle dos processos tem sido feito por software. Atualmente, os
Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5
Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos
Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1
Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1 Keila Michelly Bispo da Silva 2, Starlone Oliverio Passos 3,Wesley Vaz 4 Resumo: O processo de compras governamentais
Requisitos de Ferramentas Especializadas de Gestão de Configuração de Software
Requisitos de Ferramentas Especializadas de Gestão de Configuração de Software Ricardo Terra 1 1 Departamento de Ciência da Computação Universidade Federal de Minas Gerais (UFMG) Campus da Pampulha 31.270-010
Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse
Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Alcione Benacchio (UFPR) E mail: alcione@inf.ufpr.br Maria Salete Marcon Gomes Vaz (UEPG, UFPR) E mail: salete@uepg.br Resumo: O ambiente de
Software. Bem vindo ao mundo do GED e Tecnologias Digitais. Gerenciamento Eletrônico de Documentos, Softwares, e muito mais...
Software www.imagecomnet.com.br Bem vindo ao mundo do GED e Tecnologias Digitais Gerenciamento Eletrônico de Documentos, Softwares, e muito mais... A Empresa A Imagecom, uma empresa conceituada no ramo
Roteiro 2 Conceitos Gerais
Roteiro 2 Conceitos Gerais Objetivos: UC Projeto de Banco de Dados Explorar conceitos gerais de bancos de dados; o Arquitetura de bancos de dados: esquemas, categorias de modelos de dados, linguagens e
TECNOLOGIA WEB Aula 1 Evolução da Internet Profa. Rosemary Melo
TECNOLOGIA WEB Aula 1 Evolução da Internet Profa. Rosemary Melo Tópicos abordados Surgimento da internet Expansão x Popularização da internet A World Wide Web e a Internet Funcionamento e personagens da
CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;
CONCEITOS INICIAIS Agenda A diferença entre páginas Web, Home Page e apresentação Web; O que é necessário para se criar páginas para a Web; Navegadores; O que é site, Host, Provedor e Servidor Web; Protocolos.
Usando Ferramentas de Busca
Web Marketing Usando Ferramentas de Busca Marcelo Silveira Novatec Editora Ltda. www.novateceditora.com.br 1 Conhecendo o cenário de pesquisas na Internet Este capítulo apresenta uma visão geral sobre
Data Mining na Web para Inteligência Competitiva
Data Mining na Web para Inteligência Competitiva Simone de Almeida (CEFET/PR) simonea@pg.cefetpr.br Rui Francisco Martins Marçal (CEFET/PR) marcal@pg.cefetpr.br Luciano Scandelari (CEFET/PR) luciano@cefetpr..br
Introdução ao Plone. terça-feira, 4 de agosto de 15
Introdução ao Plone Sumário O que é Gestão de Conteúdo O que é Conteúdo Principais características de um CMS O que é o Plone Tipos de conteúdo no Plone Metadados Templates Interface do portal Gestão de
Levantamento, Análise e Gestão Requisitos. Aula 06
Levantamento, Análise e Gestão Requisitos Aula 06 Agenda Técnicas de Levantamento de Requisitos: Entrevista Workshop, Brainstorming, Storyboarding e Roleplaying Prototipação JAD Joint Application Design
18º Congresso de Iniciação Científica IMPLEMENTAÇÃO DE UM MODELO DE TESTE DE APLICAÇÕES WEB
18º Congresso de Iniciação Científica IMPLEMENTAÇÃO DE UM MODELO DE TESTE DE APLICAÇÕES WEB Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es) PLÍNIO ROBERTO SOUZA VILELA Apoio Financeiro PIBIC/CNPQ
Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados
Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses
Extração de Informação de Mídias Sociais na Web
Extração de Informação de Mídias Sociais na Web Fernando Alberto Zambelan Bossarino Engenharia de Computação CEATEC fernandozambelan@puccampinas.edu.br Resumo: Este resumo apresenta os resultados do trabalho
FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
@ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio
2. Sistemas Multi-Agentes (Multi-Agent System - MAS)
AORML uma linguagem para modelagem de uma aplicação Multiagentes: Uma Aplicação no Sistema Expertcop. Hebert de Aquino Nery, Daniel Gonçalves de Oliveira e Vasco Furtado. Universidade de Fortaleza UNIFOR
Tecnologia da Informação. Prof Odilon Zappe Jr
Tecnologia da Informação Prof Odilon Zappe Jr Internet Internet Internet é o conglomerado de redes, em escala mundial de milhões de computadores interligados, que permite o acesso a informações e todo
Sistemas de Gerência de Bancos de Dados. 7 - Outras Arquiteturas para SGBDs 7.7 - SGBDs e a Web
Sistemas de Gerência de Bancos de Dados 7 - Outras Arquiteturas para SGBDs 7.7 - SGBDs e a Web 1 Tópicos Modelos de Dados para a Web Linguagens de Consulta para a Web Integração de Informação Extraída
Autoatendimento Digital. Reduz custos e aprimora as relações com o cliente, criando experiências de autoatendimento personalizadas e significativas.
Autoatendimento Digital Reduz custos e aprimora as relações com o cliente, criando experiências de autoatendimento personalizadas e significativas. Oferece aos clientes as repostas que buscam, e a você,
Proposta Concessionária Terra Nova Land Rover
SATIS 2011 Proposta Concessionária Terra Nova Land Rover 21/03/2011 A SATIS Índice 1 A Satis 1 A Proposta 1 Serviços 2 Mapa do Site 2 SEO 3 Sistema de gerenciamento de conteudo 4 Cronograma e Prazos 5
Relatório referente ao período de 24 de abril de 2007 a 29 de maio de 2007.
Relatório do GPES Relatório referente ao período de 24 de abril de 2007 a 29 de maio de 2007. Objetivo O objetivo desse relatório é expor alguns padrões de interface para Web que foram definidos pela Coleção
Plano de Ensino. Apresentação da Unidade Curricular
Plano de Ensino Plano de Ensino Apresentação da Unidade Curricular o Funcionamento, arquitetura e conceitos fundamentais dos bancos de dados relacionais e objeto relacionais. Utilização de linguagem DDL
DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3
DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3 Eduardo Laguna Rubai, Tiago Piperno Bonetti Universidade Paranaense (Unipar) Paranavaí PR- Brasil eduardorubay@gmail.com, bonetti@unipar.br Resumo.
Capítulo 1 - Introdução 14
1 Introdução Em seu livro Pressman [22] define processo de software como um arcabouço para as tarefas que são necessárias para construir software de alta qualidade. Assim, é-se levado a inferir que o sucesso
1 UML (UNIFIED MODELING LANGUAGE)
1 UML (UNIFIED MODELING LANGUAGE) Segundo Tonsig (2003), para conseguir desenvolver um software capaz de satisfazer as necessidades de seus usuários, com qualidade, por intermédio de uma arquitetura sólida