Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos

Tamanho: px
Começar a partir da página:

Download "Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos"

Transcrição

1 UNIVERSIDADE FEDERAL DE GOIÁS INSTITUTO DE INFORMÁTICA EDISON ANDRADE MARTINS MORAIS Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos Goiânia 2007

2 EDISON ANDRADE MARTINS MORAIS Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos Dissertação apresentada ao Programa de Pós Graduação do Instituto de Informática da Universidade Federal de Goiás, como requisito parcial para obtenção do título de Mestre em Ciência da Computação. Área de concentração: Sistemas de Informação. Orientador: Profa. Dra. Ana Paula Laboissière Ambrósio Goiânia 2007

3 EDISON ANDRADE MARTINS MORAIS Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos Dissertação defendida no Programa de Pós Graduação do Instituto de Informática da Universidade Federal de Goiás como requisito parcial para obtenção do título de Mestre em Ciência da Computação, aprovada em 28 de Maio de 2007, pela Banca Examinadora constituída pelos professores: Prof. Dra. Ana Paula Laboissière Ambrósio Instituto de Informática UFG Presidente da Banca Prof. Dra. Fernanda Lima Departamento de Ciência da Computação Universidade Católica de Brasília (UCB) Prof. Dr. Cedric Luiz de Carvalho Instituto de Informática UFG

4 Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador. Edison Andrade Martins Morais Graduou-se em Tecnologia Em Processamento de Dados pelo Instituto Unificado de Ensino Superior Objetivo (1996) e especializou-se em Análise e Projeto de Sistemas de Informação pela Universidade Federal de Goiás (2003). Durante o mestrado, foi professor substituto do Instituto de Informática da Universidade Federal de Goiás. Atualmente é Analista de Sistemas do Tribunal de Justiça do Estado de Goiás.

5 Às minhas filhas, Júlia e Sofia, e a minha esposa, Ilanita.

6 Agradecimentos À Universidade Federal de Goiás (UFG), pelo apoio e incentivo que me foi dado como professor e aluno desta instituição; Ao Tribunal de Justiça do Estado de Goiás (TJGO), pelo apoio dado para a realização das pesquisas contidas neste trabalho; A todos aqueles que de alguma forma contribuíram para realização deste trabalho, especialmente o amigo Alcide Celso Ramos Jubé Neto; Aos professores do INF-UFG; A minha orientadora, Profa. Dra. Ana Paula Laboissière Ambrósio, pela inestimável orientação neste trabalho, pelo incentivo pessoal e pela dedicação profissional; A toda minha família, especialmente irmãos, avós, tios e primos. A Marcela Heitor de Andrade pela importante colaboração. Aos meus pais, que me deram o apoio e a base necessários para que eu chegasse até esta conquista. A minha esposa, pelo amor, paciência e dedicação. Às minhas filhas, que me dão a motivação necessária para melhorar e crescer sempre.

7 Resumo Morais, Edison. Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos. Goiânia, p. Dissertação de Mestrado. Instituto de Informática, Universidade Federal de Goiás. Hoje, os usuários da Web exigem que os mecanismos de recuperação de informações sejam capazes de obter, rapidamente, a maior quantidade possível de informações relevantes. Já existem várias ferramentas que auxiliam nesta busca de informações, mas elas ainda apresentam problemas principalmente ligados à falta de tratamento semântico dos documentos e das consultas. Como o problema de semântica não se restringe à recuperação de informações, existe a proposta de criação de uma Web Semântica [6], cujo objetivo é atribuir significado aos dados disponíveis em uma página Web, de forma que estes possam ser "compreendidos"pelos computadores. Para isto introduz o uso de metadados e ontologias. O sistema proposto neste trabalho utiliza técnicas de mineração de textos para associar semanticamente documentos a domínios representados por ontologias. Para isto foi proposta uma metodologia, que a partir da análise de documentos, usando técnicas estatísticas de mineração de textos, atribui um grau de similaridade (ou relevância) desse documento ao domínio representado pela ontologia. Uma ferramenta foi implementada e testada utilizando documentos contendo jurisprudências do Tribunal de Justiça de Goiás. O fato de estas jurisprudências sofrerem uma categorização manual feita por especialistas, permitiu uma comparação com a classificação automática feita pelo sistema. Como se conhece o total de documentos armazenados no banco de dados e quantos pertencem a cada categoria foi possível analisar parâmetros de eficiência e eficácia da ferramenta, através dos índices de recall(número de documentos recuperados dentre os relevantes), precision (número de documentos relevantes dentre os que foram recuperados) e fallout (índice de documentos irrelevantes retornados) do sistema. Palavras chave Ontologias, Mineração de Textos, Indexação Semântica

8 Abstract Morais, Edison. Document Contextualization in Domains Represented by Ontologies Using Text Mining. Goiânia, p. MSc. Dissertation. Instituto de Informática, Universidade Federal de Goiás. Today, users need information recovery mechanisms that can rapidly obtain the largest amount of relevant information. Several information recovery systems are available, but they still have problems related to the lack of semantic treatment on documents and queries. To relieve this problem, automatic analysis of the context in which the queries are defined has been proposed to permit an "understanding"of the query content, reducing ambiguities and augmenting the relevance of the recovered documents. Since semantics is not a problem restricted only to information retrieval, a Semantic Web has been proposed [6], where meaning is attributed to data so it can be "understood"by computers. For this, ontologies and metadata are used. The system being proposed uses statistical text mining techniques to semantically associate documents and domains represented by ontologies, giving a similarity degree (or relevance) between the document and the domain. A tool was implemented and tested using Jurisprudence documents from the Court of Justice of the State of Goiás. These documents are all indexed by specialists under predefined categories that define the subject they refer to. A comparison between the results obtained using the tool and the manual indexation was thus possible, permitting an analysis of the efficiency of the tool using recall, precision and fall-out indexes. Keywords Semantics, Ontologies, Text Mining

9 Sumário Lista de Figuras 10 Lista de Tabelas 11 Lista de Códigos de Programas 13 1 Introdução Contextualização Automática de Documentos Ontologias Mineração de Textos Motivação Sistema Proposto Estrutura da Dissertação 21 2 Ontologias Sentido Filosófico Ontologias e Ciência da Computação Principais Usos, Benefícios e Problemas relacionados às Ontologias Tipos de Ontologias Construção de Ontologias Metodologias para Construção de Ontologias Ferramentas para Construção de Ontologias Linguagens para Representação de Ontologias 38 3 Mineração de Textos O Processo de Descoberta de Conhecimento Descoberta de Conhecimento em Dados Estruturados Descoberta de Conhecimento em Dados não Estruturados Mineração de Textos - Conceitos e Definições O processo de Mineração de Textos 46 Tipos de Abordagens de Dados 47 Preparação dos Dados 49 Indexação e Normalização 54 Cálculo da Relevância 59 Seleção de Termos 61 Análise de Resultados 64

10 4 Sistema Proposto O Sistema Extração dos termos relevantes da Ontologia Extração dos termos relevantes das Jurisprudências Cálculo da similaridade entre a ontologia e as jurisprudências Funcionamento do Sistema Construção da Ontologia Seleção da Amostra Seleção de Documentos Execução do Sistema e Coleta de Dados Trabalhos Relacionados 79 5 Estudo de Caso Parâmetro de Avaliação do Sistema Amostra 1 84 Iteração 1 84 Iteração 2 86 Iteração Amostra 2 89 Iteração 1 90 Iteração Conclusões e Trabalhos Futuros Trabalhos Publicados Trabalhos Futuros 97 Referências Bibliográficas 99 A Amostra 1 - Índices de Similaridade 107 B Amostra 2 - Índices de Similaridade 110

11 Lista de Figuras 1.1 Total de usuários da Internet por Região do Mundo Visão geral dos mecanismos de busca Ontologia no Sentido Filosófico Ontologias de Aplicação [36] Exemplo de taxonomia de classes Metodologia Enteprise Methontology On to Knowledge Protégé WebODE OntoEdit Tipos de Descoberta de Conhecimento Etapas do Processo de Mineração de Textos Etapas do Processo de Indexação Automática [82] Portuguese Stemming Tela de Entrada de Dados do Sistema Ontologia sobre acidente de trânsito. 75

12 Lista de Tabelas 2.1 Linguagens para Especificação de Ontologias Cálculo do Tamanho da Amostra Índices Calculados Amostra Variáveis colhidas sobre a amostra Iteração 1 - Variáveis Iteração 1 - Índices Iteração 1 - Índices de Similaridade Iteração 2 - Variáveis Iteração 2 - Índices Iteração 2 - Índices de Similaridade Iteração 3 - Variáveis Iteração 3 - Índices Iteração 3 - Índices de Similaridade Amostra Variáveis colhidas sobre a amostra Iteração 1 - Variáveis (Amostra 2) Iteração 1 - Índices (Amostra 2) Iteração 1 - Índices de Similaridade (Amostra 2) Iteração 2 - Variáveis (Amostra 2) Iteração 2 - Índices (Amostra 2) Iteração 2 - Índices de Similaridade (Amostra 2) 92 A.1 Índices de Similaridade por Iteração - Amostra B.1 Índices de Similaridade por Iteração - Amostra 2 111

13 Lista de Códigos de Programas 2.1 Especificação em Ontolíngua Especificação em RDF Especificação em OWL Especificação em XML Ontologia sobre Acidente de Trânsito em XML 68

14 Introdução CAPÍTULO 1 O avanço das tecnologias da informação, especialmente nos últimos 30 anos, resultou no desenvolvimento da capacidade (velocidade e volume) de comunicação em todo o mundo. Como conseqüência houve um aumento no número de informações disponíveis para as pessoas, empresas e governo, provocado, primeiramente, pela popularização dos computadores, e conseqüente aumento da utilização de softwares, e posteriormente, potencializado pelo surgimento da Internet. A utilização de softwares permitiu o armazenamento de dados em arquivos de diferentes formatos, tais como documentos, planilhas ou bancos de dados, tornando-os mais facilmente disponíveis para futura utilização, gerando benefícios tanto para as pessoas, quanto para as empresas. De acordo com [37], cerca de 80% das informações das empresas no mundo é arquivada em documentos textuais, armazenados em meio eletrônico, tais como: relatórios diversos, especificações de produtos, resumos, notas, correspondência eletrônica, documentos diversos (boletins, jornais, revistas, etc.), formando grandes coleções de dados (bibliotecas virtuais, acervos documentais variados, etc.). [69] cita que, para se tornarem mais competitivas no mercado, as empresas devem justamente ser capazes de obter, rapidamente, a maior quantidade possível de informações relevantes. Pois quanto melhor o acesso, a disponibilidade e a qualidade da informação, maior é a chance de acerto em seus processos de tomada de decisão. Neste contexto surge a Internet, uma revolução tecnológica de significativas proporções, cujos efeitos, sob os mais diversos aspectos, ainda não estão totalmente avaliados. Atualmente, em todo o mundo, a Internet possui mais de um 1 bilhão de usuários, e cerca de 105 milhões de endereços registrados [41]. A figura 1.1 mostra o total de usuários (em milhões) dividido por regiões do mundo (dados de janeiro/2007 [78]).

15 14 Figura 1.1: Total de usuários da Internet por Região do Mundo. Estudos realizados em 1999 [26] indicavam que, de acordo com as previsões da época, a maior parte do conhecimento humano estaria disponível na rede em dez anos. Entretanto, é muito difícil estimar, atualmente, de forma exata, a quantidade de informações disponíveis, especialmente levando em conta que ela cresce exponencialmente. Se por um lado tamanho volume de documentos e informações gera benefícios, por outro, acaba por trazer problemas, principalmente relacionados à sua localização. Freqüentemente usuários da Internet lidam com o problema da "sobrecarga de informações", que ocorre quando estes têm muitas informações ao seu alcance, mas não têm condições de tratá-la ou de encontrar o que realmente desejam ou lhes interessa [52]. Além disto, a velocidade com que novas informações são adicionadas à Internet, obriga os usuários a pesquisas freqüentes, implicando na disponibilização de tempo, nem sempre possível. Logo, torna-se necessária a utilização de técnicas eficientes e eficazes para a melhoria no tratamento e organização destas informações, atuando principalmente na sua seleção, processamento, recuperação e disseminação. Já existem várias ferramentas que auxiliam a busca de informações na Internet. Algumas destas ferramentas permitem a localização de documentos textuais a partir de palavras chave e/ou catálogos de assuntos. Estas ferramentas dividem-se em dois tipos: Diretórios e Mecanismos de Busca, em muitos aspectos complementares. Os diretórios são sistemas organizados por assuntos, e utilizam um vocabulário controlado para definir uma lista de termos que serão usados por indexadores para catalogar suas páginas. Estes termos podem ser bastante amplos ou bastante específicos, e podem variar de sistema para sistema.

16 15 A maioria das ferramentas de busca por assunto classificam os sites em categorias amplas e permitem refinar a busca passo-a-passo. Geralmente, a quantidade de termos definidos para indexar uma página é limitada, às vezes apenas um, e pode não cobrir a variedade e complexidade de assuntos tratados na página. Porém, quando o usuário procura informações gerais sobre um determinado assunto e encontra um termo útil que representa o assunto desejado, pode-se eliminar um grande número de documentos irrelevantes, já que os assuntos classificados naquele termo foram previamente analisados pelos indexadores. Entretanto, o uso de índice hierárquico de assuntos também tem desvantagens. Quando não se conhece o termo desejado, o número de operações para encontrar a informação pode ser muito maior que utilizando palavras chave, pois se torna necessário percorrer vários níveis hierárquicos nas categorias. Além disto, a indexação de sites é feita manualmente, o que retarda a categorização levando a um número menor de páginas indexadas, e em poucas categorias. Já nos mecanismos de busca por palavra chave, os sites são indexados por todas as palavras relevantes contidas no site. Assim, o usuário pode realizar buscas por uma ou mais palavras chave, e serão retornadas páginas que têm uma ou mais dessas palavras em alguma parte do texto. No entanto pesquisas utilizando uma única palavra geralmente retornam milhares de documentos, a maioria irrelevante. Pesquisas podem ser refinadas usando mais palavras chave combinadas com operadores lógicos (E, OU, NÃO). Este tipo de mecanismo obtém melhores resultados, se comparado aos diretórios, quando o usuário não tem certeza do assunto exato no qual está interessado, se está usando jargão de uma determinada área, se não está obtendo resultados suficientes através de uma busca por assunto ou procura por um termo bem preciso. Entretanto, pesquisas utilizando palavras que têm mais de um significado devem ser mais cuidadosas, pois os mecanismos não são capazes de determinar qual o significado desejado e retornam documentos contendo aquela palavra independente do contexto. Os mecanismos de busca por palavras chave têm a vantagem de usar robôs para indexarem as páginas automaticamente (ver figura 1.2), permitindo que um número significativo e muito maior de páginas seja indexado, ampliando o espaço de busca.

17 16 Figura 1.2: Visão geral dos mecanismos de busca Analisando os problemas associados à utilização destas ferramentas, verifica-se que ocorrem principalmente pela dificuldade que estas têm de entender a semântica contida nos textos. Nos diretórios, a semântica dos textos é atribuída por pessoas que os indexam manualmente. Isto pode levar a erros de catalogação quando, por exemplo, o indexador interpreta equivocadamente o conteúdo de um documento, ou não classifica o documento em todas as categorias relevantes. Outro problema ocorre quando o usuário não consegue encontrar um assunto, dentre os pre-definidos, que represente seus interesses de busca já que, freqüentemente, pessoas diferentes podem utilizar os mesmos termos para idéias diferentes ou então utilizar termos diferentes para as mesmas idéias. Segundo [52], este problema é conhecido como "abismo semântico". Nos mecanismos de busca o problema está em contextualizar 1 as buscas realizadas pelos usuários, o que pode levar a documentos que contêm as palavras fornecidas, mas que se referem a outro contexto. Outro problema é que poderão deixar de ser recuperados documentos relevantes para o assunto escolhido, justamente porque não possuem os termos fornecidos [52]. 1 Contexto (ou espaço contextual) é um conjunto de palavras que definem um assunto ou área do conhecimento [13].

18 1.1 Contextualização Automática de Documentos 17 A causa de tais imprecisões e ambigüidades é inerente ao processo de comunicação. Em geral, é impossível transmitir significados, apenas símbolos. O significado (semântica) está na mente das pessoas e não em marcas gráficas. O contexto dos documentos acaba sendo atribuído pelas pessoas ao analisar/ler o texto. Uma proposta para amenizar tais problemas, é a análise automática do contexto em que os termos das buscas são usados. 1.1 Contextualização Automática de Documentos Uma vez que a análise do contexto é indispensável para o bom entendimento dos termos utilizados nas buscas, mecanismos automáticos de contextualização podem ajudar a resolver diversos problemas relacionados à localização eficiente de documentos, tanto para o ambiente das empresas quanto para o ambiente da Internet. Para as empresas, o principal benefício da contextualização está relacionada à transformação de grandes volumes de dados, geralmente nãoestruturados, em conhecimento útil, muitas vezes inovador [61]. Neste caso a categorização de textos pode ser utilizada para classificar um conjunto de documentos em uma ou mais categorias (contextos) existentes. Ela é geralmente utilizada para classificar mensagens, notícias, resumos, ofícios, memorandos, comunicados e publicações. A categorização também pode ser utilizada para organizar e filtrar informações. Essa capacidade faz com que esta técnica possa contribuir no processo de coleta, análise e distribuição de informações e, conseqüentemente, na gestão e na estratégia competitiva de uma empresa [69]. Já na Internet a contextualização automática pode trazer vários benefícios. Além de tornar a pesquisa mais ágil e direta, tratar o problema da contextualização também ajuda a solucionar o problema do grande volume de documentos retornados em uma pesquisa, pois neste caso já existe uma pré-categorização das páginas resultantes das buscas. Além disto, a contextualização automática pode ser usada para a recuperação automática de documentos. Neste caso um sistema pode informar usuários sobre documentos novos relacionados a assuntos de seu interesse sem que seja necessária uma busca específica feita pelo usuário. Isto permite ganho de tempo e constante atualização do usuário.

19 1.2 Ontologias 18 Um dos principais problemas da contextualização automática de documentos está relacionado à definição formal dos contextos, ou seja, como criar contextos (categorias) que permitam classificação automática de documentos. Neste trabalho, a definição dos contextos será feita utilizando ontologias. 1.2 Ontologias Ontologia, no contexto da Ciência da Computação, é uma técnica de organização de informações que vem recebendo especial atenção nos últimos anos, principalmente no que diz respeito à representação formal de conhecimento [33] [35]. Geralmente criadas por especialistas, tendo sua estrutura baseada na descrição de conceitos e dos relacionamentos semânticos entre eles, as ontologias geram uma especificação formal e explícita de uma conceitualização compartilhada [6]. Uma razão para a popularidade das ontologias é a promessa de compartilhamento e entendimento comum de algum domínio de conhecimento que possa ser comunicado entre pessoas e computadores. Neste sentido, ontologias têm sido desenvolvidas para facilitar o compartilhamento e reutilização de informações [32]. A comunidade da Internet acredita que, em um futuro próximo, todo negócio da rede deverá fornecer a semântica de suas páginas através de uma ontologia [21], pois estas oferecem uma "língua franca", que permite que máquinas processem e integrem recursos da Internet de maneira inteligente, possibilitando buscas rápidas e acuradas e facilitando a comunicação entre dispositivos heterogêneos na rede. Neste trabalho as ontologias serão utilizadas para a definição de contextos, gerando um conjunto de palavras que o identificam. Entretanto, [52] cita que o maior problema da atividade de definição de contextos é que a mesma exige tempo e disposição. Além disto, o especialista pode não ser capaz de identificar todas as palavras relevantes do contexto ou aquela que define o contexto. Por exemplo, se a ontologia a ser utilizada pertence à área de Jurídica, quem deve selecionar as palavras que definem o contexto é um especialista desta área (juiz, advogado, etc.). Isso porque esta pessoa já está acostumada com o assunto e consegue identificar quais são as palavras que são mais importantes na descrição do assunto. O especialista sabe quais são os termos comumente empregados pelas pessoas que trabalham na mesma área,

20 1.3 Mineração de Textos 19 aumentando assim a abrangência (capacidade de recuperar todos os documentos relevantes ao assunto) e a precisão (capacidade de recuperar somente documentos relevantes) do contexto. 1.3 Mineração de Textos Mineração de textos, ou text mining, é o nome dado às técnicas de análise e extração de dados a partir de textos, frases ou apenas palavras. Envolve a aplicação de algoritmos computacionais que processam textos (em diferentes formatos) e identificam informações úteis e implícitas, que normalmente não poderiam ser recuperadas utilizando métodos tradicionais de consulta, pois a informação contida nestes textos não pode ser obtida de forma direta. Segundo [4] cada vez mais se torna necessário ter uma aplicação que contemple um conjunto de ferramentas automáticas que avaliem o conteúdo de documentos, páginas web ou sites, através da utilização de ferramentas de mineração de textos, que são importantes na extração de informações em grandes massas de dados, podendo retornar resultados com alto nível de qualidade na informação obtida, aumentando as chances de descoberta de informações relevantes ou inesperadas 2. Logo, a principal motivação para utilizar esta técnica é que seu uso permite extrair conhecimento a partir de dados textuais não-estruturados. Uma vez que os documentos submetidos ao sistema proposto neste trabalho estão neste formato, este tipo de técnica pode ser utilizada. 1.4 Motivação As duas principais motivações para realização deste trabalho são: 1. Contribuir para a o processo de coleta, análise e distribuição de informações na empresas. 2. Contribuir para a solução do problema de contextualização relacionado às ferramentas de busca na Internet. 2 Uma informação é considerada inesperada quando ela é relevante, porém desconhecida do usuário, ou contradiz a opinião existente ou as expectativas do usuário [4].

21 1.5 Sistema Proposto Sistema Proposto O objetivo do sistema proposto neste trabalho é utilizar técnicas de mineração de textos para associar semanticamente documentos a domínios representados por ontologias. Neste sentido foi proposta uma metodologia que a partir da análise de documentos, usando técnicas estatísticas de mineração de textos, atribui um grau de similaridade (ou relevância) desse documento ao domínio representado pela ontologia. Uma ferramenta foi implementada para esta metodologia que foi testada no domínio de "Acidente de Transito"para verificar a eficácia do sistema proposto. Para testar o sistema foram utilizados documentos contendo jurisprudências 3 do Tribunal de Justiça do Estado de Goiás. Atualmente estas jurisprudências estão disponíveis para consulta no portal do Tribunal (www.tj.go.gov.br/jurisprudencia/juris.php). Este sistema foi utilizado no teste porque estas jurisprudências sofrem uma categorização manual feita por especialistas, o que permite uma comparação com a classificação automática feita pelo sistema. Uma das categorias usadas para classificação é "Acidente de Trânsito". Outras são "Separação Consensual"e "Indenização por Danos Morais", entre outras. Como se conhece o total de documentos armazenados no banco de dados e quantos pertencem a cada categoria foi possível analisar parâmetros de eficiência e eficácia da ferramenta. Não é objetivo deste trabalho propor técnicas para criação de ontologias. Parte-se do pressuposto que ontologias de qualidade estejam disponíveis. Infelizmente este não é ainda o caso. Apesar do avanço da Web Semântica, e de existirem diversos projetos que tratam de metodologias, ferramentas e linguagens para desenvolvimento, especificação e representação de ontologias ([2], [21], [36] e [42]), ontologias de qualidade são raras e geralmente em inglês. Isto nos obrigou a desenvolver uma ontologia para representar o domínio desejado. A ontologia foi definida com a ajuda de especialistas da área de direito que trabalham no Tribunal. O desenvolvimento seguiu as metodologias propostas (capítulo 3) e utilizou a ferramenta Protégé [63], o que permitiu uma análise do processo. Para validar o sistema desenvolvido foram utilizadas duas amostras de documentos, com 60 documentos cada uma. Cada amostra contém 30 jurisprudências sobre acidentes de trânsito e 30 sobre outros assuntos. Para a 3 Jurisprudência é o conjunto uniforme e constante das decisões judiciais sobre casos semelhantes. Este modo uniforme pelo qual os tribunais interpretam e aplicam determinadas leis, gera um conjunto de documentos texto que podem ser utilizados por quaisquer interessados.

22 1.6 Estrutura da Dissertação 21 primeira amostra foram feitas 3 iterações e para a segunda amostra foram realizadas 2 iterações. Para cada iteração foram verificados os índices de recall(número de documentos recuperados dentre os relevantes), precision (número de documentos relevantes dentre os que foram recuperados) e fallout (índice de documentos irrelevantes retornados) do sistema. Quanto mais próximos de 100% os índices de recall e precision, e mais próximo de 0% o índice de fall-out, mais eficiente é o sistema. 1.6 Estrutura da Dissertação O texto desta dissertação está organizado da seguinte forma: O capítulo 2 descreve o conceito de ontologia, seus principais usos, benefícios e problemas, os tipos de ontologias existentes, e as principais metodologias, ferramentas e linguagens utilizadas na sua construção. O capítulo 3 fornece visão geral sobre o estado da arte em mineração de textos. Partindo da análise do processo de descoberta de conhecimento em dados estruturados e não estruturados, até a definição e descrição das etapas do processo de mineração de textos. O capítulo 4 descreve o sistema proposto, detalhando a metodologia desenvolvida e a ferramenta implementada. O capítulo 5 descreve um estudo de caso, que envolve indexação semântica de jurisprudências. Uma ontologia sobre acidente de trânsito e várias jurisprudências do Tribunal de Justiça do Estado de Goiás (TJGO) foram submetidas ao sistema proposto no capítulo 4. Um conjunto de dados foi gerado pelo sistema, o que permitiu a análise da eficácia desta proposta. O capítulo 6 descreve as considerações finais.

23 Ontologias CAPÍTULO 2 Segundo [2], técnicas de tratamento e organização de dados podem ser classificadas de diversas formas: a partir de seus termos, em glossários ou dicionários; por classificação ou categorias, através de taxonomias; ou a partir de conceitos e seus relacionamentos, utilizando ontologias, tesauros ou redes semânticas. O termo ontologia tem seu sentido relacionado à ciência da computação e inteligência artificial, diferente daquele tradicional, adotado na filosofia. De forma geral, construir ontologias significa definir categorias para as coisas que existem em um mesmo domínio. Ontologia é um catálogo de tipos de coisas, as quais se assume existirem em um domínio de interesse na perspectiva de uma pessoa que usa uma determinada linguagem. O objetivo deste capítulo é descrever o estado da arte no estudo das ontologias, e como estas podem ser utilizadas em benefício dos objetivos propostos neste trabalho. 2.1 Sentido Filosófico Em seu sentido filosófico, ontologia possui diversas definições. Segundo [2], é o ramo da metafísica 1 que estuda os tipos de coisas que existem no mundo. A palavra é derivada do grego ontos, ser, e logos, palavra. Entretanto, seu termo de origem é a palavra aristotélica categoria, termo este utilizado no sentido de classificação. Neste sentido, Aristóteles 2 apresenta categorias que 1 É um ramo da filosofia que estuda o mundo como ele é, ou seja, é o estudo do ser ou da realidade. É a ciência do ser como ser, ou dos princípios e das causas do ser e de seus atributos essenciais. Ela abrange ainda o ser imóvel e incorpóreo, princípio dos movimentos e das formas do mundo, bem como o mundo mutável e material, mas em seus aspectos universais e necessários [7]. 2 Filósofo grego nascido em Estagira, colônia grega da Trácia, no litoral setentrional do mar Egeu, em 384 a.c, foi um dos maiores pensadores de todos os tempos e considerado o criador do pensamento lógico [7].

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Ontologias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Origem Teoria sobre a natureza da existência Ramo da filosofia que lida com a natureza e organização da realidade.

Leia mais

SABiO: Systematic Approach for Building Ontologies

SABiO: Systematic Approach for Building Ontologies SABiO: Systematic Approach for Building Ontologies Ricardo de Almeida Falbo Engenharia de Ontologias Departamento de Informática Universidade Federal do Espírito Santo Agenda Preocupações Principais do

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

2 Auto-sintonia de Bancos de Dados e Agentes de Software

2 Auto-sintonia de Bancos de Dados e Agentes de Software 2 Auto-sintonia de Bancos de Dados e Agentes de Software A uso da abordagem de agentes de software 1 pode trazer benefícios a áreas de aplicação em que é necessário construir sistemas autônomos, ou seja,

Leia mais

3 OOHDM e SHDM 3.1. OOHDM

3 OOHDM e SHDM 3.1. OOHDM 32 3 OOHDM e SHDM Com a disseminação em massa, desde a década de 80, de ambientes hipertexto e hipermídia, principalmente a Web, foi identificada a necessidade de elaborar métodos que estruturassem de

Leia mais

Algumas propriedades dos objetos:

Algumas propriedades dos objetos: Orientação a Objetos Vivemos num mundo de objetos. Esses objetos existem na natureza, nas entidades feitas pelo homem, nos negócios e nos produtos que usamos. Eles podem ser categorizados, descritos, organizados,

Leia mais

Web Semântica e Matching de Ontologias: Uma Visão Geral

Web Semântica e Matching de Ontologias: Uma Visão Geral Web Semântica e Matching de Ontologias: Uma Visão Geral Hélio Rodrigues de Oliveira Departamento de Computação Universidade Federal do Ceará heliorodrigues@lia.ufc.br Bernadette Farias Lóscio Departamento

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações Tópicos Conceitos Básicos Bancos de Dados Sistemas de Bancos de Dados Sistemas de Gerenciamento de Bancos de Dados Abstração

Leia mais

Modelagem do Conhecimento para a Gestão de Processos e Projetos. Modelagem do Conhecimento para a Gestão de Processos e Projetos Prof.

Modelagem do Conhecimento para a Gestão de Processos e Projetos. Modelagem do Conhecimento para a Gestão de Processos e Projetos Prof. Modelagem do Conhecimento para a Gestão de Processos e Projetos 1 Objetivo Apresentação de modelo conceitual para a integração e recuperação de informações, disponíveis em ambientes internos ou externos,

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

Gerenciamento de Rede Baseado em Políticas

Gerenciamento de Rede Baseado em Políticas Gerenciamento de Rede Baseado em Políticas (Policy-Based Networking) Ademir José de Carvalho Junior Recife, Fevereiro de 2007 Resumo: A complexidade das redes baseadas em IP atualmente segue crescendo

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Uma ontologia para a representação do domínio de agricultura familiar na arquitetura AgroMobile. Roger Alves Prof. Me.

Uma ontologia para a representação do domínio de agricultura familiar na arquitetura AgroMobile. Roger Alves Prof. Me. Uma ontologia para a representação do domínio de agricultura familiar na arquitetura AgroMobile Roger Alves Prof. Me. Vinícius Maran O que é uma ontologia? Palavra vinda do grego, advinda da união entre

Leia mais

Modelagem de informações de. construçãocapítulo1: Capítulo. Objetivo do capítulo

Modelagem de informações de. construçãocapítulo1: Capítulo. Objetivo do capítulo construçãocapítulo1: Capítulo 1 Modelagem de informações de A modelagem de informações de construção (BIM) é um fluxo de trabalho integrado baseado em informações coordenadas e confiáveis sobre um empreendimento,

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE RESUMO Fazer um bom levantamento e especificação de requisitos é algo primordial para quem trabalha com desenvolvimento de sistemas. Esse levantamento

Leia mais

Banco de Dados Multimídia

Banco de Dados Multimídia Banco de Dados Multimídia Nomes: Ariane Bazilio Cristiano de Deus Marcos Henrique Sidinei Souza Professor Mauricio Anderson Perecim Conteúdo Banco de Dados Multimídia... 3 Conceitos... 3 Descrição... 3

Leia mais

SISTEMAS INTELIGENTES DE APOIO À DECISÃO

SISTEMAS INTELIGENTES DE APOIO À DECISÃO SISTEMAS INTELIGENTES DE APOIO À DECISÃO As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Qualidade de software

Qualidade de software Faculdade de Ciências Sociais e Aplicadas de Petrolina - FACAPE Curso: Ciência da Computação Disciplina:Projeto de Sistemas Qualidade de software cynaracarvalho@yahoo.com.br Qualidade de software Qualidade

Leia mais

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS Bancos de Dados Conceitos Fundamentais Tópicos Conceitos Básicos Bancos de Dados Sistemas de Bancos de Dados Sistemas de Gerenciamento de Bancos

Leia mais

Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador

Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador Soluções de análise da SAP Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador Índice 3 Um caso para análise preditiva

Leia mais

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas 4.1 Motivação Sistemas de Informação são usados em diversos níveis dentro de uma organização, apoiando a tomada de decisão; Precisam estar

Leia mais

Cadernos UniFOA. Web Semântica: Uma Rede de Conceitos. Semantic Web: A Network of ConceptsONCEPTS

Cadernos UniFOA. Web Semântica: Uma Rede de Conceitos. Semantic Web: A Network of ConceptsONCEPTS 23 Web Semântica: Uma Rede de Conceitos Semantic Web: A Network of ConceptsONCEPTS Professor Especialista José Maurício dos Santos Pinheiro Artigo Original Original Paper Palavras-chaves: Internet Semântica

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Banco de Dados I Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM Dados

Leia mais

Programa do Módulo 2. Processo Unificado: Visão Geral

Programa do Módulo 2. Processo Unificado: Visão Geral 9.1 Programa do Módulo 2 Orientação a Objetos Conceitos Básicos Análise Orientada a Objetos (UML) O Processo Unificado (RUP) Processo Unificado: Visão Geral 9.2 Encaixa-se na definição geral de processo:

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

DSI é o processo cujo objetivo é introduzir mudanças num sistema de informação, com objetivo de melhorar o seu desempenho.

DSI é o processo cujo objetivo é introduzir mudanças num sistema de informação, com objetivo de melhorar o seu desempenho. - DSI DSI é o processo cujo objetivo é introduzir mudanças num sistema de informação, com objetivo de melhorar o seu desempenho. Preocupação: Problema técnicos Mudança na natureza e conteúdo do trabalho

Leia mais

Uso de taxonomias na gestão de conteúdo de portais corporativos.

Uso de taxonomias na gestão de conteúdo de portais corporativos. Gestão de Conteúdo web através de ontologias: conceitos e aplicações Fernando Silva Parreiras Contextualização O que? Uso de taxonomias na gestão de conteúdo de portais corporativos. Quem? Gerentes, consultores

Leia mais

Ontologia de Domínio da Biodisponibilidade de Ferro: Uma Experiência no Projeto Nutri-Fuzzy-Orixás

Ontologia de Domínio da Biodisponibilidade de Ferro: Uma Experiência no Projeto Nutri-Fuzzy-Orixás Ontologia de Domínio da Biodisponibilidade de Ferro: Uma Experiência no Projeto Nutri-Fuzzy-Orixás Alessandra Brito F. Oliveira 1; Vera Maria Benjamim Werneck 1 ; Regina Serrão Lanzillotti 1 ; Haydée Serrão

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

Engenharia de Requisitos

Engenharia de Requisitos Engenharia de Requisitos Introdução a Engenharia de Requisitos Professor: Ricardo Argenton Ramos Aula 08 Slide 1 Objetivos Introduzir a noção de requisitos do sistema e o processo da engenharia de requisitos.

Leia mais

Módulo 6: Inteligência Artificial

Módulo 6: Inteligência Artificial Módulo 6: Inteligência Artificial Assuntos: 6.1. Aplicações da IA 6.2. Sistemas Especialistas 6.1. Aplicações da Inteligência Artificial As organizações estão ampliando significativamente suas tentativas

Leia mais

XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012. GT 2: Organização e Representação do Conhecimento

XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012. GT 2: Organização e Representação do Conhecimento XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012 GT 2: Organização e Representação do Conhecimento TAXONOMIA E ETIQUETAGEM: análise dos processos de organização e recuperação

Leia mais

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com.

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com. Sistemas da Informação Banco de Dados I Edson Thizon (edson@esucri.com.br) 2008 Apresentação (mini-currículo) Formação Acadêmica Mestrando em Ciência da Computação (UFSC/ ) Créditos Concluídos. Bacharel

Leia mais

CURSO DE SISTEMAS DE INFORMAÇÃO

CURSO DE SISTEMAS DE INFORMAÇÃO 1 CURSO DE SISTEMAS DE INFORMAÇÃO EMENTÁRIO DAS DISCIPLINAS 2011.1 BRUSQUE (SC) 2015 2 SUMÁRIO 1ª FASE... 4 01 ARQUITETURA DE COMPUTADORES... 4 02 FILOSOFIA... 4 03 FUNDAMENTOS MATEMÁTICOS PARA COMPUTAÇÃO...

Leia mais

Uma arquitetura baseada em agentes de software para a automação de processos de gerênciadefalhasemredesde telecomunicações

Uma arquitetura baseada em agentes de software para a automação de processos de gerênciadefalhasemredesde telecomunicações Adolfo Guilherme Silva Correia Uma arquitetura baseada em agentes de software para a automação de processos de gerênciadefalhasemredesde telecomunicações Dissertação de Mestrado Dissertação apresentada

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Centro de Informática - Universidade Federal de Pernambuco Kiev Gama kiev@cin.ufpe.br Slides originais elaborados por Ian Sommerville e adaptado pelos professores Márcio Cornélio,

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 6 Slide 1 Objetivos Apresentar os conceitos de requisitos de usuário e de sistema Descrever requisitos funcionais

Leia mais

Padrões de Contagem de Pontos de Função

Padrões de Contagem de Pontos de Função Padrões de Contagem de Pontos de Função Contexto Versão: 1.0.0 Objetivo O propósito deste documento é apresentar os padrões estabelecidos para utilização da técnica de Análise de Pontos de Função no ambiente

Leia mais

Softwares de Sistemas e de Aplicação

Softwares de Sistemas e de Aplicação Fundamentos dos Sistemas de Informação Softwares de Sistemas e de Aplicação Profª. Esp. Milena Resende - milenaresende@fimes.edu.br Visão Geral de Software O que é um software? Qual a função do software?

Leia mais

Por que o gerenciamento de ativos de software é tão difícil e como simplificá-lo

Por que o gerenciamento de ativos de software é tão difícil e como simplificá-lo DOCUMENTAÇÃO TÉCNICA Melhores práticas de gerenciamento de ativos de software JUNHO DE 2013 Por que o gerenciamento de ativos de software é tão difícil e como simplificá-lo John Fulton CA IT Business Management

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Grupo de Banco de Dados da UFSC

Grupo de Banco de Dados da UFSC Grupo de Banco de Dados da UFSC (GBD / UFSC) Oportunidades de Pesquisa e TCCs 2010 / 2 Objetivo GBD/UFSC Pesquisa e desenvolvimento de soluções para problemas de gerenciamento de dados LISA Laboratório

Leia mais

Gestão do Conhecimento Case Documentar

Gestão do Conhecimento Case Documentar Gestão do Conhecimento Case Documentar GESTÃO DO CONHECIMENTO CASE DOCUMENTAR Empresa: Documentar Tecnologia e Informação Localização: R. Barão de Macaúbas 460 20º Andar Santo Antônio BH/MG Segmento: Tecnologia,

Leia mais

Modelagem de Casos de Uso (Parte 2)

Modelagem de Casos de Uso (Parte 2) Modelagem de Casos de Uso (Parte 2) Roteiro (1) Método para Modelagem de Casos De Uso Estudo de Caso: Sistema de Controle para Videolocadora Levantamento Inicial dos Casos de Uso Identificação dos Casos

Leia mais

Características do Software

Características do Software Questionamentos Por que tanta demora para entregar? Por que os prazos se atrasam? Por que os custos são altos? Por que não achar todos os erros antes de entregar? Por que dificuldade em medir o progresso

Leia mais

Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre. Introdução à Representação e Processamento de Ontologias: Framework O3f

Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre. Introdução à Representação e Processamento de Ontologias: Framework O3f Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre Introdução à Representação e Processamento de Ontologias: Framework O3f Luís Miguel Botelho Departamento de Ciências e Tecnologias

Leia mais

Geração automática de suíte de teste para GUI a partir de Rede de Petri

Geração automática de suíte de teste para GUI a partir de Rede de Petri Raquel Jauffret Guilhon Geração automática de suíte de teste para GUI a partir de Rede de Petri Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo

Leia mais

Modelagem de Casos de Uso (Parte 2)

Modelagem de Casos de Uso (Parte 2) Modelagem de Casos de Uso (Parte 2) Roteiro (1) Método para Modelagem de Casos De Uso Estudo de Caso: Sistema de Controle para Videolocadora Levantamento Inicial dos Casos de Uso Identificação dos Casos

Leia mais

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis Gabriel Galvão da Gama 1 ; Reginaldo Rubens da Silva 2 ; Angelo Augusto Frozza 3 RESUMO Este artigo descreve um projeto

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação SOFT DISCIPLINA: Engenharia de software AULA NÚMERO: 08 DATA: / / PROFESSOR: Andrey APRESENTAÇÃO O objetivo desta aula é apresentar e discutir conceitos relacionados a modelos e especificações. Nesta aula

Leia mais

Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet

Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet Leonardo Pimenta de Mello Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título

Leia mais

MOFI: Um Modelo para Recuperação de Informação baseado em Ontologias, Folksonomia e Indexação Automática de Conteúdo

MOFI: Um Modelo para Recuperação de Informação baseado em Ontologias, Folksonomia e Indexação Automática de Conteúdo MOFI: Um Modelo para Recuperação de Informação baseado em Ontologias, Folksonomia e Indexação Automática de Conteúdo Uedson Santos Reis (SENAI) uedsonreis@gmail.com Eduardo Manuel de Freitas Jorge (UNEB)

Leia mais

ORGANIZAÇÃO CURRICULAR

ORGANIZAÇÃO CURRICULAR ORGANIZAÇÃO CURRICULAR O curso Técnico em Informática, em Nível Médio Subseqüente, será organizado de forma semestral, com aulas presenciais, compostos por disciplinas, com conteúdos estabelecidos, tendo

Leia mais

Luiz Fernando Fernandes de Albuquerque. Avaliação de algoritmos online para seleção de links patrocinados. Dissertação de Mestrado

Luiz Fernando Fernandes de Albuquerque. Avaliação de algoritmos online para seleção de links patrocinados. Dissertação de Mestrado Luiz Fernando Fernandes de Albuquerque Avaliação de algoritmos online para seleção de links patrocinados Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de

Leia mais

Semântica para Sharepoint. Busca semântica utilizando ontologias

Semântica para Sharepoint. Busca semântica utilizando ontologias Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...

Leia mais

taxonomia em Sharepoint

taxonomia em Sharepoint taxonomia em Sharepoint Como organizar o conteúdo corporativo Por: Alexandre Lemos Caroline Piguin Pasqualino Introdução O conhecimento corporativo é um ativo de difícil tangibilidade e sua gestão é uma

Leia mais

Banco de Dados. CursoTécnico em Informática Modalidade Integrado. Professora Michelle Nery. Instituto Federal do Sul de Minas, câmpus Pouso Alegre

Banco de Dados. CursoTécnico em Informática Modalidade Integrado. Professora Michelle Nery. Instituto Federal do Sul de Minas, câmpus Pouso Alegre Banco de Dados CursoTécnico em Informática Modalidade Integrado Instituto Federal do Sul de Minas, câmpus PousoAlegre Professora Michelle Nery Conteúdo Programático Introdução O que é Banco de Dados O

Leia mais

Estudo de Caso da Implantação do Nível G do MPS.BR em Uma Empresa

Estudo de Caso da Implantação do Nível G do MPS.BR em Uma Empresa Estudo de Caso da Implantação do Nível G do MPS.BR em Uma Empresa Dayana Henriques Fonseca 1, Frederico Miranda Coelho 1 1 Departamento de Ciência da Computação Universidade Presidente Antônio Carlos (UNIPAC)

Leia mais

Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial

Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial Lucas A. de Oliveira, Rui A. R. B. Figueira, Expedito C. Lopes Mestrado em Sistemas e Computação Universidade de Salvador (UNIFACS)

Leia mais

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr.

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr. 15 Aula 15 Tópicos Especiais I Sistemas de Informação Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Conceitos básicos sobre Sistemas de Informação Conceitos sobre Sistemas

Leia mais

PDS - DATASUS. Processo de Desenvolvimento de Software do DATASUS

PDS - DATASUS. Processo de Desenvolvimento de Software do DATASUS PDS - DATASUS Processo de Desenvolvimento de Software do DATASUS Coordenação Geral de Arquitetura e Engenharia Tecnológica Coordenação de Padronização e Qualidade de Software Gerência de Padrões e Software

Leia mais

Processos de Desenvolvimento de Software. Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 2

Processos de Desenvolvimento de Software. Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 2 Processos de Desenvolvimento de Software Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 2 A Engenharia de Software Uma Tecnologia em Camadas ferramentas métodos processo foco na qualidade

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Ontologia para Gestão de Competências dos Profissionais em Tecnologia da Informação

Ontologia para Gestão de Competências dos Profissionais em Tecnologia da Informação Ontologia para Gestão de Competências dos Profissionais em Tecnologia da Informação Paulo Roberto Corrêa Leão; Káthia M. Oliveira; Eduardo A. D. Moresi Universidade Católica de Brasília (UCB) SGAN 916

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

Programação de Computadores

Programação de Computadores Programação de Computadores INTRODUÇÃO AOS ALGORITMOS E À PROGRAMAÇÃO DE COMPUTADORES PARTE 1 Renato Dourado Maia Instituto de Ciências Agrárias Universidade Federal de Minas Gerais Programas e Programação

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

A TECNOLOGIA DA INFORMAÇÃO E A EMPRESA CONTEMPORÂNEA 1 Wailton Fernando Pereira da Silva 2 e-mail: wailton@ubbi.com.br

A TECNOLOGIA DA INFORMAÇÃO E A EMPRESA CONTEMPORÂNEA 1 Wailton Fernando Pereira da Silva 2 e-mail: wailton@ubbi.com.br A TECNOLOGIA DA INFORMAÇÃO E A EMPRESA CONTEMPORÂNEA 1 Wailton Fernando Pereira da Silva 2 e-mail: wailton@ubbi.com.br 1. Introdução O advento dos microprocessadores disseminou a informática a tal ponto

Leia mais

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Access Control System Based on Face Recognition Tiago A. Neves, Welton S. De Oliveira e Jean-Jacques De Groote Faculdades COC de Ribeirão

Leia mais

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento 1 Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento Referência do texto para discussão: BRASCHER, Marisa;

Leia mais

CONSTRUÇÃO DE SOFTWARE

CONSTRUÇÃO DE SOFTWARE CONSTRUÇÃO DE SOFTWARE Náthilla Tavares Fagundes, Pablo Galvão, Wytor Venancio Rodrigues Faculdade de Tecnologia SENAC Goiânia/GO (SENAC/GO) Av. Independência número 1002 - CEP 74645-010 Setor Leste Vila

Leia mais

Sistemas de Informações Gerenciais: princípios, tipos, apoio a decisão Prof. MSc Hugo Vieira L. Souza

Sistemas de Informações Gerenciais: princípios, tipos, apoio a decisão Prof. MSc Hugo Vieira L. Souza Sistemas de Informações Gerenciais: princípios, tipos, apoio a decisão Prof. MSc Hugo Vieira L. Souza Este documento está sujeito a copyright. Todos os direitos estão reservados para o todo ou quaisquer

Leia mais

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios?

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? RESUMO DA SOLUÇÃO CA ERwin Modeling Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? O CA ERwin Modeling fornece uma visão centralizada das principais definições de

Leia mais

Projeto de Sistemas I

Projeto de Sistemas I Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Projeto de Sistemas I Professora: Kelly de Paula Cunha E-mail:kellypcsoares@ifsp.edu.br Requisitos: base para todo projeto, definindo o

Leia mais

Gerenciamento de Redes

Gerenciamento de Redes Gerenciamento de Redes As redes de computadores atuais são compostas por uma grande variedade de dispositivos que devem se comunicar e compartilhar recursos. Na maioria dos casos, a eficiência dos serviços

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

EMENTAS DAS DISCIPLINAS

EMENTAS DAS DISCIPLINAS EMENTAS DAS DISCIPLINAS CST SISTEMAS DE INFORMAÇÃO DISCIPLINA: Algoritmo e Programação I A disciplina aborda o estudo de algoritmos, envolvendo os conceitos fundamentais: variáveis, tipos de dados, constantes,

Leia mais

3 Ferramentas de busca

3 Ferramentas de busca 3 Ferramentas de busca A Internet se transformou em um vasto repositório de informações. Podemos encontrar sites sobre qualquer assunto, de futebol a religião. O difícil, porém é conseguir encontrar a

Leia mais

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA Daniel Gonzaga dos Santos 1 Faculdade Cidade de João Pinheiro Resumo: Este artigo aborda as etapas para

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

CAPÍTULO 1 INTRODUÇÃO

CAPÍTULO 1 INTRODUÇÃO CAPÍTULO 1 INTRODUÇÃO A atuação do homem no meio ambiente, ao longo da história, fornece provas de suas ações em nome do progresso. Esta evolução tem seu lado positivo, pois abre novos horizontes, novas

Leia mais

Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13

Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13 Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13 A Presidenta do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep),

Leia mais

1988 - Sistema de Automação do NDC (SAND): Controle da Terminologia de Indexação e Sistema de Informações Legislativas

1988 - Sistema de Automação do NDC (SAND): Controle da Terminologia de Indexação e Sistema de Informações Legislativas A Coordenação de Bibliotecas e a informatização do sistema: onde estamos e o que queremos 1988 - Sistema de Automação do NDC (SAND): Controle da Terminologia de Indexação e Sistema de Informações Legislativas

Leia mais

Alternativas de Integração de Dados Gerenciando Valor e Qualidade

Alternativas de Integração de Dados Gerenciando Valor e Qualidade Soluções para Possibilitar Relacionamentos Duradouros com Clientes Alternativas de Integração de Dados Gerenciando Valor e Qualidade Utilizando uma abordagem regulada para incorporar serviços de qualidade

Leia mais

Capítulo 1. Introdução. 1.1 Linguagens. OBJETIVOS DO CAPÍTULO Ao final deste capítulo você deverá ser capaz de:

Capítulo 1. Introdução. 1.1 Linguagens. OBJETIVOS DO CAPÍTULO Ao final deste capítulo você deverá ser capaz de: i Sumário 1 Introdução 1 1.1 Linguagens....................................... 1 1.2 O que é um Compilador?................................ 2 1.3 Processadores de Programas: Compiladores, Interpretadores

Leia mais

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS INTRODUÇÃO À COMPUTAÇÃO 60 h 1º Evolução histórica dos computadores. Aspectos de hardware: conceitos básicos de CPU, memórias,

Leia mais

Esta comunicação está sendo submetida sob o [x] Tema 1 Aspectos teóricos e metodológicos nos estudos em ontologias

Esta comunicação está sendo submetida sob o [x] Tema 1 Aspectos teóricos e metodológicos nos estudos em ontologias SEMINÁRIO DE PESQUISA EM ONTOLOGIA NO BRASIL 11 e 12 de Agosto Universidade Federal Fluminense Departamento de Ciência da Informação Niterói Rio de Janeiro Brasil Esta comunicação está sendo submetida

Leia mais

Ciclo de Vida Clássico ou Convencional CICLOS DE VIDA DE DESENVOLVIMENTO DE SISTEMAS. Ciclo de Vida Clássico ou Convencional. Enfoque Incremental

Ciclo de Vida Clássico ou Convencional CICLOS DE VIDA DE DESENVOLVIMENTO DE SISTEMAS. Ciclo de Vida Clássico ou Convencional. Enfoque Incremental CICLOS DE VIDA DE DESENVOLVIMENTO DE SISTEMAS Elicitação Ciclo de Vida Clássico ou Convencional O Modelo Cascata Análise Ana Paula Terra Bacelo Blois Implementação Material Adaptado do Prof. Marcelo Yamaguti

Leia mais

Universidade de Santa Cruz do Sul Departamento de Informática

Universidade de Santa Cruz do Sul Departamento de Informática Universidade de Santa Cruz do Sul Departamento de Informática I Seminário dos Grupos de Pesquisa da UNISC Ficha de Inscrição do Grupo de Pesquisa Gestão do Conhecimento Santa Cruz do Sul, 06 de julho de

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

ENGENHARIA DE SOFTWARE Prof. Ricardo Rodrigues Barcelar http://www.ricardobarcelar.com.br

ENGENHARIA DE SOFTWARE Prof. Ricardo Rodrigues Barcelar http://www.ricardobarcelar.com.br - MÓDULO 3 - MODELAGEM DE SISTEMAS ORIENTADA A OBJETOS COM UML 1. INTRODUÇÃO A partir de 1980, diversos métodos de desenvolvimento de sistemas surgiram para apoiar o paradigma orientado a objetos com uma

Leia mais