Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos

Tamanho: px
Começar a partir da página:

Download "Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos"

Transcrição

1 UNIVERSIDADE FEDERAL DE GOIÁS INSTITUTO DE INFORMÁTICA EDISON ANDRADE MARTINS MORAIS Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos Goiânia 2007

2 EDISON ANDRADE MARTINS MORAIS Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos Dissertação apresentada ao Programa de Pós Graduação do Instituto de Informática da Universidade Federal de Goiás, como requisito parcial para obtenção do título de Mestre em Ciência da Computação. Área de concentração: Sistemas de Informação. Orientador: Profa. Dra. Ana Paula Laboissière Ambrósio Goiânia 2007

3 EDISON ANDRADE MARTINS MORAIS Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos Dissertação defendida no Programa de Pós Graduação do Instituto de Informática da Universidade Federal de Goiás como requisito parcial para obtenção do título de Mestre em Ciência da Computação, aprovada em 28 de Maio de 2007, pela Banca Examinadora constituída pelos professores: Prof. Dra. Ana Paula Laboissière Ambrósio Instituto de Informática UFG Presidente da Banca Prof. Dra. Fernanda Lima Departamento de Ciência da Computação Universidade Católica de Brasília (UCB) Prof. Dr. Cedric Luiz de Carvalho Instituto de Informática UFG

4 Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador. Edison Andrade Martins Morais Graduou-se em Tecnologia Em Processamento de Dados pelo Instituto Unificado de Ensino Superior Objetivo (1996) e especializou-se em Análise e Projeto de Sistemas de Informação pela Universidade Federal de Goiás (2003). Durante o mestrado, foi professor substituto do Instituto de Informática da Universidade Federal de Goiás. Atualmente é Analista de Sistemas do Tribunal de Justiça do Estado de Goiás.

5 Às minhas filhas, Júlia e Sofia, e a minha esposa, Ilanita.

6 Agradecimentos À Universidade Federal de Goiás (UFG), pelo apoio e incentivo que me foi dado como professor e aluno desta instituição; Ao Tribunal de Justiça do Estado de Goiás (TJGO), pelo apoio dado para a realização das pesquisas contidas neste trabalho; A todos aqueles que de alguma forma contribuíram para realização deste trabalho, especialmente o amigo Alcide Celso Ramos Jubé Neto; Aos professores do INF-UFG; A minha orientadora, Profa. Dra. Ana Paula Laboissière Ambrósio, pela inestimável orientação neste trabalho, pelo incentivo pessoal e pela dedicação profissional; A toda minha família, especialmente irmãos, avós, tios e primos. A Marcela Heitor de Andrade pela importante colaboração. Aos meus pais, que me deram o apoio e a base necessários para que eu chegasse até esta conquista. A minha esposa, pelo amor, paciência e dedicação. Às minhas filhas, que me dão a motivação necessária para melhorar e crescer sempre.

7 Resumo Morais, Edison. Contextualização de Documentos em Domínios Representados por Ontologias Utilizando Mineração de Textos. Goiânia, p. Dissertação de Mestrado. Instituto de Informática, Universidade Federal de Goiás. Hoje, os usuários da Web exigem que os mecanismos de recuperação de informações sejam capazes de obter, rapidamente, a maior quantidade possível de informações relevantes. Já existem várias ferramentas que auxiliam nesta busca de informações, mas elas ainda apresentam problemas principalmente ligados à falta de tratamento semântico dos documentos e das consultas. Como o problema de semântica não se restringe à recuperação de informações, existe a proposta de criação de uma Web Semântica [6], cujo objetivo é atribuir significado aos dados disponíveis em uma página Web, de forma que estes possam ser "compreendidos"pelos computadores. Para isto introduz o uso de metadados e ontologias. O sistema proposto neste trabalho utiliza técnicas de mineração de textos para associar semanticamente documentos a domínios representados por ontologias. Para isto foi proposta uma metodologia, que a partir da análise de documentos, usando técnicas estatísticas de mineração de textos, atribui um grau de similaridade (ou relevância) desse documento ao domínio representado pela ontologia. Uma ferramenta foi implementada e testada utilizando documentos contendo jurisprudências do Tribunal de Justiça de Goiás. O fato de estas jurisprudências sofrerem uma categorização manual feita por especialistas, permitiu uma comparação com a classificação automática feita pelo sistema. Como se conhece o total de documentos armazenados no banco de dados e quantos pertencem a cada categoria foi possível analisar parâmetros de eficiência e eficácia da ferramenta, através dos índices de recall(número de documentos recuperados dentre os relevantes), precision (número de documentos relevantes dentre os que foram recuperados) e fallout (índice de documentos irrelevantes retornados) do sistema. Palavras chave Ontologias, Mineração de Textos, Indexação Semântica

8 Abstract Morais, Edison. Document Contextualization in Domains Represented by Ontologies Using Text Mining. Goiânia, p. MSc. Dissertation. Instituto de Informática, Universidade Federal de Goiás. Today, users need information recovery mechanisms that can rapidly obtain the largest amount of relevant information. Several information recovery systems are available, but they still have problems related to the lack of semantic treatment on documents and queries. To relieve this problem, automatic analysis of the context in which the queries are defined has been proposed to permit an "understanding"of the query content, reducing ambiguities and augmenting the relevance of the recovered documents. Since semantics is not a problem restricted only to information retrieval, a Semantic Web has been proposed [6], where meaning is attributed to data so it can be "understood"by computers. For this, ontologies and metadata are used. The system being proposed uses statistical text mining techniques to semantically associate documents and domains represented by ontologies, giving a similarity degree (or relevance) between the document and the domain. A tool was implemented and tested using Jurisprudence documents from the Court of Justice of the State of Goiás. These documents are all indexed by specialists under predefined categories that define the subject they refer to. A comparison between the results obtained using the tool and the manual indexation was thus possible, permitting an analysis of the efficiency of the tool using recall, precision and fall-out indexes. Keywords Semantics, Ontologies, Text Mining

9 Sumário Lista de Figuras 10 Lista de Tabelas 11 Lista de Códigos de Programas 13 1 Introdução Contextualização Automática de Documentos Ontologias Mineração de Textos Motivação Sistema Proposto Estrutura da Dissertação 21 2 Ontologias Sentido Filosófico Ontologias e Ciência da Computação Principais Usos, Benefícios e Problemas relacionados às Ontologias Tipos de Ontologias Construção de Ontologias Metodologias para Construção de Ontologias Ferramentas para Construção de Ontologias Linguagens para Representação de Ontologias 38 3 Mineração de Textos O Processo de Descoberta de Conhecimento Descoberta de Conhecimento em Dados Estruturados Descoberta de Conhecimento em Dados não Estruturados Mineração de Textos - Conceitos e Definições O processo de Mineração de Textos 46 Tipos de Abordagens de Dados 47 Preparação dos Dados 49 Indexação e Normalização 54 Cálculo da Relevância 59 Seleção de Termos 61 Análise de Resultados 64

10 4 Sistema Proposto O Sistema Extração dos termos relevantes da Ontologia Extração dos termos relevantes das Jurisprudências Cálculo da similaridade entre a ontologia e as jurisprudências Funcionamento do Sistema Construção da Ontologia Seleção da Amostra Seleção de Documentos Execução do Sistema e Coleta de Dados Trabalhos Relacionados 79 5 Estudo de Caso Parâmetro de Avaliação do Sistema Amostra 1 84 Iteração 1 84 Iteração 2 86 Iteração Amostra 2 89 Iteração 1 90 Iteração Conclusões e Trabalhos Futuros Trabalhos Publicados Trabalhos Futuros 97 Referências Bibliográficas 99 A Amostra 1 - Índices de Similaridade 107 B Amostra 2 - Índices de Similaridade 110

11 Lista de Figuras 1.1 Total de usuários da Internet por Região do Mundo Visão geral dos mecanismos de busca Ontologia no Sentido Filosófico Ontologias de Aplicação [36] Exemplo de taxonomia de classes Metodologia Enteprise Methontology On to Knowledge Protégé WebODE OntoEdit Tipos de Descoberta de Conhecimento Etapas do Processo de Mineração de Textos Etapas do Processo de Indexação Automática [82] Portuguese Stemming Tela de Entrada de Dados do Sistema Ontologia sobre acidente de trânsito. 75

12 Lista de Tabelas 2.1 Linguagens para Especificação de Ontologias Cálculo do Tamanho da Amostra Índices Calculados Amostra Variáveis colhidas sobre a amostra Iteração 1 - Variáveis Iteração 1 - Índices Iteração 1 - Índices de Similaridade Iteração 2 - Variáveis Iteração 2 - Índices Iteração 2 - Índices de Similaridade Iteração 3 - Variáveis Iteração 3 - Índices Iteração 3 - Índices de Similaridade Amostra Variáveis colhidas sobre a amostra Iteração 1 - Variáveis (Amostra 2) Iteração 1 - Índices (Amostra 2) Iteração 1 - Índices de Similaridade (Amostra 2) Iteração 2 - Variáveis (Amostra 2) Iteração 2 - Índices (Amostra 2) Iteração 2 - Índices de Similaridade (Amostra 2) 92 A.1 Índices de Similaridade por Iteração - Amostra B.1 Índices de Similaridade por Iteração - Amostra 2 111

13 Lista de Códigos de Programas 2.1 Especificação em Ontolíngua Especificação em RDF Especificação em OWL Especificação em XML Ontologia sobre Acidente de Trânsito em XML 68

14 Introdução CAPÍTULO 1 O avanço das tecnologias da informação, especialmente nos últimos 30 anos, resultou no desenvolvimento da capacidade (velocidade e volume) de comunicação em todo o mundo. Como conseqüência houve um aumento no número de informações disponíveis para as pessoas, empresas e governo, provocado, primeiramente, pela popularização dos computadores, e conseqüente aumento da utilização de softwares, e posteriormente, potencializado pelo surgimento da Internet. A utilização de softwares permitiu o armazenamento de dados em arquivos de diferentes formatos, tais como documentos, planilhas ou bancos de dados, tornando-os mais facilmente disponíveis para futura utilização, gerando benefícios tanto para as pessoas, quanto para as empresas. De acordo com [37], cerca de 80% das informações das empresas no mundo é arquivada em documentos textuais, armazenados em meio eletrônico, tais como: relatórios diversos, especificações de produtos, resumos, notas, correspondência eletrônica, documentos diversos (boletins, jornais, revistas, etc.), formando grandes coleções de dados (bibliotecas virtuais, acervos documentais variados, etc.). [69] cita que, para se tornarem mais competitivas no mercado, as empresas devem justamente ser capazes de obter, rapidamente, a maior quantidade possível de informações relevantes. Pois quanto melhor o acesso, a disponibilidade e a qualidade da informação, maior é a chance de acerto em seus processos de tomada de decisão. Neste contexto surge a Internet, uma revolução tecnológica de significativas proporções, cujos efeitos, sob os mais diversos aspectos, ainda não estão totalmente avaliados. Atualmente, em todo o mundo, a Internet possui mais de um 1 bilhão de usuários, e cerca de 105 milhões de endereços registrados [41]. A figura 1.1 mostra o total de usuários (em milhões) dividido por regiões do mundo (dados de janeiro/2007 [78]).

15 14 Figura 1.1: Total de usuários da Internet por Região do Mundo. Estudos realizados em 1999 [26] indicavam que, de acordo com as previsões da época, a maior parte do conhecimento humano estaria disponível na rede em dez anos. Entretanto, é muito difícil estimar, atualmente, de forma exata, a quantidade de informações disponíveis, especialmente levando em conta que ela cresce exponencialmente. Se por um lado tamanho volume de documentos e informações gera benefícios, por outro, acaba por trazer problemas, principalmente relacionados à sua localização. Freqüentemente usuários da Internet lidam com o problema da "sobrecarga de informações", que ocorre quando estes têm muitas informações ao seu alcance, mas não têm condições de tratá-la ou de encontrar o que realmente desejam ou lhes interessa [52]. Além disto, a velocidade com que novas informações são adicionadas à Internet, obriga os usuários a pesquisas freqüentes, implicando na disponibilização de tempo, nem sempre possível. Logo, torna-se necessária a utilização de técnicas eficientes e eficazes para a melhoria no tratamento e organização destas informações, atuando principalmente na sua seleção, processamento, recuperação e disseminação. Já existem várias ferramentas que auxiliam a busca de informações na Internet. Algumas destas ferramentas permitem a localização de documentos textuais a partir de palavras chave e/ou catálogos de assuntos. Estas ferramentas dividem-se em dois tipos: Diretórios e Mecanismos de Busca, em muitos aspectos complementares. Os diretórios são sistemas organizados por assuntos, e utilizam um vocabulário controlado para definir uma lista de termos que serão usados por indexadores para catalogar suas páginas. Estes termos podem ser bastante amplos ou bastante específicos, e podem variar de sistema para sistema.

16 15 A maioria das ferramentas de busca por assunto classificam os sites em categorias amplas e permitem refinar a busca passo-a-passo. Geralmente, a quantidade de termos definidos para indexar uma página é limitada, às vezes apenas um, e pode não cobrir a variedade e complexidade de assuntos tratados na página. Porém, quando o usuário procura informações gerais sobre um determinado assunto e encontra um termo útil que representa o assunto desejado, pode-se eliminar um grande número de documentos irrelevantes, já que os assuntos classificados naquele termo foram previamente analisados pelos indexadores. Entretanto, o uso de índice hierárquico de assuntos também tem desvantagens. Quando não se conhece o termo desejado, o número de operações para encontrar a informação pode ser muito maior que utilizando palavras chave, pois se torna necessário percorrer vários níveis hierárquicos nas categorias. Além disto, a indexação de sites é feita manualmente, o que retarda a categorização levando a um número menor de páginas indexadas, e em poucas categorias. Já nos mecanismos de busca por palavra chave, os sites são indexados por todas as palavras relevantes contidas no site. Assim, o usuário pode realizar buscas por uma ou mais palavras chave, e serão retornadas páginas que têm uma ou mais dessas palavras em alguma parte do texto. No entanto pesquisas utilizando uma única palavra geralmente retornam milhares de documentos, a maioria irrelevante. Pesquisas podem ser refinadas usando mais palavras chave combinadas com operadores lógicos (E, OU, NÃO). Este tipo de mecanismo obtém melhores resultados, se comparado aos diretórios, quando o usuário não tem certeza do assunto exato no qual está interessado, se está usando jargão de uma determinada área, se não está obtendo resultados suficientes através de uma busca por assunto ou procura por um termo bem preciso. Entretanto, pesquisas utilizando palavras que têm mais de um significado devem ser mais cuidadosas, pois os mecanismos não são capazes de determinar qual o significado desejado e retornam documentos contendo aquela palavra independente do contexto. Os mecanismos de busca por palavras chave têm a vantagem de usar robôs para indexarem as páginas automaticamente (ver figura 1.2), permitindo que um número significativo e muito maior de páginas seja indexado, ampliando o espaço de busca.

17 16 Figura 1.2: Visão geral dos mecanismos de busca Analisando os problemas associados à utilização destas ferramentas, verifica-se que ocorrem principalmente pela dificuldade que estas têm de entender a semântica contida nos textos. Nos diretórios, a semântica dos textos é atribuída por pessoas que os indexam manualmente. Isto pode levar a erros de catalogação quando, por exemplo, o indexador interpreta equivocadamente o conteúdo de um documento, ou não classifica o documento em todas as categorias relevantes. Outro problema ocorre quando o usuário não consegue encontrar um assunto, dentre os pre-definidos, que represente seus interesses de busca já que, freqüentemente, pessoas diferentes podem utilizar os mesmos termos para idéias diferentes ou então utilizar termos diferentes para as mesmas idéias. Segundo [52], este problema é conhecido como "abismo semântico". Nos mecanismos de busca o problema está em contextualizar 1 as buscas realizadas pelos usuários, o que pode levar a documentos que contêm as palavras fornecidas, mas que se referem a outro contexto. Outro problema é que poderão deixar de ser recuperados documentos relevantes para o assunto escolhido, justamente porque não possuem os termos fornecidos [52]. 1 Contexto (ou espaço contextual) é um conjunto de palavras que definem um assunto ou área do conhecimento [13].

18 1.1 Contextualização Automática de Documentos 17 A causa de tais imprecisões e ambigüidades é inerente ao processo de comunicação. Em geral, é impossível transmitir significados, apenas símbolos. O significado (semântica) está na mente das pessoas e não em marcas gráficas. O contexto dos documentos acaba sendo atribuído pelas pessoas ao analisar/ler o texto. Uma proposta para amenizar tais problemas, é a análise automática do contexto em que os termos das buscas são usados. 1.1 Contextualização Automática de Documentos Uma vez que a análise do contexto é indispensável para o bom entendimento dos termos utilizados nas buscas, mecanismos automáticos de contextualização podem ajudar a resolver diversos problemas relacionados à localização eficiente de documentos, tanto para o ambiente das empresas quanto para o ambiente da Internet. Para as empresas, o principal benefício da contextualização está relacionada à transformação de grandes volumes de dados, geralmente nãoestruturados, em conhecimento útil, muitas vezes inovador [61]. Neste caso a categorização de textos pode ser utilizada para classificar um conjunto de documentos em uma ou mais categorias (contextos) existentes. Ela é geralmente utilizada para classificar mensagens, notícias, resumos, ofícios, memorandos, comunicados e publicações. A categorização também pode ser utilizada para organizar e filtrar informações. Essa capacidade faz com que esta técnica possa contribuir no processo de coleta, análise e distribuição de informações e, conseqüentemente, na gestão e na estratégia competitiva de uma empresa [69]. Já na Internet a contextualização automática pode trazer vários benefícios. Além de tornar a pesquisa mais ágil e direta, tratar o problema da contextualização também ajuda a solucionar o problema do grande volume de documentos retornados em uma pesquisa, pois neste caso já existe uma pré-categorização das páginas resultantes das buscas. Além disto, a contextualização automática pode ser usada para a recuperação automática de documentos. Neste caso um sistema pode informar usuários sobre documentos novos relacionados a assuntos de seu interesse sem que seja necessária uma busca específica feita pelo usuário. Isto permite ganho de tempo e constante atualização do usuário.

19 1.2 Ontologias 18 Um dos principais problemas da contextualização automática de documentos está relacionado à definição formal dos contextos, ou seja, como criar contextos (categorias) que permitam classificação automática de documentos. Neste trabalho, a definição dos contextos será feita utilizando ontologias. 1.2 Ontologias Ontologia, no contexto da Ciência da Computação, é uma técnica de organização de informações que vem recebendo especial atenção nos últimos anos, principalmente no que diz respeito à representação formal de conhecimento [33] [35]. Geralmente criadas por especialistas, tendo sua estrutura baseada na descrição de conceitos e dos relacionamentos semânticos entre eles, as ontologias geram uma especificação formal e explícita de uma conceitualização compartilhada [6]. Uma razão para a popularidade das ontologias é a promessa de compartilhamento e entendimento comum de algum domínio de conhecimento que possa ser comunicado entre pessoas e computadores. Neste sentido, ontologias têm sido desenvolvidas para facilitar o compartilhamento e reutilização de informações [32]. A comunidade da Internet acredita que, em um futuro próximo, todo negócio da rede deverá fornecer a semântica de suas páginas através de uma ontologia [21], pois estas oferecem uma "língua franca", que permite que máquinas processem e integrem recursos da Internet de maneira inteligente, possibilitando buscas rápidas e acuradas e facilitando a comunicação entre dispositivos heterogêneos na rede. Neste trabalho as ontologias serão utilizadas para a definição de contextos, gerando um conjunto de palavras que o identificam. Entretanto, [52] cita que o maior problema da atividade de definição de contextos é que a mesma exige tempo e disposição. Além disto, o especialista pode não ser capaz de identificar todas as palavras relevantes do contexto ou aquela que define o contexto. Por exemplo, se a ontologia a ser utilizada pertence à área de Jurídica, quem deve selecionar as palavras que definem o contexto é um especialista desta área (juiz, advogado, etc.). Isso porque esta pessoa já está acostumada com o assunto e consegue identificar quais são as palavras que são mais importantes na descrição do assunto. O especialista sabe quais são os termos comumente empregados pelas pessoas que trabalham na mesma área,

20 1.3 Mineração de Textos 19 aumentando assim a abrangência (capacidade de recuperar todos os documentos relevantes ao assunto) e a precisão (capacidade de recuperar somente documentos relevantes) do contexto. 1.3 Mineração de Textos Mineração de textos, ou text mining, é o nome dado às técnicas de análise e extração de dados a partir de textos, frases ou apenas palavras. Envolve a aplicação de algoritmos computacionais que processam textos (em diferentes formatos) e identificam informações úteis e implícitas, que normalmente não poderiam ser recuperadas utilizando métodos tradicionais de consulta, pois a informação contida nestes textos não pode ser obtida de forma direta. Segundo [4] cada vez mais se torna necessário ter uma aplicação que contemple um conjunto de ferramentas automáticas que avaliem o conteúdo de documentos, páginas web ou sites, através da utilização de ferramentas de mineração de textos, que são importantes na extração de informações em grandes massas de dados, podendo retornar resultados com alto nível de qualidade na informação obtida, aumentando as chances de descoberta de informações relevantes ou inesperadas 2. Logo, a principal motivação para utilizar esta técnica é que seu uso permite extrair conhecimento a partir de dados textuais não-estruturados. Uma vez que os documentos submetidos ao sistema proposto neste trabalho estão neste formato, este tipo de técnica pode ser utilizada. 1.4 Motivação As duas principais motivações para realização deste trabalho são: 1. Contribuir para a o processo de coleta, análise e distribuição de informações na empresas. 2. Contribuir para a solução do problema de contextualização relacionado às ferramentas de busca na Internet. 2 Uma informação é considerada inesperada quando ela é relevante, porém desconhecida do usuário, ou contradiz a opinião existente ou as expectativas do usuário [4].

21 1.5 Sistema Proposto Sistema Proposto O objetivo do sistema proposto neste trabalho é utilizar técnicas de mineração de textos para associar semanticamente documentos a domínios representados por ontologias. Neste sentido foi proposta uma metodologia que a partir da análise de documentos, usando técnicas estatísticas de mineração de textos, atribui um grau de similaridade (ou relevância) desse documento ao domínio representado pela ontologia. Uma ferramenta foi implementada para esta metodologia que foi testada no domínio de "Acidente de Transito"para verificar a eficácia do sistema proposto. Para testar o sistema foram utilizados documentos contendo jurisprudências 3 do Tribunal de Justiça do Estado de Goiás. Atualmente estas jurisprudências estão disponíveis para consulta no portal do Tribunal (www.tj.go.gov.br/jurisprudencia/juris.php). Este sistema foi utilizado no teste porque estas jurisprudências sofrem uma categorização manual feita por especialistas, o que permite uma comparação com a classificação automática feita pelo sistema. Uma das categorias usadas para classificação é "Acidente de Trânsito". Outras são "Separação Consensual"e "Indenização por Danos Morais", entre outras. Como se conhece o total de documentos armazenados no banco de dados e quantos pertencem a cada categoria foi possível analisar parâmetros de eficiência e eficácia da ferramenta. Não é objetivo deste trabalho propor técnicas para criação de ontologias. Parte-se do pressuposto que ontologias de qualidade estejam disponíveis. Infelizmente este não é ainda o caso. Apesar do avanço da Web Semântica, e de existirem diversos projetos que tratam de metodologias, ferramentas e linguagens para desenvolvimento, especificação e representação de ontologias ([2], [21], [36] e [42]), ontologias de qualidade são raras e geralmente em inglês. Isto nos obrigou a desenvolver uma ontologia para representar o domínio desejado. A ontologia foi definida com a ajuda de especialistas da área de direito que trabalham no Tribunal. O desenvolvimento seguiu as metodologias propostas (capítulo 3) e utilizou a ferramenta Protégé [63], o que permitiu uma análise do processo. Para validar o sistema desenvolvido foram utilizadas duas amostras de documentos, com 60 documentos cada uma. Cada amostra contém 30 jurisprudências sobre acidentes de trânsito e 30 sobre outros assuntos. Para a 3 Jurisprudência é o conjunto uniforme e constante das decisões judiciais sobre casos semelhantes. Este modo uniforme pelo qual os tribunais interpretam e aplicam determinadas leis, gera um conjunto de documentos texto que podem ser utilizados por quaisquer interessados.

22 1.6 Estrutura da Dissertação 21 primeira amostra foram feitas 3 iterações e para a segunda amostra foram realizadas 2 iterações. Para cada iteração foram verificados os índices de recall(número de documentos recuperados dentre os relevantes), precision (número de documentos relevantes dentre os que foram recuperados) e fallout (índice de documentos irrelevantes retornados) do sistema. Quanto mais próximos de 100% os índices de recall e precision, e mais próximo de 0% o índice de fall-out, mais eficiente é o sistema. 1.6 Estrutura da Dissertação O texto desta dissertação está organizado da seguinte forma: O capítulo 2 descreve o conceito de ontologia, seus principais usos, benefícios e problemas, os tipos de ontologias existentes, e as principais metodologias, ferramentas e linguagens utilizadas na sua construção. O capítulo 3 fornece visão geral sobre o estado da arte em mineração de textos. Partindo da análise do processo de descoberta de conhecimento em dados estruturados e não estruturados, até a definição e descrição das etapas do processo de mineração de textos. O capítulo 4 descreve o sistema proposto, detalhando a metodologia desenvolvida e a ferramenta implementada. O capítulo 5 descreve um estudo de caso, que envolve indexação semântica de jurisprudências. Uma ontologia sobre acidente de trânsito e várias jurisprudências do Tribunal de Justiça do Estado de Goiás (TJGO) foram submetidas ao sistema proposto no capítulo 4. Um conjunto de dados foi gerado pelo sistema, o que permitiu a análise da eficácia desta proposta. O capítulo 6 descreve as considerações finais.

23 Ontologias CAPÍTULO 2 Segundo [2], técnicas de tratamento e organização de dados podem ser classificadas de diversas formas: a partir de seus termos, em glossários ou dicionários; por classificação ou categorias, através de taxonomias; ou a partir de conceitos e seus relacionamentos, utilizando ontologias, tesauros ou redes semânticas. O termo ontologia tem seu sentido relacionado à ciência da computação e inteligência artificial, diferente daquele tradicional, adotado na filosofia. De forma geral, construir ontologias significa definir categorias para as coisas que existem em um mesmo domínio. Ontologia é um catálogo de tipos de coisas, as quais se assume existirem em um domínio de interesse na perspectiva de uma pessoa que usa uma determinada linguagem. O objetivo deste capítulo é descrever o estado da arte no estudo das ontologias, e como estas podem ser utilizadas em benefício dos objetivos propostos neste trabalho. 2.1 Sentido Filosófico Em seu sentido filosófico, ontologia possui diversas definições. Segundo [2], é o ramo da metafísica 1 que estuda os tipos de coisas que existem no mundo. A palavra é derivada do grego ontos, ser, e logos, palavra. Entretanto, seu termo de origem é a palavra aristotélica categoria, termo este utilizado no sentido de classificação. Neste sentido, Aristóteles 2 apresenta categorias que 1 É um ramo da filosofia que estuda o mundo como ele é, ou seja, é o estudo do ser ou da realidade. É a ciência do ser como ser, ou dos princípios e das causas do ser e de seus atributos essenciais. Ela abrange ainda o ser imóvel e incorpóreo, princípio dos movimentos e das formas do mundo, bem como o mundo mutável e material, mas em seus aspectos universais e necessários [7]. 2 Filósofo grego nascido em Estagira, colônia grega da Trácia, no litoral setentrional do mar Egeu, em 384 a.c, foi um dos maiores pensadores de todos os tempos e considerado o criador do pensamento lógico [7].

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

SABiO: Systematic Approach for Building Ontologies

SABiO: Systematic Approach for Building Ontologies SABiO: Systematic Approach for Building Ontologies Ricardo de Almeida Falbo Engenharia de Ontologias Departamento de Informática Universidade Federal do Espírito Santo Agenda Preocupações Principais do

Leia mais

Modelagem do Conhecimento para a Gestão de Processos e Projetos. Modelagem do Conhecimento para a Gestão de Processos e Projetos Prof.

Modelagem do Conhecimento para a Gestão de Processos e Projetos. Modelagem do Conhecimento para a Gestão de Processos e Projetos Prof. Modelagem do Conhecimento para a Gestão de Processos e Projetos 1 Objetivo Apresentação de modelo conceitual para a integração e recuperação de informações, disponíveis em ambientes internos ou externos,

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas 4.1 Motivação Sistemas de Informação são usados em diversos níveis dentro de uma organização, apoiando a tomada de decisão; Precisam estar

Leia mais

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Ontologias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Origem Teoria sobre a natureza da existência Ramo da filosofia que lida com a natureza e organização da realidade.

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Semântica para Sharepoint. Busca semântica utilizando ontologias

Semântica para Sharepoint. Busca semântica utilizando ontologias Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

Uma ontologia para a representação do domínio de agricultura familiar na arquitetura AgroMobile. Roger Alves Prof. Me.

Uma ontologia para a representação do domínio de agricultura familiar na arquitetura AgroMobile. Roger Alves Prof. Me. Uma ontologia para a representação do domínio de agricultura familiar na arquitetura AgroMobile Roger Alves Prof. Me. Vinícius Maran O que é uma ontologia? Palavra vinda do grego, advinda da união entre

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Engenharia de Requisitos

Engenharia de Requisitos Engenharia de Requisitos Introdução a Engenharia de Requisitos Professor: Ricardo Argenton Ramos Aula 08 Slide 1 Objetivos Introduzir a noção de requisitos do sistema e o processo da engenharia de requisitos.

Leia mais

Introdução à Engenharia de Software

Introdução à Engenharia de Software Introdução à Engenharia de Software Professor: Rômulo César romulodandrade@gmail.com www.romulocesar.com.br Imagem Clássica Objetivo da aula Depois desta aula você terá uma visão sobre o que é a engenharia

Leia mais

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações Tópicos Conceitos Básicos Bancos de Dados Sistemas de Bancos de Dados Sistemas de Gerenciamento de Bancos de Dados Abstração

Leia mais

Autor(es) BARBARA STEFANI RANIERI. Orientador(es) LUIZ EDUARDO GALVÃO MARTINS, ANDERSON BELGAMO. Apoio Financeiro PIBIC/CNPQ. 1.

Autor(es) BARBARA STEFANI RANIERI. Orientador(es) LUIZ EDUARDO GALVÃO MARTINS, ANDERSON BELGAMO. Apoio Financeiro PIBIC/CNPQ. 1. 19 Congresso de Iniciação Científica ESPECIFICAÇÃO E IMPLEMENTAÇÃO DE UMA FERRAMENTA AUTOMATIZADA DE APOIO AO GERSE: GUIA DE ELICITAÇÃO DE REQUISITOS PARA SISTEMAS EMBARCADOS Autor(es) BARBARA STEFANI

Leia mais

ü Curso - Bacharelado em Sistemas de Informação

ü Curso - Bacharelado em Sistemas de Informação Curso - Bacharelado em Sistemas de Informação Nome e titulação do Coordenador: Coordenador: Prof. Wender A. Silva - Mestrado em Engenharia Elétrica (Ênfase em Processamento da Informação). Universidade

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Banco de Dados I Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM Dados

Leia mais

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS INTRODUÇÃO À COMPUTAÇÃO 60 h 1º Evolução histórica dos computadores. Aspectos de hardware: conceitos básicos de CPU, memórias,

Leia mais

Softwares de Sistemas e de Aplicação

Softwares de Sistemas e de Aplicação Fundamentos dos Sistemas de Informação Softwares de Sistemas e de Aplicação Profª. Esp. Milena Resende - milenaresende@fimes.edu.br Visão Geral de Software O que é um software? Qual a função do software?

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Tópicos em Engenharia de Software (Optativa III) AULA 2. Prof. Andrêza Leite andreza.lba@gmail.com (81 )9801-6619

Tópicos em Engenharia de Software (Optativa III) AULA 2. Prof. Andrêza Leite andreza.lba@gmail.com (81 )9801-6619 Tópicos em Engenharia de Software (Optativa III) AULA 2 Prof. Andrêza Leite andreza.lba@gmail.com (81 )9801-6619 Engenharia de Software Objetivo da aula Depois desta aula você terá uma revisão sobre o

Leia mais

PDS - DATASUS. Processo de Desenvolvimento de Software do DATASUS

PDS - DATASUS. Processo de Desenvolvimento de Software do DATASUS PDS - DATASUS Processo de Desenvolvimento de Software do DATASUS Coordenação Geral de Arquitetura e Engenharia Tecnológica Coordenação de Padronização e Qualidade de Software Gerência de Padrões e Software

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

DSI é o processo cujo objetivo é introduzir mudanças num sistema de informação, com objetivo de melhorar o seu desempenho.

DSI é o processo cujo objetivo é introduzir mudanças num sistema de informação, com objetivo de melhorar o seu desempenho. - DSI DSI é o processo cujo objetivo é introduzir mudanças num sistema de informação, com objetivo de melhorar o seu desempenho. Preocupação: Problema técnicos Mudança na natureza e conteúdo do trabalho

Leia mais

Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13

Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13 Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13 A Presidenta do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep),

Leia mais

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS Bancos de Dados Conceitos Fundamentais Tópicos Conceitos Básicos Bancos de Dados Sistemas de Bancos de Dados Sistemas de Gerenciamento de Bancos

Leia mais

Programa do Módulo 2. Processo Unificado: Visão Geral

Programa do Módulo 2. Processo Unificado: Visão Geral 9.1 Programa do Módulo 2 Orientação a Objetos Conceitos Básicos Análise Orientada a Objetos (UML) O Processo Unificado (RUP) Processo Unificado: Visão Geral 9.2 Encaixa-se na definição geral de processo:

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE RESUMO Fazer um bom levantamento e especificação de requisitos é algo primordial para quem trabalha com desenvolvimento de sistemas. Esse levantamento

Leia mais

Algumas propriedades dos objetos:

Algumas propriedades dos objetos: Orientação a Objetos Vivemos num mundo de objetos. Esses objetos existem na natureza, nas entidades feitas pelo homem, nos negócios e nos produtos que usamos. Eles podem ser categorizados, descritos, organizados,

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

Prof. Dr. Ivanir Costa. Unidade III QUALIDADE DE SOFTWARE

Prof. Dr. Ivanir Costa. Unidade III QUALIDADE DE SOFTWARE Prof. Dr. Ivanir Costa Unidade III QUALIDADE DE SOFTWARE Normas de qualidade de software - introdução Encontra-se no site da ABNT (Associação Brasileira de Normas Técnicas) as seguintes definições: Normalização

Leia mais

Banco de Dados. CursoTécnico em Informática Modalidade Integrado. Professora Michelle Nery. Instituto Federal do Sul de Minas, câmpus Pouso Alegre

Banco de Dados. CursoTécnico em Informática Modalidade Integrado. Professora Michelle Nery. Instituto Federal do Sul de Minas, câmpus Pouso Alegre Banco de Dados CursoTécnico em Informática Modalidade Integrado Instituto Federal do Sul de Minas, câmpus PousoAlegre Professora Michelle Nery Conteúdo Programático Introdução O que é Banco de Dados O

Leia mais

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP) Hardware (Nível 0) Organização O AS/400 isola os usuários das características do hardware através de uma arquitetura de camadas. Vários modelos da família AS/400 de computadores de médio porte estão disponíveis,

Leia mais

A sua operação de mina faz uso de uma solução de software de planejamento integrado ou utiliza aplicações de software isoladas?

A sua operação de mina faz uso de uma solução de software de planejamento integrado ou utiliza aplicações de software isoladas? XACT FOR ENTERPRISE A ênfase na produtividade é fundamental na mineração à medida que as minas se tornam mais profundas, as operações se tornam cada vez mais complexas. Empresas de reconhecimento mundial

Leia mais

Ontologia de Domínio da Biodisponibilidade de Ferro: Uma Experiência no Projeto Nutri-Fuzzy-Orixás

Ontologia de Domínio da Biodisponibilidade de Ferro: Uma Experiência no Projeto Nutri-Fuzzy-Orixás Ontologia de Domínio da Biodisponibilidade de Ferro: Uma Experiência no Projeto Nutri-Fuzzy-Orixás Alessandra Brito F. Oliveira 1; Vera Maria Benjamim Werneck 1 ; Regina Serrão Lanzillotti 1 ; Haydée Serrão

Leia mais

Thalita Moraes PPGI Novembro 2007

Thalita Moraes PPGI Novembro 2007 Thalita Moraes PPGI Novembro 2007 A capacidade dos portais corporativos em capturar, organizar e compartilhar informação e conhecimento explícito é interessante especialmente para empresas intensivas

Leia mais

Programação de Computadores

Programação de Computadores Programação de Computadores INTRODUÇÃO AOS ALGORITMOS E À PROGRAMAÇÃO DE COMPUTADORES PARTE 1 Renato Dourado Maia Instituto de Ciências Agrárias Universidade Federal de Minas Gerais Programas e Programação

Leia mais

GESTÃO DE TI NAS ORGANIZAÇÕES CONTEMPORÂNEAS

GESTÃO DE TI NAS ORGANIZAÇÕES CONTEMPORÂNEAS GESTÃO DE TI NAS ORGANIZAÇÕES CONTEMPORÂNEAS WALLACE BORGES CRISTO 1 JOÃO CARLOS PEIXOTO FERREIRA 2 João Paulo Coelho Furtado 3 RESUMO A Tecnologia da Informação (TI) está presente em todas as áreas de

Leia mais

ORGANIZAÇÃO CURRICULAR

ORGANIZAÇÃO CURRICULAR ORGANIZAÇÃO CURRICULAR O curso Técnico em Informática, em Nível Médio Subseqüente, será organizado de forma semestral, com aulas presenciais, compostos por disciplinas, com conteúdos estabelecidos, tendo

Leia mais

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com.

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com. Sistemas da Informação Banco de Dados I Edson Thizon (edson@esucri.com.br) 2008 Apresentação (mini-currículo) Formação Acadêmica Mestrando em Ciência da Computação (UFSC/ ) Créditos Concluídos. Bacharel

Leia mais

3 OOHDM e SHDM 3.1. OOHDM

3 OOHDM e SHDM 3.1. OOHDM 32 3 OOHDM e SHDM Com a disseminação em massa, desde a década de 80, de ambientes hipertexto e hipermídia, principalmente a Web, foi identificada a necessidade de elaborar métodos que estruturassem de

Leia mais

2 Auto-sintonia de Bancos de Dados e Agentes de Software

2 Auto-sintonia de Bancos de Dados e Agentes de Software 2 Auto-sintonia de Bancos de Dados e Agentes de Software A uso da abordagem de agentes de software 1 pode trazer benefícios a áreas de aplicação em que é necessário construir sistemas autônomos, ou seja,

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação SOFT DISCIPLINA: Engenharia de software AULA NÚMERO: 08 DATA: / / PROFESSOR: Andrey APRESENTAÇÃO O objetivo desta aula é apresentar e discutir conceitos relacionados a modelos e especificações. Nesta aula

Leia mais

EMC Consulting. Estratégia visionária, resultados práticos. Quando a informação se reúne, seu mundo avança.

EMC Consulting. Estratégia visionária, resultados práticos. Quando a informação se reúne, seu mundo avança. EMC Consulting Estratégia visionária, resultados práticos Quando a informação se reúne, seu mundo avança. Alinhando TI aos objetivos de negócios. As decisões de TI de hoje devem basear-se em critérios

Leia mais

Pós Graduação Engenharia de Software

Pós Graduação Engenharia de Software Pós Graduação Engenharia de Software Ana Candida Natali COPPE/UFRJ Programa de Engenharia de Sistemas e Computação FAPEC / FAT Estrutura do Módulo Parte 1 QUALIDADE DE SOFTWARE PROCESSO Introdução: desenvolvimento

Leia mais

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web Resumo. Desenvolvimento de um software de gerenciamento de projetos para utilização na Web Autor: Danilo Humberto Dias Santos Orientador: Walteno Martins Parreira Júnior Bacharelado em Engenharia da Computação

Leia mais

Módulo 4. Visão geral dos controles do COBIT aplicáveis para implantação da Sarbanes, o papel de TI, a importância dos softwares e exercícios

Módulo 4. Visão geral dos controles do COBIT aplicáveis para implantação da Sarbanes, o papel de TI, a importância dos softwares e exercícios Módulo 4 Visão geral dos controles do COBIT aplicáveis para implantação da Sarbanes, o papel de TI, a importância dos softwares e exercícios Estruturas e Metodologias de controle adotadas na Sarbanes COBIT

Leia mais

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA INTRODUÇÃO O projeto de um banco de dados é realizado sob um processo sistemático denominado metodologia de projeto. O processo do

Leia mais

Um estudo sobre a geração e narração automática de estórias. Dissertação apresentada como requisito parcial para obtenção

Um estudo sobre a geração e narração automática de estórias. Dissertação apresentada como requisito parcial para obtenção Fabio Wanderley Guerra Engenharia de Estórias Um estudo sobre a geração e narração automática de estórias Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de

Leia mais

Introdução. Gestão do Conhecimento GC

Introdução. Gestão do Conhecimento GC Introdução A tecnologia da informação tem um aspecto muito peculiar quanto aos seus resultados, uma vez que a simples disponibilização dos recursos computacionais (banco de dados, sistemas de ERP, CRM,

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

JOSÉ AUGUSTO FABRI. Uma Proposta de Modelo para a Criação e a Organização de Processos de Produção em um Contexto de Fábrica de Software

JOSÉ AUGUSTO FABRI. Uma Proposta de Modelo para a Criação e a Organização de Processos de Produção em um Contexto de Fábrica de Software JOSÉ AUGUSTO FABRI Uma Proposta de Modelo para a Criação e a Organização de Processos de Produção em um Contexto de Fábrica de Software São Paulo 2007 JOSÉ AUGUSTO FABRI Uma Proposta de Modelo para a Criação

Leia mais

Módulo 07 Gestão de Conhecimento

Módulo 07 Gestão de Conhecimento Módulo 07 Gestão de Conhecimento Por ser uma disciplina considerada nova dentro do campo da administração, a gestão de conhecimento ainda hoje tem várias definições e percepções, como mostro a seguir:

Leia mais

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1 SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1 CURSO: SISTEMAS DA INFORMAÇÃO MISSÃO DO CURSO Os avanços da ciência, a melhoria dos processos produtivos e a abertura de mercado, são exemplos de fatores que contribuíram

Leia mais

Revisão de Banco de Dados

Revisão de Banco de Dados Revisão de Banco de Dados Fabiano Baldo 1 Sistema de Processamento de Arquivos Antes da concepção dos BDs o registro das informações eram feitos através de arquivos. Desvantagens: Redundância e Inconsistência

Leia mais

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento 1 Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento Referência do texto para discussão: BRASCHER, Marisa;

Leia mais

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo Roteiro Introdução Sistemas de Informação - SI Executive Information

Leia mais

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE A proposta para o ambiente apresentada neste trabalho é baseada no conjunto de requisitos levantados no capítulo anterior. Este levantamento, sugere uma

Leia mais

UTILIZAÇÃO DO AMBIENTE COLABORATIVO TIDIA-AE PELO GRUPO DE GERENCIAMENTO DO VOCABULÁRIO CONTROLADO DO SIBiUSP - BIÊNIO 2011-2013

UTILIZAÇÃO DO AMBIENTE COLABORATIVO TIDIA-AE PELO GRUPO DE GERENCIAMENTO DO VOCABULÁRIO CONTROLADO DO SIBiUSP - BIÊNIO 2011-2013 UTILIZAÇÃO DO AMBIENTE COLABORATIVO TIDIA-AE PELO GRUPO DE GERENCIAMENTO DO VOCABULÁRIO CONTROLADO DO SIBiUSP - BIÊNIO 2011-2013 Adriana Nascimento Flamino 1, Juliana de Souza Moraes 2 1 Mestre em Ciência

Leia mais

Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet

Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet Leonardo Pimenta de Mello Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título

Leia mais

5 Mecanismo de seleção de componentes

5 Mecanismo de seleção de componentes Mecanismo de seleção de componentes 50 5 Mecanismo de seleção de componentes O Kaluana Original, apresentado em detalhes no capítulo 3 deste trabalho, é um middleware que facilita a construção de aplicações

Leia mais

Universidade Paulista

Universidade Paulista Universidade Paulista Ciência da Computação Sistemas de Informação Gestão da Qualidade Principais pontos da NBR ISO/IEC 12207 - Tecnologia da Informação Processos de ciclo de vida de software Sergio Petersen

Leia mais

Grupo de Estudos sobre Organização e Representação do Conhecimento. UNESP de Marília.

Grupo de Estudos sobre Organização e Representação do Conhecimento. UNESP de Marília. 1 Grupo de Estudos sobre Organização e Representação do Conhecimento UNESP de Marília. Pontos principais do texto: HJØRLAND, B. Towards a Theory of Aboutness, Subject, Topicality, Theme, Domain, Field,

Leia mais

Padrões de Contagem de Pontos de Função

Padrões de Contagem de Pontos de Função Padrões de Contagem de Pontos de Função Contexto Versão: 1.0.0 Objetivo O propósito deste documento é apresentar os padrões estabelecidos para utilização da técnica de Análise de Pontos de Função no ambiente

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr.

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr. 15 Aula 15 Tópicos Especiais I Sistemas de Informação Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Conceitos básicos sobre Sistemas de Informação Conceitos sobre Sistemas

Leia mais

Uma Extensão da Disciplina de Requisitos do OpenUP/Basic para a Construção de Ontologias Aplicadas à Web Semântica

Uma Extensão da Disciplina de Requisitos do OpenUP/Basic para a Construção de Ontologias Aplicadas à Web Semântica SEMINÁRIO DE PESQUISA EM ONTOLOGIA NO BRASIL 11 e 12 de Agosto Universidade Federal Fluminense Departamento de Ciência da Informação Niterói Rio de Janeiro Brasil [X] Tema 2 Técnicas e Ferramentas em Ontologias

Leia mais

Uso de taxonomias na gestão de conteúdo de portais corporativos.

Uso de taxonomias na gestão de conteúdo de portais corporativos. Gestão de Conteúdo web através de ontologias: conceitos e aplicações Fernando Silva Parreiras Contextualização O que? Uso de taxonomias na gestão de conteúdo de portais corporativos. Quem? Gerentes, consultores

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

Gerenciamento de Rede Baseado em Políticas

Gerenciamento de Rede Baseado em Políticas Gerenciamento de Rede Baseado em Políticas (Policy-Based Networking) Ademir José de Carvalho Junior Recife, Fevereiro de 2007 Resumo: A complexidade das redes baseadas em IP atualmente segue crescendo

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 6 Slide 1 Objetivos Apresentar os conceitos de requisitos de usuário e de sistema Descrever requisitos funcionais

Leia mais

Modelagem de informações de. construçãocapítulo1: Capítulo. Objetivo do capítulo

Modelagem de informações de. construçãocapítulo1: Capítulo. Objetivo do capítulo construçãocapítulo1: Capítulo 1 Modelagem de informações de A modelagem de informações de construção (BIM) é um fluxo de trabalho integrado baseado em informações coordenadas e confiáveis sobre um empreendimento,

Leia mais

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br Programação com acesso a BD Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br 1 Introdução BD desempenha papel crítico em todas as áreas em que computadores são utilizados: Banco: Depositar ou retirar

Leia mais

Estudo de Caso da Implantação do Nível G do MPS.BR em Uma Empresa

Estudo de Caso da Implantação do Nível G do MPS.BR em Uma Empresa Estudo de Caso da Implantação do Nível G do MPS.BR em Uma Empresa Dayana Henriques Fonseca 1, Frederico Miranda Coelho 1 1 Departamento de Ciência da Computação Universidade Presidente Antônio Carlos (UNIPAC)

Leia mais

Gestão do Conhecimento Case Documentar

Gestão do Conhecimento Case Documentar Gestão do Conhecimento Case Documentar GESTÃO DO CONHECIMENTO CASE DOCUMENTAR Empresa: Documentar Tecnologia e Informação Localização: R. Barão de Macaúbas 460 20º Andar Santo Antônio BH/MG Segmento: Tecnologia,

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Centro de Informática - Universidade Federal de Pernambuco Kiev Gama kiev@cin.ufpe.br Slides originais elaborados por Ian Sommerville e adaptado pelos professores Márcio Cornélio,

Leia mais

Estratégias de Pesquisa

Estratégias de Pesquisa Estratégias de Pesquisa Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Survey Design e Criação Estudo de Caso Pesquisa Ação Experimento

Leia mais

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP Banco de Dados Introdução João Eduardo Ferreira Osvaldo Kotaro Takai jef@ime.usp.br DCC-IME-USP Importância dos Bancos de Dados A competitividade das empresas depende de dados precisos e atualizados. Conforme

Leia mais

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar.

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar. APRESENTAÇÃO DO PRODUTO Mais que um software, o método mais eficaz para conciliar. Com Conciliac é possível conciliar automaticamente qualquer tipo de transação; Bancos, Cartões de Crédito e Débito, Contas

Leia mais

EXPERIÊNCIA DE USO DE ARQUITETURA CORPORATIVA NO PROJETO DE RES

EXPERIÊNCIA DE USO DE ARQUITETURA CORPORATIVA NO PROJETO DE RES EXPERIÊNCIA DE USO DE ARQUITETURA CORPORATIVA NO PROJETO DE RES Rigoleta Dutra Mediano Dias 1, Lívia Aparecida de Oliveira Souza 2 1, 2 CASNAV, MARINHA DO BRASIL, MINISTÉRIO DA DEFESA, BRASIL Resumo: Este

Leia mais

MSF- MICROSOFT SOLUTIONS FRAMEWORK. Cesar Eduardo Freitas Italo Alves

MSF- MICROSOFT SOLUTIONS FRAMEWORK. Cesar Eduardo Freitas Italo Alves MSF- MICROSOFT SOLUTIONS FRAMEWORK Cesar Eduardo Freitas Italo Alves A ORIGEM DO MSF (MICROSOFT SOLUTIONS FRAMEWORK) Baseado na experiência da empresa na construção de softwares como Office e Windows e

Leia mais

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Carla Gomes de Faria1, Ismênia Ribeiro de Oliveira1, Rosario Girardi1 1Universidade Federal do Maranhão (UFMA)

Leia mais

Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador

Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador Soluções de análise da SAP Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador Índice 3 Um caso para análise preditiva

Leia mais

Ontologias na Computação

Ontologias na Computação Ontologias na Computação Claudio Akio Namikata, Henrique Sarmento, Marcio Valença Ramos cjnamikata90@hotmail.com, rique-182@hotmail.com, maxtr3m3@hotmail.com Resumo: Este trabalho tem como objetivo apresentar

Leia mais

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios?

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? RESUMO DA SOLUÇÃO CA ERwin Modeling Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? O CA ERwin Modeling fornece uma visão centralizada das principais definições de

Leia mais

UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB

UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB Alan Francisco de Souza¹, Claudete Werner¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil alanfsouza.afs@gmail.com,

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO Fabiana Pacheco Lopes 1 1 Universidade Presidente Antônio Carlos (UNIPAC) fabipl_21@yahoo.com.br Resumo.Este

Leia mais

Gerenciamento de Requisitos Gerenciamento de Requisitos

Gerenciamento de Requisitos Gerenciamento de Requisitos Gerenciamento de Requisitos Objetivos da disciplina Descrever o processo de Gerenciamento e Engenharia de Requisitos para projetos Treinar alunos no Gerenciamento de Requisitos Apresentar estudos de caso

Leia mais

C O B I T. Gerenciamento dos Riscos Mitigação. Aceitação. Transferência. Evitar/Eliminar.

C O B I T. Gerenciamento dos Riscos Mitigação. Aceitação. Transferência. Evitar/Eliminar. C O B I T Evolução Estratégica A) Provedor de Tecnologia Gerenciamento de Infra-estrutura de TI (ITIM) B) Provedor de Serviços Gerenciamento de Serviços de TI (ITSM) C) Parceiro Estratégico Governança

Leia mais

Utilização de Técnicas de Recuperação da Informação na Construção de uma Ferramenta de Busca em Documentos do Arquivo Público de Biguaçu

Utilização de Técnicas de Recuperação da Informação na Construção de uma Ferramenta de Busca em Documentos do Arquivo Público de Biguaçu Utilização de Técnicas de Recuperação da Informação na Construção de uma Ferramenta de Busca em Documentos do Arquivo Público de Biguaçu Alessandro Mueller alessandro@univali.br UNIVALI Luiz Gonzaga Ferreira

Leia mais

Engenharia de Software Introdução. Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 1

Engenharia de Software Introdução. Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 1 Engenharia de Software Introdução Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 1 Tópicos Apresentação da Disciplina A importância do Software Software Aplicações de Software Paradigmas

Leia mais

Como conduzir com sucesso um projeto de melhoria da qualidade

Como conduzir com sucesso um projeto de melhoria da qualidade Como conduzir com sucesso um projeto de melhoria da qualidade Maria Luiza Guerra de Toledo Coordenar e conduzir um projeto de melhoria da qualidade, seja ele baseado no Seis Sigma, Lean, ou outra metodologia

Leia mais

Roteiro 2 Conceitos Gerais

Roteiro 2 Conceitos Gerais Roteiro 2 Conceitos Gerais Objetivos: UC Projeto de Banco de Dados Explorar conceitos gerais de bancos de dados; o Arquitetura de bancos de dados: esquemas, categorias de modelos de dados, linguagens e

Leia mais