UNIVERSIDADE FEDERAL DA BAHIA

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE FEDERAL DA BAHIA"

Transcrição

1 UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO Leonardo de Jesus Silva Agrupamento de Serviços Web Semânticos Salvador 2014

2

3 Leonardo de Jesus Silva Agrupamento de Serviços Web Semânticos Monografia apresentada ao Curso de graduação em Ciência da Computação, Departamento de Ciência da Computação, Instituto de Matemática, Universidade Federal da Bahia, como requisito parcial para obtenção do grau de Bacharel em Ciência da Computação. Orientadora: Daniela Barreio Claro Universidade Federal da Bahia UFBA Orientador: Daniela Barreio Claro Salvador 2014

4

5 Leonardo de Jesus Silva Agrupamento de Serviços Web Semânticos Monografia apresentada ao Curso de graduação em Ciência da Computação, Departamento de Ciência da Computação, Instituto de Matemática, Universidade Federal da Bahia, como requisito parcial para obtenção do grau de Bacharel em Ciência da Computação. Orientadora: Daniela Barreio Claro Trabalho aprovado. Salvador, de dezembro de 2014: Daniela Barreio Claro Orientadora Professor Convidado 1 Professor Convidado 2 Salvador 2014

6

7 O conhecimento serve para encantar as pessoas. Não para humilhá-las. (Mário Sérgio Cortella)

8

9 Resumo O número crescente de serviços web impõe desafios maiores para encontrar um conjunto de serviços relacionados à necessidade do usuário. Quando esse usuário é um agente de software os serviços devem ainda ter descrições semânticas para desambiguação e obtenção de todos os serviços relacionados à uma atividade de forma transparente. Então o presente trabalho propõe a definir domínios de serviços web semânticos para facilitar a busca. Esses domínios devem conter serviços similares entre si conforme a funcionalidade que desempenham. Para determinar esses domínios de maneira automática são aplicados aplicados algoritmos de agrupamento. Foram aplicados os algoritmos de agrupamento Partitioning Around Medoids - PAM e o Agrupamento Hierárquico Aglomerativo além de desenvolvidas duas medidas de similaridade. Assim foram gerados quatro agrupamento através da combinação entre cada algoritmo e medida de dissimilaridade, sendo então avaliados através de duas medidas de validação silhueta e medida F. Os resultados demonstraram uma boa qualidade dos grupos gerados. Palavras-chaves: Serviços Web Semânticos. Algoritmos de Agrupamento. Medida de Similaridade Semântica.

10

11 Abstract The growing number of web services requires greater challenges to find a set of user needs related services. When that user is a software agent services must still have semantic descriptions for disambiguation and obtain all services related to a transparent activity. So this work proposes to define domains of semantic web services to facilitate the search. These domains should contain similar services to each other as the functionality they perform. To determine automatically those domains clustering algorithms are applied. We applied the Partitioning Around Medoids - PAM and the Agglomerative Hierarchical Clustering besides developed two measures of similarity. So were generated four grouping by combining each algorithm and dissimilarity measure, and then evaluated by silhouette and measure F. The results showed a good quality of the generated groups. Key-words: Semantic Web Service. Clustering Algorithms. Semantic Similarity Measure.

12

13 Lista de ilustrações Figura 1 Nível superior da ontologia serviço Figura 2 Um fragmento de uma ontologia sobre veículos Figura 3 Single link(dissio) Figura 4 Complete link(dissio) Figura 5 UPGMA(dissIO) Figura 6 UPGMC(dissIO) Figura 7 WPGMC(dissIO) Figura 8 WPGMA(dissIO) Figura 9 Ward(dissIO) Figura 10 PAM(dissIO) Figura 11 Single link(disssimple) Figura 12 complete link(disssimple) Figura 13 UPGMA(dissSimple) Figura 14 UPGMC(dissSimple) Figura 15 WPGMC(dissSimple) Figura 16 WPGMA(dissSimple) Figura 17 Ward(dissSimple) Figura 18 PAM(dissSimple) Figura 19 Medida F para os grupos gerados pelo PAM(dissIO) Figura 20 Medida F para os grupos gerados pelo Ward(dissIO) Figura 21 Medida F para os grupos gerados pelo PAM(dissSimple) Figura 22 Medida F para os grupos gerados pelo Ward(dissSimple)

14

15 Sumário 1 INTRODUÇÃO FUNDAMENTAÇÃO TEÓRICA Serviços Web Semânticos Algoritmos de Agrupamento Métodos Particionais Partitioning Around Medoid - PAM Agrupamento Hierárquico TRABALHOS RELACIONADOS PROPOSTA - DOMAINS TO SEMANTIC WEB SERVICES Medida Dissimilarity IO - dissio Medida Dissimilarity Simple - disssimple EXPERIMENTOS E RESULTADOS Ambiente Metodologia Experimentos Realizados Escolha dos Algoritmos Avaliação dos Grupos Resultados Escolha dos Algoritmos Avaliação dos Grupos CONCLUSÃO E TRABALHOS FUTUROS Referências

16

17 15 1 Introdução Com o crescimento da internet, a necessidade de integrar diversos sistemas torna evidente uma maior interoperabilidade entre os diversos fornecedores de serviços disponíveis. Esta interoperabilidade é garantida através da Service-Oriented Architecture(SOA)(RAINES, 2013) que permite integrar componentes descritos de forma consistente em um formato de serviço web. Assim, um serviço web é definido como um sistema de software projetado para suportar interação máquina-a-máquina interoperável sobre uma rede. Ele tem uma interface descrita em um formato processável por máquina (RAINES, 2013, tradução nossa). Ma et al. (2008) lista alguns mecanismos para encontrar serviços web como os portais de serviços, motores de busca e registros de serviços Universal, Description, Discovery and Integration 1 (UDDI). Al-Masri e Mahmoud (2008) monitoraram essas fontes de serviços web e verificaram um declínio na quantidade de serviços acessíveis através de UDDI enquanto que houve um crescimento através de portais de serviços e rastreamento web (web crawling). Em um repositório UDDI, apenas 53% dos serviços estão ativos enquanto que através de motores de busca 92% dos serviços obtidos estão ativos. No entanto, encontrar esses serviços em motores de busca é difícil. Hatzi et al. (2012) mostra que numa pesquisa por documentos Web Services Description Language(WSDL)(CHRISTENSEN et al., 2001) no Google, Yahoo e Bing apenas 12% dos resultados obtidos apresentam descrições WSDL. Isso acontece porque esses motores de busca consideram todos os termos do documento, não considerando estruturas específicas de documentos WSDL(HATZI et al., 2012). Além disso, oferecem apenas meios sintáticos para a busca de serviços dificultando a sua descoberta, pois palavras podem ser ambíguas(possuir mais de um significado) ou ainda sinônimos(várias palavras possuírem o mesmo significado) provocando a obtenção de serviços indesejados e não relevantes para o usuário ou a não obtenção de serviços relevantes. Diante desse cenário, os serviços disponíveis precisam ser descritos de maneira não ambígua com intuito de maximizar a relevância nos resultados obtidos. Algumas linguagens de descrições permitem relacionar parâmetros dos serviços a um conceito em uma ontologia elas são OWL-S(BURSTEIN et al., 2004), WSMO(BRUIJN et al., 2005) e SAWSDL(KOPECKY et al., 2007). Os serviços com essas descrições são conhecidos como Serviços Web Semânticos(SWS). Com os SWS, determinar sua funcionalidade automaticamente é mais fácil. No entanto, com o crescimento da internet existirá ainda mais serviços web similares, ou seja, que executam tarefas semelhantes. Esses serviços podem estar em diferentes ramos de atividade como indústria, comércio, governo, etc. Assim, o presente trabalho propõe definir domínios de serviços 1 UDDI é um serviço de diretório onde é permitido empresas registrar(publicar) e buscar(descobrir) serviços web. A descoberta é baseada em palavra chave e navegação sobre categorias.

18 16 Capítulo 1. Introdução para facilitar a busca. Para isso, dois tipos de algoritmos de agrupamento e duas medidas de dissimilaridade entre os serviços semânticos foram propostas(silva et al., 2015). Experimentos foram definidos com o intuito de avaliar os agrupamentos gerados e os resultados apontam que domínios podem ser automaticamente definidos para agrupar SWS. O presente trabalho está organizado como segue: O Capítulo 2 apresenta os conceitos relacionados a serviços web e serviços web semânticos e uma descrição de alguns algoritmos de agrupamento. O Capítulo 3 apresenta os trabalhos relacionados. O Capítulo 4 apresenta a proposta e como medir a similaridade entre serviços. O Capítulo 5 faz uma análise dos resultados produzidos pelos algoritmos. Finalizando, no Capítulo 6 seguem as conclusões e considerações finais.

19 17 2 Fundamentação Teórica Neste capítulo será apresentado primeiro, como serviços web são descritos e como podem ser chamados de similares. Segundo, apontar as características dos algoritmos de agrupamento que serão utilizados neste trabalho. 2.1 Serviços Web Semânticos Como definido na introdução serviços web é um sistema de software projetado para suportar interação máquina-a-máquina interoperável sobre uma rede. Ele tem uma interface descrita em um formato processável por máquina (RAINES, 2013, tradução nossa). Portanto, tais serviços podem ser escritos em diferentes linguagens de programação, estar em diferentes sistemas operacionais ou sob diversas redes em empresas diferentes, e mesmo assim comunicarse entre si de maneira automática. Um exemplo hipotético seria de uma agência de viagem. Para fechar um pacote de viagem, um sistema dessa agencia poderia comunicar-se com pelo menos três outros serviços. Primeiro, um serviço web de uma companhia aérea para reserva de passagem de avião, segundo, um serviço de uma locadora de carros para aluguel de veículo para transportar o passageiro do aeroporto para o hotel e terceiro, um serviço web do hotel que permite fazer a reserva de quarto. Todos esses devem satisfazer alguns requisitos da agência como local, assim a companhia deve ter voo da origem e para o destino desejado pelo cliente, a locadora e o hotel devem operar na cidade destino. Se existe mais de uma opção de hotel, por exemplo, deve estabelecer outros critérios como preço ou conforto para selecionar entre eles ou verificar em quais hotéis existem vagas. Para fazer tais tarefas sem intervenção humana é necessária uma interface padrão que permita a comunicação entre esses serviços, que é a Web Services Description Language(WSDL) (CHRISTENSEN et al., 2001). Essa descrição resolve o problema da interface padrão, mas não facilita a busca de serviços similares ou serviços que possuem um determinado parâmetro de entrada desejado pelo usuário ou agente de software. Por exemplo, o usuário procura um serviço que tem o parâmetro tempo, referente a condição climática, e é retornado um serviço com parâmetro tempo no sentido de tempo decorrido. Encontrar serviços similares olhando para os arquivos WSDL(Código 2.1 envolve algumas etapas. Primeira, um pré-processamento que irá remover tags e palavras comuns a vários serviços web. Segunda, identificar algumas seções significativas para determinar sua similaridade. Algumas delas são complextype, messages e porttype (palavras mais significativas estão em negrito no Código 2.1) ainda há o content que apresenta uma descrição do serviço web. Ter-

20 18 Capítulo 2. Fundamentação Teórica Código 2.1 Trecho do serviço web WeatherForecast que mostra a estrutura de tipos, mensagens e portas. <wsdl:definitions targetnamespace="http://www.webservicex.net">... <s:complextype> <s:sequence> <s:element minoccurs="0" maxoccurs="1" name="zipcode" type="s:string"/> </s:sequence> ComplexType </s:complextype>... <wsdl:message name="getweatherbyzipcodehttpgetin"> <wsdl:part name="zipcode" type="s:string"/> message </wsdl:message>... <wsdl:porttype name="weatherforecasthttpget"> <wsdl:operation name="getweatherbyzipcode"> <wsdl:input message="tns:getweatherbyzipcodehttpgetin"/> <wsdl:output message="tns:getweatherbyzipcodehttpgetout"/> </wsdl:operation> </wsdl:porttype> porttype ceira, aplicar uma medida de similaridade que relaciona dois serviços. Esta medida pode não ser tão efetiva, pois serviços descritos em WSDL são avaliados de maneira sintática estando sujeito a sinônimos e palavras ambíguas. Diferente da busca em documentos em que sinônimos geralmente estão presentes no mesmo documento, isso não acontece com documentos WSDL que são documentos pequenos. Para facilitar a descoberta de serviços e determinar o quanto os serviços web são similares entre si, no caso de desejar substituir um serviço por outro, deve ter uma forma não ambígua de descrevê-los. Então é necessária a incorporação de semântica para a representação de requisitos e capacidades dos serviços web. Assim surge os serviços web semânticos(burstein et al., 2004). Afim de incorporar semântica aos serviços algumas linguagens de descrição semântica são comumente referenciadas na literatura. São elas OWL-S (BURSTEIN et al., 2004), WSMO(BRUIJN et al., 2005) e o SAWSDL(KOPECKY et al., 2007). Neste trabalho, é utilizada a OWL-S uma ontologia de serviços baseada sobre a Ontology Web Language (OWL)(MCGUINNESS; HARMELEN, 2004). OWL se destina a ser usada quando as informações contidas em documentos necessitam ser processadas por aplicações, em oposição a situações onde o conteúdo somente necessita ser apresentado para humanos. OWL pode ser utilizada para explicitamente representar o significado dos termos em vocabulários e relacionamento entre esses termos. Esta representação dos termos e seus interrelacionamentos é chamada de ontologia. OWL tem mais facilidades para expressar termos e semântica que XML, RDF e RDF-S, assim OWL vai além dessas linguagens em sua capacidade de representar conteúdo interpretável por máquina(mcguinness; HARMELEN, 2004, tradução nossa).

21 2.1. Serviços Web Semânticos 19 A Figura 1 mostra as classes 1, do nível mais alto da ontologia serviço, representadas pelas elipses e suas propriedades representadas pelas setas. Os nomes dessas propriedades são presents, supports e describedby que relaciona a classe Service às classes ServiceProfile, ServiceGrounding e ServiceModel. Cada uma dessas classes descrevem o serviço buscando responder as perguntas o que faz, como acessá-lo e como funciona. Figura 1 Nível superior da ontologia serviço. Fonte: Burstein et al. (2004, tradução nossa) 1. A classe ServiceProfile(Código 2.2) diz a um agente de busca o que o serviço faz. Isso inclui uma descrição do que é realizado pelo serviço, limitações de aplicabilidade e qualidade do serviço e requisitos que o solicitante deve satisfazer para utilizá-lo(burstein et al., 2004). Onde apresenta os parâmetro dos serviços. Esses parâmetros são conhecidos como IOPE(input, output, preconditions e effects/result). Neste trabalho serão utilizados apenas o input e output. 2. A classe ServiceModel diz como um cliente deve utilizar o serviço, detalhando o conteúdo semântico dos pedidos, as condições em que os resultados particulares irão ocorrer, e se necessário, o passo a passo dos processos que levam a esses resultados(burstein et al., 2004). No Código 2.3, é mostrado uma subclasse da servicemodel a classe service- Process. Neste é possível notar a qual classe na ontologia cada parâmetro é mapeado. Por exemplo o _PERSON, está relacionado à classe books.owl#person na ontologia books. 1 Classes definem um grupo de indivíduos que estão juntos por compartilharem características comuns entre si. A raiz da ontologia é a classe Thing(algo).

22 20 Capítulo 2. Fundamentação Teórica Código 2.2 Trecho do OWL-S: Service Profile <profile:profile rdf:id="creditaccountbookperson PROFILE"> <service:ispresentedby rdf:resource="#creditaccountbookperson SERVICE"/> <profile:servicename xml:lang="en"> Book Shopping </profile:servicename> <profile:textdescription xml:lang="en"> This service checks validity of a credit account of an authorised person and adds the selected book in his shopping cart. </profile:textdescription> <profile:hasinput rdf:resource="#_person"/> <profile:hasinput rdf:resource="#_book"/> <profile:hasinput rdf:resource="#_creditaccount"/> <profile:hasoutput rdf:resource="#_price"/> <profile:hasresult rdf:resource="#bookordered"/> IOPE <profile:hasprecondition rdf:resource="#authorization"/> <profile:has_process rdf:resource="creditaccountbookperson PROCESS" /> </profile:profile> Código 2.3 Trecho do OWL-S: Service Process <process:input rdf:id="_person"> <process:parametertype rdf:datatype="http://www.w3.org/2001/xmlschema#anyuri"> </process:parametertype> <rdfs:label></rdfs:label> </process:input> Parâmetro _PERSON Classe Person <process:input rdf:id="_book"> <process:parametertype rdf:datatype="http://www.w3.org/2001/xmlschema#anyuri"> </process:parametertype> <rdfs:label></rdfs:label> </process:input> 3. Por último a classe ServiceGrounding que especifica os detalhes de como acessar o serviço, mapeando as representações abstratas dos parâmetros para a especificação concreta(burstein et al., 2004). Como já existe uma grande quantidade de serviço web descritos em WSDL, serviços OWL-S tomam tais descrições como base. Neste trabalho não são utilizados as informações contidas nessa classe. 2.2 Algoritmos de Agrupamento Algoritmos de agrupamento permitem que grandes quantidades de dados sejam agrupados através de uma medida de similaridade onde dados de alta similaridade entre si ficam dentro de um mesmo grupo mas são dissimilares a dados de outros grupos(han; KAMBER, 2006).

23 2.2. Algoritmos de Agrupamento 21 Existem vários algoritmos de agrupamento na literatura e é difícil fazer uma classificação nítida dos métodos de agrupamento, pois essas categorias podem se sobrepor(han; KAMBER, 2006). Ainda assim, é possível apresentar uma relativamente organizada categorização dos métodos de agrupamento. Eles podem ser: métodos particionais é definido um número k de clusters que devem ter pelo menos um objeto e um objeto pode estar em apenas um grupo. métodos hierárquicos, que se dividem entre aglomerativos e divisivos que será apresentado na subseção métodos baseados em densidade se baseiam na noção de densidade, um grupo continua crescendo agregando objetos "vizinhos"até um determinado limiar for atingido, isto é, para cada objeto dentro de um cluster, sua vizinhança tem um determinado raio onde deve ter uma quantidade mínima de objetos. métodos baseados em grid quantifica o espaço do objeto em um número finito de células que forma uma estrutura em grid. Todas as operações de agrupamento são realizadas sobre essas estrutura. métodos baseados em modelos supõe um modelo para cada um dos grupos e encontra o melhor ajuste dos dados ao modelo apresentado. Esses métodos podem encontrar grupos construindo uma função de densidade que reflete a distribuição espacial dos objetos. Outra categorização pode ser vista no survey (XU; WUNSCH, 2005), tal como fuzzy que permite que um objeto pode pertencer a todos os grupos com um certo grau de relacionamento. Entretanto, nem todos os algoritmos podem ser utilizados, seja por que alguns funcionam apenas para dados numéricos (k-means) ou porque grupos formados necessitam possuir formas arbitrárias como reconhecimento de imagem. Nas duas seções seguintes serão descritos os métodos de agrupamento particionais e hierárquico, os algoritmos que serão utilizados nesse trabalho Métodos Particionais Os mais bem conhecidos e comumente utilizados métodos de agrupamento são k-means, k-medoids e suas variações(han; KAMBER, 2006; XU; WUNSCH, 2005). Tanto k-means quanto o k-medoids tem um parâmetro de entrada k e particiona um conjunto de N objetos em k clusters onde k N. No k-means cada grupo é representado por um centróide, isto é, um valor médio entre os objetos do grupo. Por exemplo, seja os objetos c 1 (2, 3) e c 2 (6, 7) de um cluster c, o centróide desse grupo será (4,5). Assim novos objetos

24 22 Capítulo 2. Fundamentação Teórica para entrar nesse grupo devem estar mais próximo desse centróide, do que de todos os outros centróides dos outros grupos. A cada objeto que entra, o centróide é atualizado. No k-medoid um dos objetos c 1 (2, 3) ou c 2 (6, 7) é escolhido para ser um medóide, um objeto que representa o grupo, os demais objetos ficam nos grupos onde tem maior similaridade com seu medóide. Os medóides podem ser trocados objetivando diminuir uma função custo total. Um algoritmo baseado em medóide é o Patitioning Around Medoid - PAM(KAUFMAN; ROUSSEUW, 1990). Quanto a complexidade de tempo, o k-means é O(Nkd), onde d é a dimensão do dado, e o PAM é O(k(N k) 2 ). Apesar da maior complexidade do PAM, este é menos sensível a outlier pois usa dados reais para representar o grupo e lida tanto com dados numéricos como não numéricos, pois não precisa calcular uma média(útil para esse trabalho devido os serviços web não serem representados por dados numéricos). O PAM que foi utilizado nesse trabalho para fazer o agrupamento dos serviços Partitioning Around Medoid - PAM O PAM baseia-se na busca de objetos representativos do conjunto de dados. Ele busca k objetos representativos entre todos os objetos a se agrupar. No algoritmo PAM os objetos representativos(objetos selecionados) são os assim chamados medóides de grupos. Depois de encontrar um conjunto de k objetos representativos, os k grupos são construídos pela atribuição de cada objeto do conjunto de dados ao objeto representativo mais próximo(kaufman; ROUSSEUW, 1990). O PAM possui duas fases BUILD e SWAP. Nessas fases são mantidos dois vetores, vetor D que armazena a distância de cada objeto j ao seu mais similar medóide, e E que armazena a distância de cada objeto j ao seu segundo mais similar medóide. Essas fases são descritas a seguir. 1. BUILD escolhe os k medóides iniciais(um agrupamento inicial). Eles podem ser escolhidos aleatoriamente ou outra forma definida pelo usuário. Nesse trabalho é utilizada a forma descrita por Kaufman e Rousseuw (1990). Alguns passos do Código 2.4 são descritos a seguir: Linha 2-3: O primeiro objeto selecionado m 1 possui a menor soma de dissimilaridades para com todos os outros objetos. Linha 4: Repete o laço k 1 vezes adicionando os medóides restantes. Linha 5-15: Busca um novo medóide entre todos os objetos não selecionados. Para todos os objetos i não selecionados são calculados o custo. O objeto que adicionar o menor custo, caso seja selecionado, entre todos os outros possíveis medóides será um candidato. Linha 17: O candidato definido na etapa anterior é marcado como medóide.

25 2.2. Algoritmos de Agrupamento 23 Código 2.4 Algoritmo fase BUILD 1 procedimento phasebuild() 2 m 1 <- objeto cuja a soma de dissimilaridade com todos os outros menor possivel. 3 addmedoid(m 1 ) 4 repita 5 para (objeto i não selecionado de C) faca 6 custo = 0 7 custoatual = 8 para (objeto j não selecionado de C) faca 9 custo+ = max(d j d(i, j), 0) 10 fim para 11 se (custo > custoatual) entao 12 custoatual = custo 13 candidatom edoid = i 14 fim se 15 fim para 16 addm edoid(candidatom edoid) 17 ate kmedoids 18 fim procedimento Código 2.5 Algoritmo fase BUILD 1 procedimento phaseswap() 2 custo = 0 3 custoatual = + 4 para (objeto i selecionado de C) faca 5 para (objeto h não selecionado de C) faca 6 para (objeto j não selecionado de C, j h) faca 7 se (d(j, i) > D j ) entao 8 se (d(j, h) < D j ) entao 9 custo+ = d(j, h) D j 10 fim se 11 senao 12 se (d(j, h) < E j ) entao 13 custo+ = d(j, h) d(j, i) 14 senao 15 custo+ = E j D j 16 fim se 17 fim se 18 fim para 19 se (custoatual > custo) entao 20 custoatual = custo 21 medoid = i 22 candidatoh = h 23 fim se 24 fim para 25 fim para 26 se (custoatual < 0) entao 27 troca(medoid, candidatoh) 28 reinicia o laço com o novo medoid selecionado objeto i. 29 fim se 30 fim procedimento

26 24 Capítulo 2. Fundamentação Teórica 2. SWAP(Código 2.5) tenta melhorar o conjunto dos objetos representativos. Para isso é considerado todos os pares (i, h) onde i é um objeto representativo e h não. Então é determinado o efeito de trocar o objeto i por h como objeto representativo. Diferentemente do BUILD, verifica o custo de trocar um dos medóides por outro. Assim, são avaliados quatro casos possíveis para determinar o custo da substituição de i(um objeto selecionado) por h. Esses casos são descritos abaixo: a) Sendo d(j, i) > D j e d(j, h) D j, j é mais distante de ambos, i e h, que de qualquer outro objeto representativo então j contribui com nenhum custo na substituição(linha 7). Objeto j não mudaria de medóide. b) Sendo d(j, i) > D j e d(j, h) < D j, j é mais distante do objeto i do que pelo menos um dos outros objetos representativos e mais próximo de h que qualquer objeto representativo(linha 9). O medóide h passaria a ser seu objeto representativo. c) Sendo d(j, i) = D j e d(j, h) < E j, j é mais próximo de h que do segundo objeto representativo mais próximo(linha 13). O medóide h passaria a ser seu objeto representativo. d) Sendo d(j, i) = D j e d(j, h) E j, j é pelo menos tão distante de h quanto do segundo mais próximo objeto representativo(linha 15). O segundo mais similar medóide passaria a ser o mais similar objeto representativo para j. Assim, é calculada a soma dos custos de cada j para cada par (i, h) de possíveis substituições. O par (i, h) que tiver menor custo e este for negativo, será feita a substituição de i por h, recomeçando o algoritmo. Se o custo não for negativo, o algoritmo para(linhas 26-29). Determinar a quantidade de grupos é outro desafio. Agrupamento são também chamados em aprendizagem de máquina como aprendizagem não supervisionada, ou seja, não se tem nenhum conhecimento dos dados a priori. Desta forma, não é possível se quer determinar a quantidade de grupos naturais uma coleção de dados pode ter. ROUSSEEUW (1987) propôs a largura da silhueta cujo valor varia de -1, mau agrupado, e 1, bem agrupado. Assim, o PAM pode ser executado algumas vezes com diferentes valores para k e tem a silhueta do agrupamento avaliada para cada uma delas. O valor de k que alcançar a silhueta média mais próxima de 1 é o que tem o melhor agrupamento Agrupamento Hierárquico Os algoritmos hierárquicos podem ser divisivos(top-down), ou seja, inicialmente todos os objetos estão em um grupo que vai se dividindo formando outros até cada grupo conter apenas um objeto, ou aglomerativos(bottom-up) começa com cada grupo contendo apenas um objeto e vão sendo unidos pares de grupos até formar apenas um. Esses algoritmos mantém

27 2.2. Algoritmos de Agrupamento 25 Código 2.6 Algoritmo Hierárquico Aglomerativo 1 Entrada: 2 k: quantidade de grupos para formar 3 D: um conjunto de dados contendo N objetos 4 Saida: k grupos 5 Inicie com M grupos(cada grupo com um objeto). Calcule a matriz de dissimilaridade para os M grupos. 6 repita 7 busque a distância mínima D(C i, C j ) = min 1 m,l M m l D(C m, C l ) onde D(*, *) é a função distância e combina os grupos C i e C j para formar um novo grupo 8 Atualize a matriz de proximidade para calcular as distâncias entre o novo grupo e os outros grupos. 9 ate formar k grupo uma estrutura hierárquica dos grupos formados. Assim é possível avaliar a estrutura e também poder fazer cortes em qualquer dos níveis da hierarquia. Esses cortes podem ser feitos de duas formas diferentes, fornecendo um k com a quantidade de grupos desejados, ou h, a altura num dendrograma 2, que considera a dissimilaridade entre os objetos e grupos. Neste trabalho foi determinado um limiar especificando uma quantidade predeterminada de grupos que se deseja formar. Assim o algoritmo começa com M grupos, onde cada grupo é composto por um objeto e para quando atinge a quantidade k de grupos especificados na entrada(código 2.6). Em relação às definições para distância(função distância D(*, *) Código 2.6) entre dois grupos existem diversos métodos de agrupamento aglomerativo. Xu e Wunsch (2005) o single link e complete link estão entre os mais populares. Everitt et al. (2011) mostram essas e outras definições: single link - a distância entre dois grupos é determinado pelos dois objetos mais próximos em diferentes grupos; complete link - a distância entre dois grupos é determinado pelos dois objetos mais distantes em diferentes grupos; média de grupo(upgma unweighted pair-group method using the average) - é definido como a média da distância de todos os possíveis pares de objetos que são compostos por um objeto de cada grupo; centróide(upgmc unweighted pair-group method using the centroid)- distância euclidiana ao quadrado entre vetores médio(centróide); 2 Dendrograma - uma forma de representar agrupamento hierárquico. É uma estrutura semelhante a árvore, onde a altura indica a dissimilaridade entre objetos e grupos

28 26 Capítulo 2. Fundamentação Teórica mediana (WPGMC weigthed pair-group method using the centroid) - É similar ao método centróide, exceto que os centróides dos grupos constituintes são ponderados igualmente para produzir o novo centróide do grupo mesclado; conexão média ponderada (WPGMA weigthed pair-group method using the average) - É similar a média de grupo, mas a distância ponderada entre grupos de acordo pelo inverso do número de objetos em cada classe; ward - A fusão de dois grupos baseia-se no tamanho do critério erro da soma dos quadrados(soma das distâncias euclidianas ao quadrado). O objetivo em cada iteração é minimizar o aumento na soma do erro ao quadrado total dentro do grupo; Cada um dessas formas de medir distância entre os grupos tem impactos na qualidade do agrupamento e alguns problemas já conhecidos na literatura. Everitt et al. (2011, pág. 79) apresentam uma tabela com algumas observações sobre esses métodos. Por exemplo, o single link tende a formar grupos desbalanceados especialmente em grandes conjuntos de dados ou UPGMC e WPGMC são sujeitos a reversão.

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

Sistemas Operacionais

Sistemas Operacionais 7 Sistemas Operacionais 7.1 Fundamentos da ciência da computação Cengage Learning Objetivos 7.2 Compreender o papel do sistema operacional. Compreender o processo de inicialização para carregar o sistema

Leia mais

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider Ferramenta: Spider-CL Manual do Usuário Versão da Ferramenta: 1.1 www.ufpa.br/spider Histórico de Revisões Data Versão Descrição Autor 14/07/2009 1.0 15/07/2009 1.1 16/07/2009 1.2 20/05/2010 1.3 Preenchimento

Leia mais

Agrupamento de dados

Agrupamento de dados Organização e Recuperação de Informação: Agrupamento de dados Marcelo K. A. Faculdade de Computação - UFU Agrupamento de dados / 7 Overview Agrupamento: introdução Agrupamento em ORI 3 K-médias 4 Avaliação

Leia mais

UNIVERSIDADE. Sistemas Distribuídos

UNIVERSIDADE. Sistemas Distribuídos UNIVERSIDADE Sistemas Distribuídos Ciência da Computação Prof. Jesus José de Oliveira Neto Web Services Web Services Existem diferentes tipos de comunicação em um sistema distribuído: Sockets Invocação

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

Software de gerenciamento do sistema Intel. Guia do usuário do Pacote de gerenciamento do servidor modular Intel

Software de gerenciamento do sistema Intel. Guia do usuário do Pacote de gerenciamento do servidor modular Intel Software de gerenciamento do sistema Intel do servidor modular Intel Declarações de Caráter Legal AS INFORMAÇÕES CONTIDAS NESTE DOCUMENTO SÃO RELACIONADAS AOS PRODUTOS INTEL, PARA FINS DE SUPORTE ÀS PLACAS

Leia mais

3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica

3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica 3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica Este trabalho tem o objetivo de integrar o controle de acesso no projeto de aplicações na web semântica. Uma arquitetura de software

Leia mais

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

Manual da Ferramenta Metadata Editor

Manual da Ferramenta Metadata Editor 4 de março de 2010 Sumário 1 Introdução 3 2 Objetivos 3 3 Visão Geral 3 3.1 Instalação............................. 3 3.2 Legenda.............................. 4 3.3 Configuração Inicial........................

Leia mais

ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS. Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms.

ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS. Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms. ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms. Mauricio Duarte 2 Centro Universitário Euripides de Marilia UNIVEM FATEC Faculdade de

Leia mais

Sincronização do Catálogo de Endereços no MDaemon 6.x com o uso do ComAgent, LDAP, MAPI e WAB

Sincronização do Catálogo de Endereços no MDaemon 6.x com o uso do ComAgent, LDAP, MAPI e WAB Sincronização do Catálogo de Endereços no MDaemon 6.x com o uso do ComAgent, LDAP, MAPI e WAB Alt-N Technologies, Ltd 1179 Corporate Drive West, #103 Arlington, TX 76006 Tel: (817) 652-0204 2002 Alt-N

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 Rational Quality Manager Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 1 Informações Gerais Informações Gerais sobre o RQM http://www-01.ibm.com/software/awdtools/rqm/ Link para o RQM https://rqmtreina.mvrec.local:9443/jazz/web/console

Leia mais

SOA Introdução. SOA Visão Departamental das Organizações

SOA Introdução. SOA Visão Departamental das Organizações 1 Introdução A Organização é a forma pela qual nós coordenamos nossos recursos de todos os tipos para realizar o trabalho que nos propusemos a fazer. A estrutura de nossas organizações manteve-se basicamente

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

O USO DA FERRAMENTA SOLVER DO EXCEL NA RESOLUÇÃO DE PROBLEMAS DE PROGRAMAÇÃO LINEAR

O USO DA FERRAMENTA SOLVER DO EXCEL NA RESOLUÇÃO DE PROBLEMAS DE PROGRAMAÇÃO LINEAR O USO DA FERRAMENTA SOLVER DO EXCEL NA RESOLUÇÃO DE PROBLEMAS DE PROGRAMAÇÃO LINEAR João Batista de Jesus FATEC-JAHU Célio Favoni 2 FATEC-JAHU Resumo Este trabalho expõe de maneira sintetizada as funcionalidades

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

Aranda SQL COMPARE. [Manual de Uso] Todos os direitos reservados Aranda Software www.arandasoft.com [1]

Aranda SQL COMPARE. [Manual de Uso] Todos os direitos reservados Aranda Software www.arandasoft.com [1] [1] Aranda SQL COMPARE Versão 1.0 Aranda Software Corporation 2002-2007. Todos os direitos reservados. Qualquer documentação técnica fornecida pela Aranda software Corporation é um produto registrado da

Leia mais

Professor: Macêdo Firmino Disciplina: Sistemas Operacionais de Rede

Professor: Macêdo Firmino Disciplina: Sistemas Operacionais de Rede Professor: Macêdo Firmino Disciplina: Sistemas Operacionais de Rede O sistema de nome de domínio (DNS) é um sistema que nomeia computadores e serviços de rede e é organizado em uma hierarquia de domínios.

Leia mais

4 Aplicativo para Análise de Agrupamentos

4 Aplicativo para Análise de Agrupamentos 65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido

Leia mais

Recuperação de Informação em Bases de Texto. Aula 10

Recuperação de Informação em Bases de Texto. Aula 10 Aula 10 1 Agrupamento/ clustering de documentos: Agrupar os documentos em classes/grupos, de acordo com a sua semelhança Aprendizagem não supervisionada Sem conjunto de treino/exemplos 2 3 Agrupamento/

Leia mais

CA Nimsoft Monitor. Guia do Probe Ping do Internet Control Message Protocol. icmp série 1.1

CA Nimsoft Monitor. Guia do Probe Ping do Internet Control Message Protocol. icmp série 1.1 CA Nimsoft Monitor Guia do Probe Ping do Internet Control Message Protocol icmp série 1.1 Aviso de copyright do CA Nimsoft Monitor Este sistema de ajuda online (o Sistema ) destina-se somente para fins

Leia mais

Requisitos do Sistema

Requisitos do Sistema PJ8D - 017 ProJuris 8 Desktop Requisitos do Sistema PJ8D - 017 P á g i n a 1 Sumario Sumario... 1 Capítulo I - Introdução... 2 1.1 - Objetivo... 2 1.2 - Quem deve ler esse documento... 2 Capítulo II -

Leia mais

Um estudo sobre o uso de agentes de internet em buscas (Junho 2010)

Um estudo sobre o uso de agentes de internet em buscas (Junho 2010) IA009 INTRODUÇÃO À TEORIA DE AGENTES 1 Um estudo sobre o uso de agentes de internet em buscas (Junho 2010) Alexandre Fatayer Canova, RA 107214, UNICAMP Agentes de internet são parte integrante da web na

Leia mais

Frontur Consolidação Portal / Manual versão 2.0

Frontur Consolidação Portal / Manual versão 2.0 Frontur Consolidação Portal / Manual versão 2.0 Manual Avançado Portal Agências Sumário 1 Portal Frontur Consolidação... 3 2 Reconhecendo o Portal... 03/04/2014 3 3 Navegando e utilizando o Portal... 5

Leia mais

Anexo V - Planilha de Apuração Aquisição de Solução de Redes Sociais

Anexo V - Planilha de Apuração Aquisição de Solução de Redes Sociais Anexo V - Planilha de Apuração Aquisição de Solução de Redes Sociais Será utilizado o seguinte critério: Atende / Não atende (Atende em parte será considerado Não atende) Item Itens a serem avaliados conforme

Leia mais

VPAT (Voluntary Product Accessibility Template, Modelo de Acessibilidade de Produto) do eportfolio da Desire2Learn Maio de 2013 Conteúdo

VPAT (Voluntary Product Accessibility Template, Modelo de Acessibilidade de Produto) do eportfolio da Desire2Learn Maio de 2013 Conteúdo VPAT (Voluntary Product Accessibility Template, Modelo de Acessibilidade de Produto) do eportfolio da Desire2Learn Maio de 2013 Conteúdo Introdução Recursos de acessibilidade principais Navegação usando

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar.

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar. APRESENTAÇÃO DO PRODUTO Mais que um software, o método mais eficaz para conciliar. Com Conciliac é possível conciliar automaticamente qualquer tipo de transação; Bancos, Cartões de Crédito e Débito, Contas

Leia mais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Aula 2 Computação em Nuvem Desafios e Oportunidades A Computação em Nuvem

Leia mais

3 Metodologia para Segmentação do Mercado Bancário

3 Metodologia para Segmentação do Mercado Bancário 3 Metodologia para Segmentação do Mercado Bancário Este capítulo descreve a metodologia proposta nesta dissertação para a segmentação do mercado bancário a partir da abordagem post-hoc, servindo-se de

Leia mais

Balanceamento de carga: Conceitos básicos

Balanceamento de carga: Conceitos básicos Balanceamento de carga: Conceitos básicos Introdução A tecnologia de balanceamento de carga está viva e está bem; de fato, ela é a base sobre a qual operam os application delivery controller (ADCs). A

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

Estruturas de Dados Árvores

Estruturas de Dados Árvores Estruturas de Dados Árvores Prof. Eduardo Alchieri Árvores (introdução) Importância de estruturas unidimensionais ou lineares (vetores e listas) é inegável Porém, estas estruturas não são adequadas para

Leia mais

Google Drive. Passos. Configurando o Google Drive

Google Drive. Passos. Configurando o Google Drive Google Drive um sistema de armazenagem de arquivos ligado à sua conta Google e acessível via Internet, desta forma você pode acessar seus arquivos a partir de qualquer dispositivo que tenha acesso à Internet.

Leia mais

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP) Hardware (Nível 0) Organização O AS/400 isola os usuários das características do hardware através de uma arquitetura de camadas. Vários modelos da família AS/400 de computadores de médio porte estão disponíveis,

Leia mais

5 Mecanismo de seleção de componentes

5 Mecanismo de seleção de componentes Mecanismo de seleção de componentes 50 5 Mecanismo de seleção de componentes O Kaluana Original, apresentado em detalhes no capítulo 3 deste trabalho, é um middleware que facilita a construção de aplicações

Leia mais

NEVA: Programa para aumento de performance de sites web usando o algoritmo de esteganografia

NEVA: Programa para aumento de performance de sites web usando o algoritmo de esteganografia NEVA: Programa para aumento de performance de sites web usando o algoritmo de esteganografia MÁRCIO PANTOJA LOBATO 1, PEDRO VICTOR PONTES PINHEIRO 1, ROBERTO YURI DA SILVA FRANCO 1, ALESSANDRA NATASHA

Leia mais

Ave: Manual do usuário

Ave: Manual do usuário As iniciais no canto superior esquerdo indicam a atual lista de espécies em uso. Clique neste campo para abrir uma grade com todas Ave: Manual do usuário Introdução A Janela Inicial O botão Listas Sobre

Leia mais

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064 Sistemas Distribuídos Professora: Ana Paula Couto DCC 064 Sistemas Distribuídos Basedos na Web Capítulo 12 Agenda Arquitetura Processos Comunicação Nomeação Sincronização Consistência e Replicação Introdução

Leia mais

PROGRAMAÇÃO SERVIDOR WEBSERVICES EM SISTEMAS WEB. Prof. Dr. Daniel Caetano 2012-1

PROGRAMAÇÃO SERVIDOR WEBSERVICES EM SISTEMAS WEB. Prof. Dr. Daniel Caetano 2012-1 PROGRAMAÇÃO SERVIDOR EM SISTEMAS WEB WEBSERVICES Prof. Dr. Daniel Caetano 2012-1 Objetivos Compreender o que é um WebService e sua utilidade Compreender a lógica de funcionamento de um WebService Capacitar

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos Compreensão Agrupa documentos relacionados

Leia mais

MANUAL RASTREAMENTO 2013

MANUAL RASTREAMENTO 2013 MANUAL RASTREAMENTO 2013 Visão Geral O menu geral é o principal módulo do sistema. Através do visão geral é possível acessar as seguintes rotinas do sistema: Sumário, localização, trajetos, últimos registros.

Leia mais

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido Arquitetura Roteiro Arquitetura Tipos de Arquitetura Centralizado Descentralizado Hibrido Questionário 2 Arquitetura Figura 1: Planta baixa de uma casa 3 Arquitetura Engenharia de Software A arquitetura

Leia mais

V O C Ê N O C O N T R O L E.

V O C Ê N O C O N T R O L E. VOCÊ NO CONTROLE. VOCÊ NO CONTROLE. O que é o Frota Fácil? A Iveco sempre coloca o desejo de seus clientes à frente quando oferece ao mercado novas soluções em transportes. Pensando nisso, foi desenvolvido

Leia mais

SUMÁRIO. Introdução... 3

SUMÁRIO. Introdução... 3 SUMÁRIO Introdução..................................... 3 1 Consultas por Similaridade e Espaços métricos............. 5 1.1 Consultas por abrangência e consultas aos k-vizinhos mais próximos... 5 1.2

Leia mais

Consumindo um Web Service através de uma Aplicação Comercial em Android. Alex Malmann Becker www.alex.porthal.com.br alex@porthal.com.

Consumindo um Web Service através de uma Aplicação Comercial em Android. Alex Malmann Becker www.alex.porthal.com.br alex@porthal.com. Consumindo um Web Service através de uma Aplicação Comercial em Android Alex Malmann Becker www.alex.porthal.com.br alex@porthal.com.br 08/2014 Agenda Introdução Conceitos Web Service Por que utilizar

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Conceitos e Aplicações Sobre Pastas Públicas com o MDaemon 6.0

Conceitos e Aplicações Sobre Pastas Públicas com o MDaemon 6.0 Conceitos e Aplicações Sobre Pastas Públicas com o MDaemon 6.0 Alt-N Technologies, Ltd 1179 Corporate Drive West, #103 Arlington, TX 76006 Tel: (817) 652-0204 2002 Alt-N Technologies. Todos os Direitos

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Infra estrutura da Tecnologia da Informação

Infra estrutura da Tecnologia da Informação Infra estrutura da Tecnologia da Informação Capítulo 3 Adaptado do material de apoio ao Livro Sistemas de Informação Gerenciais, 7ª ed., de K. Laudon e J. Laudon, Prentice Hall, 2005 CEA460 Gestão da Informação

Leia mais

4.1. Introdução. 4.2. Layout do DNS

4.1. Introdução. 4.2. Layout do DNS MIT 18.996 Tópico da Teoria da Ciência da Computação: Problemas de Pesquisa na Internet Segundo Trimestre 2002 Aula 4 27de fevereiro de 2002 Palestrantes: T. Leighton, D. Shaw, R. Sudaran Redatores: K.

Leia mais

Histórico da Revisão. Versão Descrição Autor. 1.0 Versão Inicial

Histórico da Revisão. Versão Descrição Autor. 1.0 Versão Inicial 1 of 14 27/01/2014 17:33 Sistema de Paginação de Esportes Universitários Documento de Arquitetura de Software Versão 1.0 Histórico da Revisão Data 30 de novembro de 1999 Versão Descrição Autor 1.0 Versão

Leia mais

Manual de Utilização Chat Intercâmbio

Manual de Utilização Chat Intercâmbio Manual de Utilização Chat Intercâmbio 1 INDICE 1 Chat Intercâmbio... 6 1.1 Glossário de Termos Utilizados.... 6 1.2 Definições de uma Sala de Chat... 7 1.3 Como Acessar o Chat Intercâmbio... 8 1.4 Pré-requisitos

Leia mais

Introdução à Programação de Computadores

Introdução à Programação de Computadores 1. Objetivos Introdução à Programação de Computadores Nesta seção, vamos discutir os componentes básicos de um computador, tanto em relação a hardware como a software. Também veremos uma pequena introdução

Leia mais

Faculdades Santa Cruz - Inove. Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira.

Faculdades Santa Cruz - Inove. Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira. Período letivo: 4 Semestre. Quinzena: 5ª. Faculdades Santa Cruz - Inove Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira. Unidade Curricular Sistemas Distribuídos Processos

Leia mais

J820. Integração Contínua. com CVS, CruiseControl, Cruise Control. argonavis.com.br. AntHill Gump e Helder da Rocha (helder@acm.

J820. Integração Contínua. com CVS, CruiseControl, Cruise Control. argonavis.com.br. AntHill Gump e Helder da Rocha (helder@acm. J820 Integração Contínua com CVS, CruiseControl, Cruise Control AntHill Gump e Helder da Rocha (helder@acm.org) Integração contínua Um dos requisitos para implementar a integração contínua é ter um sistema

Leia mais

Referência de cores Fiery

Referência de cores Fiery 2014 Electronics For Imaging. As informações nesta publicação estão cobertas pelos termos dos Avisos de caráter legal deste produto. 11 de junho de 2014 Conteúdo 3 Conteúdo Introdução à referência de cores

Leia mais

Instalação do IBM SPSS Modeler Server Adapter

Instalação do IBM SPSS Modeler Server Adapter Instalação do IBM SPSS Modeler Server Adapter Índice Instalação do IBM SPSS Modeler Server Adapter............... 1 Sobre a Instalação do IBM SPSS Modeler Server Adapter................ 1 Requisitos de

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Semântica para Sharepoint. Busca semântica utilizando ontologias

Semântica para Sharepoint. Busca semântica utilizando ontologias Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...

Leia mais

Metas de um Sistema Distribuído

Metas de um Sistema Distribuído Metas de um Sistema Distribuído Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia do

Leia mais

Web Services. (Introdução)

Web Services. (Introdução) Web Services (Introdução) Agenda Introdução SOA (Service Oriented Architecture) Web Services Arquitetura XML SOAP WSDL UDDI Conclusão Introdução Comunicação distribuída Estratégias que permitem a comunicação

Leia mais

Instalando o Debian em modo texto

Instalando o Debian em modo texto Instalando o Debian em modo texto Por ser composto por um número absurdamente grande de pacotes, baixar os CDs de instalação do Debian é uma tarefa ingrata. Você pode ver uma lista dos mirrors disponíveis

Leia mais

Infraestrutura de Hardware. Memória Virtual

Infraestrutura de Hardware. Memória Virtual Infraestrutura de Hardware Memória Virtual Perguntas que Devem ser Respondidas ao Final do Curso Como um programa escrito em uma linguagem de alto nível é entendido e executado pelo HW? Qual é a interface

Leia mais

Arquiteturas, Padrões e Serviços para Geoprocessamento. Lúbia Vinhas 13/05/2008

Arquiteturas, Padrões e Serviços para Geoprocessamento. Lúbia Vinhas 13/05/2008 Arquiteturas, Padrões e Serviços para Geoprocessamento Lúbia Vinhas 13/05/2008 Desejo saber estatísticas sobre áreas queimadas. Desejo fazer análises por localização, por classes de uso ou ainda por seleção

Leia mais

Organização Básica de Computadores. Memória. Memória. Memória. Memória. Memória Parte I. Computador eletrônico digital. Sistema composto por

Organização Básica de Computadores. Memória. Memória. Memória. Memória. Memória Parte I. Computador eletrônico digital. Sistema composto por Ciência da Computação Arq. e Org. de Computadores Parte I Organização Básica de Computadores Computador eletrônico digital Sistema composto por processador memória dispositivos de entrada e saída interligados.

Leia mais

Solução de acessibilidade. Guia do administrador

Solução de acessibilidade. Guia do administrador Solução de acessibilidade Guia do administrador Julho de 2014 www.lexmark.com Conteúdo 2 Conteúdo Visão geral...3 Configurando o aplicativo...4 Configurando o acesso do usuário...4 Desativando funções

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Sistemas Distribuídos

Sistemas Distribuídos Sistemas Distribuídos LICENCIATURA EM COMPUTAÇÃO Prof. Adriano Avelar Site: www.adrianoavelar.com Email: eam.avelar@gmail.com Mecanismos de Comunicação Protocolos de Aplicação Mecanismos de comunicação

Leia mais

TSE TRIBUNAL SUPEIROR ELEITORAL Secretaria de Informática Coordenadoria de Sistemas Administrativos Setor de Apoio ao Usuário

TSE TRIBUNAL SUPEIROR ELEITORAL Secretaria de Informática Coordenadoria de Sistemas Administrativos Setor de Apoio ao Usuário TSE TRIBUNAL SUPEIROR ELEITORAL Secretaria de Informática Coordenadoria de Sistemas Administrativos Setor de Apoio ao Usuário (versão 1.0) 1 APRESENTAÇÃO O Tribunal Superior Eleitoral usando de suas atribuições

Leia mais

Processo de Envio de email

Processo de Envio de email Processo de Envio de email Introdução O envio de documentos de forma eletrônica vem sendo muito utilizado, assim o envio de arquivos, relatórios, avisos, informações é realizado via e-mail. O sistema disponibiliza

Leia mais

O conjunto é composto por duas seções: o App Inventor Designer e o App Inventor Blocks Editor, cada uma com uma função específica.

O conjunto é composto por duas seções: o App Inventor Designer e o App Inventor Blocks Editor, cada uma com uma função específica. Google App Inventor: o criador de apps para Android para quem não sabe programar Por Alexandre Guiss Fonte: www.tecmundo.com.br/11458-google-app-inventor-o-criador-de-apps-para-android-para-quem-naosabe-programar.htm

Leia mais

Criando documentação com javadoc

Criando documentação com javadoc H Criando documentação com javadoc H.1 Introdução Neste apêndice, fornecemos uma introdução a javadoc ferramenta utilizada para criar arquivos HTML que documentam o código Java. Essa ferramenta é usada

Leia mais

O sistema operacional recomendado deve ser o Windows 2003, Windows 2000 ou Windows XP (nessa ordem de recomendação).

O sistema operacional recomendado deve ser o Windows 2003, Windows 2000 ou Windows XP (nessa ordem de recomendação). Módulo Nota Fiscal Eletrônica Sispetro Roteiro de Instalação Módulo Autenticador NFE Pré-Requisitos O sistema operacional recomendado deve ser o Windows 2003, Windows 2000 ou Windows XP (nessa ordem de

Leia mais

Despachante Express - Software para o despachante documentalista veicular DESPACHANTE EXPRESS MANUAL DO USUÁRIO VERSÃO 1.1

Despachante Express - Software para o despachante documentalista veicular DESPACHANTE EXPRESS MANUAL DO USUÁRIO VERSÃO 1.1 DESPACHANTE EXPRESS MANUAL DO USUÁRIO VERSÃO 1.1 1 Sumário 1 - Instalação Normal do Despachante Express... 3 2 - Instalação do Despachante Express em Rede... 5 3 - Registrando o Despachante Express...

Leia mais

Wireshark Lab: DNS. Versão 1.1 2005 KUROSE, J.F & ROSS, K. W. Todos os direitos reservados 2008 BATISTA, O. M. N. Tradução e adaptação para Wireshark.

Wireshark Lab: DNS. Versão 1.1 2005 KUROSE, J.F & ROSS, K. W. Todos os direitos reservados 2008 BATISTA, O. M. N. Tradução e adaptação para Wireshark. Wireshark Lab: DNS Versão 1.1 2005 KUROSE, J.F & ROSS, K. W. Todos os direitos reservados 2008 BATISTA, O. M. N. Tradução e adaptação para Wireshark. Como descrito na seção 2.5 do livro, o Domain Name

Leia mais

Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas

Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas Vinicius Ruela Pereira Borges 1 1 Faculdade de Computação - Universidade Federal de Uberlândia

Leia mais

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart. Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart. Versão 1.6 15/08/2013 Visão Resumida Data Criação 15/08/2013 Versão Documento 1.6 Projeto Responsáveis

Leia mais

Instituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I Clusters

Instituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I Clusters Instituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I Clusters Trabalho elaborado por: 980368 - Sérgio Gonçalves Lima 1010949 - Nisha Sudhirkumar Chaganlal Clusters O que é

Leia mais

Integração com o Ambiente Virtual de Aprendizagem Moodle

Integração com o Ambiente Virtual de Aprendizagem Moodle Integração com o Ambiente Virtual de Aprendizagem Moodle Integração com o Ambiente Virtual de Aprendizagem Moodle Página 2 Sumário 1. Apresentação... 4 1.1. O Moodle... 4 1.2. Objetivo da integração...

Leia mais

Serviços Web Semânticos

Serviços Web Semânticos Serviços Web Semânticos Paulo Vitor Antonini Orlandin paulovitor_e@hotmail.com Resumo O grande crescimento na utilização de Serviços Web torna imprescindível o desenvolvimento de uma forma de melhoria

Leia mais

Instruções de Instalação do IBM SPSS Modeler (Licença de Usuário Autorizado)

Instruções de Instalação do IBM SPSS Modeler (Licença de Usuário Autorizado) Instruções de Instalação do IBM SPSS Modeler (Licença de Usuário Autorizado) Índice Instruções de Instalação....... 1 Requisitos do sistema........... 1 Código de autorização.......... 1 Instalando...............

Leia mais

AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM. Victor Marinho Furtado

AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM. Victor Marinho Furtado AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM Victor Marinho Furtado Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia de Sistemas e Computação, COPPE, da Universidade

Leia mais

Processos (Threads,Virtualização e Migração de Código)

Processos (Threads,Virtualização e Migração de Código) Processos (Threads,Virtualização e Migração de Código) Roteiro Processos Threads Virtualização Migração de Código O que é um processo?! Processos são programas em execução. Processo Processo Processo tem

Leia mais

Considerações sobre o Disaster Recovery

Considerações sobre o Disaster Recovery Considerações sobre o Disaster Recovery I M P O R T A N T E O backup completo para Disaster Recovery não dispensa o uso de outros tipos de trabalhos de backup para garantir a integridadedo sistema. No

Leia mais

FAT32 ou NTFS, qual o melhor?

FAT32 ou NTFS, qual o melhor? FAT32 ou NTFS, qual o melhor? Entenda quais as principais diferenças entre eles e qual a melhor escolha O que é um sistema de arquivos? O conceito mais importante sobre este assunto, sem sombra de dúvidas,

Leia mais

Índice. Informações sobre conteúdo do site...04

Índice. Informações sobre conteúdo do site...04 Índice Informações sobre conteúdo do site...04 Como usar o site...05 Conhecendo o site... 06 Conectando ao site...10 Resumo de suas reservas...11 Iniciando a pesquisa...12 Como fazer reserva de hotel Definindo

Leia mais

GUILHERME STUTZ TÖWS ANIMAÇÃO DE ALGORITMOS

GUILHERME STUTZ TÖWS ANIMAÇÃO DE ALGORITMOS GUILHERME STUTZ TÖWS ANIMAÇÃO DE ALGORITMOS Trabalho de graduação do Curso de Ciência da Computação do Setor de Ciências Exatas da Universidade Federal do Paraná. Professor: André Luiz Pires Guedes CURITIBA

Leia mais

Documento de Instalação e Configuração do InfoGrid

Documento de Instalação e Configuração do InfoGrid Documento de Instalação e Configuração do InfoGrid Tecgraf/PUC Rio infogrid@tecgraf.puc rio.br 1.Introdução O objetivo deste documento é podermos registrar em um único local todas as informações necessárias

Leia mais

WORKSHOP Ferramenta OLAP IBM Cognos

WORKSHOP Ferramenta OLAP IBM Cognos WORKSHOP Ferramenta OLAP IBM Cognos O objetivo deste documento é orientar o usuário final na utilização das funcionalidades da ferramenta OLAP IBM Cognos, referente a licença de consumidor. Sumário 1 Query

Leia mais

SISTEMAS DISTRIBUÍDOS

SISTEMAS DISTRIBUÍDOS SISTEMAS DISTRIBUÍDOS Cluster, Grid e computação em nuvem Slide 8 Nielsen C. Damasceno Introdução Inicialmente, os ambientes distribuídos eram formados através de um cluster. Com o avanço das tecnologias

Leia mais