Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto
|
|
- Maria Fernanda Vidal Schmidt
- 6 Há anos
- Visualizações:
Transcrição
1 Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Eduardo Delazeri Ferreira, Francieli Zanon Boito, Aline Villavicencio 1. Introdução 1 Instituto de Informática - Universidade Federal do Rio Grande do Sul Porto Alegre, Brasil -{edferreira, fzboito, avillavicencio}@inf.ufrgs.br A criação de tesauros distribucionais [Lin 1998, Baroni and Lenci 2010] é de fundamental importância para uma série de aplicações de Processamento de Linguagem Natural (PLN). No entanto, existe uma grande dificuldade na obtenção desses tesauros: para que o tesauro tenha uma boa qualidade, é necessário um volume muito grande de dados, resultando em uma grande demora para que esses dados sejam processados. Assim, este trabalho propõe uma paralelização desse processamento. A paralelização tem como objetivo apenas a redução do tempo de execução, devendo produzir o mesmo resultado obtido pelo processamento sequencial. Este artigo faz uma comparação entre a versão paralela e sequencial da parte de contagem de palavras e contextos na criação de tesauros distribucionais. A comparação foi feita com base nos tempos de duas implementações: uma sequencial, do pacote de construção de tesauros distribucionais Minimantics [Padró et al. 2014] 1, e outra paralela, desenvolvida para este trabalho com Spark 2, que realiza operações em paralelo utilizando um cluster de computadores. O restante deste artigo está organizado da seguinte forma: a próxima Seção apresenta trabalhos relacionados, a Seção 3 apresenta a abordagem que foi utilizada na paralelização do algoritmo, a Seção 4 apresenta os resultados obtidos, e a Seção 5 apresenta as conclusões e os trabalhos futuros. 2. Trabalhos Relacionados Um tesauro é uma lista de palavras associadas por uma característica específica, como a similaridade entre elas (sinonímia). Sua construção é, tradicionalmente, manual e resulta em um recurso de alta qualidade, mas de baixa cobertura e de alto custo. Para solucionar esse problema, a criação de tesauros pode ser feita automaticamente, a partir de textos, com base na hipótese distribucional de Harris [Harris 1954], a qual propõe que se pode conhecer uma palavra pela sua companhia. Uma das principais abordagens na criação dos tesauros é o método de contagem [Lin 1998, Baroni and Lenci 2010]. Para criar esses tesauros utilizando o método de contagem, inicialmente são extraídas ocorrências de todas as palavras do texto com as palavras que as acompanham dentro de uma janela de tamanho fixo. Em seguida, é feita a contagem total da coocorrência de cada par de palavras. Com essas contagens, é criada uma matriz que possui o número de vezes que cada palavra ocorreu com cada uma das outras palavras do texto (Tabela 1)
2 Posteriormente, para cada palavra-alvo (linha), é calculada a força de associação entre ela e cada um dos seus contextos (colunas) [Lin 1998, Baroni and Lenci 2010]. A Tabela 1 apresenta um exemplo de matriz de coocorrências. Tabela 1. Frequência de ocorrência de cada palavra chocolate comer bom chocolate comer Materiais e Métodos A parte paralelizada do algoritmo foi a de contagem de cada palavra com seus contextos. A entrada para a fase de contagem de associações é um arquivo contendo uma série de pares de palavras (alvo e contexto) exemplificados na Tabela 2 e a saída é a contagem de todos os pares no corpus exemplificados na Tabela 3. Tabela 2. Exemplo de entrada Alvo Contexto chocolate comer chocolate delicioso chocolate caro chocolate delicioso Tabela 3. Exemplo de saída Alvo Contexto Contagem chocolate comer 1 chocolate delicioso 2 chocolate caro 1 Esse tipo de processamento se encaixa no paradigma MapReduce[Lämmel 2008] de programação, pois cada parte do texto pode ser considerada separadamente para contagem de pares, e depois todos os resultados obtidos podem ser agrupados. Ou seja, o texto pode ser dividido entre múltiplas tarefas (Map), em que cada tarefa fará a contagem na sua porção de forma independente, e,por fim, as contagens dos mesmos pares podem ser somadas (Reduce). Optou-se pelo uso de Spark por ser uma ferramenta adequada à manipulação de grandes quantidades de dados, oferecendo um ambiente para desenvolvimento em MapReduce. Para a escrita do algoritmo, foi usada a linguagem Scala, suportada pelo ambiente Spark. Foram utilizados dois subconjuntos do corpus UKWaC [Ferraresi et al. 2008]: um com 68KB e outro com 11GB. Os arquivos foram copiados para todos os nós antes da execução do código paralelo. 4. Experimentos e Resultados Para a realização do trabalho, foi utilizado o framework Spark com Scala no cluster Sagittaire do Grid Foram usados até 40 nós desse cluster, cada um equipado com 2 AMD Opteron GHz, 2GB de memória RAM e um disco rígido de 73GB (SCSI). Os nós estão ligados através de uma rede Gigabit Ethernet. O sistema operacional utilizado foi Linux, com a distribuição Debian 6 ( Squeeze ). Um dos nós atua como mestre, e os demais como escravos. 3
3 (a) Tempo (segundos) (b) Speedup Figura 1. Resultados com o corpus de 11GB Os resultados obtidos são apresentados nas Tabelas 4 e 5 para 68KB e 11 GB, respectivamente. Os tempos apresentados são a média aritmética de até 8 execuções. Foram observados ganhos de desempenho apenas para o corpus maior (Tabela 5): de para 180 segundos, um ganho de 77.57% com 40 nós. Os resultados para esse corpus também estão representados na Figura 1. Tabela 4. Resultados com o corpus de 68KB Sequencial Paralelo (40 nós) Tempo (s) 0,09 45,31 Desvio-Padrão 0,00 0,95 Speedup - 0,002 Eficiência 1 0,00 Tabela 5. Resultados com o corpus de 11GB Sequencial Paralelo (10 nós) Paralelo (20 nós) Paralelo (40 nós) Tempo (s) 14029,8 536,74 289,85 180,87 Desvio-Padrão 0 1,056 1,46 3,3 Speedup - 26,13 48,4 77,56 Eficiência 1 1,3 1,21 0,96 Para o corpus menor (Tabela 4), foi observado um aumento no tempo de execução com a paralelização do algoritmo. Isso acontece devido ao custo do tempo de inicialização do próprio Spark, que é diluído quando o corpus de entrada passa a ser maior. Além disso, de acordo com o tamanho da entrada e as configurações utilizadas, o mestre dispara apenas duas tarefas para processar esse corpus, independente do número de escravos disponíveis (por esse motivo, são apresentados resultados com apenas um número de nós). Comparando os tempos obtidos para as implementações paralela e sequencial, foram calculados speedup e eficiência. Esses valores representam, respectivamente, a melhoria de desempenho obtida pela versão paralela e o quão eficiente é essa melhoria em relação ao número de processadores e núcleos de processamento utilizados. Pode-se observar que a implementação paralela obtém speedup maior do que o número de cores utilizado e eficiência acima de 1 (com 10 e 20 nós). Isso acontece
4 porque, apesar de implementarem a mesma contagem, a versão sequencial faz a ordenação dos pares antes de gerar o arquivo de saída, enquanto a versão paralela não precisa dessa ordenação por causa da representação dada pelo Spark aos dados. Na versão sequencial, o arquivo de saída dessa fase precisa estar ordenado para processamento pela próxima fase da criação do tesauro. No entanto, na versão paralela os dados podem ser diretamente manipulados pela próxima fase através de novas fases de Map e Reduce. O speedup e a eficiência caem conforme aumenta o número de nós envolvidos na execução. Uma possível explicação para isso é que a proporção entre o número de tarefas geradas e o número de cores disponíveis torna-se subótima para esse ambiente, considerando o custo de manutenção de um grande número de escravos. Nesse caso, maior eficiência seria obtida para 40 nós de processamento com um corpus de entrada maior. 5. Conclusões e Trabalhos Futuros Nesse artigo, apresentamos a paralelização (usando Spark) do algoritmo de geração de contagens de palavras e contextos para a criação de tesauros distribucionais. Foi avaliado o desempenho dessa paralelização em um cluster com até 40 nós. Os resultados obtidos mostram ganhos de desempenho de até 77% para o maior tamanho de entrada. Trabalhos futuros incluem a paralelização e avaliação das outras fases da criação de tesauros (cálculo de associação entre palavras e contextos e cálculo de similaridade entre as palavras). 6. Agradecimentos Os experimentos apresentados neste artigo foram realizados na plataforma experimental Grid 5000, em desenvolvimento pela ação INRIA ALADDIN com apoio de CNRS, RENATER e diversas universidades e órgãos de fomento (ver Agradecemos a Carlos Ramisch, que disponibilizou o Minimantics, ao grupo de Processamento Paralelo da UFRGS e ao Instituto de Informática da UFRGS pelo apoio à pesquisa. Parte dos resultados apresentados neste trabalho foram obtidos no projeto Simplificação Textual de Expressões Complexas patrocinado pela Samsung Eletrônica da Amazônia Ltda., através da lei 8.248/91, e também contou com apoio do CNPq (113700/ ). Referências Baroni, M. and Lenci, A. (2010). Distributional memory: A general framework for corpus-based semantics. Computational Linguistics, 36(4): Ferraresi, A., Zanchetta, E., Baroni, M., and Bernardini, S. (2008). Introducing and evaluating ukwac, a very large web-derived corpus of english. In Proceedings of the 4th Web as Corpus Workshop (WAC-4) Can we beat Google, pages Harris, Z. S. (1954). Distributional structure. Word. Lämmel, R. (2008). Google s mapreduce programming model revisited. Science of computer programming, 70(1):1 30. Lin, D. (1998). Automatic retrieval and clustering of similar words. In Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th
5 International Conference on Computational Linguistics - Volume 2, ACL 98, pages Association for Computational Linguistics. Padró, M., Idiart, M., Villavicencio, A., and Ramisch, C. (2014). Nothing like good old frequency: Studying context filters for distributional thesauri. In Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP 2014) - short papers, Doha, Qatar.
Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos
Universidade Federal do Rio Grande do Sul Grupo de Processamento de Linguagens Naturais Projeto Expressões Multipalavras Verificação automática de substantivos compostos através de reconhecimento de padrões
Leia maisSobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental
Sobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental Douglas Oliveira Cristina Boeres Fábio Laboratório Nacional de Computação Científica
Leia maisSumário. Referências utilizadas. Introdução. MAFIA: Merging of Adaptive Finite Intervals. Introdução Visão Geral e Objetivos do MAFIA
Sumário : Merging of Adaptive Finite Intervals Elaine Ribeiro de Faria Análise de Agrupamento de Dados ICMC-USP Dezembro 2010 Introdução Visão Geral e Objetivos do Algoritmo Grid Adaptativo Algoritmo Algoritmo
Leia maisAvaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop
Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Paulo Romero Martins Maciel prmm@cin.ufpe.br Dados,
Leia maisDESENVOLVIMENTO DE UM ALGORITMO PARALELO PARA APLICAÇÃO EM CLUSTER DE COMPUTADORES
DESENVOLVIMENTO DE UM ALGORITMO PARALELO PARA APLICAÇÃO EM CLUSTER DE COMPUTADORES João Ricardo Kohler Abramoski (PAIC/FUNDAÇÃO ARAUCÁRIA), Sandra Mara Guse Scós Venske (Orientadora), e-mail: ssvenske@unicentro.br
Leia maisUniversidade Estadual de Maringá/Departamento de Informática Maringá, PR. Ciências Exatas e da Terra / Metodologia e Técnicas da Computação.
TESTES E EXPERIMENTOS COM APLICAÇÕES PARALELAS EM CLUSTERS DE COMPUTADORES SUN: PROCESSAMENTO DE IMAGENS GEOGRÁFICAS Carlos Roberto Santos de Oliveira Júnior (PIBIC/CNPq-UEM), Henrique Yoshikazu Shishido
Leia maisAluno de Pós-Graduação em Engenharia de Software para Dispositivos Móveis pela UNINTER
COMPARAÇÃO DE DESEMPENHO NA PROGRAMAÇÃO PARALELA HÍBRIDA (MPI + OPENMP) NA BUSCA DE TEXTO EM ARQUIVOS 1 COMPARISON OF PERFORMANCE IN HYBRID PARALLEL PROGRAMMING (MPI + OPENMP) IN SEARCH OF TEXT IN FILES
Leia maisUm Calculador de Capacidade de Computação para Nós de Máquinas Virtuais LAM/MPI
Um Calculador de Capacidade de Computação para Nós de Máquinas Virtuais LAM/MPI Diego Luis Kreutz 1 Lucas Mello Schnorr 2 Cleverton Marlon Possani 3 Resumo Este texto apresenta um calculador de capacidade
Leia maisCOMPUTAÇÃO PARALELA E DISTRIBUÍDA
COMPUTAÇÃO PARALELA E DISTRIBUÍDA Aluno: Alessandro Faletti Orientadora: Noemi Rodriguez Introdução O objetivo inicial no projeto era aplicar a possibilidade de processamento em paralelo no sistema CSBase
Leia maisAnálise empírica de algoritmos de ordenação
Análise empírica de algoritmos de ordenação Mario E. Matiusso Jr. (11028407) Bacharelado em Ciências da Computação Universidade Federal do ABC (UFABC) Santo André, SP Brasil mario3001[a]ig.com.br Resumo:
Leia maisIntrodução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná
Fabiola Santore Universidade Federal do Paraná Sumário 1. Introdução 2. Ferramentas Unix 2.1 Análise de log 2.2 Filosofia Unix 3. MapReduce 3.1 Procedimento 3.2 Reduce: Joins e Agrupamento 3.3 Análise
Leia maisMCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III
MCZA017-13 Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin.
Leia maisTécnicas de Processamento Paralelo na Geração do Fractal de Mandelbrot
Técnicas de Processamento Paralelo na Geração do Fractal de Mandelbrot Bruno Pereira dos Santos Dany Sanchez Dominguez Esbel Tomás Evalero Orellana Universidade Estadual de Santa Cruz Roteiro Breve introdução
Leia maisPARALELIZAÇÃO DE ALGORITMO DE INSPEÇÃO DE ROTAS UTILIZANDO PERMUTAÇÃO LEXICOGRÁFICA 1
PARALELIZAÇÃO DE ALGORITMO DE INSPEÇÃO DE ROTAS UTILIZANDO PERMUTAÇÃO LEXICOGRÁFICA 1 Jessica De Almeida Berlezi 2, Janiel Ceretta Foletto 3, Edson Luiz Padoin 4, Rogério S. M. Martins 5. 1 Trabalho realizado
Leia maisAVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP
AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados
Leia maisLista de Exercícios sobre Conceitos de Informática. Exercício 1: Correspondência
Lista de Exercícios sobre Conceitos de Informática Exercício 1: Correspondência Relacione os termos da tabela 1 abaixo com as definições da tabela 2. Para facilitar, os termos da tabela 1 estão colocados
Leia maisGrupo de Processamento de Linguagem Natural do Instituto de Informática (PLN-II)
Integrantes Grupo de Processamento de Linguagem Natural do Instituto de Informática (PLN-II) Aline Villavicencio 1,2 1 Instituto de Informática, Universidade Federal do Rio Grande do Sul (Brasil) 2 Department
Leia maisO Gênero influi no Tempo de Reação em Busca Visual?
X WORKSHOP DE COMPUTAÇÃO DA FACCAMP (WCF 2014) O Gênero influi no Tempo de Reação em Busca Visual? Sergio Santos Silva Filho, Felipe Rodrigues, Bruno Nogueira Sumário 1. Introdução; 2. Objetivos e Hipóteses
Leia maisMonografia de Conclusão do Curso de Graduação em Ciência da Computação. 2
APLICAÇÃO DE BALANCEAMENTO DE CARGA COM CHARM++ NA PARALELIZANDO DE UM SIMULADOR DO MOVIMENTO DA ÁGUA NO SOLO 1 LOAD BALANCING APLICATION WITH CHARM++ IN THE PARALELIZATION OF A WATER MOVEMENT SIMULATOR
Leia maisAULA 2. Prof.: Jadiel Mestre. Introdução à Informática. Introdução à Informática Componentes de um Sistema de Informação
AULA 2 Prof.: Jadiel Mestre. Componentes de um Sistema de Informação Os componentes de um sistema de informação são divididos em três partes 2 1 Componentes físicos do computador Dispositivos de Entrada/Saída
Leia maisIntrodução à Programação uma Abordagem Funcional
Universidade Federal do Espírito Santo Introdução à Programação uma Abordagem Funcional Programação I Prof.ª Claudia Boeres boeres@inf.ufes.br CT VII - Sala 34 Departamento de Informática Centro Tecnológico
Leia maisBALANCEAMENTO DE CARGA EM SISTEMAS MULTIPROCESSADORES UTILIZANDO O MODELO DE PROGRAMAÇÃO CHARM++ 1
BALANCEAMENTO DE CARGA EM SISTEMAS MULTIPROCESSADORES UTILIZANDO O MODELO DE PROGRAMAÇÃO CHARM++ 1 Guilherme Henrique Schiefelbein Arruda 2, Edson Luiz Padoin 3. 1 Trabalho desenvolvido no contexto do
Leia maisCOMPARAÇÃO DE DESEMPENHO ENTRE IMPLEMENTAÇÕES DO ALGORITMO JOGO DA VIDA COM PTHREAD E OPEMMP 1
COMPARAÇÃO DE DESEMPENHO ENTRE IMPLEMENTAÇÕES DO ALGORITMO JOGO DA VIDA COM PTHREAD E OPEMMP 1 Márcia Da Silva 2, Igor Gamste Haugg 3, Eliézer Silveira Prigol 4, Édson L. Padoin 5, Rogério S. M. Martins
Leia maisARQUITETURA DE COMPUTADORES
RCM00014 Haswell wafer ARQUITETURA DE COMPUTADORES Prof. Luciano Bertini Site: http://www.professores.uff.br/lbertini/ Objetivos do Curso Entendimento mais aprofundado do funcionamento
Leia maisAlgoritmos e Estruturas de Dados I Prof. Tiago Eugenio de Melo
Algoritmos e Estruturas de Dados I Prof. Tiago Eugenio de Melo tmelo@uea.edu.br www.tiagodemelo.info Observações O conteúdo dessa aula é parcialmente proveniente do Capítulo 11 do livro Fundamentals of
Leia maisRuby e JRuby em... Paralelos e Distribuídos. Felipe Barden Lucas Fialho Zawacki
Ruby e JRuby em... Paralelos e Distribuídos Felipe Barden 151343 Lucas Fialho Zawacki 172072 Sobre o que vamos falar? A linguagem Ruby e suas aplicações em programação paralela e distribuída. A implementação
Leia maisFramework para Deduplicação de Dados com Apache Spark
Framework para Deduplicação de Dados com Apache Spark César Magrin - magrin@inf.ufpr.br Disciplina: Metodologia Científica - CI860 Professor: Alexandre Direne Sumário 1. Qualidade de Dados 2. Deduplicação
Leia maisOs efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais
72 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais Renan Gomes Pereira¹ Maria Fernanda Moura²
Leia maisAlgoritmos e Estruturas de Dados II. Trabalho Prático 4
Algoritmos e Estruturas de Dados II Trabalho Prático 4 Entrega: 23/11/09 Devolução: 10/12/09 (sem possibilidade de entrega com atraso) Trabalho em dupla Prof. Jussara Marques de Almeida Problema 1: Construção
Leia maisNOÇÕES DE INFORMÁTICA
NOÇÕES DE INFORMÁTICA ALISSON CLEITON MÓDULO I 1. A placa-mãe (motherboard) de um computador é o hardware responsável por conectar e interligar todos os componentes. Um componente que já vem instalado
Leia maisParadigmas de Processamento Paralelo na Resolução do Fractal de Mandelbrot
Paradigmas de Processamento Paralelo na Resolução do Fractal de Mandelbrot Bruno Pereira dos Santos Dany Sanchez Dominguez Universidade Estadual de Santa Cruz Cronograma Introdução Serial vs Processamento
Leia maisAnálise de Desempenho da Paralelização do Problema de Caixeiro Viajante
Análise de Desempenho da Paralelização do Problema de Caixeiro Viajante Gabriel Freytag Guilherme Arruda Rogério S. M. Martins Edson L. Padoin Universidade Regional do Noroeste do Estado do Rio Grande
Leia maisDeep Learning for Chinese Word Segmentation and POS Tagging
Deep Learning for Chinese Word Segmentation and POS Tagging Lin Yu Han Universidade Federal do Paraná Novembro 2015 Tagging: Sumário Sumário Introdução. Arquitetura da Rede Neural Experimentos Considerações
Leia maisIntrodução à Informática Engenharia Agrícola
Conceitos Básicos Introdução à Informática Engenharia Agrícola Sumário Computador Processamento de dados Hardware Software Sistemas Arquivos Modalidades de Computadores Arquitetura Básica. Uma referência
Leia maisInformática Parte 10 Prof. Márcio Hunecke
Escriturário Informática Parte 10 Prof. Márcio Hunecke Informática CONCEITOS DE MAPREDUCE E HDFS/HADOOP/YARN 2.7.4 Big Data O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se
Leia maisÍndice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed
Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação
Leia maisParalelização do Método de Jacobi em Memória Compartilhada 1
Paralelização do Método de Jacobi em Memória Compartilhada 1 Claudio Schepke cschepke@inf.ufrgs.br 1 PPGC - Instituto de Informática - UFRGS Introdução ao Processamento Paralelo e Distribuído Professor
Leia mais5 Simulações e Resultados
5 Simulações e Resultados 5.. Introdução Neste capítulo são apresentados alguns estudos de casos que analisam a aplicabilidade da metodologia proposta: o algoritmo de fechos convexos na resolução do problema
Leia maisUSO DE PARALELISMO DE DADOS PARA MAIOR EFICIÊNCIA DE ALGORITMOS DE PROCESSAMENTO DE IMAGENS
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM USO DE PARALELISMO DE DADOS PARA MAIOR EFICIÊNCIA DE ALGORITMOS DE PROCESSAMENTO
Leia maisParalelização Eficiente para o Algoritmo Binário de Exponenciação Modular
Paralelização Eficiente para o Algoritmo Binário de Exponenciação Modular Pedro Carlos da Silva Lara Fábio Borges de Oliveira Renato Portugal Laboratório Nacional de Computação Científica Índice 1 Introdução
Leia maisUNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Sistema de Sumarização Automática de Textos Baseado em Classes de Documentos PROPOSTA DE TRABALHO DE GRADUAÇÃO
Leia maisDGPAPP Tutorial. Introdução. Daniel Centeno Einloft Vinicius Meirelles Pereira. 20 May 2014
DGPAPP Tutorial Daniel Centeno Einloft Vinicius Meirelles Pereira 20 May 2014 Qualquer um tem o direito de copiar, modicar e distribuir cópias deste documento, sob os termos da GNU Free Documentation License
Leia maisLista de Exercícios sobre Conceitos de Informática. Exercício 1: Correspondência
Lista de Exercícios sobre Conceitos de Informática Exercício 1: Correspondência Relacione os termos da tabela 1 abaixo com as definições da tabela 2. Para facilitar, os termos da tabela 1 estão colocados
Leia maisPredição de Utilização de Recursos Computacionais Usando Séries Temporais
Predição de Utilização de Recursos Computacionais Usando Séries Temporais Aluno: Paulo Roberto Pereira da Silva Orientador: Paulo Romero Martins Maciel Coorientador: Jean Carlos Teixeira de Araujo de Garanhuns
Leia mais1.1 o que é um algoritmo... 6
sumário introdução 1 1 fundamentos 5 1.1 o que é um algoritmo... 6 1.1.1 algoritmos executados por um computador...7 1.1.2 comandos básicos executados por um computador...11 1.1.3 da necessidade do desenvolvimento
Leia maisIntrodução aos Sistemas Operacionais. Ricardo Ramos de Oliveira
Introdução aos Sistemas Operacionais Ricardo Ramos de Oliveira E-mail: ricardo.ramos@ifsuldeminas.edu.br Cadastro Wiki USP Endereço: http://garapa.intermidia.icmc.usp.br/mediawiki Objetivos Conceituar
Leia maisUso de Anotações Semânticas para Exploração de Paralelismo em Workflows Intensivos em Dados
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Intensivos em Dados Elaine Naomi Watanabe 1, Kelly Rosa Braghetto 1 1 Departamento de Ciência da Computação Instituto de Matemática
Leia maisUso de Paralelismo de Dados em Algoritmos de Processamento de Imagens Utilizando Haskell
1/32 Uso de Paralelismo de Dados em Algoritmos de Processamento de Imagens Utilizando Haskell Pedro R. Mendes Júnior Lucília Figueiredo David Menotti Departamento de Computação Universidade Federal de
Leia maisEste tutorial apresenta uma análise para uso adequado e otimizado de seus parâmetros nos processos de ETL, e sua aplicação em situações distintas.
O Pentaho Data Integration ( PDI ) ou Kettle tem um step responsável pela ordenação ou classificação de dados chamado Sort Rows, este step permite ordenar dados através de campos informados em sua lista.
Leia maisCP Introdução à Informática Prof. Msc. Carlos de Salles
CP 1015.1 Prof. Msc. Carlos de Salles PROGRAMA 1. CONCEITO DE SISTEMAS 1.1 Sistemas e sua classificação 1.2 Informações e Dados 1.3 O Processamento de Dados 1.4 O Computador e sua História 2. ESTRUTURA
Leia mais3 Similaridade e tamanho da seqüência de consulta no BLAST
3 Similaridade e tamanho da seqüência de consulta no BLAST Quando se planeja construir aplicativos que utilizam um agrupamento de computadores no intuito de paralelizar ou distribuir processamento, se
Leia maisMineração de Textos na Web
Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na
Leia maisTesauros Distribucionais para o Português: avaliação de metodologias
Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4 7, 2015. c 2015 Sociedade Brasileira de Computação. Tesauros Distribucionais para o Português: avaliação
Leia maisTreinamento em Activiti Workflow e BPM Open Source
Treinamento em Activiti Workflow e BPM Open Source Sobre o treinamento Este treinamento e voltado para usuários e desenvolvedores que pretendem conhecer o processo de implementação de workflows na Ferramenta
Leia maisBOINC + R: Executando rotinas de
de bioinformática Instituto de Matemática e Estatística Universidade de São Paulo 16 de novemo de 2009 Bioinformática Aplicação de técnicas computacionais e matemáticas para geração, gerenciamento e análise
Leia maisINTRODUÇÃO. Introdução a Informática. Vinícius Pádua
INTRODUÇÃO Introdução a Informática Introdução Para que serve o computador? Word, Filme, Facebook,... Resolver problemas do usuário Coletar, manipular e fornecer os resultados Processamento eletrônico
Leia maisANÁLISE DE ALGORITMOS: PARTE 1. Prof. André Backes. Como resolver um problema no computador? Precisamos descrevê-lo de uma forma clara e precisa
ANÁLISE DE ALGORITMOS: PARTE 1 Prof. André Backes Algoritmos 2 Como resolver um problema no computador? Precisamos descrevê-lo de uma forma clara e precisa Precisamos escrever o seu algoritmo Um algoritmo
Leia maisCOMPARAÇÃO DO TEMPO DE EXECUÇÃO DE ALGORITMOS MAXMIN EM DIFERENTES PROCESSSADORES
COMPARAÇÃO DO TEMPO DE EXECUÇÃO DE ALGORITMOS MAXMIN EM DIFERENTES PROCESSSADORES Comparison of the Runtime of Algorithms Maxmin in Different Processsadores Walteno Martins Parreira Júnior, Marcio Oliveira
Leia maisESTRUTURA DE DADOS I AULA I
ESTRUTURA DE DADOS I AULA I PROF. ME. HÉLIO ESPERIDIÃO O que é um dado? Dado pode ser definido como a matéria-prima originalmente obtida de uma ou mais fontes (etapa de coleta). o que é a informação A
Leia maisO ENSINO DOS NOVOS CONTEÚDOS DE INFORMÁTICA E COMPUTAÇÃO NAS ENGENHARIAS
O ENSINO DOS NOVOS CONTEÚDOS DE INFORMÁTICA E COMPUTAÇÃO NAS ENGENHARIAS Camilo de Lelis Gondim Medeiros camilo@dsc.ufcg.edu.br Departamento de Sistemas e Computação Centro de Ciências e Tecnologia Universidade
Leia maisThe future is parallel but it may not be easy
The future is parallel but it may not be easy Adriano Tabarelli, Alex Morinaga, Caio Silva, Cássia Ferreira, Daniel Santos, Eduardo Apolinário, Hugo Posca, Thiago Batista, Paulo Floriano Universidade de
Leia maisBCC402 Algoritmos e Programação Avançada. Prof. Marco Antonio M. Carvalho Prof. Túlio Toffolo 2012/1
BCC402 Algoritmos e Programação Avançada Prof. Marco Antonio M. Carvalho Prof. Túlio Toffolo 2012/1 2 2 aulas teóricas e 2 aulas práticas (ambas em laboratório) Terças às 17:10, lab 22 do DECOM Prof. Túlio
Leia maisClusterização K-Means Paralelo Aplicado na Classificação de Alvos em Imagens de Alta Resolução
Clusterização K-Means Paralelo Aplicado na Classificação de Alvos em Imagens de Alta Resolução Luís Paulo Manfré Ribeiro luis.ribeiro@inpe.br Instituto Nacional de Pesquisas Espaciais - INPE São José dos
Leia maisFUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES SISTEMAS DE COMPUTAÇÃO. Cristina Boeres
FUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES SISTEMAS DE COMPUTAÇÃO Cristina Boeres Sistema de Computação! Conjunto de componentes integrados com o objetivo de manipular dados e gerar informações úteis.
Leia maisCEFET/RJ Centro Federal de Educação Tecnológica Celso Suckow da Fonseca 2. LNCC Laboratório Nacional de Computação Científica 3
Rumo à Integração da Álgebra de Workflows com o Processamento de Consulta Relacional João Ferreira 1, Jorge Soares 1, Fabio Porto 2, Esther Pacitti 3, Rafaelli Coutinho 1, Eduardo Ogasawara 1 1 CEFET/RJ
Leia maisAluno do Curso de Ciência da Computação UNIJUÍ, 3
PROPOSTA DE UM BALANCEADOR DE CARGA PARA REDUÇÃO DE TEMPO DE EXECUÇÃO DE APLICAÇÕES EM AMBIENTES PARALELOS 1 PROPOSAL FOR A LOAD BALANCER TO REDUCE APPLICATION RUNTIME IN PARALLEL ENVIRONMENTS Vinícius
Leia maisALINHAMENTO MANUAL DE TEXTOS E SUMÁRIOS EM UM CORPUS JORNALÍSTICO MULTIDOCUMENTO
ALINHAMENTO MANUAL DE TEXTOS E SUMÁRIOS EM UM CORPUS JORNALÍSTICO MULTIDOCUMENTO 1. Introdução Com o imenso volume de informação disponível na web, necessita-se de estratégias que permitam absorvê-la de
Leia maisImplementação de um escalonador de processos em GPU
Implementação de um escalonador de processos em GPU Guilherme Martins guilhermemartins@usp.br 6 de abril de 2017 Guilherme Martins (guilhermemartins@usp.br) Implementação de um escalonador de processos
Leia maisCURSO TÉCNICO PROFISSIONALIZANTE Disciplina: Informática Básica (Hardware)
CURSO TÉCNICO PROFISSIONALIZANTE Disciplina: Informática Básica (Hardware) HARDWARE É a parte física do computador, ou seja, são as peças que compõem um PC; Nesse capítulo iremos aprender a conhecer algumas
Leia maisAnálise de Desempenho de Aplicações Paralelas do Padrão Pipeline em Processadores com Múltiplos Núcleos
Análise de Desempenho de Aplicações Paralelas do Padrão Pipeline em Processadores com Múltiplos Núcleos Giuseppe G. P. Santana 1, Luís F. W. Goés 1 1 Departamento de Ciência da Computação Pontifícia Universidade
Leia maisAnálise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas
Universidade de São Paulo Mestrado em Ciência da Computação Instituto de Matemática e Estatística Disciplina MAC5725 Lingüística Computacional Análise Sintática de Frases utilizando Gramáticas Livres de
Leia maisClassificação Externa: Intercalação de Partições Classificadas
Classificação Externa: Intercalação de Partições Classificadas Vanessa Braganholo Baseado no Material de: Inhaúma Neves Ferraz (IC/UFF) Relembrando: Modelo da Classificação Externa 2 Aula Passada: Etapa
Leia maisA IMPORTÂNCIA DE THREADS NO DESEMPENHO DE APLICAÇÕES
A IMPORTÂNCIA DE THREADS NO DESEMPENHO DE APLICAÇÕES Euzébio da Costa Silva 1, Victor Pereira Ribeiro 2, Susana Brunoro Costa de Oliveira 3 1 29520-000, euzebioprogramacao@gmail.com 2 29520-000, victor3ifes@gmail.com
Leia maisUm estudo sobre consumo energético na indexação de conteúdo visual com síntese em alto nível usando hardware reconfigurável
1 de 61 Um estudo sobre consumo energético na indexação de conteúdo visual com síntese em alto nível usando hardware reconfigurável Elmar Uwe Kurt Melcher (Orientador) Universidade Federal de Campina Grande
Leia maisIMPLEMENTAÇÃO E AVALIAÇÃO DE UM MODELO DE MERCADO IMPERFEITO EM COMPUTAÇÃO PARALELA
IMPLEMENTAÇÃO E AVALIAÇÃO DE UM MODELO DE MERCADO IMPERFEITO EM COMPUTAÇÃO PARALELA Ana Luísa de A. Santos, Diego Carvalho, Felipe G. França DEL/UFRJ, COPPE/UFRJ E-mail: analuisa@lps.ufrj.br RESUMO Este
Leia maisINPE Outubro, Fabiana. S. Santana, César Bravo, Antonio. M. Saraiva Projeto:
INPE Outubro, 2008 Fabiana. S. Santana, César Bravo, Antonio. M. Saraiva fabiana.santana@usp.br, amsaraiv@usp.br Apoio: Instituição: Projeto: Objetivos: Apresentar versão de alto desempenho para o Garp
Leia maisSparse Matrix-Vector Multiplication on GPU: When Is Rows Reordering Worthwhile?
Sparse Matrix-Vector Multiplication on GPU: When Is Rows Reordering Worthwhile? Paula Prata João Muranho Instituto de Telecomunicações Departamento de Informática Universidade da Beira Interior Instituto
Leia maisAlgoritmos e Programação
ESTADO DE MATO GROSSO SECRETARIA DE ESTADO DE CIÊNCIA E TECNOLOGIA UNIVERSIDADE DO ESTADO DE MATO GROSSO CAMPUS UNIVERSITÁRIO DE SINOP FACULDADE DE CIÊNCIAS EXATAS E TECNOLÓGICAS CURSO DE ENGENHARIA ELÉTRICA
Leia maisComponente de aplicação. Figura 1 - Elementos funcionais de uma aplicação sendo executados de forma distribuída
11 1 Introdução Recentes avanços em redes de computadores impulsionaram a busca e o desenvolvimento de meios para facilitar e acelerar o desenvolvimento de aplicações em sistemas distribuídos, tornando
Leia maisInstalação e Manutenção de Computadores Sandra Silva
Instalação e Manutenção de Computadores Sandra Silva 2010 Unicenter. Todos os direitos reservados Hardware vs software Hardware É a parte física do computador, ou seja, o conjunto de dispositivos responsáveis
Leia mais5.1. Fluxo para geração do Roadmap
46 5 VelvetH-DB Os Sistemas Gerenciadores de Banco de Dados (SGBDs), foram criados com o intuito de permitir o armazenamento e manipulação de grandes volumes de dados, fornecendo uma aplicação que garanta,
Leia maisChaves. Acesso a Registros. Chaves Primária e Secundária. Chaves Primária e Secundária
Algoritmos e Estruturas de Dados II Prof. Ricardo J. G. B. Campello Chaves Acesso a Registros Uma chave (key) está associada a um registro e permite a sua recuperação É uma ferramenta conceitual importante
Leia maisAvaliação de atividades de programação submetidas em MOOC com emprego de técnicas de visualização
III Workshop de Ensino em Pensamento Computacional, Algoritmos e Programação VI Congresso Brasileiro de Informática na Educação Avaliação de atividades de programação submetidas em MOOC com emprego de
Leia maisPROPOSTA DE UMA ESTRATÉGIA DE PROGRAMAÇÃO EXPLÍCITA COM ANOTAÇÃO EM CÓDIGO EM BUSCA DE EFICIÊNCIA ENERGÉTICA 1
PROPOSTA DE UMA ESTRATÉGIA DE PROGRAMAÇÃO EXPLÍCITA COM ANOTAÇÃO EM CÓDIGO EM BUSCA DE EFICIÊNCIA ENERGÉTICA 1 Bruno Mokan Muenchen 2, João Vicente Ferreira Lima 3. 1 Projeto de pesquisa realizado pelo
Leia maisUNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular INFORMÁTICA Ano Lectivo 2017/2018
Programa da Unidade Curricular INFORMÁTICA Ano Lectivo 2017/2018 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Gestão das Organizações Desportivas 3. Ciclo de Estudos 1º 4.
Leia maisAluno do curso de Ciência da Computação da Unijuí e Bolsista PIBIC/UNIJUÍ, 3. Professor Orientador do Departamento de Ciências Exatas e Engenharias 4
ALGORITMO DE BALANCEAMENTO DE CARGA PARA REDUÇÃO DO TEMPO DE EXECUÇÃO DE APLICAÇÕES PARALELAS 1 PARALLEL APPLICATIONS RUNTIME REDUCTION FOCUSED LOAD BALANCEMENT ALGORITHM Vinícius Mânica Mastella 2, Edson
Leia maisEstrutura e Funcionamento dos Computadores (Conceitos Básicos)
Estrutura e Funcionamento dos Computadores (Conceitos Básicos) Sistema Computacional Peopleware (usuário) Software (programas) Hardware (máquina) Hardware Corresponde à parte material, aos componentes
Leia maisSQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina
Susana Rosich Soares Velloso SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção
Leia maisArquiteturas Paralelas
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES Arquiteturas Paralelas Medidas de desempenho Alexandre Amory Edson Moreno Índice 2 1. Introdução 2. Medidas de Desempenho Introdução 3 Aumento de desempenho dos
Leia maisCompressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:
Compressão de Textos Estrutura de Dados II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM O volume
Leia maisUma ferramenta para anotação de relações semânticas entre termos
1. Introdução Uma ferramenta para anotação de relações semânticas entre termos O Processamento de Língua Natural (PLN) adquire importância cada vez maior atualmente. É uma área em evidência pois a quantidade
Leia maisSISTEMA DE CONVERSÃO DE DADOS DE SIMULAÇÃO HIDRODINÂMICA DO SISBAHIA PARA O GNOME
SISTEMA DE CONVERSÃO DE DADOS DE SIMULAÇÃO HIDRODINÂMICA DO SISBAHIA PARA O GNOME Cabral, A. 1 ; Sperb, R. M. 2 ; Lima, G. 3 ; Mussi, C. S. 4 RESUMO A crescente demanda por estudos sobre a dispersão de
Leia maisComo os Processadores Funcionam
clubedohardware.com.br Por Gabriel Torres Editor executivo do Clube do Hardware Introdução Apesar de cada microprocessador ter seu próprio desenho interno, todos os microprocessadores compartilham do mesmo
Leia maisAlgoritmos e Programação
ESTADO DE MATO GROSSO SECRETARIA DE ESTADO DE CIÊNCIA E TECNOLOGIA UNIVERSIDADE DO ESTADO DE MATO GROSSO CAMPUS UNIVERSITÁRIO DE SINOP FACULDADE DE CIÊNCIAS EXATAS E TECNOLÓGICAS Algoritmos e Programação
Leia maisFicha de trabalho Nº 1 Utilizar adequadamente o computador e/ou dispositivos similares que processem dados.
TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO Data: 016/017 TURMAS: 7ºano Ficha de trabalho Nº 1 Utilizar adequadamente o computador e/ou dispositivos similares que processem dados. 1. Estabelece a correspondência
Leia maisINTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO
INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM Autores: Giulia Denise Kujat VIEIRA; Milene Karine GUBETTI. Identificação autores: Estudantes do Curso Técnico em Informática
Leia maisDesenvolvimento de Ferramentas no igeom: Utilizando a Geometria Dinâmica no Ensino
Desenvolvimento de Ferramentas no igeom: Utilizando a Geometria Dinâmica no Ensino Presencial e à Distância Seiji Isotani Orientador: Leônidas de Oliveira Brandão Defesa de Mestrado Departamento de Ciência
Leia maisAlgoritmos de Junção Estrela em MapReduce
Algoritmos de Junção Estrela em MapReduce Jaqueline Joice Brito 09 de junho de 2015 1 Modelo Relacional Dados armazenados em um conjunto de tabelas Amplamente utilizado Junção Recuperação de dados de duas
Leia maisANÁLISE DE DESEMPENHO DA APLICAÇÃO DE BALANCEAMENTO DE CARGA EM BENCHMARK SINTÉTICOS 1. Bruna Schneider Padilha 2, Edson Luiz Padoin 3.
ANÁLISE DE DESEMPENHO DA APLICAÇÃO DE BALANCEAMENTO DE CARGA EM BENCHMARK SINTÉTICOS 1 Bruna Schneider Padilha 2, Edson Luiz Padoin 3. 1 Resumo expandido resultado do Projeto de Pesquisa Utilização de
Leia maisArquivos invertidos 39
Arquivos invertidos 39 Arquivos invertidos É um mecanismo que utiliza palavras para indexar uma coleção de documentos a fim de facilitar a busca e a recuperação Estruturas de um arquivo invertido Vocabulário
Leia mais