2 Pesquisa Bibliográfica
|
|
|
- Renato Silva Moreira
- 9 Há anos
- Visualizações:
Transcrição
1 2 Pesquisa Bibliográfica As estratégias para detecção de conteúdo relevante podem ser divididas em duas abordagens: orientada a site e orientada a página. A primeira técnica utiliza várias páginas de um mesmo site para detectar templates. As desvantagens desta técnica é que nem todos sites na internet mantêm o mesmo modelo de estilo em suas páginas e se um novo site surge o modelo criado pode não ser mais aplicável. A vantagem deste método é que determinadas categorias de sites são bem regulares, como por exemplo sites de comércio virtual. A segundatécnicaprocuratemplates por página. Estatécnicausualmente examina apenas as características dos nós da árvore DOM sem comparar com outras árvores DOM. A desvantagem desta técnica é que muitas vezes as características do nó DOM é vista isoladamente, o que pode diminuir a acurácia do método em um site regular. A vantagem é poder generalizar o método para diferentes categorias de sites. Este capítulo discute alguns trabalhos que utilizaram a técnica orientada a site na Seção 2.1 e outros que utilizaram a técnica orientada a página na Seção Estratégias orientadas a site Uma técnica de extração de templates baseada no estilo de apresentação Yi et. al em (YLL03) classifica um conjunto de páginas com descrição de produtos e críticas de produtos em diferentes categorias. O objetivo de Yi é mostrar que templates nas páginas podem impactar negativamente o desempenho de tarefas de mineração de dados, como classificação em categorias e agrupamento. A idéia descrita em (YLL03) se baseia na observação dos autores que em um típico site comercial as páginas tendem a seguir um estilo de apresentação fixo, pois a maioria das páginas são geradas automaticamente. As partes da página cujo estilo e o conteúdo real,isto é,links,texto,imagens, dentre outros, aparecem repetidamente em muitas páginas do site é mais provável que seja
2 Capítulo 2. Pesquisa Bibliográfica 16 um template. O conteúdo da página são as partes da página cujo conteúdo real e estilo não se repetem em outras páginas. A partir desta observação Yi propõe uma estratégia que constrói uma nova estrutura de dados baseada no estilo da página a partir de uma árvore DOM, esta nova estrutura também é uma árvore e é chamada de SST (Site Style Tree). O estilo que os autores consideram são cor de fundo, cor da fonte, tamanho da fonte, dentre outros atributos que um CSS 1 pode conter. Uma análise do conteúdo real também faz parte da estratégia criada. A construção de uma SST começa com o parser do conjunto de páginas do site, esta etapa produz um conjunto de árvores DOM. Estas árvores são mapeadas para uma árvore SST. Veja um exemplo de mapeamento na Figura 2.1. Os nós com o mesmo estilo que possuem o mesmo pai são agrupados em um nó na SST, veja que os três nós <td> se tornaram apenas um. Existe um contador para cada nó da SST representando o número de árvores DOM que aquele nó se encontra, por exemplo observe que o nó <p> na SST apresenta o número um no seu canto superior esquerdo porque ele só existe na árvore DOM da direita. Figura 2.1: Exemplo de árvore DOM para ST Com o término da construção da SST o próximo passo é identificar a importância de um nó da SST atribuindo uma pontuação ao nó. Esta pontuação pode ser calculada a partir das características do seu estilo de apresentaçãoe doseu conteúdoreal, para mais detalhes deste cálculo consulte 1
3 Capítulo 2. Pesquisa Bibliográfica 17 (YLL03). Após esta atribuição, as páginas do site podem ter seus templates extraídos utilizando a pontuação calculada para cada nó da SST construída Uma técnica de extração de templates baseada em distância de edição entre árvores Vieira et. al (VdSP + 06) propõe outro algoritmo que adota a estratégia orientada a site. Neste trabalho o objetivo é melhorar o desempenho das tarefas de classificação e agrupamento em sites comerciais removendo templates das páginas. Metade dos sites comerciais considerados no corpus são sites de comércio eletrônico e a outra metade são sites de diferentes domínios, como CNN, E-Jazz, EncyclopediaMythica, UBL (Ultimate BandList) e Wikipedia. A motivação do algoritmo desenvolvido por Vieira, chamado de RTDM-TD, veio da observação que templates são apenas fragmentos de códigohtml dentro de uma coleção de documentos HTML em regiões específicas da página. Isto acontece porque sites comerciais normalmente utilizam ferramentas que geram códigohtml automaticamente. A idéia dos autores é, intuitivamente, identificar uma subárvore que se repete ao longo de páginas de um site, esta subárvore então é considerada o template do site. Para obter o template de um conjunto de páginas Vieira et. al determina o mapeamento entre a estrutura das árvores. Este mapeamento detecta nós idênticos nas árvores e subárvores que contém estes nós. Após a identificação deste mapeamento, em um pequeno conjunto de páginas do site, as outras páginas do site podem ter seus templates extraídos. O funcionamento do algoritmo de mapeamento pode ser consultado em (VdSP + 06). A estratégia proposta por Vieira reduz o problema de detecção de templates a achar a subárvore em comum a um conjunto de árvores. O primeiro passo da estratégia é construir um conjunto das árvores DOM das páginas de um site através de um parser. A seguir duas árvores T 0 e T 1 são selecionadas aletoriamente e removidas deste conjunto árvores. O segundo passo extrai a subárvore s i 1 em comum entre T 0 e T 1. O próximo passo consiste em um laço onde uma árvore T i é selecionada aleatoriamente na i-ésima iteração. O algoritmo verifica se T i contém a subárvore s i 1, se s i 1 não está contida em T i uma outra subávore s i é extraída entre s i 1 e T i, caso contrário o procedimento segue para a próxima iteração. Quando o número de iterações terminar a última subárvore s i é retornada. O número de iterações é o número mínimo de páginas que precisa ser examinada para se obter o template mais geral possível
4 Capítulo 2. Pesquisa Bibliográfica 18 Uma técnica de extração de templates baseada em pagelets Bar-Yossef e Rajagopalan apresentam em (BYR02) dois algoritmos que também utilizam várias páginas de um site para detectar templates. Seu objetivo, assim como dos outros trabalhos descritos acima, é aplicar seus algoritmos a tarefas de mineração de dados. A fim de detectar os templates Bar-Yossef e Rajagopalan definem o conceito de pagelet. Citando a definição semântica de pagelet encontrada no artigo: Um pagelet é a região de uma página web que: 1) tem um tópico ou funcionalidade bem definidos; e 2) não esta aninhado dentro de nenhuma outra região que tem o mesmo tópico ou funcionalidade. Oprimeiropassodaestratégia é dividir apáginaempagelets. Para atingir esta finalidade primeiro é feito o parser de uma página. Uma pilha armazena a raiz como primeiro elemento. O próximo passo é iterar em um laço que termina quando a pilha esta vazia. Dentro do laço uma variável v recebe um elemento que é desempilhado e então é verificado se os descendentes de v tem ao menos k links, se isto acontece os descendentes de v são empilhados, caso contrário v é declarado como um pagelet. Este algoritmo de particionamento é baseado na idéia de que se um elemento HTML contém pelo menos um determinado número de links então é provável que represente um tópico ou idéia independente. Após a divisão em pagelets um dos dois algoritmos propostos podem ser executados. O algoritmo chamado delocal Template Detection é adequado para um conjunto pequeno de páginas enquanto o algoritmo chamado Global Template Detection é adequado para um conjunto grande de páginas. No algoritmo Local Template Detection a primeira etapa elimina as páginas duplicadas do seu domínio de páginas. A segunda etapa ordena e agrupa os pagelets de todo seu universo de páginas de acordo com seu shingle. Um shingle é uma representação única de um texto que não varia se existe pequenas pertubações. Nesta segunda etapa os grupos formados são pagelets candidatos a templates. A terceira etapa enumera os grupos e retorna os pagelets pertencentes a cada grupo. O algoritmoglobal Template Detection é mais sofisticado. O primeiro passo monta o conjunto dos shingles dos pagelets que ocorrem pelo menos duas vezes no conjunto de pagelets construído, aquele conjunto é chamado de T s. O segundo passo é extrair os pagelets que ocorrem no conjunto T s, o conjunto destes pagelets é chamado T c. A seguir, para cada shingle s T s, o algoritmo seleciona as páginas que contêm s. O conjunto destas páginas é chamado de G s. O próximo passo é achar os links entre as páginas de G s,
5 Capítulo 2. Pesquisa Bibliográfica 19 para cada s, estes links formam o conjunto T l. O próximo passo enumera os shingles em T s e para cada um carrega na memória todos os links entre páginas de G s. Finalmente, é utilizado um algoritmo BFS para obter as componentes conexas e não-direcionadas em G s. Cada componente é um template ou não. As componentes que são templates são retornadas como resultado. 2.2 Estratégias orientadas a páginas Uma técnica de extração de conteúdo relevante baseada em tags Lin e Ho em (LH02) apresentam um algoritmo para detectar conteúdo informativo em páginas de sites de notícias utilizando a estratégia orientada a página. Os autores também propõem que este algoritmo utilize a tag <TABLE> para particionar a página e separar o conteúdo da página em conteúdo informativo e conteúdo não informativo. Algumas tags, em particular, também são consideradas, como title, headings, <p>, <tr> e <td>. O algoritmo proposto em (LH02) se baseia na idéia que o conteúdo de uma página é estrutura de em tabelas. Portanto a idéia é localizar qual tabela possui o conteúdo desejado. O algoritmo proposto tem cinco fases. A primeira fase extrai blocos de conteúdo de uma página. Blocos de conteúdo fazem parte de uma estrutura primitiva de árvore, a qual é obtida por um parsing da página HTML baseado natag <TABLE>. Cadanóinternodestaestruturaindicaum blocode conteúdo que consiste de uma string, ou mais, do conteúdo como suas folhas. A segunda etapa extrai atributos dos blocos de conteúdo. Neste caso os atributos são as palavras sinificativas. As stop words não são incluídas. A terceira etapa calcula o valor da entropia dos atributos. O valor da entropia de um atributo é estimado de acordo com o peso da distribuição dos atributos aparecendo em um conjunto de páginas de um site. A quarta etapa estima a entropia dos blocos de conteúdo. A entropia de um bloco de conteúdo, chamada de H(CB), é a média de todas as entropias dos atributos do bloco. A última etapa classifica os blocos em informativo e não informativos. Se um bloco possui uma entropia H(CB) menor que um limiar então ele é informativo, caso contrário ele é não informativo. O limiar é determinado por uma estratégia gulosa, aplicada para um conjunto de páginas
6 Capítulo 2. Pesquisa Bibliográfica 20 Uma técnica de localização de conteúdo baseada em segmentação de página HTML Deng et. al descrevem um algoritmo, chamado de VIPS, em (CYWM03) paralocalização de conteúdoatravés dasegmentaçãodapágina em segmentos ou blocos. Um bloco é definido por Deng como uma estrutura semântica de uma página web. Neste algoritmo a árvore DOM é transformada em uma nova estrutura chamada de vision-based content structure (VCS). Esta estrutura também está na forma de árvore, onde cada nó é um bloco. Cada bloco consiste de um conjunto de nós DOM. A idéia é dividir a página em partes cujo conteúdoestejamrelacionados. A partição que possui o conteúdo relevante poderá ser então detectada. O processo que constrói um VCS tem três etapas principais: extração de blocos, detecção de separadores e a construção de uma estrutura de conteúdo. A extração dos blocos se inicia com o parsing das páginas. Em seguida cada nó DOM passa por uma avaliação, baseada em pistas visuais, para saber se ele forma um único bloco ou não. Se o nó DOM não forma um bloco então seus descendentes são processados da mesma maneira. Cada bloco extraído recebe uma pontuação chamada de DoC (Degree of Coherence) que mede o grau de coerência do bloco. Quando todos os blocos são extraídos na página eles são armazenados em um conjunto. Os separadores entre estes blocos são identificados e um peso é atribuído para cada separador baseado nas propriedades dos seus blocos vizinhos. A hierarquia do estilo de apresentação é construída baseada nestes separadores. Após a construção da hierarquia do estilo, o procedimento verifica se as folhas da VCS atendem ou não ao grau de granularidade requerida. Se não atendem ao grau de granularidade o procedimento tratacada folha como uma página e a segmenta. Após todos estes passos a VCS montada é retornada como saída Uma técnica de extração de templates baseado em aprendizado de máquina e suavização isotônica Chakrabarti et. al descrevem em (CKP07) um ambiente que foi construído com o intuito de extrair templates. O ambiente pode ser divididos em três passos: geração automática de dados de treino, classificação e suavização isotônica. A geração automática de dados de treinamento é feita utilizando a estratégia orientada a site. Para cada site, o algoritmo obtém aleatóriamente um conjunto de páginas P. Então para cada página p P e para cada nó
7 Capítulo 2. Pesquisa Bibliográfica 21 DOM n p, o hash h(n) do nó n é calculado. Em seguida o algoritmo constrói um conjunto de nós I α + que ocorrem em uma fração α de páginas em P. Para a etapa da classificação inicialmente os atributos dos nós do conjunto I α + são identificadas no contexto das páginas que elas aparecem. Um classificador é treinado usando os atributos escolhidos e tratando os nós do conjunto I α + como nós da classe templates, sabendo que existe a classe template e a classe não-template. Na última etapa os autores utilizaram um classificador de regressão logística (Mit97) que atribui uma probabilidade de cada nó ser template. A seguir uma suavização é aplicada na probabilidade de cada nó a fim de que a seguinte propriedade seja seguida, Um nó em uma árvore é um template se e somente se todos os seus filhos são templates. Após a suavização os templates podem ser enfim detectados Umatécnica de extração de conteúdo relevante baseada emaprendizado de máquina e atributos visuais Outro algoritmo que utilizou a estratégia orientada a página foi implementado por Zheng et. al (ZSW07). Nesta implementação os autores propõem uma estrutura de dados diferente de uma árvore DOM para capturar o conteúdo de páginas de notícias. Esta estrutura também possui a organização de uma árvore. Cada nó nesta estrutura, chamado de bloco visual, é um nó DOM cuja área é maior que zero ao ser renderizado em um navegador. Um bloco visual b 1 é pai de outro bloco b 2 caso não haja outro bloco, contido em b 1, que contém b 2. Após a construção da estrutura visual cada bloco tem seus atributos extraídos para treino ou teste. Os atributos extraídos são listados na Tabela 2.1. Veja na Figura 2.2 a seção de uma página de notícia. O nó que engloba o corpo na notícia é a tag <font>. Segue os valores dos atributos deste nó na estrutura de dados proposta em (ZSW07). Posição: x = 155, y = 240 e nível de aninhamento é 18. Formato da fonte: Tamanho da fonte é 13, não é negrito e não é itálico. Estatísticas: 0 imagens, 0 links, 1603 tamanho do texto, 0 parágrafos, 0 parágrafos itálicos, 3 parágrafos negritos e 0 tabelas.
8 Capítulo 2. Pesquisa Bibliográfica 22 Tabela 2.1: Atributos utilizados no algoritmo V-Wrapper Nome Descrição X Posição em relação ao eixo das abscissas, localizado no eixo superior do navegador. Y Posição em relação ao eixo das ordenadas, localizado no eixo esquerdo do navegador. Nível de aninhamento Quantos antecessores o bloco possui. Largura Largura do bloco. Altura Altura do bloco. Tamanho da fonte Tamanho da fonte do texto contido no bloco. Fonte em negrito Atributo booleano indicando se o texto do bloco é negrito. Fonte em itálico Atributo booleano indicando se o texto do bloco é itálico. Número de Imagens Número de imagens existentes na subárvore do bloco. Número de Links Número de links existentes na subárvore do bloco. Número de Parágrafos Número de tags <p> existentes na subárvore do bloco. Número de Parágrafos Negritos Número de tags <b> existentes na subárvore do bloco. Número de Parágrafos Itálicos Número de tags <i> existentes na subárvore do bloco. Número de Tabelas Número de tags <table> existentes na subárvore do bloco. Tamanho do texto Número de caracteres do texto contido na subárvore do bloco. Se for uma folha, o número de caracteres do texto contido nela. Largura relativa A razão do tamanho da largura do bloco pela largura do pai. Posição relativa Posição do bloco em relação ao eixo das ordenadas menos a posição do pai em relação ao eixo das ordenadas.
9 Capítulo 2. Pesquisa Bibliográfica 23 Figura 2.2: Exemplo dos atributos de blocos Estendidas: 1.0 é a razão da largura em relação ao pai e 0 é o deslocamento em relação ao pai considerando o eixo das ordenadas. Este nó é pai dos nós que contém o texto do corpo da notícia. Porém veja que alguns valores não são acumulativos, por exemplo se o texto do nó é negrito. Esses valores são inicializados nas folhas. Um exemplo é o nó folha <b>resultados da primeira etapa</b>, da Figura 2.2, que é negrito. Após a extração dos atributos acontece a fase de rotulação do conjunto de treino. Nesta fase os blocos que são folhas são rotulados de acordo com as seguintes classes: título, conteúdo e outros. Um nó pertence à primeira classe quando o texto nele contido é o título da notícia, um nó pertence à segunda classe quando o seu texto está contido no conteúdo da notícia e o último rótulo se aplica a nós cujo conteúdo não faz parte do título da notícia nem do conteúdo da notícia. Após os nós folhas serem rotulados, os nós internos são rotulados com as seguintes classes: Positivo e Negativo. Um nó é da classe Positivo quando pelo menos um de seus filhos é da classe título, conteúdo ou Positivo. Um nó é da classe Negativo quando todos seus filhos são da classe Negativo ou outros. Depois da rotulação do conjunto de dados os nós internos são separados em um conjunto B 1 e um classificador é treinado neste conjunto. Neste mesmo conjunto B 1 o classificador que foi treinado é aplicado. As folhas, cujo pai está em B 1 e foi classificado como Positivo, são separadas para construir um conjunto B 2. Um classificador é treinado neste conjunto B 2. Portanto a estratégia é constituída de dois classificadores, um para nós internos e outro para nós folhas.
10 Capítulo 2. Pesquisa Bibliográfica 24 Finalmente a última fase constituí-se da extração do conteúdo. Nesta fase o primeiro passo é classificar os nós internos do conjunto de dados. O algoritmo então percorre a estrutura de blocos procurando por folhas cujos pais foram classificados como Positivo. A busca para quando encontra uma folha, neste caso a folha é retornada como conteúdo, ou quando encontra um nó Negativo, neste caso não existe conteúdo para retornar. O segundo passo utiliza o classificador de folhas para rotular as classes das folhas selecionadas no primeiro passo. O resultado do segundo passo indica qual é o conteúdo a ser extraído da página de notícia.
4 Experimentos. 4.4 detalha os experimentos com os algoritmos V-Wrapper e NCE. 4.1
4 Experimentos A estratégia V-Wrapper descrita por Zheng et. al (ZSW07), resumida no Capítulo 2, foi implementada com a finalidade de comparar um método baseado em atributos visuais com o algoritmo proposto
Aula 5 - Classificação
AULA 5 - Aula 5-1. por Pixel é o processo de extração de informação em imagens para reconhecer padrões e objetos homogêneos. Os Classificadores "pixel a pixel" utilizam apenas a informação espectral isoladamente
Inteligência Artificial. Metodologias de Busca
Inteligência Artificial Metodologias de Busca 1 Solução de problemas como Busca Um problema pode ser considerado como um objetivo Um conjunto de ações podem ser praticadas para alcançar esse objetivo Ao
REPÓRTER ADVFN - ARTIGOS
REPÓRTER ADVFN - ARTIGOS T E M P O E S T I M A D O P A R A C O N C L U S Ã O : 1 5 M I N U T O S REQUISIÇÕES MÍNIMAS Ter uma conta gratuita no portal ADVFN. Você poderá fazer isto através do link http://br.advfn.com/p.php?pid=register.
PÓS-GRADUAÇÃO EM MATEMÁTICA COMPUTACIONAL INFORMÁTICA INSTRUMENTAL Aula 06: Introdução Linguagem HTML
PÓS-GRADUAÇÃO EM MATEMÁTICA COMPUTACIONAL INFORMÁTICA INSTRUMENTAL Aula 06: Introdução Linguagem HTML O Desenvolvimento Web O desenvolvimento web é o termo utilizado para descrever atividade relacionada
Desenvolvimento em Ambiente Web. HTML - Introdução
Desenvolvimento em Ambiente Web HTML - Introdução O que é HTML? HTML é uma linguagem para descrever a estrutura de uma página WEB. Ela permite: Publicar documentos online com cabeçalhos, texto, tabelas,
Introdução à Tecnologia Web HTML HyperText Markup Language XHTML extensible HyperText Markup Language Seção do Corpo Elementos Textuais Básicos
IntroduçãoàTecnologiaWeb HTML HyperTextMarkupLanguage XHTML extensiblehypertextmarkuplanguage SeçãodoCorpo ElementosTextuaisBásicos ProfªMSc.ElizabeteMunzlinger ProfªMSc.ElizabeteMunzlinger SeçãodoCorpo
INTRODUÇÃO AO DESENVOLVIMENTO WEB. PROFª. M.Sc. JULIANA H Q BENACCHIO
INTRODUÇÃO AO DESENVOLVIMENTO WEB PROFª. M.Sc. JULIANA H Q BENACCHIO Estrutura básica do HTML Um documento HTML deve estar delimitado pela tag e . Dentro deste documento, podemos ainda distinguir
Vejamos um exemplo. Vamos supor que queiramos montar uma tabela 3X2, ou seja de 3 colunas por 2 linhas, o código HTML para isso é :
TABELAS As tabelas são muito importantes para o designer de uma home-page. Com elas podese fazer alinhamentos que dificilmente seriam possíveis com simples comandos. A funcionalidade de uma tabela faz
Apresentação de Dados em Tabelas e Gráficos
Apresentação de Dados em Tabelas e Gráficos Os dados devem ser apresentados em tabelas construídas de acordo com as normas técnicas ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística
Prof.: Melba Lima Gorza Aula Introdutória de HTML. Componentes do HTML. Estrutura de um documento XHTML
Prof.: Melba Lima Gorza Aula Introdutória de HTML Componentes do HTML Estrutura de um documento XHTML primeiro Documento XHTML meu primeiro documento XHTML
Portal do Projeto Tempo de Ser
Sumário Portal do Projeto Tempo de Ser O que é um Wiki?...2 Documentos...2 Localizando documentos...3 Links...3 Criando um Documento...4 Criando um link...4 Editando um Documento...5 Sintaxe Básica...5
UNIPAMPA Universidade Federal do Pampa. Núcleo de Tecnologia da Informação (NTI)
UNIPAMPA Universidade Federal do Pampa Núcleo de Tecnologia da Informação (NTI) Instruções para gerenciamento dos sites em Joomla (versão 1.5.3) Níveis: Editor e Administrador Junho/2008 Í N D I C E Usuários
Prof. Daniela Barreiro Claro
Prof. Daniela Barreiro Claro SQL, SQL3 e OQL são linguagens declarativas O SGBD deve processar e otimizar estas consultas antes delas serem efetivamente executadas Uma consulta possui muitas estratégias
Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões
Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos
Memória cache. Prof. Francisco Adelton
Memória cache Prof. Francisco Adelton Memória Cache Seu uso visa obter uma velocidade de acesso à memória próxima da velocidade das memórias mais rápidas e, ao mesmo tempo, disponibilizar no sistema uma
Regras Métodos Identificadores Variáveis Constantes Tipos de dados Comandos de atribuição Operadores aritméticos, relacionais e lógicos
Lógica Aula 2 Técnicas de Programação Criando algoritmos Regras Métodos Identificadores Variáveis Constantes Tipos de dados Comandos de atribuição Operadores aritméticos, relacionais e lógicos Criando
Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados
1. Introdução O governo é um dos maiores detentores de recursos da informação. Consequentemente, tem sido o responsável por assegurar que tais recursos estejam agregando valor para os cidadãos, as empresas,
Recuperação de Informação
Recuperação de Informação Estrutura de Dados II Mariella Berger 1 Roteiro Tarefas de Recuperação de Informação Modelos de Recuperação de Documentos Modelo Booleano Modelo Espaço Vetorial Recuperação de
Figure 2 - Nós folhas de uma árvore binária representando caracteres ASCII
A ocorrência tamanho ASCII codificação de Huffman é um A Codificação método de compactação de Huffman caracteres (American e a variável codificação dos usado símbolos Standard para por cada muitas no Code
Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU
Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU Prof. Dr. Sergio Pilling (IPD/ Física e Astronomia) II Métodos numéricos para encontrar raízes (zeros) de funções reais. Objetivos:
TUTORIAL DO ASSISTENTE VIRTUAL (QUICK START)
TUTORIAL DO ASSISTENTE VIRTUAL (QUICK START) VERSÃO DO ASSISTENTE VIRTUAL: 1.3.1 POR ADS DIGITAL (WWW.ADSDIGITAL.COM.BR) 1 º Passo: Endereços do Assistente Virtual Para uso/perguntas código_cliente.adsdigital.com.br
4 Aplicativo para Análise de Agrupamentos
65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido
Gerenciamento de memória
Na memória principal ficam todos os programas e os dados que serão executados pelo processador. Possui menor capacidade e custo maior. S.O buscam minimizar a ocupação da memória e otimizar sua utilização.
LÓGICA DE PROGRAMAÇÃO. Vitor Valerio de Souza Campos
LÓGICA DE PROGRAMAÇÃO Vitor Valerio de Souza Campos Exemplos de algoritmos Faça um algoritmo para mostrar o resultado da multiplicação de dois números. Algoritmo em descrição narrativa Passo 1 Receber
Algoritmos Estruturas Seqüenciais. José Gustavo de Souza Paiva
Algoritmos Estruturas Seqüenciais José Gustavo de Souza Paiva 1 Introdução Objetivo básico da computação auxiliar os seres humanos em trabalhos repetitivos e braçais, diminuindo i i d esforços e economizando
Introdução. Capítulo. 1.1 Considerações Iniciais
Capítulo 1 Introdução 1.1 Considerações Iniciais A face humana é uma imagem fascinante, serve de infinita inspiração a artistas há milhares de anos. Uma das primeiras e mais importantes habilidades humanas
Manual do Usuário - ProJuris Web - Biblioteca Jurídica Página 1 de 20
As informações contidas neste documento estão sujeitas a alterações sem o prévio aviso, o que não representa um compromisso da Virtuem Informática. As pessoas, organizações ou empresas e eventos de exemplos
DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO Aluno: Rafael
Introdução à Tecnologia Web HTML HyperText Markup Language XHTML extensible HyperText Markup Language Estrutura Básica do Documento HTML
IntroduçãoàTecnologiaWeb HTML HyperTextMarkupLanguage XHTML extensiblehypertextmarkuplanguage EstruturaBásicadoDocumentoHTML ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br ProfªMSc.ElizabeteMunzlinger
Aula 2: Listas e Links
Aula 2: Listas e Links Nesta segunda aula, você aprenderá a utilizar listas numeradas ou não, a entender o que são listas de definições e como fazer referências a outros documentos. Vamos entender a diferença
JavaScript (ou JScript)
1. Introdução JavaScript (ou JScript) Uma linguagem como o JavaScript permite criar interfaces interativas na web (permite a interação do usuário). Para desenvolver web sites interativos precisamos de
5 Extraindo listas de produtos em sites de comércio eletrônico
5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl
Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001
47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações
Manual de Publicação Wordpress
Fundação Universidade Federal de Mato Grosso do Sul Manual de Publicação Wordpress Núcleo de Tecnologia da Informação - UFMS Maurílio Mussi Montanha 2014 Sumário 1 Introdução... 3 2 ACESSO À INTERFACE
Classificação de Imagens
Universidade do Estado de Santa Catarina Departamento de Engenharia Civil Classificação de Imagens Profa. Adriana Goulart dos Santos Extração de Informação da Imagem A partir de uma visualização das imagens,
Complexidade de Algoritmos
Complexidade de Algoritmos Complexidade de Algoritmos Envolvendo Estruturas de Dados Elementares Prof. Osvaldo Luiz de Oliveira Estas anotações devem ser complementadas por apontamentos em aula. Vetor
INSTITUTO CAMPINENSE DE ENSINO SUPERIOR FACULDADE MAURÍCIO DE NASSAU CURSO DE ENFERMAGEM. NOME DOS ALUNOS (equipe de 4 pessoas) TÍTULO DO PROJETO
1 INSTITUTO CAMPINENSE DE ENSINO SUPERIOR FACULDADE MAURÍCIO DE NASSAU CURSO DE ENFERMAGEM NOME DOS ALUNOS (equipe de 4 pessoas) TÍTULO DO PROJETO CAMPINA GRANDE-PB 2014 2 NOME DOS ALUNOS (equipe de 4
Tutorial de Acesso ao AVA - Ambiente Virtual de Aprendizagem e-learning Consinco. Agosto 2015, versão 1
Tutorial de Acesso ao AVA - Ambiente Virtual de Aprendizagem e-learning Consinco Agosto 2015, versão 1 Consinco e-learning O Que é? Como Acessar? O Consinco e-learning é o portal de Ensino a Distância
Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística
Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa
COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO. Versão 1.0
COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO Versão 1.0 2015 SUMÁRIO 1. O MOODLE 3 2. Acesso à Plataforma 3 2.1. Cadastrar-se em uma disciplina 4 2.2. Página Inicial do Curso 5 3.
Notas de Cálculo Numérico
Notas de Cálculo Numérico Túlio Carvalho 6 de novembro de 2002 2 Cálculo Numérico Capítulo 1 Elementos sobre erros numéricos Neste primeiro capítulo, vamos falar de uma limitação importante do cálculo
Guia de Acesso ao AVA. Ms. Eng. Claudio Ferreira de Carvalho
Guia de Acesso ao AVA Ms. Eng. Claudio Ferreira de Carvalho Introdução Este guia apresenta os procedimentos iniciais para acessar o AVA (Ambiente Virtual de Aprendizagem), que será utilizado para as disciplinas
Autoria Web HTML. Introdução a HTML e as principais tags da linguagem. Thiago Miranda dos Santos Souza
HTML Introdução a HTML e as principais tags da linguagem Conteúdos Os materiais de aula, apostilas e outras informações estarão disponíveis em: www.thiagomiranda.net Objetivos Apresentar a HTML Apresentar
Para o OpenOffice Impress, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides.
OPENOFFICE IMPRESS 1. O QUE É UMA APRESENTAÇÃO Para o OpenOffice Impress, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides. Em cada slide podemos ter vários elementos
Unidade 5: Sistemas de Representação
Arquitetura e Organização de Computadores Atualização: 9/8/ Unidade 5: Sistemas de Representação Números de Ponto Flutuante IEEE 754/8 e Caracteres ASCII Prof. Daniel Caetano Objetivo: Compreender a representação
Trabalho de Implementação Jogo Reversi
Trabalho de Implementação Jogo Reversi Paulo Afonso Parreira Júnior {[email protected]} Rilson Machado de Olivera {[email protected]} Universidade Federal de Lavras UFLA Departamento de Ciência da
Administrando um curso em Moodle (1.6.5+)
Administrando um curso em Moodle (1.6.5+) Athail Rangel Pulino 2 Ficha Técnica Título Administrando um curso em Moodle Autor Athail Rangel Pulino Filho Copyright Creative Commons Edição Agosto 2007 Administrando
Agência Nacional de Energia Elétrica ANEEL
Agência Nacional de Energia Elétrica ANEEL Superintendência de Gestão Técnica da Informação SGI Superintendência de Fiscalização Econômica e Financeira SFF MANUAL DE INSTRUÇÃO PARA ELABORAÇÃO E ENVIO DE
Introdução. Uso do disco Vantagens Desvantagens Baixo custo, facilidade de manutenção do software e do hardware, simetria e flexibilidade
Introdução É sabido que os processos rodam em processadores. Nos sistemas tradicionais existe somente um único processador, de forma que não há dúvida a respeito de como ele deve ser usado. Em um sistema
Manual de Utilizador. Caderno. Recursos da Unidade Curricular. Gabinete de Ensino à Distância do IPP. http://eweb.ipportalegre.pt. ged@ipportalegre.
Manual de Utilizador Caderno Recursos da Unidade Curricular Gabinete de Ensino à Distância do IPP http://eweb.ipportalegre.pt [email protected] Índice RECURSOS... 1 ADICIONAR E CONFIGURAR RECURSOS...
Optimização de um Mundo Virtual
secção 3.2 Optimização de um Mundo Virtual Dadas as limitações impostas pela actual tecnologia, um mundo virtual que não seja cuidadosamente optimizado torna-se necessariamente demasiado lento para captar
Trabalho 7 Fila de prioridade usando heap para simulação de atendimento
Trabalho 7 Fila de prioridade usando heap para simulação de atendimento Data: 21/10/2013 até meia-noite Dúvidas até: 09/10/2013 Faq disponível em: http://www2.icmc.usp.br/~mello/trabalho07.html A estrutura
Capítulo 4 Gerenciamento de Memória
Capítulo 4 Gerenciamento de Memória 4.1 Gerenciamento básico de memória 4.2 Troca de processos 4.3 Memória virtual 4.4 Algoritmos de substituição de páginas 4.5 Modelagem de algoritmos de substituição
Quem sou eu? Ana Paula Alves de Lima. Formação: E-mail: [email protected]
Introdução a Linguagem HTML: Conceitos Básicos e Estrutura ANA PAULAALVES DE LIMA INFORMÁTICA E METODOLOGIA - SUBSEQUENTE 1 Quem sou eu? Ana Paula Alves de Lima Formação: Bacharel em Sistemas de Informação;
TÉCNICAS DE PROGRAMAÇÃO
TÉCNICAS DE PROGRAMAÇÃO (Adaptado do texto do prof. Adair Santa Catarina) ALGORITMOS COM QUALIDADE MÁXIMAS DE PROGRAMAÇÃO 1) Algoritmos devem ser feitos para serem lidos por seres humanos: Tenha em mente
Memória - Gerenciamento. Sistemas Operacionais - Professor Machado
Memória - Gerenciamento Sistemas Operacionais - Professor Machado 1 Partes físicas associadas à memória Memória RAM Memória ROM Cache MMU (Memory Management Unit) Processador Tabela de Páginas TLB 2 Conceitos
Arquitetura de processadores: RISC e CISC
Arquitetura de processadores: RISC e CISC A arquitetura de processador descreve o processador que foi usado em um computador. Grande parte dos computadores vêm com identificação e literatura descrevendo
Disciplina Técnicas de Modelagem
T É C N I C A 3 MODELAGEM CONCEITUAL GENERALIZAÇÃO/ESPECIALIZAÇÃO, AGREGAÇÃO E COMPOSIÇÃO Generalização/Especialização Herança é o termo em orientação a objetos que se refere à criação de novas classes
CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word 2010. Sumário
CADERNO DE INFORMÁTICA FACITA Faculdade de Itápolis Aplicativos Editores de Texto WORD 2007/2010 Sumário Editor de texto... 3 Iniciando Microsoft Word... 4 Fichários:... 4 Atalhos... 5 Área de Trabalho:
LIVRO ENGENHARIA DE SOFTWARE FUNDAMENTOS, MÉTODOS E PADRÕES CAPÍTULO ATIVIDADES, PAG. 138 A 150
LIVRO ENGENHARIA DE SOFTWARE FUNDAMENTOS, MÉTODOS E PADRÕES WILSON PADUA PAULA FILHO CAPÍTULO ATIVIDADES, PAG. 138 A 150 1 ANÁLISE ESTRUTURAL IDENTIFICAR AS CLASSES ORGANIZAR AS CLASSES IDENTIFICAR RELACIONAMENTOS
Índice. 5. Editar as seções de um curso 6. Estruturar o curso 7. Publicar o curso 8. Resumo do Fluxo de criação de um curso no educommons
Manual do Professor Índice 1. Selecionar a categoria na qual incluir o curso 2. Adicionar um curso novo 3. Importar o template do curso 4. Fazer upload de conteúdos do novo curso para a plataforma 4.1.
Algoritmos e Estruturas de Dados I 01/2013. Estruturas Condicionais e de Repetição (parte 2) Pedro O.S. Vaz de Melo
Algoritmos e Estruturas de Dados I 01/2013 Estruturas Condicionais e de Repetição (parte 2) Pedro O.S. Vaz de Melo Problema 1 Suponha que soma (+) e subtração (-) são as únicas operações disponíveis em
Edital N.º 11/PROAD/SGP/2015 e complementares
Edital N.º 11/PROAD/SGP/2015 e complementares Nome do Candidato Número de Inscrição - Assinatura do Candidato Secretaria de Articulação e Relações Institucionais Gerência de Exames e Concursos I N S T
CRUZAMENTO DE VARIÁVEIS, ANÁLISE BIVARIADA E GRÁFICOS
Sphinx APRENDIZ - p.201 8 ANÁLISES CRUZADAS E MÚLTIPLAS CRUZAMENTO DE VARIÁVEIS, ANÁLISE BIVARIADA E GRÁFICOS O sistema permite que sejam feitos cruzamentos dos mais diversos tipos de variáveis. Os cruzamentos,
MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas [email protected]
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas [email protected] Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
UTILIZANDO RECURSOS E ATIVIDADES NO MOODLE
UTILIZANDO RECURSOS E ATIVIDADES NO MOODLE Luanna Azevedo Cruz Polyana Ribas Bernardes 2015 2015 1. INTRODUÇÃO Para utilizar as funcionalidades acesse o Moodle: http://moodle.ead.ufvjm.edu.br/ e clique
paradigma WBC Public - compra direta Guia do Fornecedor paradigma WBC Public v6.0 g1.0
paradigma WBC Public - compra direta Guia do Fornecedor paradigma WBC Public v6.0 g1.0 agosto de 2007 As informações contidas neste documento, incluíndo quaisquer URLs e outras possíveis referências a
Para o PowerPoint, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides.
POWERPOINT 1. O QUE É UMA APRESENTAÇÃO Para o PowerPoint, assim como para vários softwares de apresentação, uma apresentação é um conjunto de slides. Em cada slide podemos ter vários elementos ou objetos
L 276/4 PT Jornal Oficial da União Europeia. DECISÃO N. o 190. de 18 de Junho de 2003
L 276/4 PT Jornal Oficial da União Europeia DECISÃO N. o 190 de 18 de Junho de 2003 relativa às características técnicas do cartão europeu de seguro de doença (Texto relevante para efeitos do EEE e do
- Aulas 57, 58, 59 e 60 - Técnicas de programação. Funções
1 - Aulas 57, 58, 59 e 60 - Técnicas de programação. Funções Um programa pode possuir determinados processos realizados repetidas vezes ao longo da execução do programa. Estes processos podem se agrupar
Aula de JavaScript 05/03/10
Objetos Sabe-se que variável são contêiners que podem armazenar um número, uma string de texto ou outro valor. O JavaScript também suporta objetos. Objetos são contêiners que podem armazenar dados e inclusive
Programação Web. Professor: Diego Oliveira. Conteúdo 02: JSP e Servlets
Programação Web Professor: Diego Oliveira Conteúdo 02: JSP e Servlets JSP JSP é um template de uma página Web que usa Java para gerar HTML dinamicamente JSP é considerado server-side e roda em um objeto
Sumário. 1. Instalando a Chave de Proteção 3. 2. Novas características da versão 1.3.8 3. 3. Instalando o PhotoFacil Álbum 4
1 Sumário 1. Instalando a Chave de Proteção 3 2. Novas características da versão 1.3.8 3 3. Instalando o PhotoFacil Álbum 4 4. Executando o PhotoFacil Álbum 9 3.1. Verificação da Chave 9 3.1.1. Erro 0001-7
Manual do Publicador. Wordpress FATEA Sistema de Gerenciamento de Conteúdo Web
Manual do Publicador Wordpress FATEA Sistema de Gerenciamento de Conteúdo Web Sumário Painel de Administração... 3 1 - Inserção de post... 5 2 Publicação de post com notícia na área headline (galeria de
Gerência do Sistema de Arquivos. Adão de Melo Neto
Gerência do Sistema de Arquivos Adão de Melo Neto 1 Gerência do Sistema de Arquivos Organização dos arquivos Estrutura de diretório Gerência de espaço livre Gerência de alocação de espaços em disco Proteção
Processamento Digital de Imagens
Processamento Digital de Imagens Israel Andrade Esquef a Márcio Portes de Albuquerque b Marcelo Portes de Albuquerque b a Universidade Estadual do Norte Fluminense - UENF b Centro Brasileiro de Pesquisas
Introdução. Introdução a HTML. A Linguagem HTML. Estrutura de uma Página. Mário Antonio Meireles Teixeira
Introdução Introdução a HTML Mário Antonio Meireles Teixeira Dept o. de Informática - UFMA [email protected] Página Web: É um documento composto de texto e códigos especiais, chamados tags, que especificam
3.1 Definições Uma classe é a descrição de um tipo de objeto.
Unified Modeling Language (UML) Universidade Federal do Maranhão UFMA Pós Graduação de Engenharia de Eletricidade Grupo de Computação Assunto: Diagrama de Classes Autoria:Aristófanes Corrêa Silva Adaptação:
Extração de conteúdo em páginas da web
Departamento de Informática Extração de conteúdo em páginas da web Aluno: Pedro Lazéra Cardoso Orientador: Eduardo Sany Laber Antecedentes Na primeira fase da Iniciação Científica, foi realizado um estudo
* Técnicas Avançadas. Desenvolvimento de SOFTWARES. Sistemas de Gerenciamento de Conteúdo com Joomla e Magento
* Técnicas Avançadas Desenvolvimento de SOFTWARES Sistemas de Gerenciamento de Conteúdo com Joomla e Magento * Tópicos Sistema de Gerenciamento de Conteúdo CMS. Fron-end Back-end Instalando Site e Lojas
Manual do Aluno para o Curso do SEER à Distância
Manual do Aluno para o Curso do SEER à Distância Elaborado por: Alexandre Faria de Oliveira Consultor TI / Monitor Colaborador: Dr.Miguel Ángel Márdero Arellano Coordenador SEER - IBICT Brasília, 2011
5 Instrução e integração
SEÇÃO 5 Instrução e integração no meio de trabalho Quando um novo funcionário entra para uma organização, é importante que ele receba um bom apoio para entender sua função e a organização. Instrução é
Do neurônio biológico ao neurônio das redes neurais artificiais
Do neurônio biológico ao neurônio das redes neurais artificiais O objetivo desta aula é procurar justificar o modelo de neurônio usado pelas redes neurais artificiais em termos das propriedades essenciais
O ENSINO DE CÁLCULO NUMÉRICO: UMA EXPERIÊNCIA COM ALUNOS DO CURSO DE CIÊNCIA DA COMPUTAÇÃO
O ENSINO DE CÁLCULO NUMÉRICO: UMA EXPERIÊNCIA COM ALUNOS DO CURSO DE CIÊNCIA DA COMPUTAÇÃO Prof. Leugim Corteze Romio Universidade Regional Integrada URI Campus Santiago-RS [email protected] Prof.
Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008
Tabela de Símbolos Análise Semântica A Tabela de Símbolos Fabiano Baldo Após a árvore de derivação, a tabela de símbolos é o principal atributo herdado em um compilador. É possível, mas não necessário,
Aula 4 Estatística Conceitos básicos
Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a
UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS
UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS Obter uma imagem temática a partir de métodos de classificação de imagens multi- espectrais 1. CLASSIFICAÇÃO POR PIXEL é o processo de extração
TRANSFORMADORES. P = enrolamento do primário S = enrolamento do secundário
TRANSFORMADORES Podemos definir o transformador como sendo um dispositivo que transfere energia de um circuito para outro, sem alterar a frequência e sem a necessidade de uma conexão física. Quando existe
Especificação do Trabalho Prático
Especificação do Trabalho Prático O professor Thomas é um homem muito ocupado. Tem, em sua agenda, uma série de compromissos que ele deve atender em 2009. De tantos compromissos que tem, resolveu contratar
MULTIACERVO Implementações da versão 20-1
Data: Janeiro / 2015 Recurso pop-up O pop-up é um recurso que abre uma nova janela sem sair da tela original. Isto é interessante pois permite complementar uma informação e permanecer no ponto original,
Superintendência Regional de Ensino de Ubá - MG Núcleo de Tecnologia Educacional NTE/Ubá. LibreOffice Impress Editor de Apresentação
Superintendência Regional de Ensino de Ubá - MG Núcleo de Tecnologia Educacional NTE/Ubá LibreOffice Impress Editor de Apresentação Iniciando o Impress no Linux Educacional 4 1. Clique no botão 'LE' no
Chaves. Chaves. O modelo relacional implementa dois conhecidos conceitos de chaves, como veremos a seguir:
Chaves 1 Chaves CONCEITO DE CHAVE: determina o conceito de item de busca, ou seja, um dado que será empregado nas consultas à base de dados. É um conceito lógico da aplicação (chave primária e chave estrangeira).
