Criando um modelo para extração terminológica automática

Tamanho: px
Começar a partir da página:

Download "Criando um modelo para extração terminológica automática"

Transcrição

1 UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL Instituto de Informática Departamento de Informática Aplicada INF Tópicos Especiais em Computação I - Mineração de Dados Professor: Paulo Martins Engel Criando um modelo para extração terminológica automática Carlos Eduardo Ramisch Daniel Emilio Beck Números: / Porto Alegre, 3 de julho de 2009

2 1 O Problema O Processamento de Linguagem Natural estuda o tratamento computacional dado à linguagem humana, ou seja, de que forma o computador interpreta informações expressas em português ou em inglês. Um dos problemas dessa área diz respeito à cobertura dos dicionários empregados pelos sistemas, os quais não contém entradas suficientes para cobrir, por exemplo, termos específicos às diversas áreas do conhecimento. Por isso mesmo, foram desenvolvidos métodos para o aprendizado automático de unidades lexicais a partir de corpora (conjuntos de textos) especializados e especificamente anotados para esse fim. Em lingüística tradicional, a contrapartida da aquisição lexical automática chama-se terminografia, e trata da construção manual de glossários e dicionários especializados. O problema abordado por esse trabalho tem por foco a classificação automática de seqüências de palavras, ou seja, de multi-palavras, em duas classes: termo multi-palavras (MWT) ou seqüência aleatória (NonMWT). Por exemplo, dadas as seqüências sistema operacional e sistema preferido, é desejado inferir de forma automática que a primeira é um termo específico em ciência da computação, cujo conceito representado é delimitado de forma não-ambígua, enquanto o segundo é apenas uma combinação randômica de um substantivo com um adjetivo. A metodologia empregada consiste em utilizar um conjunto de dados anotados por especialistas de determinada área do conhecimento para aprender modelos que permitam (a) prever a classe de uma nova instância, agilizando o trabalho de terminógrafos e terminólogos e (b) descrever (para melhor compreender) os fenômenos lingüísticos que permitem a uma combinação qualquer de palavras de receber o estatuto de termo. Para cada instância, um conjunto de atributos é calculado com base nas suas freqüências de ocorrência e de medidas que estimam a força da associação entre as suas palavras. Nesse trabalho, usar-se-á o termo candidato a termo e instância como sinônimos. Através da ferramenta de mineração e análise de dados WEKA, pretende-se avaliar um conjunto de algoritmos de aprendizado de máquina. A avaliação será realizada sobre uma parte específica para testes, separada do restante dos dados para esse fim. Para mensurá-la, será levada em conta a acurácia (precisão e cobertura por classe) dos classificadores ou dos agrupamentos aprendidos sobre os dados de treinamento. Os atributos usados não são lexicalizados, ou seja, as palavras que compõem uma instância não são levadas em conta, mas apenas as medidas de associação e o padrão de classes morfológicas seguido pelo candidato. Dessa forma, os modelos aprendidos tornam-se independentes da língua ou do domínio em questão, podendo ser aplicados a diversas configurações sem a necessidade de anotação adicional. Esse fato é uma grande vantagem visto que a anotação manual de candidatos é uma tarefa bastante onerosa e que seu reaproveitamento através de modelos suficientemente genéricos poderia diminuir ou eliminar esse custo. Dois tipos de aplicação são podem ser considerados para esses modelos: criação de dicionários e desenvolvimento de sistemas de PLN. O primeiro é um dos 1

3 objetivos dos profissionais em terminologia e, por se tratar de um trabalho dispendioso, poderia ter amplos benefícios através do ganho de tempo proporcionado pela identificação (semi-)automática de terminologias. O último é importante na adaptação de recursos lingüístico-computacionais para domínios específicos, por exemplo, para que um sistema de tradução automática tenha desempenho razoável sobre um conjunto de textos de direito ambiental, será necessário que o dicionário do sistema contenha entradas para um grande número de termos que descrevem as leis e os crimes do meio-ambiente. 2 Conjunto de dados Para o trabalho descrito, foi utilizado um corpus de domínio biomédico, o GE- NIA. Esse corpus é composto por resumos de artigos da área biomédica, onde os termos existentes foram anotados manualmente por especialistas. O trabalho consiste em extrair candidatos a termos, filtrá-los através de aprendizado de máquina e, então, avaliar os resultados através da comparação com o conjunto de termos anotados. Para isso, é construída uma base de dados utilizando o seguinte algoritmo: O corpus é rotulado, ou seja, cada palavra é associada à sua função morfossintática (substantivo, verbo, etc.). A lista de candidatos é criada, extraindo-se do corpus sequências de palavras que sigam determinados padrões morfossintáticos, como por exemplo seqüências de dois substantivos, substantivos seguidos de adjetivos, etc. Para cada candidato, obtêm-se sua frequência no corpus GENIA e na Web (utilizando o Yahoo). Medidas estatísticas são calculadas, utilizando a informação de frequência, conforme descrito abaixo. No trabalho, foram utilizadas as medidas prob, PMI, teste t e Dice; Constrói-se a base de dados, utlizando o padrão morfossintático, as medidas e a informação de classe (retirada da anotação manual) Para cada candidato w 1...w n e para cada corpus de tamanho N, a freqüência simples f (w 1...w n ) e as freqüências marginais f (w 1 )... f (w n ) são usadas para calcular as medidas abaixo: 2

4 prob = f (w 1...w n ) N f (w 1...w n ) PMI =log 2 N n 1 f /0 (w 1...w n ) t = f (w 1...w n ) N n 1 f /0 (w 1...w n ) f (w1...w n ) Dice = n f (w 1...w n ) n i=1 f (w i) (Estimativa de Máxima Verossimilhança) (Informação mútua pontual) (Teste t de Student) (Coeficiente de Dice) Em resumo, cada instância da base gerada corresponde a determinada seqüência de palavras e consiste em uma tupla contendo nove atributos preditivos e um atributo de classe. As palavras que compõem o candidato não são usadas como atributo de classificação para manter os modelos tão independentes de língua e de domínio quanto possível. Para fins de avaliação, separou-se candidatos para teste (correspondente aos últimos 100 resumos do corpus) enquanto o restante dos dados, ou seja, instâncias, foram usadas para treinar os modelos. A distribuição inicial é 37,15% de instâncias positivas no conjunto de treinamento e 24,16% de instâncias positivas no conjunto de teste. Os atributos usados, bem como seus tipos, são: Padrão POS - nominal Probabilidade (GENIA) - numérico PMI (GENIA) - numérico Teste T (GENIA) - numérico Dice (GENIA) - numérico Probabilidade (Web) - numérico PMI (Web) - numérico Teste T (Web) - numérico Dice (Web) - numérico ismwt - atributo nominal de avaliação, valores MWT ou NonMWT 3

5 3 Modelos baseados em classificação Para avaliar os diversos algoritmos de aprendizado testados, existem três dimensões possíveis. Primeiramente, gostaria-se que o desempenho geral do algoritmo fosse bom, ou seja, a quantidade de instâncias classificadas corretamente deve ser alta. Em segundo lugar, pode-se avaliar a acurácia dos algoritmos sobre cada classe. Aqui, no entanto, os dados não são balanceados de forma que os algoritmos, de maneira, geral, tendem a classificar os candidatos como NonMWT quando estão em dúvida, simplismente porque a probabilidade dessa classe é maior. Por isso, a segunda avaliação realizada leva em conta a acurácia apenas sobre a classe MWT, que é também aquela que mais interessa para as aplicações que venham a utilizar os modelos gerados. Finalmente, avalia-se o tempo gasto por cada um dos algoritmos para construir o modelo. 3.1 Algoritmos testados Os algoritmos usados podem ser divididos em dois sub-grupos: algoritmos simbólicos, baseados em regras de decisão, e algoritmos numéricos. Entre os primeiros, testou-se o aprendizado baseado em instâncias através do algoritmo dos K vizinhos mais próximos, chamado IBk no WEKA. Testou-se também um algoritmo de construção de árvore de decisão, o J48. Finalmente, o algoritmo JRip, que funciona por aprendizado de regras, foi testado, pois o algoritmo Prism não permite atributos numéricos. Dada a natureza essencialmente numérica dos atributos usados, testou-se um maior número de algoritmos numéricos com diversos parâmetros. Três deles pertencem à família do aprendizado Bayesiano, incluindo os algoritmos NaiveBayes e BayesNet. Com relação ao último, que constrói uma rede Bayesiana para modelar os dados e em seguida utiliza um algoritmo de busca heurística para maximizar a probabilidade das classes, variou-se a heurística de busca utilizada entre a árvore de cobertura mínima (spanning tree, chamada TAN no WEKA) e o algoritmo de busca por Simulated Annealing (SA). Diversos parâmetros foram tentados para o algoritmo de redes neurais de perceptron multicamadas (MLP). Primeiro, usou-se os parâmetros default do WEKA, que estabelece, entre outros, um número automático de neurônios na camada oculta. Depois, tentou-se um número fixo de neurônios na camada oculta (50) com uma taxa de treinamento menor (0.1) e um número maior de épocas de treinamento (1000). Por fim, a mesma configuração porém com 100 neurônios na camada oculta, foi tentada. Adicionalmente, avaliou-se um algoritmo simplificado de aprendizagem, chamado Voted Perceptron (VP). Finalmente, usou-se máquinas de vetor de suporte (SVM). O algoritmo de aprendizado para as máquinas de vetor de suporte realiza uma otimização escolhendo uma fronteira de decisão com distância máxima entre determinadas instâncias limítrofes, chamadas vetores de suporte. A forma da fronteira de decisão é um parâmetro do algoritmo, e corresponde a uma família de funções. Na avalia- 4

6 Algoritmo Instâncias corretas IBk 65.0% J % Jrip 74.9% NaiveBayes 26.1% BayesNet (busca SA) 76.5% BayesNet (busca TAN) 75.4% MLP h % MLP h % MLP default 75.6% Voted Perceptron 64.2% SVM (kernel polinomial) 63.2% SVM (kernel radial) 76.7% Tabela 1: Porcentagem de instâncias corretamente classificadas para cada algoritmo indica o desempenho global do mesmo. ção aqui realizada, usou-se dois tipos de funções de núcleo (kernel), polinomiais e radiais. 3.2 Avaliação global A tabela 3.2 mostra uma avaliação do desempenho de cada um dos algoritmos e parâmetros testados, medido através da proporção de instâncias classificadas corretamente. Apesar de a acurácia em uma das classes ser mais importante do que em outra, essa medida fornece uma idéia geral do desempenho dos algoritmos. No entanto, vale lembrar que a proporção inicial de candidatos da classe NonMWT é igual a 75,84%, portanto um algoritmo ignorante que classifique todas as instâncias com o mesmo rótulo de classe poderia ser considerado bom se apenas essa medida de avaliação fosse considerada. Os resultados mostram que, entre os métodos simbólicos, a árvore de decisão se sai melhor do que os demais algoritmos, superando em 10% o algoritmo IBk, que tem baixo desempenho. Esse resultado era esperado e ilustra uma das razões pelas quais os modelos de árvore de decisão são bastante populares em problemas de mineração de dados. No entanto, modelos numéricos são superiores à árvore de decisão, como se pode observar para ambos os tipos de rede Bayesiana. Apesar de o algoritmo Naive Bayes apresentar um desempenho baixíssimo, os algoritmos que realizam a busca na rede Bayesiana se saem bem, com destaque para a busca por Simulated Annealing. Os resultados dos testes para as redes neurais são bastante surpreendentes, pois ao que parece um número maior de neurônios na camada oculta pode gerar resultados piores, como se pode ver quando se compara as configurações h100 e h50. O 5

7 Algoritmo Precisão Cobertura F-measure Ibk 33.7% 46.4% 39.0% J % 19.7% 27.9% Jrip 46.1% 24.1% 31.7% NaiveBayes 23.3% 90.0% 37.1% BayesNet (busca SA) 52.4% 28.9% 37.2% BayesNet (busca TAN) 48.6% 32.1% 38.6% MLP h % 8.3% 13.2% MLP h % 4.9% 8.8% MLP default 27.3% 0.5% 1.0% Voted Perceptron 36.3% 63.8% 46.3% SVM (kernel polinomial) 34.9% 60.1% 44.1% SVM (kernel radial) 52.6% 35.4% 42.3% Tabela 2: que pode estar ocorrendo aí é um superaprendizado dos dados (overfit), de forma que o modelo aprendido generalize mal as observações pertencentes ao conjunto de treinamento. O algoritmo Voted Perceptron tem baixo desempenho com relação aos algoritmos mais simplificados, que realizam a propagação reversa dos pesos sobre a rede. Finalmente, o melhor desempenho global foi obtido com uma SVM de kernel radial, com desempenho ligeiramente superior ao algoritmo ignorante suposto acima. A máquina que utiliza fronteiras de decisão polinomiais se sai mal, com o segundo menor desempenho da tabela. No entanto, conforme esboçado anteriormente, é necessário encontrar uma maneira mais fina de avaliar os algoritmos, pois os dados desbalanceados fazem com que um algoritmo ignorante se saia tão bem, em número de instâncias classificadas corretamente, quanto um algoritmo sofisticado de aprendizado real. Um baixo desempenho global significa que o algoritmo é ruim, no entanto um alto desempenho global não é necessariamente ligado a um bom algoritmo. Dessa forma, exceto pelo algoritmo Naive Bayes, todos os algoritmos parecem aceitáveis. Por isso, a próxima seção explora a avaliação através da acurácia na classe minoritária, ou seja, os candidatos que realmente pertencem à classe dos MWT. 3.3 Acurácia da classe MWT O desempenho dos algoritmos de aprendizado de máquina é apresentada na tabela 2. Apenas a acurácia da classe MWT é mostrada, pois, como os dados não são balanceados, a classe NonMWT possui acurácia superior a 80% para todos os algoritmos. Os mesmos dados também foram plotados em forma de gráfico de barras na figura 1, em que a precisão e o recall possuem tons de cinza enquanto sua média harmônica, a f-measure, está destacada em azul por sumarizar as informações presentes 6

8 Figura 1: Representação gráfica da acurácia dos algoritmos de aprendizado testados nas outras duas barras. Curiosamente, a situação dos algoritmos simbólicos se inverte aqui: a pior F- measure é obtida pela árvore de decisão enquanto o algoritmo dos N vizinhos mais próximo é aquele que se sai melhor. A deficiência principal do algoritmo J48 é seu baixo recall, algo que poderia ser tolerado em certos casos porém acaba diminuindo bastante sua f-measure. No entanto, o desempenho dos três algoritmos pode ser bastante melhorado com o uso de modelos mais sofisticados ou baseados em distribuições de probabilidades. A vantagem de modelos simbólicos é, além do baixo custo computacional, o fato de que eles geram um modelo de dados facilmente interpretável (e.g. uma árvore com 484 nodos). É fácil perceber, por exemplo, que os atributos mais próximos da raiz (mais importantes) são os testes t nos dois corpora, enquanto o menos importante parece ser o padrão morfológico, geralmente nas folhas da árvore. O problema desse e da maioria dos outros algoritmos é considerar que ambas as classes possuem o mesmo peso, levando a um baixo desempenho sobre a classe MWT. Nesse sentido, o aprendizado através da rede Bayesiana é mais eficiente, sobretudo com a busca por árvore de dispersão mínima (TAN) ao invés de Simmulated Annealing, mais uma vez contrariando os resultados anteriores. A cobertura de ambos ainda é decepcionante e os métodos sofrem do mesmo problema que os algoritmos simbólicos, isto é, dão igual importância a ambas as classes. 7

9 Algoritmo Tempo (em segundos) IBk 0.02 J Jrip NaiveBayes 1.14 BayesNet (busca SA) (5,6 minutos) BayesNet (busca TAN) 2.69 MLP h (9 horas) MLP h (4,5 horas) MLP default (1,5 horas) Voted Perceptron (7,2 minutos) SVM (kernel polinomial) (2,8 horas) SVM (kernel radial) Desconhecido Tabela 3: Custo computacional em termos de tempo total de processamento na criação de cada modelo. A rede neural multi-camadas com 33 1 neurônios ocultos tem um desempenho muito ruim: captura apenas 5% dos candidatos positivos. O algoritmo Voted Perceptron (VP), apesar de mais simples do que os MLPs, tem desempenho surpreendentemente alto, com larga cobertura dos candidatos positivos. Esse foi o melhor desempenho obtido entre os algoritmos testados, apesar de que a proporção de instâncias bem classificadas é menor do que nos demais, mostrando que de alguma forma o algoritmo parece funcionar bem mesmo para dados não balanceados. Após o VP, os melhores resultados foram obtidos com algoritmos de máquinas de vetor de suporte com núcleo polinomial e radial. Cada uma das configurações testandas privilegia um dos aspectos: a primeira tem boa cobertura, enquanto a última tem uma precisão de 52,6%. Uma das vantagens desse algoritmo é a possibilidade de se atribuir pesos diferentes para as classes (algo que o algoritmo IBk, por exemplo, também permite). No entanto, após algumas tentativas de combinação de pesos, chegou-se à conclusão que o melhor resultado era obtido quando a máquina considerava ambas as classes igualmente importantes. 3.4 Custo computacional O custo computacional de cada um dos algoritmos foi medido através do tempo que ele leva para construir o modelo dos dados. A tabela 3 mostra o tempo em segundos, ou em minutos e horas quando mais conveniente. Todos os algoritmos simbólicos são baratos, com destaque para o algoritmo IBk em que os próprios dados são o modelo. Apesar de uma avaliação (teste) mais lenta, o custo não é elevado demais. Algoritmos mais sofisticados podem levar desde um ou dois segun- 1 Número de neurônios ocultos calculado automaticamente pelo WEKA. 8

10 Total de clusters Precisão Recall F-measure % 0.24% 0.49% % 0.45% 0.89% % 4.05% 7.52% % 7.53% 13.26% Tabela 4: Clusters gerados pelo algoritmo K-médias avaliados de acordo com a anotação existente. Total de clusters Precisão Recall F-measure % 5.86% 10.70% % 16.40% 25.49% % 22.90% 32.83% Tabela 5: Clusters gerados pelo algoritmo EM avaliados de acordo com a anotação existente. dos até várias horas. É interessante observar que, dependendo da busca heurística utilizada, o algoritmo Bayes Net pode levar 2,69 segundos (TAN) ou 5,6 minutos (SA). No entanto, os algoritmos mais caros são sem dúvida os de treinamento de redes neurais. A rede com parâmetros default leva uma hora e meia para ser treinada, porém quanto mais neurônios na camada oculta e épocas de treinamento, mais o algoritmo demora, chegando a levar 9 horas para treinar uma rede com 100 neurônios na camada oculta. Apesar de serem os mais caros, os algoritmos não têm o melhor desempenho. No entanto, o Voted Perceptron tem um custo relativamente baixo com relação ao desempenho que oferece, levando a crer que ele é o algoritmo ideal para esse conjunto de dados. Para uma das máquinas de vetor de suporte, não foi possível calcular o tempo de criação do modelo. No entanto, ele é similar ao da SVM com kernel polinomial, que levou quase 3 horas para ser construída. Apesar de ter um desempenho bastante bom, esses algoritmos também são caros e exigem bastante tempo de processamento. 4 Modelos baseados em clusterização A criação de uma base de dados com as classes já obtidas foi possível pelo fato do corpus utilizado possuir os termos anotados. No entanto, esse pode não ser o caso para outros corpora. A extração terminológica de corpora brutos (raw) é interessante quando não se dispõe de recursos para anotação manual dos termos. Nesse caso, foram utilizados como parâmetros somente a informação morfossintática e as medidas estatísticas, sendo que a informação de classe foi utilizada posteriormente 9

11 para avaliação de cada modelo gerado. Para a construção dos modelos, foram testados os algoritmos K-médias e Expectation Maximization (EM). Apesar de sabermos o número de classes de antemão (dois), esse número não necessariamente é igual ao número de clusters presentes no espaço do problema, já que ele pode não ser linearmente separável. Sendo assim, foram feitos testes variando o número de clusteres gerados (16,32,64 e 128). Para avaliar o modelo, os clusteres foram separados em dois grupos. Aqueles em que a quantidade de MWTs era maior do que os candidatos falsos foram para um grupo e os demais para outro. A informação sobre cada candidato foi retirada da anotação manual. Finalmente cada grupo foi avaliado com as métricas de precisão e cobertura. Os resultados são mostrados nas tabelas 4 e 5 5 Conclusões Os resultados apresentados neste trabalho demonstram que a extração terminológica automática pode se valer bastante dos algoritmos de mineração de dados. Apesar de, num primeiro momento, eles parecem baixos, são resultados melhores do que se obteria através dos métodos já existentes, que freqüentemente usam apenas regras heurísticas de padrões morfossintáticos e filtros de freqüência. Além disso, os resultados também dependem dos dados. A base utilizada possui apenas quatro métricas de associação para cada corpus, mas existem inúmeras outras que poderiam ser aplicadas, por exemplo, medidas mais robustas que usam tabelas de contingência. Além disso, poderíamos extrair frequências dos candidatos em outros corpora além do GENIA e da Web. Finalmente, outros atributos simbólicos além do padrão morfossintático poderiam ser utilizados, como por exemplo, informações relativas ao contexto de ocorrência das multi-palavras. Um número maior de atributos tem usualmente impacto positivo para os resultados, porém é sempre necessário ter em mente que um número exagerado de atributos pode levar a situações de super-treinamento em que os dados não são aprendidos mas decorados. No entanto, mesmo que se aprimore a base de dados, a escolha do algoritmo adequado para a criação do modelo também é importante. Isso é possível verificar pela diferença encontrada nos resultados entre os algoritmos testados. Os algoritmos simbólicos oferecem um bom custo-benefício, porém são inadequados quando se exige resultados mais precisos. Algoritmos como o BayesNet podem ter bom desempenho porém a escolha correta dos parâmetros é fundamental. Com relação ás redes neurais de múltiplas camadas, os resultados observados foram supreendentemente baixos, levando a duas hipóteses possíveis: (a) o algoritmo está mal configurado e oscila muito, levando a um comportamento praticamente aleatório ou (b) o modelo não possúi um número suficiente de neurônios nas camadas ocultas. Enquanto a primeira hipótese é sustentada pelo fato de que um algoritmo muito mais simples, o Voted Perceptron, possui desempenho superior ao MLP, a última é decorrência da observação de que o recall aumenta conforme o número de neurô- 10

12 nios da camada oculta aumenta. Uma investigação aprofundada sobre esse problema poderia ser feita se houvessem recursos computacionais disponíveis, visto que a rede com 100 neurônios levou 9 horas para ser treinada e que, por exemplo, dobrar o número de neurônios poderia dobrar o tempo necessário para treiná-los. Finalmente, as SVMs são populares no meio acadêmico em parte porque oferecem custo relativamente alto e resultados relativamente bons, parecendo também oferecer um bom compromisso entre precisão e recall. Dentre todos os algoritmos testados, a maior acurácia foi obtida pelo VP mas o desempenho global é melhor para o SVM de kernel radial. No entanto, não existe uma resposta única para escolher o algoritmo a ser usado para essa tarefa. A escolha do algoritmo deve levar em conta não somente a F-measure mas também as medidas de precisão e recall tomadas individualmente, pois as aplicações da terminologia possuem diferentes requisitos para os quais pode ser mais ou menos interessante privilegiar precisão ou recall. Além disso, os recursos computacionais e o tamanho dos conjuntos de dados podem impôr restrições que impeçam ou favoreçam o uso de determinado algoritmo em detrimento de um que ofereça melhor desempenho. 11

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

MLP (Multi Layer Perceptron)

MLP (Multi Layer Perceptron) MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

1 Introdução. 1.1 Apresentação do tema

1 Introdução. 1.1 Apresentação do tema 1 Introdução 1.1 Apresentação do tema Segundo Basílio (1987), as principais funções do léxico são a representação conceitual e o fornecimento de unidades básicas para a construção dos enunciados. Para

Leia mais

Capítulo 7 Medidas de dispersão

Capítulo 7 Medidas de dispersão Capítulo 7 Medidas de dispersão Introdução Para a compreensão deste capítulo, é necessário que você tenha entendido os conceitos apresentados nos capítulos 4 (ponto médio, classes e frequência) e 6 (média).

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto.

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto. Discussão sobre Nivelamento Baseado em Fluxo de Caixa. Item aberto na lista E-Plan Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron. 1024 UMA ABORDAGEM BASEADA EM REDES PERCEPTRON MULTICAMADAS PARA A CLASSIFICAÇÃO DE MASSAS NODULARES EM IMAGENS MAMOGRÁFICAS Luan de Oliveira Moreira¹; Matheus Giovanni Pires² 1. Bolsista PROBIC, Graduando

Leia mais

BCC202 - Estrutura de Dados I

BCC202 - Estrutura de Dados I BCC202 - Estrutura de Dados I Aula 04: Análise de Algoritmos (Parte 1) Reinaldo Fortes Universidade Federal de Ouro Preto, UFOP Departamento de Ciência da Computação, DECOM Website: www.decom.ufop.br/reifortes

Leia mais

5 Resultados. 5.1. Avaliação Baseada na Taxa de Igual Erro

5 Resultados. 5.1. Avaliação Baseada na Taxa de Igual Erro 5 Resultados Neste capitulo discutem-se os resultados obtidos no desenvolvimento desta pesquisa segundo a metodologia descrita no capitulo anterior. A avaliação de acurácia para tarefas de verificação

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti Jogos Redes Sociais e Econômicas Prof. André Vignatti Teoria dos Jogos Neste curso, queremos olhar para redes a partir de duas perspectivas: 1) uma estrutura subjacente dos links de conexão 2) o comportamentos

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Revisão de Probabilidade e Estatística Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Conceitos Básicos Estamos

Leia mais

5 Resultados. 1 Os resultados apresentados foram obtidos com 1 rodada do simulador.

5 Resultados. 1 Os resultados apresentados foram obtidos com 1 rodada do simulador. 5 Resultados A dificuldade em modelar analiticamente o comportamento de sistemas celulares hierarquizados faz com que grande parte dos estudos de desempenho destes sistemas seja baseada em simulações.

Leia mais

2 Atualidade de uma base de dados

2 Atualidade de uma base de dados 2 Atualidade de uma base de dados Manter a atualidade de uma base de dados é um problema que pode ser abordado de diferentes maneiras. Cho e Garcia-Molina [CHO] definem esse problema da seguinte forma:

Leia mais

7.Conclusão e Trabalhos Futuros

7.Conclusão e Trabalhos Futuros 7.Conclusão e Trabalhos Futuros 158 7.Conclusão e Trabalhos Futuros 7.1 Conclusões Finais Neste trabalho, foram apresentados novos métodos para aceleração, otimização e gerenciamento do processo de renderização

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

Sistema de avaliação da tarefa 47 da fase 5

Sistema de avaliação da tarefa 47 da fase 5 Sistema de avaliação da tarefa 47 da fase 5 A Fase 5 da nossa Olimpíada mantém a forma de avaliação de 2014. O processo de avaliação será realizado por duas correções concomitantes: a já conhecida e consolidada

Leia mais

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO

Leia mais

Visite o hotsite do livro: http://bit.ly/1ysv0da

Visite o hotsite do livro: http://bit.ly/1ysv0da Este ebook possui 5 dicas práticas avançadas de Facebook Ads que foram retiradas do novo livro que estamos escrevendo, chamado Facebook Marketing Avançado, que vai possuir muitas outras dicas práticas,

Leia mais

CERTIFICAÇÃO PROFISSIONAL POR EXPERIÊNCIA DE ADMINISTRADORES

CERTIFICAÇÃO PROFISSIONAL POR EXPERIÊNCIA DE ADMINISTRADORES CERTIFICAÇÃO PROFISSIONAL POR EXPERIÊNCIA DE ADMINISTRADORES ANÁLISE DE REQUISITOS PARA RELATOR E AVALIADOR DA BANCA EXAMINADORA ESBOÇO ESQUEMÁTICO CONSIDERAÇÕES INICIAIS Esta breve análise pretende abordar

Leia mais

2 Desenvolvimento da Publicidade de Busca

2 Desenvolvimento da Publicidade de Busca Desenvolvimento da Publicidade de Busca 21 2 Desenvolvimento da Publicidade de Busca Em seus primórdios, a publicidade na Web era quase que totalmente baseada na venda de impressões, ou seja, exibições

Leia mais

Casos de teste semânticos. Casos de teste valorados. Determinar resultados esperados. Gerar script de teste automatizado.

Casos de teste semânticos. Casos de teste valorados. Determinar resultados esperados. Gerar script de teste automatizado. 1 Introdução Testes são importantes técnicas de controle da qualidade do software. Entretanto, testes tendem a ser pouco eficazes devido à inadequação das ferramentas de teste existentes [NIST, 2002].

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

Do neurônio biológico ao neurônio das redes neurais artificiais

Do neurônio biológico ao neurônio das redes neurais artificiais Do neurônio biológico ao neurônio das redes neurais artificiais O objetivo desta aula é procurar justificar o modelo de neurônio usado pelas redes neurais artificiais em termos das propriedades essenciais

Leia mais

Universidade Federal de Alfenas

Universidade Federal de Alfenas Universidade Federal de Alfenas Projeto e Análise de Algoritmos Aula 04 Introdução a Análise de Algoritmos humberto@bcc.unifal-mg.edu.br Última aula Fundamentos de Matemática Exercícios: Somatórios; Logaritmos

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I! A utilização de escores na avaliação de crédito! Como montar um plano de amostragem para o credit scoring?! Como escolher as variáveis no modelo de credit

Leia mais

Arquitetura de Rede de Computadores

Arquitetura de Rede de Computadores TCP/IP Roteamento Arquitetura de Rede de Prof. Pedro Neto Aracaju Sergipe - 2011 Ementa da Disciplina 4. Roteamento i. Máscara de Rede ii. Sub-Redes iii. Números Binários e Máscara de Sub-Rede iv. O Roteador

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES 3.1 - IDENTIFICADORES Os objetos que usamos no nosso algoritmo são uma representação simbólica de um valor de dado. Assim, quando executamos a seguinte instrução:

Leia mais

ALGORITMOS PARTE 01. Fabricio de Sousa Pinto

ALGORITMOS PARTE 01. Fabricio de Sousa Pinto ALGORITMOS PARTE 01 Fabricio de Sousa Pinto Algoritmos: Definição 2 É uma sequência de instruções finita e ordenada de forma lógica para a resolução de uma determinada tarefa ou problema. Algoritmos 3

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior MRP II Introdução A lógica de cálculo das necessidades é conhecida há muito tempo Porém só pode ser utilizada na prática em situações mais complexas a partir dos anos 60 A partir de meados da década de

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

Extração de Requisitos

Extração de Requisitos Extração de Requisitos Extração de requisitos é o processo de transformação das idéias que estão na mente dos usuários (a entrada) em um documento formal (saída). Pode se entender também como o processo

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais

A Grande Importância da Mineração de Dados nas Organizações

A Grande Importância da Mineração de Dados nas Organizações A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil

Leia mais

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho 20 Capítulo 3 Avaliação de Desempenho Este capítulo aborda como medir, informar e documentar aspectos relativos ao desempenho de um computador. Além disso, descreve os principais fatores que influenciam

Leia mais

Diagrama de Classes. Um diagrama de classes descreve a visão estática do sistema em termos de classes e relacionamentos entre as classes.

Diagrama de Classes. Um diagrama de classes descreve a visão estática do sistema em termos de classes e relacionamentos entre as classes. 1 Diagrama de Classes Um diagrama de classes descreve a visão estática do sistema em termos de classes e relacionamentos entre as classes. Um dos objetivos do diagrama de classes é definir a base para

Leia mais

MANUTENÇÃO ELÉTRICA INDUSTRIAL * ENROLAMENTOS P/ MOTORES CA *

MANUTENÇÃO ELÉTRICA INDUSTRIAL * ENROLAMENTOS P/ MOTORES CA * MANUTENÇÃO ELÉTRICA INDUSTRIAL * ENROLAMENTOS P/ MOTORES CA * Vitória ES 2006 7. ENROLAMENTOS PARA MOTORES DE CORRENTE ALTERNADA A maneira mais conveniente de associar vários condutores de um enrolamento

Leia mais

ESTUDO DE VIABILIDADE. Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos

ESTUDO DE VIABILIDADE. Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos ESTUDO DE VIABILIDADE Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos Objetivos O que é um estudo de viabilidade? O que estudar e concluir? Benefícios e custos Análise de Custo/Benefício

Leia mais

Scale-Invariant Feature Transform

Scale-Invariant Feature Transform Scale-Invariant Feature Transform Renato Madureira de Farias renatomdf@gmail.com Prof. Ricardo Marroquim Relatório para Introdução ao Processamento de Imagens (COS756) Universidade Federal do Rio de Janeiro,

Leia mais

Unidade 7: Panes no Excel

Unidade 7: Panes no Excel Unidade 7: Panes no Excel 7.0 Introdução A maioria das pessoas que usam o Excel já deve ter passado por redução no desempenho, congelamento e aquelas temidas palavras "O Microsoft Excel encontrou um problema

Leia mais

4 Implementação e Resultados Experimentais

4 Implementação e Resultados Experimentais 4 Implementação e Resultados Experimentais Com o objetivo de fazer a criação automática de visões materializadas, ou seja, prover uma solução on-the-fly para o problema de seleção de visões materializadas,

Leia mais

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática Rene Baltazar Introdução Serão abordados, neste trabalho, significados e características de Professor Pesquisador e as conseqüências,

Leia mais

Protocolo TCP/IP. Neste caso cada computador da rede precisa de, pelo menos, dois parâmetros configurados:

Protocolo TCP/IP. Neste caso cada computador da rede precisa de, pelo menos, dois parâmetros configurados: Protocolo TCP/IP Neste caso cada computador da rede precisa de, pelo menos, dois parâmetros configurados: Número IP Máscara de sub-rede O Número IP é um número no seguinte formato: x.y.z.w Não podem existir

Leia mais

Modelo Cascata ou Clássico

Modelo Cascata ou Clássico Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação

Leia mais

Exercícios Teóricos Resolvidos

Exercícios Teóricos Resolvidos Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Matemática Exercícios Teóricos Resolvidos O propósito deste texto é tentar mostrar aos alunos várias maneiras de raciocinar

Leia mais

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais Cleyton Zanardo de Oliveira CER, DEs, UFSCar Vera Lúcia Damasceno Tomazella, DEs, UFSCar Resumo Uma única pessoa

Leia mais

Núcleo de Informática Aplicada à Educação Universidade Estadual de Campinas

Núcleo de Informática Aplicada à Educação Universidade Estadual de Campinas Núcleo de Informática Aplicada à Educação Universidade Estadual de Campinas Resumo Tradicionalmente os alunos ingressantes no bacharelado de Ciência da Computação da UNICAMP aprendem a programar utilizando

Leia mais

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL)

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL) PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL) Melhor método para avaliar investimentos 16 perguntas importantes 16 respostas que todos os executivos devem saber Francisco Cavalcante(f_c_a@uol.com.br)

Leia mais

2. Representação Numérica

2. Representação Numérica 2. Representação Numérica 2.1 Introdução A fim se realizarmos de maneira prática qualquer operação com números, nós precisamos representa-los em uma determinada base numérica. O que isso significa? Vamos

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

GASTAR MAIS COM A LOGÍSTICA PODE SIGNIFICAR, TAMBÉM, AUMENTO DE LUCRO

GASTAR MAIS COM A LOGÍSTICA PODE SIGNIFICAR, TAMBÉM, AUMENTO DE LUCRO GASTAR MAIS COM A LOGÍSTICA PODE SIGNIFICAR, TAMBÉM, AUMENTO DE LUCRO PAULO ROBERTO GUEDES (Maio de 2015) É comum o entendimento de que os gastos logísticos vêm aumentando em todo o mundo. Estatísticas

Leia mais

Engenharia de Software III

Engenharia de Software III Engenharia de Software III Casos de uso http://dl.dropbox.com/u/3025380/es3/aula6.pdf (flavio.ceci@unisul.br) 09/09/2010 O que são casos de uso? Um caso de uso procura documentar as ações necessárias,

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

4 Arquitetura básica de um analisador de elementos de redes

4 Arquitetura básica de um analisador de elementos de redes 4 Arquitetura básica de um analisador de elementos de redes Neste capítulo é apresentado o desenvolvimento de um dispositivo analisador de redes e de elementos de redes, utilizando tecnologia FPGA. Conforme

Leia mais

DIFERENÇAS ENTRE HUB, SWITCH E ROOTER

DIFERENÇAS ENTRE HUB, SWITCH E ROOTER ESCOLA SECUNDÁRIA DE AROUCA CURSO OPERADOR DE INFORMÁTICA (2) Educação e Formação de Adultos DIFERENÇAS ENTRE HUB, SWITCH E ROOTER 1º PERÍODO Sara Matias ICORLI 2008/2009 Muita gente sabe que hub, switch

Leia mais

Profissionais de Alta Performance

Profissionais de Alta Performance Profissionais de Alta Performance As transformações pelas quais o mundo passa exigem novos posicionamentos em todas as áreas e em especial na educação. A transferência pura simples de dados ou informações

Leia mais

Curso de Instalação e Gestão de Redes Informáticas

Curso de Instalação e Gestão de Redes Informáticas ESCOLA PROFISSIONAL VASCONCELLOS LEBRE Curso de Instalação e Gestão de Redes Informáticas SISTEMAS DE ARQUIVOS FAT E FAT32 José Vitor Nogueira Santos FT2-0749 Mealhada, 2009 Introdução Muitos usuários

Leia mais

AULA 11 Desenhos, recursos e obstáculos

AULA 11 Desenhos, recursos e obstáculos 1 AULA 11 Desenhos, recursos e obstáculos Ernesto F. L. Amaral 15 de abril de 2010 Metodologia (DCP 033) Fonte: Flick, Uwe. 2009. Desenho da pesquisa qualitativa. Porto Alegre: Artmed. pp.57-73 & 75-85.

Leia mais

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental Ajuda ao SciEn-Produção 1 Este texto de ajuda contém três partes: a parte 1 indica em linhas gerais o que deve ser esclarecido em cada uma das seções da estrutura de um artigo cientifico relatando uma

Leia mais

CAPÍTULO 6 - ESTRUTURA DE SELEÇÃO

CAPÍTULO 6 - ESTRUTURA DE SELEÇÃO 6.1 - INTRODUÇÃO CAPÍTULO 6 - ESTRUTURA DE SELEÇÃO Existem problemas que podem ter mais de um caminho a ser seguido para seleção correta, ou existem restrições em suas soluções. O sujeito que irá executar

Leia mais

Dadas a base e a altura de um triangulo, determinar sua área.

Dadas a base e a altura de um triangulo, determinar sua área. Disciplina Lógica de Programação Visual Ana Rita Dutra dos Santos Especialista em Novas Tecnologias aplicadas a Educação Mestranda em Informática aplicada a Educação ana.santos@qi.edu.br Conceitos Preliminares

Leia mais

Instalações Máquinas Equipamentos Pessoal de produção

Instalações Máquinas Equipamentos Pessoal de produção Fascículo 6 Arranjo físico e fluxo O arranjo físico (em inglês layout) de uma operação produtiva preocupa-se com o posicionamento dos recursos de transformação. Isto é, definir onde colocar: Instalações

Leia mais

4 Avaliação Econômica

4 Avaliação Econômica 4 Avaliação Econômica Este capítulo tem o objetivo de descrever a segunda etapa da metodologia, correspondente a avaliação econômica das entidades de reservas. A avaliação econômica é realizada a partir

Leia mais

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Laboratório de Pesquisa e Desenvolvimento Universidade Federal de Alfenas versão

Leia mais

TOTVS BA Guia de Customização Linha Logix

TOTVS BA Guia de Customização Linha Logix TOTVS BA Guia de Customização Linha Logix Guia de Customização Sumário Título do documento 1. Objetivo... 3 2. Introdução... 3 3. Customização... 3 2 TOTVS BA Linha Logix Guia de Customização Projeto/Versão:

Leia mais

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento Professor Rene - UNIP 1 Roteamento Dinâmico Perspectiva e histórico Os protocolos de roteamento dinâmico são usados

Leia mais

PARANÁ GOVERNO DO ESTADO

PARANÁ GOVERNO DO ESTADO A COMUNICAÇÃO NA INTERNET PROTOCOLO TCP/IP Para tentar facilitar o entendimento de como se dá a comunicação na Internet, vamos começar contando uma história para fazer uma analogia. Era uma vez, um estrangeiro

Leia mais

UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda.

UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda. UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda. Avaliação do risco de viés de ensaios clínicos randomizados pela ferramentada colaboração Cochrane Alan P. V. de Carvalho,

Leia mais

PROVA COMENTADA Parte 1 TRT 4ª REGIÃO

PROVA COMENTADA Parte 1 TRT 4ª REGIÃO youyou PROVA COMENTADA Parte 1 TRT 4ª REGIÃO Técnico Judiciário RACIOCÍNIO LÓGICO Professor: Alex Lira Aula Prova 01 Prof. Alex Lira www.concurseiro24horas.com.br 1 10 COMPRA COLETIVA DE CURSOS PARA CONCURSOS

Leia mais

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO) Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO) Parte: 1 Prof. Cristóvão Cunha Objetivos de aprendizagem

Leia mais

Indicadores de transferência e de abandono no ensino superior português

Indicadores de transferência e de abandono no ensino superior português Indicadores de transferência e de abandono no ensino superior português Direção-Geral de Estatísticas da Educação e Ciência (DGEEC) João Oliveira Baptista Seminário Sucesso Académico - Teatro Thalia -

Leia mais

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE Redes Neurais Construtivas Germano Crispim Vasconcelos Centro de Informática - UFPE Motivações Redes Feedforward têm sido bastante utilizadas em aplicações de Reconhecimento de Padrões Problemas apresentados

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Um compilador é um programa que lê um programa escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num programa equivalente

Um compilador é um programa que lê um programa escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num programa equivalente Capítulo 1 Introdução Um compilador é um que lê um escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num equivalente numa outra linguagem, a linguagem destino Como parte importante neste

Leia mais

Encontrar adequados com o PEP- Localizador de Talentos. Mais fácil, mais barato e melhor!

Encontrar adequados com o PEP- Localizador de Talentos. Mais fácil, mais barato e melhor! Encontrar adequados com o PEP- Localizador de Talentos. Mais fácil, mais barato e melhor! PROCURA com o PEP-Localizador de Talentos: Exemplo de muitos candidatos Em apenas 2 semanas, o número de 3135 candidatos

Leia mais

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO BACHARELADO AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS Orientando: Oliver Mário

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Disciplina: Suprimentos e Logística II 2014-02 Professor: Roberto Cézar Datrino Atividade 3: Transportes e Armazenagem

Disciplina: Suprimentos e Logística II 2014-02 Professor: Roberto Cézar Datrino Atividade 3: Transportes e Armazenagem Disciplina: Suprimentos e Logística II 2014-02 Professor: Roberto Cézar Datrino Atividade 3: Transportes e Armazenagem Caros alunos, Essa terceira atividade da nossa disciplina de Suprimentos e Logística

Leia mais

Sistemas Distribuídos: Princípios e Algoritmos Introdução à Análise de Complexidade de Algoritmos

Sistemas Distribuídos: Princípios e Algoritmos Introdução à Análise de Complexidade de Algoritmos Sistemas Distribuídos: Princípios e Algoritmos Introdução à Análise de Complexidade de Algoritmos Francisco José da Silva e Silva Laboratório de Sistemas Distribuídos (LSD) Departamento de Informática

Leia mais

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro Parte 2. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro Parte 2. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu. Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro Parte 2 Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br versão da aula: 0.3 Última aula teórica Algoritmo de Tentativa e Erro:

Leia mais

JUVENTUDE PERDAS E GANHOS SOCIAIS NA CRISTA DA POPULAÇÃO JOVEM. Carlos Henrique Corseuil (IPEA) Miguel Foguel (IPEA) Gustavo Gonzaga (PUC-Rio)

JUVENTUDE PERDAS E GANHOS SOCIAIS NA CRISTA DA POPULAÇÃO JOVEM. Carlos Henrique Corseuil (IPEA) Miguel Foguel (IPEA) Gustavo Gonzaga (PUC-Rio) JUVENTUDE E risco RISCO PERDAS E GANHOS SOCIAIS NA CRISTA DA POPULAÇÃO JOVEM EFEITOS DE UM PROGRAMA DE APRENDIZ SOBRE SALÁRIOS E EMPREGABILIDADE DE JOVENS NO BRASIL Carlos Henrique Corseuil (IPEA) Miguel

Leia mais

Algoritmos e Estrutura de Dados III. Árvores

Algoritmos e Estrutura de Dados III. Árvores Algoritmos e Estrutura de Dados III Árvores Uma das mais importantes classes de estruturas de dados em computação são as árvores. Aproveitando-se de sua organização hierárquica, muitas aplicações são realizadas

Leia mais

Sumário Executivo. Amanda Reis. Luiz Augusto Carneiro Superintendente Executivo

Sumário Executivo. Amanda Reis. Luiz Augusto Carneiro Superintendente Executivo Comparativo entre o rendimento médio dos beneficiários de planos de saúde individuais e da população não coberta por planos de saúde regional e por faixa etária Amanda Reis Luiz Augusto Carneiro Superintendente

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais