Data, Text and Web Mining
|
|
|
- Bernadete Marina Caldas Vasques
- 10 Há anos
- Visualizações:
Transcrição
1 Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010
2 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web Mining Objetivo 2
3 Importância do Tema 3
4 Problema Importância do Tema Problema 4
5 Alguns dados... Relação Horário x Dia x Quantidade de Notícias Produzidas Notícias Horário Dia 90 Quantidade de notícias publicadas na Web por apenas seis veículos de notícias. Importância do Tema Alguns dados... 5
6 Alguns dados Estadão Folha G1 Globo Online Terra Último Segundo Total Notícias publicadas na Internet Quantidade (Notícias) Tempo (Dias) Importância do Tema Alguns dados... 6
7 Por que minerar informações? Explicitar conhecimento médico a partir de registros médicos. Sumarizar tendências de publicações de artigos e patentes sobre um determinado tema. Sumarizar e filtrar notícias relevantes. Importância do Tema Por que minerar informações? 7
8 Sumarizar a opinião expressa na Web sobre a sua empresa. Identificar padrões de navegação em sites. Identificar grupos de usuários com perfil similar em ambientes de escrita colaborativa. Importância do Tema Por que minerar informações? 8
9 Explicitar conhecimento médico a partir de registros médicos 9
10 Diagnóstico para o uso de lentes de contato O setor de oftalmologia de um hospital da cidade de São Paulo possui, no seu banco de dados, um histórico de pacientes que procuraram o hospital queixando-se de problemas na visão. A conduta, em alguns casos, realizada pelo corpo cĺınico de oftalmologistas do hospital é indicar o uso de lentes ao paciente. Problema: Extrair do banco de dados do hospital uma hipótese que explica que paciente deve usar ou não lente de contatos. Explicitar conhecimento médico a partir de registros médicos Diagnóstico para o uso de lentes de contato 10
11 Quais são os componentes deste sistema? 11
12 Componentes Que objetos são relevantes para a criação da hipótese? Como representá-los? Que linguagem de representação de conhecimento deve-se utilizar para representar a hipótese? Que algoritmo utilizar para gerar a hipótese? Quais são os componentes deste sistema? Componentes 12
13 Que objetos são relevantes? Depois de um estudo detalhado do problema com especialistas da área... Idade do paciente. Se o paciente tem ou não miopia. Se o paciente tem ou não astigmatismo. Qual é a taxa de lacrimejamento dos olhos do paciente. Como representá-los? Atributo/Valor Quais são os componentes deste sistema? Componentes 13
14 Atributos idade (jovem, adulto, idoso) miopia (míope, hipermétrope) astigmatismo (não, sim) taxa de lacrimejamento (reduzido, normal) lentes de contato (forte, fraca, nenhuma) Quais são os componentes deste sistema? Atributos 14
15 Dados Idade Miopia Astigmat. Lacrimej. Lentes jovem míope não reduzido nenhuma jovem míope não normal fraca jovem míope sim reduzido nenhuma jovem míope sim normal forte jovem hiper não reduzido nenhuma jovem hiper não normal fraca jovem hiper sim reduzido nenhuma jovem hiper sim normal forte adulto míope não reduzido nenhuma Quais são os componentes deste sistema? Dados 15
16 Idade Miopia Astigmat. Lacrimej. Lentes adulto míope não normal fraca adulto míope sim reduzido nenhuma adulto míope sim normal forte adulto hiper sim reduzido nenhuma adulto hiper não normal fraca adulto hiper sim reduzido nenhuma adulto hiper sim normal nenhuma Quais são os componentes deste sistema? Dados 16
17 Idade Miopia Astigmat. Lacrimej. Lentes idoso míope não reduzido nenhuma idoso míope não normal nenhuma idoso míope sim reduzido nenhuma idoso míope sim normal forte idoso hiper não reduzido nenhuma idoso hiper não normal fraca idoso hiper sim reduzido nenhuma idoso hiper sim normal nenhuma Quais são os componentes deste sistema? Dados 17
18 Extração de conhecimento O que foi apresentado nos slides anteriores pode ser considerado como conhecimento? Não Pode ser apresentado como uma informação que consegue explicar a tomada de decisão dos especialistas? Não O que fazer? Quais são os componentes deste sistema? Extração de conhecimento 18
19 Extração de conhecimento Extrair a informação realmente relevante. Utilizar uma linguagem de representação compreensível ao ser humano. Quais são os componentes deste sistema? Extração de conhecimento 19
20 Árvore de decisão Cada nodo interno testa um atributo. Cada aresta corresponde a um valor de atributo. Cada nodo folha retorna uma classificação. Quais são os componentes deste sistema? Árvore de decisão 20
21 Algoritmos Indutores de Decisão Árvores de Que algoritmo utilizar para gerar hipóteses na forma de árvores de decisão? ID3, C4.5[2]: são algoritmos indutores de árvore de decisão, top-down, recursivos e que fazem uso do conceito de entropia para identificar os melhores atributos que representam o conjunto de dados. Quais são os componentes deste sistema? Algoritmos Indutores de Árvores de Decisão 21
22 Resultado: Sistema Especialista (none, soft, hard) Quais são os componentes deste sistema? Resultado: Sistema Especialista 22
23 Sistema Especialista: Regras de Produção Baseado na premissa que o processo de tomada de decisão humano pode ser modelado por meio de regras do tipo SE condições ENTÃO conclusões [FAÇA ações] Convertendo uma árvore de decisão em regras de produção: Quais são os componentes deste sistema? Sistema Especialista: Regras de Produção 23
24 SE lacrimejamento=reduzido ENTÃO lente=nenhuma SE lacrimejamento=normal E astigmatismo=não ENTÃO lente=fraca SE lacrimejamento=normal E astigmatismo=sim E miopia=miope ENTÃO lente=forte SE lacrimejamento=normal E astigmatismo=sim E miopia=hipermetrope ENTÃO lente=nenhuma Quais são os componentes deste sistema? Sistema Especialista: Regras de Produção 24
25 Um pouco de código... Gerar a árvore de decisão usando o RapidMiner a. Codificar as regras de produção usando o Drools Expert b. a b Quais são os componentes deste sistema? Um pouco de código... 25
26 Organizar documentos 26
27 O que fazer com grandes quantidades de documentos? Notícias, patentes, artigos... Para tirar proveito desta informação é necessário organizá-la de alguma forma: Agrupamento de notícias, patentes, artigos. Classificação, Recomendação e Filtragem de Notícias. Organizar documentos O que fazer com grandes quantidades de documentos? 27
28 Exemplo de agrupamento E quando não é possível fazer manualmente? Organizar documentos Exemplo de agrupamento 28
29 Definições de Algoritmos de Agrupamento O objetivo dos algoritmos de agrupamento é colocar os objetos similares em um mesmo grupo e objetos não similares em grupos diferentes. Normalmente, objetos são descritos e agrupados usando um conjunto de atributos e valores. Não existe nenhuma informação sobre a classe ou categoria dos objetos. Organizar documentos Definições de Algoritmos de Agrupamento 29
30 Formato de um documento... Esta disciplina tem como objetivo apresentar os principais conceitos da área de Inteligência Artificial, caracterizar as principais técnicas e métodos, e implementar alguns problemas clássicos desta área sob um ponto de vista introdutório. A estratégia de trabalho, o conteúdo ministrado e a forma dependerão dos projetos selecionados pelos alunos. Inicialmente, os alunos deverão trazer os seus Projetos de Conclusão de Curso, identificar intersecções entre o projeto e a disciplina, e propor atividades para a disciplina.... Organizar documentos Formato de um documento 30
31 Atributo/Valor usando vetores Como representar os documentos? di = (p i1, p i2,, pin) (1) Os atributos são as palavras que aparecem nos documentos. Se todas as palavras que aparecem nos documentos forem utilizadas, o vetor não ficará muito grande? Organizar documentos Atributo/Valor usando vetores 31
32 Diminuindo a dimensionalidade do vetor Como filtrar as palavras que devem ser usadas como atributos? Em todos os idiomas existem átomos (palavras) que não significam muito. Stop-words Esta disciplina tem como objetivo apresentar os principais conceitos da área de Inteligência Artificial, caracterizar as principais técnicas e métodos, e implementar alguns problemas clássicos desta área sob um ponto de vista introdutório. Organizar documentos Diminuindo a dimensionalidade do vetor 32
33 Diminuindo ainda mais a dimensionalidade do vetor Algumas palavras podem aparecer no texto de diversas maneiras: técnica, técnicas, implementar, implementação... Stemming - encontrar o radical da palavra e usar apenas o radical. Organizar documentos Diminuindo ainda mais a dimensionalidade do vetor 33
34 Atributo/Valor usando vetores Já conhecemos os atributos. E os valores? Booleana - se a palavra aparece ou não no documento (1 ou 0) Por freqüência do termo - a freqüência com que a palavra aparece no documento (normalizada ou não) Ponderação tf-idf - o peso é proporcional ao número de ocorrências do termo no documento e inversamente proporcional ao número de documentos onde o termo aparece. Organizar documentos Atributo/Valor usando vetores 34
35 Por freqüência do termo (apresent,0.33) (form,0.33) (tecnic,0.33) (caracteriz,0.33) (projet,1.0) (introdutori,0.33) (objet,0.33) (inteligente,0.33) (conclusa,0.33) (selecion,0.33) (intersecco,0.33) (classic,0.33) (identific,0.33) (conceit,0.33) (trabalh,0.33) (disciplin,1.0) (traz,0.33) Organizar documentos Por freqüência do termo 35
36 Conjunto de Exemplos - Atributo/Valor Doc. apresent form tecnic caracteriz d d d d d d n Organizar documentos Conjunto de Exemplos - Atributo/Valor 36
37 Componentes para uma solução... Organizar documentos Componentes para uma solução... 37
38 Pré-processamento dos documentos: um pouco de código... Converter texto em TF-IDF usando o RapidMiner. Organizar documentos Pré-processamento dos documentos: um pouco de código... 38
39 Que algoritmo de agrupamento utilizar? Organizar documentos Que algoritmo de agrupamento utilizar? 39
40 Algoritmos para Agrupamento - K-means K significa o número de agrupamentos (que deve ser informado à priori). Sequência de ações iterativas. A parada é baseada em algum critério de qualidade dos agrupamentos (por exemplo, similaridade média). Organizar documentos Algoritmos para Agrupamento - K-means 40
41 Algoritmo para Agrupamento - K-means (1) Objetos que devem ser agrupados (2) Sorteio dos pontos centrais dos agrupamentos (3) Atribuição dos objetos aos agrupamentos (4) Definição do centro do agrupamento Organizar documentos Algoritmo para Agrupamento - K-means 41
42 Algoritmos para agrupamento dos documentos - Weka Execução do K-means no Weka a. a Organizar documentos Algoritmos para agrupamento dos documentos - Weka 42
43 Algoritmo para agrupamento dos documentos - Resultados A i n s t â n c i a 0. 1, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 1, 0. 2, 0. 3, 0. 1, 0. 8 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 3, 0. 4, 0. 5, 0. 8, 0. 9 e s t á no c l u s t e r 0 A i n s t â n c i a 0. 3, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 3, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 8, 0. 7, 0. 8, 0. 8, 0. 8 e s t á no c l u s t e r 0 A i n s t â n c i a 0. 1, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 1, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 1, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 6, 0. 5, 0. 6, 0. 6, 0. 6 e s t á no c l u s t e r 0 A i n s t â n c i a 0. 6, 0. 5, 0. 6, 0. 6, 0. 6 e s t á no c l u s t e r 0 A i n s t â n c i a 0. 1, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 A i n s t â n c i a 0. 2, 0. 8, 0. 8, 0. 7, 0. 9 e s t á no c l u s t e r 0 A i n s t â n c i a 0. 1, 0. 1, 0. 1, 0. 1, 0. 1 e s t á no c l u s t e r 1 Organizar documentos Algoritmo para agrupamento dos documentos - Resultados 43
44 Classificação de documentos 44
45 Classificação e Filtragem de Notícias Classificação de documentos Classificação e Filtragem de Notícias 45
46 Conjunto de Exemplos - Atributo/Valor e Classe Doc. apresent form tecnic caracteriz Relevante d d d d d d n Classificação de documentos Conjunto de Exemplos - Atributo/Valor e Classe 46
47 Qual é o problema? Classificação de documentos Qual é o problema? 47
48 Uma solução... Classificação de documentos Uma solução... 48
49 Processo de trabalho Classificação de documentos Processo de trabalho 49
50 Minerando ambientes colaborativos de escrita (Wiki) 50
51 Que informações um Wiki tem? Documento Versão Editor Data Documento Versão Editor Data d 1 1 u 1 d 2 4 u 7 d 1 2 u 2 d 3 1 u 5 d 1 3 u 2 d 3 2 u 6 d 1 4 u 3 d 3 3 u 6 d 1 5 u 4 d 4 1 u 8 d 2 1 u 4 d 4 2 u 9 d 2 2 u 5 d 5 1 u 10 d 2 3 u 6 d 5 2 u 11 Exemplo de histórico de criação e alteração de páginas em um Wiki. Minerando ambientes colaborativos de escrita (Wiki) Que informações um Wiki tem? 51
52 O que eu posso fazer com isto? (a) Legenda: ui = usuário i di = documento i u5 u6 d3 d2 u7 u2 u4 u9 d1 d5 d4 u1 u3 u10 u11 u8 (b) d d d d d Similaridade: alta média baixa Minerando ambientes colaborativos de escrita (Wiki) O que eu posso fazer com isto? 52
53 Exemplo Execução de uma aplicação usando estes conceitos. Minerando ambientes colaborativos de escrita (Wiki) Exemplo 53
54 Considerações Finais 54
55 Considerações Finais Caso sobre conhecimento médico: Data Mining. Agrupamento, classificação e filtragem de documentos: Text Mining. Caso Wiki: Web Mining O que existe em comum nestes casos? Considerações Finais Considerações Finais 55
56 Referências 56
57 References [1] Tom M. Mitchell. Machine Learning. McGraw-Hill, [2] J. R. Quinlan. Knowledge Acquisition for Knowledge-Based Systems, chapter Simplifying Decision Trees. Academic Press, [3] Stuart J. Russel and Peter Norvig. Artificial intelligence: a modern approach. Prentice-Hall, 2 edition, [4] Ian H. Witten and Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques. Elsevier, second edition,
Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ [email protected]
Uma Introdução à Mineração de Informações Fabrício J. Barth Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ [email protected] Outubro de 2010 Objetivo Apresentar
Web Data Mining com R
Web Data Mining com R Fabrício J. Barth [email protected] VAGAS Tecnologia e Faculdade BandTec Maio de 2014 Objetivo O objetivo desta palestra é apresentar conceitos sobre Web Data Mining, fluxo
Informações na era do Big Data
Uma Introdução à Mineração de Informações na era do Big Data Fabrício J. Barth VAGAS Tecnologia e Faculdades BandTec Setembro de 2012 Palestrante Fabrício J. Barth. Formado em Ciência da Computação pela
Algoritmos Indutores de Árvores de
Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso
Disciplina de Text Mining
Disciplina de Text Mining Fabrício J. Barth [email protected] Pós Graduação em Big Data - Faculdade BandTec Novembro de 2015 Objetivo O objetivo deste curso é apresentar a área de Text Mining. Serão
Web Data mining com R: aprendizagem de máquina
Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de
Aprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Hierarquia de modelos e Aprendizagem de Máquina
Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia
MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas [email protected]
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas [email protected] Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
Contexto de Big Data, Ciência de Dados e KDD
Contexto de Big Data, Ciência de Dados e KDD Fabrício J. Barth! Disciplina de Modelagem Descritiva e Preditiva! Pós-Graduação em Big Data e Analytics 100 10 quantidade de informações Sempre houve:!! Produção
Algoritmos de Agrupamento - Aprendizado Não Supervisionado. Fabrício Jailson Barth
Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth Abril de 2013 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento Plano Agrupamento Hierárquico
Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados
Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de
Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento
Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um
Laboratório de Mídias Sociais
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais parte I Prof. Dalton Martins [email protected] Gestão da Informação Universidade Federal de Goiás O que é Análise Textual? Análise
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas
Gerenciamento de Dados e Gestão do Conhecimento
ELC1075 Introdução a Sistemas de Informação Gerenciamento de Dados e Gestão do Conhecimento Raul Ceretta Nunes CSI/UFSM Introdução Gerenciando dados A abordagem de banco de dados Sistemas de gerenciamento
Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse
Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas
Observatório da Web: Uma Plataforma para Monitoramento de Eventos em Tempo Real. Gisele L. Pappa [email protected] Outubro/2013
Observatório da Web: Uma Plataforma para Monitoramento de Eventos em Tempo Real Gisele L. Pappa [email protected] Outubro/2013 Observatório da Web Transforma, em tempo real, grandes volumes de dados
SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER
SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo
DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS
DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG [email protected] Prof.
RECUPERANDO INFORMAÇÃO SOBRE TEXTOS PUBLICADOS NO TWITTER
RECUPERANDO INFORMAÇÃO SOBRE TEXTOS PUBLICADOS NO TWITTER Autores: Miguel Airton FRANTZ 1 ;; Angelo Augusto FROZZA 2, Reginaldo Rubens da SILVA 2. Identificação autores: 1 Bolsista de Iniciação Científica
[email protected] www.ufpa.br/srbo
CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira [email protected] www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto
Aprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Sistema Tutor Inteligente baseado em Agentes. Pedagógicas da Universidade Aberta do Piauí. Prof. Dr. Vinicius Ponte Machado
Sistema Tutor Inteligente baseado em Agentes na Plataforma MOODLE para Apoio às Atividades Pedagógicas da Universidade Aberta do Piauí Prof. Dr. Vinicius Ponte Machado Parnaíba, 14 de Novembro de 2012
Semântica para Sharepoint. Busca semântica utilizando ontologias
Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...
O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.
O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar
Ambiente Weka Waikato Environment for Knowledge Analysis
Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Ambiente Weka Waikato Environment for Knowledge Analysis Classificação
Analista de Sistemas S. J. Rio Preto - 2009
CERTIFICAÇÃO ITIL V3. Desde o final de maio de 2007, quando o Office of Government Commerce (OGC) do Reino Unido lançou a versão ITIL V3, houve mudanças nas certificações para os profissionais de TI. A
Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP
Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Thiago Ferauche, Maurício Amaral de Almeida Laboratório de Pesquisa em Ciência de Serviços
Diferenças da versão 6.3 para a 6.4
Release Notes Diferenças da versão 6.3 para a 6.4 Melhorias Comuns ao Sistema Help O Help Online foi remodelado e agora é possível acessar os manuais de cada módulo diretamente do sistema. Mapeamento de
ADM041 / EPR806 Sistemas de Informação
ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes
Manual do sistema Versão 1.0
SIACON SISTEMA INTEGRADO DE CONVÊNIO Manual do sistema Versão 1.0 1. Introdução O SIACON é um sistema de convênio-empresa, baseado na plataforma de internet, aonde os funcionários de empresas conveniadas
DATA WAREHOUSE. Introdução
DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta
DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO Aluno: Rafael
textos documentos semi-estruturado
1 Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semiestruturados
Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões
Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos
Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1
Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,
Ferramentas Livres de Armazenamento e Mineração de Dados
Ferramentas Livres de Armazenamento e Mineração de Dados JasperBI, Pentaho, Weka 09/2009 Eng. Pablo Jorge Madril [email protected] Summa Technologies www.summa.com.br Eng. Pablo Jorge Madril [email protected]
Extração Automática de Palavras-chave de Textos da Língua Portuguesa
Extração Automática de Palavras-chave de Textos da Língua Portuguesa Maria Abadia Lacerda Dias, Marcelo de Gomensoro Malheiros Centro Universitário UNIVATES Lajeado RS Brasil {mald,mgm}@univates.br Abstract.
Considerações sobre Conhecimento Incerto e Redes Bayesianas
Considerações sobre Conhecimento Incerto e Redes Bayesianas Felipe S. Gurgel 1, Maiquel de Brito 1 1 Universidade Federal de Santa Catarina - UFSC Departamento de Automação e Sistemas - DAS UFSC/CTC/DAS
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda
Chapter 3. Análise de Negócios e Visualização de Dados
Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos
REQUISITOS. Prof. Msc. Hélio Esperidião
REQUISITOS Prof. Msc. Hélio Esperidião OS REQUISITOS O que são requisitos? Uma descrição de um serviço ou de uma limitação O que é a engenharia de requisitos? O processo envolvido no desenvolvimento de
Projeto de Redes Top-Down
Projeto de Redes Top-Down Referência: Slides extraídos (material de apoio) do livro Top-Down Network Design (2nd Edition), Priscilla Oppenheimer, Cisco Press, 2010. http://www.topdownbook.com/ Alterações
Data Mining: Conceitos e Técnicas
Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:
Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR
Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise
Extração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1
Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO
O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados
SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento
Web Data Mining com R: design de projetos para criação de modelos preditivos
Web Data Mining com R: design de projetos para criação de modelos preditivos Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário e Objetivos Etapas em estudos preditivos Escolha
Análise de usabilidade de menus de navegação em portal com grande quantidade de informação e vários níveis hierárquicos
Análise de usabilidade de menus de navegação em portal com grande quantidade de informação e vários níveis hierárquicos Marcia Maia Outubro/2007 Vamos ver nesta apresentação Análise de usabilidade de menus
Projeto de Redes Neurais e MATLAB
Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar [email protected] Thiago Miotto [email protected] Baseado na apresentação
Clique este botão para submeter outra pesquisa. Você também pode fazê-lo premindo a tecla 'Enter'.
A. Guias Clique na aba do tipo de procura que você precisa. Escolha entre pesquisar na Web, somente imagens, Grupos (arquivo de discussão Usenet) ou o Diretório Google (a Web organizada em categorias navegáveis).
O Que é Data Warehouse
O Que é Data Warehouse Escrito por Carlos Alberto Sowek Buscando dar uma melhor visão sobre uma proposta de arquitetura de um Data Warehouse para a Celepar, bem como para os clientes da Celepar, sentimos
Histórico da Revisão. Versão Descrição Autor. 1.0 Versão Inicial
1 of 14 27/01/2014 17:33 Sistema de Paginação de Esportes Universitários Documento de Arquitetura de Software Versão 1.0 Histórico da Revisão Data 30 de novembro de 1999 Versão Descrição Autor 1.0 Versão
ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD
ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos
GED E ECM. Bruno Velaz. Maximizando resultados com ECM e GED para pequenas e médias empresas. 21/09/2011 1
GED E ECM Maximizando resultados com ECM e GED para pequenas e médias empresas. Bruno Velaz Diretor de Operações TI Microsoft Taugor Corporation 21/09/2011 1 Agenda Apresentação Objetivo O que é Gestão
www. inf.br Outubro/2008 5www.habisp.inf.br TREINAMENTO HABISP VERBA DE ATENDIMENTO
5 www. HABISP. inf.br Outubro/2008 TREINAMENTO HABISP MÓDULO VERBA DE ATENDIMENTO 1 INTRODUÇÃO Este documento, tem por finalidade, permitir aos usuários a utilização das ferramentas do HABISP que possibilitam
Sistema de pedidos. com técnicas de recomendação
Universidade Católica de Pelotas Centro Politécnico Analise e Desenvolvimento de Sistema Sistema de pedidos com técnicas de recomendação por Aníbal di Primio Documento de conclusão da disciplina de Trabalho
Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela
Aula 01 - Formatações prontas e Sumário Formatar como Tabela Formatar como Tabela (cont.) Alterando as formatações aplicadas e adicionando novos itens Removendo a formatação de tabela aplicada Formatação
Banco de Dados - Senado
Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs
Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares
Universidade de Brasília Faculdade de Ciência da Informação Prof a Lillian Alvares Fóruns Comunidades de Prática Mapeamento do Conhecimento Portal Intranet Extranet Banco de Competências Memória Organizacional
No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o
DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é
Microsoft Innovation Center
Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi [email protected] Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração
Experimentos de Mineração de Dados em R Disciplina do curso de Pós-Graduação da UTFPR
Experimentos de Mineração de Dados em R Disciplina do curso de Pós-Graduação da UTFPR Paulo Carvalho Diniz Junior CPGEI / UTFPR Avenida Sete de Setembro, 3165 Curitiba-PR - CEP 80.230-910 E-mail: [email protected]
FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
@ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. [email protected] http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio
Prof. Msc. Paulo Muniz de Ávila
Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida
OBJETOS DE APRENDIZAGEM
MEDs e METADADOS OBJETOS DE APRENDIZAGEM O que é um objeto de aprendizagem? Segundo Wiley, D.A.,2000 Qualquer entidade DIGITAL que pode ser usada, reusada ou referenciada durante um processo de aprendizagem
MANUAL JOOMLA 2.5 PORTAL INTERNET. Ministério do Esporte
MANUAL JOOMLA 2.5 PORTAL INTERNET Ministério do Esporte SUMÁRIO 1.0 - Módulo Administração... 1 2.0 Banner randômico... 2 2.1 Adicionar novo slide... 2 2.2 Excluir slide... 6 3.0 Artigos... 7 3.1 Adicionar
Padronização de Processos: BI e KDD
47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil [email protected] Abstract:
UTILIZANDO O SOFTWARE WEKA
UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia
Capítulo. Sistemas de apoio à decisão
Capítulo 10 1 Sistemas de apoio à decisão 2 Objectivos de aprendizagem Identificar as alterações que estão a ter lugar na forma e função do apoio à decisão nas empresas de e-business. Identificar os papéis
PO 001 - GESTÃO DE PROCESSOS E DOCUMENTAÇÃO 008
1 - OBJETIVO PO 001 - GESTÃO DE PROCESSOS E DOCUMENTAÇÃO 008 Este retrata a forma que deve ser conduzida a gestão dos s da entidade desde a sua concepção até o seu acompanhamento e melhoria. 2 - AUTORIDADE
BlackBerry World Storefront. Versão: 4.3.1. Guia do usuário
Storefront Versão: 4.3.1 Guia do usuário Publicado: 24/04/2013 SWD-20130424144735133 Conteúdo... 4 num piscar de olhos... 4 Pesquisar aplicativos, jogos, música ou vídeos... 4 Ocultar itens direcionados
DANFE e o Código de Barras
DANFE e o Código de Barras Escrito por: Eng. Luciano T.Junior Danfe e o Código de Barras...3 A Chave de Acesso...4 Cálculo do Dígito Verificador da Chave de Acesso da NF-e...5 Transformando a Chave de
ANEXO I Sumário Manual de Preços e Serviços Digitais
Sumário 1 -LANDING PAGE...2 1.1)Layout, texto e produção do HTML...2 2 -MÍDIA...2 2.1)Planejamento de mídia...2 2.2)Criação das Campanhas...2 2.3)Mensuração dos resultados...2 2.4)Criação e Produção das
A Grande Importância da Mineração de Dados nas Organizações
A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil
Aula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
CAPÍTULO 1 INTRODUÇÃO À GESTÃO DA QUALIDADE
Índice Índice de figuras e tabelas 19 Prefácio 29 CAPÍTULO 1 INTRODUÇÃO À GESTÃO DA QUALIDADE 1. Introdução 35 2. Conceitos da qualidade 36 3. Origem dos principais problemas da qualidade 41 4. Alguns
GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas
PIM PROGRAMA DE INTEGRAÇÃO COM O MERCADO GUIA DE CURSO Tecnologia em Sistemas de Informação Tecnologia em Desenvolvimento Web Tecnologia em Análise e Desenvolvimento de Sistemas Tecnologia em Sistemas
Complemento da Versão 2.3 Categorização Pagina 1 Fone: (17) 3426-5560 www.megaonline.com.br/hoken. Agenda Hoken Versão 2.
Pagina 1 Fone: (17) 3426-5560 www.megaonline.com.br/hoken Agenda Hoken Versão 2.3 Categorização Pagina 2 Fone: (17) 3426-5560 www.megaonline.com.br/hoken Abaixo iremos mostrar através de explicações e
Nova Versão 3.0 do Software de Gestão de Equipamentos da Katun KDFM!
Nova Versão 3.0 do Software de Gestão de Equipamentos da Katun KDFM! MAIS FÁCIL DE NAVEGAR MAIS RÁPIDO DE USAR MAIS FÁCIL DE GERIR ALERTAS NOVAS OPÇÕES DE LIMPEZA DE ALERTAS MAIS FÁCIL DE USAR OS PERFIS
4 Estratégias para Implementação de Agentes
Estratégias para Implementação de Agentes 40 4 Estratégias para Implementação de Agentes As principais dúvidas do investidor humano nos dias de hoje são: quando comprar ações, quando vendê-las, quanto
UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação
SOFT DISCIPLINA: Engenharia de Software AULA NÚMERO: 10 DATA: / / PROFESSOR: Andrey APRESENTAÇÃO O objetivo desta aula é apresentar e discutir os conceitos de coesão e acoplamento. DESENVOLVIMENTO Projetar
Palavras-chave: i3geo, gvsig, Mapserver, integração, plugin. Contato: [email protected] ou [email protected]
III Jornada Latinoamericana e do Caribe do gvsig Artigo: Integração do software i3geo com o gvsig Autor: Edmar Moretti Resumo: O i3geo é um software para a criação de mapas interativos para internet qu
Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining
Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro
T U T O R I A I S WEB OF SCIENCE TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. WEB OF SCIENCE - Tutorial
T U T O R I A I S WEB OF SCIENCE TUTORIAL Biblioteca da Escola de Engenharia da UFRGS WEB OF SCIENCE - Tutorial O que é? O Web of Science é uma base de dados que disponibiliza acesso a mais de 9.200 títulos
Indice. Prefácio... 15. CAPÍTULO 1 - Introdução à gestão da qualidade
" Indice Prefácio........................... 15 CAPÍTULO 1 - Introdução à gestão da qualidade 1. Introdução.... 2. Conceitos da qualidade. 3. Origem dos principais problemas da qualidade 4. Alguns dos
Módulo 4: Gerenciamento de Dados
Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não
Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados
Algoritmos Genéticos em Mineração de Dados Descoberta de Conhecimento Descoberta do Conhecimento em Bancos de Dados Processo interativo e iterativo para identificar padrões válidos, novos, potencialmente
Planejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na
