Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education
|
|
- Fernanda Prado
- 5 Há anos
- Visualizações:
Transcrição
1 Data Science Data Stream Mining: trabalhando com dados massivos André Luís Nunes Porto Alegre, 2018 Globalcode Open4education
2 Data Stream Mining trabalhando com dados massivos 2018
3 agenda
4 andré luís nunes Gestor Técnico Cientista de Dados CWI Software São Leopoldo/RS Núcleo de Tecnologia Mestrado em Ciência da Computação, UNISINOS (2017) Crescer Bacharel em Sistemas de Informação, FACCAT (2008) P&I
5 data stream Fluxo contínuo de dados. Real Time?
6 data stream
7 data stream Sequência de dados potencialmente infinita. Velocidade na chegada: Importantes apenas na chegada; Após processamento são descartados. BASES NÃO-ESTACIONÁRIOS
8 data stream Exemplo de dados: Base Airlines
9 data stream Primeiro algoritmo: VFDT Very Fast Decision Tree (2001, Domingos and Hulten)
10 data stream A partir da implementação da árvore de Hoeffding. Probability Inequalities for Sums of Bounded Random Variables (1962, Wassily Hoeffding)
11 data mining Etapas do processo: KNOWLEDGE DISCOVER in DATABASE (KDD)
12 data mining Etapas do processo: KNOWLEDGE DISCOVER in DATABASE (KDD)
13 data mining Ciclo: dados selecionados dados processados dados transformados padrões de dados conhecimento dados
14 data mining Ciclo: dados selecionados dados processados dados transformados padrões de dados conhecimento dados
15 pré-processamento? Exemplo: discretização de valores numéricos. O intervalo é desconhecido.
16 data stream mining Resumo do fluxo:
17 Trabalhos com comparativos de resultados. Na grande maioria com bases estacionárias.
18 data mining data stream (tradicional) múltiplos passos ilimitado ilimitado acurácia único tempo restrito memória restrita aproximação
19 data stream mining Três dimensões influenciam memória tempo poder de generalização
20 data stream mining Três dimensões influenciam memória tempo EQUILÍBRIO poder de generalização
21 data stream mining ferramenta {M}assive {O}nline {A}nalysis Evolução do popular WEKA, voltado para Data Stream Mining.
22 data stream mining Interface gráfica
23 data stream mining Contexto: Machine Learning Distributed Non Distributed Batch Stream Batch Stream Hadoop S4, Storm, Samza Mahout SAMOA R, Weka,... MOA
24 data stream mining Leitura dos dados.
25 data stream mining Leitura dos dados. Através de janelas deslizantes.
26 data stream mining Leitura dos dados. Conjunto de dados i 1 ( f ) Tamanho da amostragem i n
27 data stream mining Leitura dos dados, capturando amostras ( f ). Conjunto de dados (5M) i 1 ( f =100K ) Tamanho da amostragem i n
28 data stream mining Leitura dos dados, capturando amostras ( f ). Conjunto de dados (5M) i 1 ( f =100K ) Tamanho da amostragem i n
29 data stream mining Leitura dos dados, capturando amostras ( f ). Conjunto de dados (5M) (w) tamanho da janela i 1 i n ( f =100K ) Tamanho da amostragem
30 data stream mining Uma janela (w) desliza sobre a amostragem. Conjunto de dados (5M) (w=1k) tamanho da janela i 1 ( f =100K ) Tamanho da amostragem i n
31 data stream mining Uma janela (w) desliza sobre a amostragem. (w=1k) tamanho da janela i 1 ( f =100K ) Tamanho da amostragem i n
32 data stream mining Para cada amostragem, o processo de aprendizado: PARA CADA AMOSTRAGEM ( f =100K ) CAPTURA JANELAS (w=1k) 1. Processa o Algoritmo; 2. Atualiza Estatísticas; 3. Atualiza Modelo;
33 data stream mining Para cada amostragem, o processo de aprendizado: PARA CADA AMOSTRAGEM ( f =100K ) CAPTURA JANELAS (w=1k) 1. Processa o Algoritmo; 2. Atualiza Estatísticas; 3. Atualiza Modelo;
34 data stream mining Dentro do processo de aprendizado: 1. Definição do Algoritmo; 2. Definição dos critério para a seleção de atributos;
35 data stream mining Aplicando a ferramenta na prática. Exemplo Base Airlines Passo 1: qual o tipo de tarefa? REGRESSÃO
36 data stream mining Contexto: Aprendizado de Máquina Supervisionado Não Supervisionado Classificação Regressão Clusterização Associação
37 data stream mining Exemplo de dados: Base Airlines
38 data stream mining Aplicando a ferramenta na prática. Passo 2: qual(is) algoritmo(s)?
39 data stream mining Aplicando a ferramenta na prática. Alguns algoritmos (MOA) para REGRESSÃO FIMT-DD AMRules IBLStreams SNF Regressor
40 data stream mining Algoritmos selecionados: FIMT-DD: Fast Incremental Model Tree with Drift Detect AMRules: Associate Model Rules IBLStreams: Instance-Base Learning SNF Regressor: Scalar Free-Network
41 regressão Como avaliar o resultado da regressão (erro)? x1 x2 x3 y predicted Métrica muito utilizada: Mean Absolute Error
42 regressão Como avaliar o resultado da regressão (erro)? x1 x2 x3 y predicted diff n MAE = 1 n i 1 y i y i SUM(ABS(y-predicted)) COUNT(instances)
43 regressão Como avaliar o resultado da regressão (erro)? x1 x2 x3 y predicted diff n MAE = 1 n i 1 y i y i 6 3
44 data stream mining - exemplo Base Airlines
45 data stream mining - exemplo Base Airlines Year,Month,DayofMonth,DayofWeek,CRSDepTime,CRSArrTime, UniqueCarrier,FlightNum,ActualElapsedTime,Origin,Dest, Distance,Diverted,ArrDelay 2008,1,1,2,10,737,NW,336,274,LAX,DTW,1979,0, ,1,1,2,15,823,B6,172,299,SMF,JFK,2521,0, ,1,1,2,25,535,AA,622,182,SMF,DFW,1431,0, ,1,1,2,25,709,DL,430,266,PHX,JFK,2153,0, ,1,1,2,30,444,AS,198,222,ANC,SEA,1449,0,24
46 data stream mining - exemplo Resultados memória tempo poder de generalização
47 data stream mining - exemplo Resultados MAE AMRules... FIMT-DD... IBLStreams... SFN+AMRules... SFN+FIMT-DD... 12,54 11,26 x 10,97 11,29
48 data stream mining - exemplo Resultados Memória MB AMRules... FIMT-DD... SFN+AMRules... SFN+FIMT-DD
49 data stream mining - exemplo Resultados Tempo minutos AMRules... FIMT-DD... SFN+AMRules... SFN+FIMT-DD
50 data stream mining - exemplo Resultados Tempo FIMT-DD, 12
51 Data stream mining Data Stream Mining deve prever concept drift :
52 Data stream mining Data Stream Mining deve prever concept drift :
53 Data stream mining Data Stream Mining deve prever concept drift :
54 concept drift - configuração Base sintética - Friedman
55 concept drift - configuração Base sintética - Friedman
56 concept drift - configuração Base Friedman: Geração de 4 diferentes configurações (concept) com 1M de instâncias: C1 C2 C3 C4
57 concept drift - configuração Base Friedman: Geração de 4 diferentes configurações (concept) com 1M de instâncias: C1 f
58 concept drift - configuração Base Friedman: Geração de 4 diferentes configurações (concept) com 1M de instâncias: C1 f
59 concept drift - configuração Base Friedman: Geração de 4 diferentes configurações (concept) com 1M de instâncias: C2 f
60 concept drift - configuração Base Friedman: Geração de 4 diferentes configurações (concept) com 1M de instâncias: C3 f
61 concept drift - configuração Base Friedman: Geração de 4 diferentes configurações (concept) com 1M de instâncias: C4 f
62 concept drift - configuração Base Friedman: Última configuração é uma cópia da primeira: C1 C2 C3 C4 C5
63 concept drift - configuração Base Friedman: Última configuração é uma cópia da primeira: 1MI + 1MI + 1MI + 1MI + 1MI = 5 MI C1 C2 C3 C4 C5 instâncias
64 concept drift - configuração Base Friedman, bases derivadas: + 2 bases foram geradas a partir da original: Fried FriedChar FriedWOx4 Original Convertendo o valor (x 4 ) numérico para caractere 1=A, 2=B,... Removendo o atributo x 4
65 concept drift - resultados Tempo (min) de aprendizado para cada base de dados Fried FriedChar FriedWOx4 AMRules FIMT-DD SFN AMRules SFN FIMT-DD 17
66 Erro MAE concept drift - resultados Avaliando o comportamento durante a evolução do processo: 30 Análise do Erro MAE - Fried ,1 1,1 2,1 3,1 4,1 Instâncias (Milhão) AMRules FIMT-DD SFN AMRules SFN FIMT-DD
67 Erro MAE concept drift - resultados Avaliando o comportamento durante a evolução do processo: Análise do Erro MAE - FriedChar 0,1 1,1 2,1 3,1 4,1 Instâncias (Milhão) AMRules FIMT-DD SFN AMRules SFN FIMT-DD
68 Erro MAE concept drift - resultados Avaliando o comportamento durante a evolução do processo: Análise do Erro MAE - FriedWOx ,1 1,1 2,1 3,1 4,1 Instâncias (Milhão) AMRules FIMT-DD SFN AMRules SFN FIMT-DD
69 data stream mining - resumo Pré-Processamento Treinamento Concept Drift Métodos de Validação
70 Globalcode Open4education THE DEVELOPER S CONFERENCE POA-2018 Data Stream Mining: trabalhando com dados massivos André Luís Nunes nunes.br@gmail.com Data Science
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Leia maisProcesso de Descoberta de Conhecimento aplicado ao SIGAA UFPI
Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI
Leia maisMineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
Leia maisPentaho IoT Analytics Open Source Trilha IoT
Pentaho IoT Analytics Open Source Trilha IoT Marcio Junior Vieira CEO & Data Scientist, Ambiente Livre Marcio Junior Vieira Mini-cv 18 anos de experiência em informática, vivência em desenvolvimento e
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM
Leia mais19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA
19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ
Leia maisAprendizado de Máquina
Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de
Leia maisTutorial: Árvore de Decisão com Weka para a classificação de carne suína
Universidade Estadual de Londrina - UEL 2 CTA 121 - Processamento de Imagens em Alimentos Prática de Aprendizado de Máquina com Weka 28/07/2016 Prof. Dr. Sylvio Barbon Jr Tutorial: Árvore de Decisão com
Leia maisAgenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios
Machine Learning Agenda Conceitos Iniciais Modelos de aprendizado Oportunidades e casos de uso Ferramentas Desafios Ronald Bertele Bacharelado em Ciências da Computação - UCS MBA em Gestão de Negócios
Leia maisMACHINE LEARNING E DATA SCIENCE NA SAÚDE. aprendendo a usar as ferramentas da inovação sem precisar programação
MACHINE LEARNING E DATA SCIENCE NA SAÚDE aprendendo a usar as ferramentas da inovação sem precisar programação ü Comece a usar a ciência de dados em seus projetos rapidamente ü Conquiste a nuvem com suas
Leia maisA contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe
A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe Leopoldo Ramos de Oliveira 1, Fausto Bernard Melo Soares 2, José Acácio de Jesus
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisProfessor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisFACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
Leia maisProf. Heitor Silvério Lopes
Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto
Leia maisFigura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC
Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio
Leia maisPassos para o Aprendizado de Máquina com Pentaho. Prof. Marcos Vinicius Fidelis UTFPR/UEPG
Passos para o Aprendizado de Máquina com Pentaho Prof. Marcos Vinicius Fidelis UTFPR/UEPG Apresentação Professor da UTFPR, leciona Sistemas de Apoio a Decisão e Tópicos Avançados em BD (WEKA, Pentaho e
Leia mais18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA
18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio
Leia maisClassificação: 1R e Naïve Bayes. Eduardo Raul Hruschka
Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada
Leia maisO Impacto de diferentes tipos de vieses em modelos de Aprendizado de Máquina Trilha Machine Learning
O Impacto de diferentes tipos de vieses em modelos de Aprendizado de Máquina Trilha Machine Learning Agenda Análise de Dados Aprendizado de Máquina Viés Análise de Dados Globalcode Open4education Análise
Leia maisDeterminação de vícios refrativos oculares utilizando Support Vector Machines
Determinação de vícios refrativos oculares utilizando Support Vector Machines Giampaolo Luiz Libralão, André Ponce de Leon F. de Carvalho, Antonio Valerio Netto, Maria Cristina Ferreira de Oliveira Instituto
Leia maisHTILDE-RT: Um algoritmo para aprender Árvores de Regressão Relacionais em grandes conjuntos de dados
HTILDE-RT: Um algoritmo para aprender Árvores de Regressão Relacionais em grandes conjuntos de dados Glauber M. C. Menezes 1, Gerson Zaverucha 1 1 Programa de Engenharia de Sistemas de Computação (PESC)
Leia maisAnálise de Risco de Crédito Bancário
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UFCG Curso de Mestrado em Informática Aluno: Francisco Fabian de Macedo Almeida Disciplina: Mineração de Dados Professor: Marcos Sampaio Data: 20 de dezembro de 2007
Leia maisAprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR
Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados. Cenário
Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas
Leia maisCRI Minas Indústria 4.0. Case Vallourec: Golden Batch na produção de tubos
CRI Minas Indústria 4.0 Case Vallourec: Golden Batch na produção de tubos 02 05 2018 G o l d e n B a t c h A n a l y s i s Case Vallourec Líder mundial em soluções tubulares premium, a Vallourec assegura
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.1. Introdução às Redes Neurais Artificiais (RNAs) 2.1.1. Motivação
Leia maisFundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD
Leia maisClassificação de Padrões. Abordagem prática com Redes Neurais Artificiais
Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas
Leia maisAprendizado de Máquina
Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos
Leia maisAlternativas para construção de classificadores de solos brasileiros
48 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Alternativas para construção de classificadores de solos brasileiros Matheus Agostini Ferraciolli¹ Luiz Manoel Silva Cunha² Resumo: Este
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia mais7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS
7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução
Leia maisMineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
Leia maisAnálise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina
Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Ana Carolina Bras Costa 1, Êmile Cunha Lopes 1 1 Departamento de Informática Universidade Federal do Maranhão (UFMA)
Leia maisAgregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
Leia maisTópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr
Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências
Leia maisMetodologia Aplicada a Computação.
Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisExtração de associações entre itens de um portfólio de tecnologias agrícolas
78 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Extração de associações entre itens de um portfólio de tecnologias agrícolas Luisa Miyashiro Tápias¹ Maria Fernanda Moura² Stanley Robson
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Leia maisBoas Maneiras em Aprendizado de Máquinas
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas
Leia maisMáquinas de suporte vetorial e sua aplicação na detecção de spam
e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura
Leia maisAprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Leia maisPREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO
PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos Carla Fernandes da SILVA 1 ; Clayton Silva MENDES 2. RESUMO A evasão escolar é um dos principais desafios a ser superado
Leia maisMineração de Dados Aplicada no Contexto Educacional
Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 08 Linear Max Pereira : Prevendo valores de casas Quanto vale a minha casa? Quero vender minha casa. R$??? Verificar as últimas vendas no meu bairro. Por quanto
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS Etapas do Processo de KDD Livro: Data Mining Conceitos, técnicas, algoritmos, Orientações e aplicações Ronaldo Goldschmidt, Eduardo Bezerra, Emmanuel Passos KDD Knowledge Discovery
Leia maisAprendizado de Máquina
Aprendizado de Máquina Introdução Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 19 Introdução
Leia maisTeoria do aprendizado
Teoria do aprendizado Marcelo K. Albertini 7 de Agosto de 2014 2/37 Teoria do aprendizado Teoremas não existe almoço grátis Viés e variância Aprendizado PAC Dimensão VC Máquinas de vetores suporte 3/37
Leia maisReconhecimento de Linguagem de Sinais e Tecnologia Adaptativa
Reconhecimento de Linguagem de Sinais e Tecnologia Adaptativa Dr. Hemerson Pistori GPEC - Universidade Católica Dom Bosco (UCDB) - Campo Grande, MS Brasil www.gpec.ucdb.br Imagens extraídas de www.dicionariolibras.com.br
Leia maisJAI 6 - Deep Learning Teoria e Prática
JAI 6 - Deep Learning Teoria e Prática Esteban Clua e Cristina Nader Vasconcelos Universidade Federal Fluminense Fundamentos Computação baseada em modelos crisnv@ic.uff.br 2 Computação baseada em aprendizado
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisRedes Neurais e Sistemas Fuzzy
Redes Neurais e Sistemas Fuzzy O ADALINE e o algoritmo LMS O ADALINE No contexto de classificação, o ADALINE [B. Widrow 1960] pode ser visto como um perceptron com algoritmo de treinamento baseado em minimização
Leia maisData Mining. Resultados Desportivos PROJETO FEUP MIEGI TURMA 1 EQUIPA 2
Data Mining Resultados Desportivos PROJETO FEUP MIEGI TURMA 1 EQUIPA 2 SUPERVISOR Armando Leitão MONITOR Luís Dias André Pinto Bárbara Ribeiro Beatriz Gonçalves Margarida Silva Teresa Matos Objetivos Caraterizar
Leia maisAprendizado por Árvores de Decisão
Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: pozzer@inf.ufsm.br Período: 2006/01 Aprendizado por Árvores
Leia maisEstimativa de demanda potencial de matrículas em ensino superior usando dados públicos e múltiplos modelos de regressão
Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2014-10 Estimativa de demanda potencial
Leia maisMineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra
Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação
Leia maisANALISADOR DE DADOS AUTOMATIZADO UTILIZANDO MACHINE LEARNING. QCONSP 18 Eiti Kimura Maio/2018
ANALISADOR DE DADOS AUTOMATIZADO UTILIZANDO MACHINE LEARNING QCONSP 18 Eiti Kimura Maio/2018 SOBRE MIM Eiti Kimura Coordenador de TI e Software Architect na Movile Msc. in Electrical Engineering Apache
Leia maisEstudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende
Estudo de Caso Daniel Gomes Dosualdo Solange Oliveira Rezende Índice Descrição da Área Identificação do Problema Descrição do Conjunto de Dados Pré-Processamento Extração de Padrões Pós-Processamento Disponibilização
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Francisco de A.T. de Carvalho 1 Aprendizagem de Máquina 1/ Introdução Situações do dia a dia em que AM é importante: Saúde. input: informações sobre pacientes relativas a gravidez
Leia maisUNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIRO CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
UNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIRO CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA Detecção de Ataques de Negação de Serviço Utilizando Aprendizado de Máquina
Leia maisMineração em Data Streams - Weka e MOA. Profa. Elaine Faria UFU
Mineração em Data Streams - Weka e MOA Profa. Elaine Faria UFU - 2018 O que é o Weka? Ferramenta para Aprendizado de Máquina desenvolvida em Java Criado por pesquisadores da Universidade de Waikato Nova
Leia maisBANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka
BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Mining Árvores de Decisão Categorização de Dados Parte II Rogério
Leia maisDescoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
Leia maisData Mining. Felipe E. Barletta Mendes. 21 de maio de 2008
21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é
Leia maisMineração de Dados Educacionais nos Resultados do ENEM de 2015
Mineração de Dados Educacionais nos Resultados do ENEM de 2015 Augusto Simon 1, Sílvio César Cazella 2,3 1 Programa de Pós-Graduação em Educação (PPGEDU) Universidade Federal do Rio Grande do Sul (UFRGS)
Leia maisPCS 2039 Modelagem e Simulação de Sistemas Computacionais
UNIVERSIDADE DE SÃO PAULO ESCOLA POLITÉCNICA Departamento de Engenharia de Computação e Sistemas Digitais PCS 2039 Modelagem e Simulação de Sistemas Computacionais Graduação em Engenharia de Computação
Leia maisÁrvores de Decisão. Sistemas Inteligentes
Árvores de Decisão Sistemas Inteligentes Uma Abordagem típica em aprendizagem simbólica Árvores de decisão: inductive decision trees (ID3) Instâncias (exemplos) são representadas por pares atributo-valor
Leia maisMétodos para Classificação: - Naïve Bayes.
Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo
Leia maisColeta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software
Coleta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software Rodolfo Vebber Bisol, Anderson Santos da Silva, Cristian Cleder Machado, Lisandro Zambenedetti
Leia maisPredição de Utilização de Recursos Computacionais Usando Séries Temporais
Predição de Utilização de Recursos Computacionais Usando Séries Temporais Aluno: Paulo Roberto Pereira da Silva Orientador: Paulo Romero Martins Maciel Coorientador: Jean Carlos Teixeira de Araujo de Garanhuns
Leia maisPrograma do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas
Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação
Leia mais2284-ELE/5, 3316-IE/3
INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem
Leia maisAprendizado indutivo. Marcelo K. Albertini. 17 de Abril de 2014
Aprendizado indutivo Marcelo K. Albertini 17 de Abril de 2014 2/22 Aprendizado indutivo O que é? Porque é difícil? Como podemos resolver problemas de indução? 3/22 Aprendizado supervisionado Temos: exemplos
Leia maisModelos Probabilísticos
Modelos Probabilísticos Somente para lembrar... Modelos são extremamente importantes para o estudo do desempenho de um sistema antes de implementá-lo na prática! Foguete proposto tem confiabilidade? Devemos
Leia maisMineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth -
Mineração de Dados - Contextualização Fonte: Prof. Fabrício J. Barth - http://fbarth.net.br/ Mineração de Dados - Contextualização Uso da informação Síntese do conhecimento; Manter, disseminar, organizar,
Leia maisWeka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining
Weka Universidade de Waikato - Nova Zelândia Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining implementado em Java open source software http://www.cs.waikato.ac.nz/ml/weka/
Leia maisAprendizado de Máquina
Tópicos Aprendizado de Máquina Aula 3 http://www.ic.uff.br/~bianca/aa/. Introdução Cap. (6/03). Classificação Indutiva Cap. (3/03) 3. Cap. 3 (30/03) 4. Ensembles - Artigo (06/04) 5. Avaliação Experimental
Leia maisRoteiro. Introdução. Introdução. Introdução. Abordagens. Aprendizado de máquina. (machine learning) Introdução. Arquitetura
Aprendizado de Máquina (machine learning) Introdução abordagens técnicas Arquitetura Roteiro Introdução Dificuldade classificação síntese aprendizado de máquina (simbólico) Definição: Learning denotes
Leia maisImplementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
Leia maisRedes Neurais Artificiais
Redes Neurais Artificiais Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Redes Neurais Biológicas 2. Neurônio Artificial 3. Rede Neural Artificial 4. Keras 1 Redes Neurais Biológicas
Leia maisRedes Neurais no WEKA
Redes Neurais WEKA http://www.cs.waikato.ac.nz/ml/weka/ Redes Neurais no WEKA Introdução ao WEKA Base Benchmark Estudo de Casos Análise de Crédito Bancário 1 Redes Neurais no Weka WEKA (Waikaito Environment
Leia maisAprendizado de Máquina
Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento
Leia maisMAC 0425/ Inteligência Artificial
MAC 0425/5739 - Inteligência Artificial Exercício-Programa 4 - Clasificação Prazo limite de entrega: 23:59 07/12/2016 1 Introdução Neste exercício-programa estudaremos o problema de aprendizagem supervisionado
Leia maisIntrodução a Sistemas Inteligentes
Introdução a Sistemas Inteligentes Conceituação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos originais gentilmente cedidos pelo
Leia maisUNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --
Leia maisIntrodução. Construção. Dificuldades. Exemplos
Árvore de Decisão Árvore de Decisão Introdução Construção Dificuldades Exemplos Árvore de Decisão - Introdução Que tipo de chato você é? Árvore de Decisão - Introdução Árvore de Decisão - Introdução Árvore
Leia maisANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS
ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Abrantes Diniz 1, Fabiano Rosemberg de Moura Silva 2, Roberto Douglas da Costa 3, Thiago
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados
Roteiro PCC142 / BCC444 - Mineração de Dados Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz
Leia maisINTELIGÊNCIA ARTIFICIAL APLICADA À SUPERVISÃO DA QUALIDADE DE ENERGIA
INTELIGÊNCIA ARTIFICIAL APLICADA À SUPERVISÃO DA QUALIDADE DE ENERGIA José Borges (Bolsista PIBIC/CNPQ), Aldebaro Klautau (Orientador) Laboratório de Processamento de Sinais Departamento de Engenharia
Leia maisMétodos baseados em árvores
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos baseados em árvores Eduardo Vargas Ferreira Introdução Árvore de decisão é o conjunto de regras que envolvem a estratificação
Leia maisPlataforma de Ciência de Dados. aplicada à Saúde. Pesquisador em Saúde Pública
Plataforma de Ciência de Dados aplicada à Saúde Prof. Dr. Marcel Pedroso Prof. Dr. Marcel Pedroso Pesquisador em Saúde Pública CIÊNCIA DE DADOS - DEFINIÇÃO OBJETIVO PRINCIPAL Pesquisar, desenvolver
Leia maisWEKA: Prática Carregando a base de dados no Weka
WEKA: Prática 2 1. Introdução O objetivo desta prática é utilizar a ferramenta Weka para comparar dois algoritmos de aprendizagem de máquina em um problema de detecção de SPAM. Os algoritmos a serem comparados
Leia mais