Web Data mining com R: aprendizagem de máquina



Documentos relacionados
Hierarquia de modelos e Aprendizagem de Máquina

Web Data Mining com R

Data, Text and Web Mining

Web Data Mining com R: design de projetos para criação de modelos preditivos

Disciplina de Text Mining

Aprendizagem de Máquina

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Algoritmos Indutores de Árvores de

Fabrício J. Barth. Apontador

Laboratório de Mídias Sociais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Informações na era do Big Data

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

Módulo 4: Gerenciamento de Dados

FundamentosemInformática

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

INF 1771 Inteligência Artificial

COMUNICAÇÃO NA ERA DO BIG DATA

ANEXO I Sumário Manual de Preços e Serviços Digitais

Armazém Sistema de Recebimento SDR 006 LIBERTAÇÃO DO ESTOQUE USUÁRIO MANUAL DE TREINAMENTO. Versão 1.00

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Aprendizagem de Máquina

PROJETO DE REDES

Introdução. Capítulo 1

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Introdução a Software

Uma organização pode ser descrita como um arranjo sistemático, onde esforços individuais são agregados em prol de um resultado coletivo

Gerenciamento de Dados e Gestão do Conhecimento

ADM041 / EPR806 Sistemas de Informação

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

Avaliando o que foi Aprendido

ArcGIS 1: Introdução ao GIS (10.2)

UNIVERSIDADE FEDERAL DE SANTA CATARINA

Política de privacidade do Norton Community Watch

Mineração de Opinião / Análise de Sentimentos

Inovações na sala de aula e as Redes Sociais

MANUAL COL MÓDULO DE CADASTRO DE CLIENTES

Introdução a listas - Windows SharePoint Services - Microsoft Office Online

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores

Gestão do Conhecimento. Capitulo 11

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Software Web para: Empresas, Governo, Organizações, Entidades de Classe, Sindicatos, ONG's e Profissionais Liberais

ANEXO I ROTEIRO PARA ELABORAÇÃO DO PROJETO DE NEGÓCIO

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Ambiente Virtual de Aprendizagem Moodle

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO

AVALIAÇÃO DE TÉCNICAS DE FILTRAGEM COLABORATIVA

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Chatterbot: uma ferramenta para motivar estudantes de cursos a distância

Apresenta. SofStore o mais novo aliado no gerenciamento do seu negócio

Plataformas de BI Qual é a mais adequada para o meu negócio?

Introdução à Computação

SIGEM AVALIAÇÃO DE ALUNOS WEB

Sistema Tutor Inteligente baseado em Agentes. Pedagógicas da Universidade Aberta do Piauí. Prof. Dr. Vinicius Ponte Machado

Análise e Projeto Orientados a Objetos Aula IX Modelo Conceitual do Sistema (Modelo de Domínio) Prof.: Bruno E. G. Gomes IFRN

Classificação de Imagens

02 - Usando o SiteMaster - Informações importantes

BANCO DE DADOS I AULA 3. Willamys Araújo

Gestão de Ativos. Manual do Usuário. Treinamento Fase 1 (TRN 01)

Contexto de Big Data, Ciência de Dados e KDD

Privacidade. <Nome> <Instituição> < >

Curva ABC. Tecinco Informática Ltda. Av. Brasil, º Andar Centro Cascavel PR

Orientação a Objetos

Inteligência Computacional [2COP229]

Web Services. Autor: Rômulo Rosa Furtado

Sistemas de Informação

PROJETO INFORMÁTICA NA ESCOLA

EssentialPIM: Organize sua vida sem gastar nada! 01. Start menu program group Desktop icon Quick launch icon 02.

1 INTRODUÇÃO 1.1 CONCEITO DE PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO

Tabela de Preços Sugeridos

EQUIPE: ANA IZABEL DAYSE FRANÇA JENNIFER MARTINS MARIA VÂNIA RENATA FREIRE SAMARA ARAÚJO

Marketing. Serviço de marketing

FECAP. Plataforma Microsoft

como ferramenta de análise de informações no mercado de saúde: o caso da Unimed-BH Ana Paula Franco Viegas Pereira

Número de pessoas com acesso à internet passa de 120 milhões

Moodle - CEAD Manual do Estudante

Dell Premier. Guia de Compras e Pedidos. Fazendo Login na sua Página Premier. Três formas de comprar

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Marcelo K. Albertini. 17 de Abril de 2014

Redes sociais no Terceiro Setor

Arquitetura física de um Data Warehouse

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

ATIVIDADES PRÁTICAS SUPERVISIONADAS

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Histórico da Revisão. Versão Descrição Autor. 1.0 Versão Inicial

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

A Grande Importância da Mineração de Dados nas Organizações

Complemento II Noções Introdutória em Redes Neurais

Transcrição:

Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013

Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de aprendizagem supervisionada (modelos preditivos). Exemplos de aprendizagem não supervisionada (modelos descritivos). Referências e exercícios. Web Data mining com R: aprendizagem de máquina Sumário 2

Contexto e exemplos Data Mining: grandes bases de dados têm crescido com a automatização de alguns processos e com o advento da Web, por exemplo: web click data, registros médicos, dados biológicos, dados capturados a partir de sensores. Aplicações que não podem ser programadas na mão : por exemplo, helicopteros autônomos, reconhecedor de escrita, processadores de linguagem natural e sistemas de visão computacional. Aplicações personalizáveis: Amazon, Netflix. Compreensão do aprendizado humano. Web Data mining com R: aprendizagem de máquina Contexto e exemplos 3

O que é Aprendizagem de Máquina? Área de estudo que fornece aos computadores a habilidade de aprender sem serem explicitamente programados [Arthur Samuel (1959)]. Definição bem formada: A computer program is said to learn from experience A with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E [Tom Mitchell (1998)]. Web Data mining com R: aprendizagem de máquina O que é Aprendizagem de Máquina? 4

Exercício O que cada uma das sentenças abaixo descreve segundo a definição do Tom Mitchell? Classificar e-mails como spam ou não spam. Verificar quais e-mails o usuário classifica como spam. O número (ou fração) de e-mails corretamente classificados como spam ou não spam. Web Data mining com R: aprendizagem de máquina Exercício 5

Hierarquia de aprendizado Aprendizagem Supervisionada Modelos preditivos Não supervisionada Modelos descritivos Classificação Regressão Sumarização Associação Agrupamento Web Data mining com R: aprendizagem de máquina Hierarquia de aprendizado 6

Exemplos de aprendizagem supervisionada Estimar o preço de uma casa. atributos: tamanho, posição geográfica, material. classe: preço (regressão). Determinar se uma pessoa tem câncer benigno ou maligno. atributos: tamanho do tumor, formato do tumor, idade do paciente. classe: tumor benigno ou tumor maligno (classificação). Web Data mining com R: aprendizagem de máquina Exemplos de aprendizagem supervisionada 7

Determinar se é um texto publicado em uma rede social é inadequado ou não. atributos: quantidade de palavras encontradas no texto, quantidade de palavras proibidas encontradas no texto, quantidade de textos já criados pelo usuário, idade do usuário no sistema, quantidade de textos criados pelo usuário e moderados,... classe: texto adequado ou não (classificação). classes: texto adequado, texto inadequado, texto com propaganda (classificação com múltiplas classes). Web Data mining com R: aprendizagem de máquina Exemplos de aprendizagem supervisionada 8

Exemplo de dataset com classe Idade Miopia Astigmat. Lacrimej. Lentes jovem míope não reduzido nenhuma jovem míope não normal fraca jovem míope sim reduzido nenhuma jovem míope sim normal forte adulto míope não reduzido nenhuma Web Data mining com R: aprendizagem de máquina Exemplo de dataset com classe 9

Exercícios Que problema deve ser tratado como problema de regressão e que problema deve ser tratado como problema de classificação? A sua empresa possui 1.000 itens idênticos em estoque. Você quer predizer quantos destes itens serão vendidos nos próximos três meses. Você quer examinar clientes seus e para cada um decidir se ele irá pagar todo o financiamento ou não. Web Data mining com R: aprendizagem de máquina Exercícios 10

Exemplos de aprendizagem não supervisionada Dado conjuntos de itens adquiridos na mesma compra, identificar padrões de compra. Identificar padrões de navegação em sites. Agrupar notícias semelhantes publicadas por várias fontes de informação. Numa rede social, identificar sub-grupo de pessoas. Web Data mining com R: aprendizagem de máquina Exemplos de aprendizagem não supervisionada 11

Exemplos de aprendizagem não supervisionada Table 1: Exemplo de tabela com as transações dos usuários usuário categoria 1 categoria 2 categoria 3 categoriam user 1 0 2 0 1 user 2 1 1 0 0 user 3 2 0 1 0 user 4 0 1 0 0 usern 1 1 0 1 Web Data mining com R: aprendizagem de máquina Exemplos de aprendizagem não supervisionada 12

Exemplo de identificação de grupos em redes sociais Web Data mining com R: aprendizagem de máquina Exemplo de identificação de grupos em redes sociais 13

Exercícios Quais dos problemas abaixo você iria resolver com uma abordagem não supervisionada de aprendizagem? Dado e-mails rotulados como spam e não spam, desenvolver um filtro de spam. Dado um conjunto de notícias encontradas na Internet, agrupá-las em conjunto de notícias que tratam do mesmo assunto. Web Data mining com R: aprendizagem de máquina Exercícios 14

Dado uma base de clientes, descobrir segmentos de clientes. Dado uma base de pacientes diagnosticados com diabetes ou não, aprender a classificar novos pacientes com diabetes ou não. Web Data mining com R: aprendizagem de máquina Exercícios 15

Material de consulta Tom Mitchell. Machine Learning, 1997. Iah H. Witteh and Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), 2011. Andrew Ng. http://www.ml-class.org Faceli, Lorena, Gama, Carvalho. Inteligência Artificial: uma abordagem de aprendizado de máquina, 2011. Web Data mining com R: aprendizagem de máquina Material de consulta 16