PROCESSAMENTO DE TEXTO

Tamanho: px
Começar a partir da página:

Download "PROCESSAMENTO DE TEXTO"

Transcrição

1 PROCESSAMENTO DE TEXTO (TEXT MINING) Jorge Teixeira IART 2014/2015

2 SAPO LABS ( )

3 AGENDA (Enquadramento na UC de Inteligência Artificial - IART) Parte 1: Introdução à Linguagem Natural Computacional (Secção VI) Processamento de texto (Text Mining) e Processamento da Linguagem Natural Media na Web Parte 2: Aprendizagem Automática (Secção VII) Conceitos gerais de Machine Learning k-nearest Neighbour e Support Vector Machines Caso de estudo

4 PARTE I INTRODUÇÃO À LINGUAGEM NATURAL COMPUTACIONAL

5 TEXT MINING PROCESSAMENTO DA LINGUAGEM NATURAL

6 TEXT MINING stands for? Text mining é uma sub-área do Data Mining Ciência que trata o processamento de informação (texto) Processamento que se espera de elevada qualidade - relevância, novidade, interesse

7 TEXT MINING - Técnicas Extracção de padrões Extracção de entidades Categorização de texto Clustering de texto Análise de sentimento Sumarização de texto Visualização de informação

8 TEXT MINING - Aplicações Internet (online media, social media) TV (user experience) Publicidade Saúde Segurança Smart cities E-learning

9 MEDIA NA WEB

10 ARQUITECTURA Dados Extracção Informação Processamento Informação Visualização Informação

11 MEDIA NA WEB DADOS

12 NOTÍCIAS

13 REDES SOCIAIS

14 MEDIA NA WEB EXTRAÇÃO DE INFORMAÇÃO

15 DISPONIBILIDADE DOS DADOS

16 MEDIA NA WEB PROCESSAMENTO DE INFORMAÇÃO

17 EXTRAÇÃO DE PADRÕES ( )

18 EXTRAÇÃO DE ENTIDADES ( ) ( )

19 RECOMENDAÇÃO DE CONTEÚDO ( ) ( )

20 ANÁLISE DE SENTIMENTO ( )

21 MEDIA NA WEB VISUALIZAÇÃO DE INFORMAÇÃO

22 TWITTEURO ( )

23 MUNDO EM PESSOA ( )

24 LÚSICA ( lusica.labs.sapo.pt )

25 UM PAÍS COMO NÓS ( )

26 MÁQUINA DO TEMPO ( máquinadotempo.sapo.pt )

27 GRANDE ÁREA ( )

28 PARTE II APRENDIZAGEM AUTOMÁTICA

29 Conceitos Gerais Sistemas de aprendizagem automática (ML) aprendem automaticamente a partir de características dos dados. A B C?

30 Conceitos Gerais ML é usada na classificação de conteúdos, filtros de spam, sistemas de recomendação, posicionamento de anúncios, fraude em transações electrónicas, etc. Vamo-nos focar na classificação, um dos principais tipos de ML Um classificador é um sistema que recebe (tipicamente) vectores discretos e/ou contínuos de características (features) e retorna um ou várias classe. Exemplo: sistema de filtro de spam Principais tipos de algoritmos: supervisionados, não-supervisionados e semi-supervisionados A capacidade de generalização do classificador é um dos principais fatores associados à qualidade de um classificador A quantidade de dados nem sempre corresponde a uma melhoria da classificação

31 Conceitos Gerais Learning = Representation + Evaluation + Optimization ( Pedro Domingos A few useful things to know about machine learning. Communications of the ACM, Volume 55, Issue 10, Pages October )

32 Conceitos Gerais

33 k-nearest Neighbour K-NN classifica um exemplo de teste a partir da pesquisa dos k exemplos de treino (vizinhos) mais semelhantes e atribui (prevê) a classe maioritária. Os exemplos de treino são vectores de features num espaço multi-dimensionais, cada um deles com uma classe atribuída. Métricas típicas: distância Euclidiana e distância de Hamming

34 Support Vector Machines Para um dado conjunto de dados de input, prevêem qual das duas classes possíveis caracteriza melhor cada exemplo de teste. É tipicamente um problema de classificação binário. Um modelo SVM é uma representação de pontos no espaço multidimensional, mapeados de tal forma que seja possível criar uma área de separação (margem) entre dois conjuntos de pontos. Cada uma destas áreas representa uma classe.

35 Support Vector Machines A margem entre as classes deve ser a maior possível Os vectores de suporte são vectores perpendiculares ao hiper-plano de separação (margem) que partem do ponto mais próximo de cada uma das classes. SVMs suportam classificação não-linear através de kernels também não lineares.

36 CASO DE ESTUDO

37 VERBETES EXTRACÇÃO AUTOMÁTICA DE MICRO-BIOGRAFIAS

38 O que é o Verbetes? Serviço para pesquisa biográfica de entidades (pessoas, organizações) Este serviço responde a perguntas como: - Quem é Alberto João Jardim? - Qual a profissão/cargo de Paulo Portas em Julho 2011? e hoje? - Quem é o ministro da defesa de Israel?

39 Abordagem usada Abordagem: Identificar nomes de personalidades de notícias Extraír tuplos das notícias com base em padrões [ Pedro Passos Coelho; Primeiro ministro; ; hoje ] Identificar nomes alternativos (Passos Coelho, Passos) Classificar os tuplos como pessoa, organizacão ou outro

40 Desafios Desafios: Desambiguação: - Paulo Bento: seleccionador nacional - Rui Bento: treinador do Beira-Mar - Vítor Bento: economista Inclusão de outras entidades (organizações): - Alfredo da Costa - Jerónimo Martins

41 Tecnologias usadas Tecnologias usadas: Sistema baseado em padrões existentes nas notícias: - O primeiro ministro, Pedro Passos Coelho,... - o ex-primeiro ministro José Sócrates, Baseado essencialmente em técnicas de processamento de linguagem natural e aprendizagem automática. Utilização de CRFs (Conditional Random Fields): - Para a identificação de entidades no texto

42 CONDITIONAL RANDOM FIELDS Dictionary-based annotation C news N initial Iteration 0 Bootstrapping CRF on news Bootstrapping CRF on HAREM N initial + 0,80 Baseline dictionary on news Baseline CRF on news C i Annotate C i with L i & new iteration (i ++) sum(l i ) F-measure 0,70 0,60 0,50 0,40 C i => Features 0,30 0,20 M i 0,10 Test model on C i & Identify new names No 0, Bootstrapping Iteration Stable? Yes NER model L i Jorge Teixeira, Luís Sarmento, Eugénio Oliveira. (2011) A Bootstrapping Approach for Training a NER with Conditional Random Fields Progress in Artificial Intelligence (LNAI 7026), 15th Portuguese Conference on Artificial Intelligence, EPIA 2011, Lisbon, Portugal, October 10-13, 2011, pp

43 RECURSOS DISPONÍVEIS Notícias publicadas em sites de notícias portugueses Citações de personalidades públicas Comentários de notícias Tweets (mensagens de utilizadores portugueses e perfis) Listas de personalidades, co-menções, etc (Verbetes) Listas de profissões, nacionalidades, palavrões, etc (SemanticLists) Listas de palavras polarizadas (sentiment analysis)

44 PROJETOS IART 14/15 Extracção de informação Extracção de outros descritores (projecto Verbetes) Normalização de tópicos ( OE2014 vs Orçamento de Estado 2014 ) Criação de perfis opinativos a partir dos tweets e comentários Aprendizagem Automática (Machine Learinig) Hierarquização de tópicos ( Desporto, Futebol e Liga Sagres ) Identificação de citações com CRFs

45 Q&A Jorge Teixeira - jft@fe.up.pt Sala i124 - Labs Sapo / UP

MEDIA NA WEB. JORGE TEIXEIRA - SSIIM 2011/2012. Processamento de notícias da web

MEDIA NA WEB. JORGE TEIXEIRA - SSIIM 2011/2012. Processamento de notícias da web MEDIA NA WEB Processamento de notícias da web JORGE TEIXEIRA - jft@fe.up.pt SSIIM 2011/2012 NOTÍCIAS PROCESSAMENTO DE INFORMAÇÃO Sistemas de recomendação PROCESSAMENTO DE INFORMAÇÃO Sistemas de personalização

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos

Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos Introdução * Método supervisionado de aprendizagem de máquina * Empregado em classificação de dados Classificação binária

Leia mais

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Introdução a Machine Learning: Teoria, Aplicações e IA na Arquitetura Intel Vitor Hugo Ferreira, DSc - UFF Flávio Mello, DSc UFRJ e Ai2Biz

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani O que é Machine Learning? Estatística Machine Learning

Leia mais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 17 Support Vector Machines (SVM) Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor

Leia mais

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários

Leia mais

Informática Parte 19 Prof. Márcio Hunecke

Informática Parte 19 Prof. Márcio Hunecke Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem

Leia mais

scikit-learn: Aprendizado de máquina 101 com Python

scikit-learn: Aprendizado de máquina 101 com Python scikit-learn: Aprendizado de máquina 101 com Python Luciana Fujii Campus Party BH 2016 1 / 30 Introdução Aprendizado de máquina Aprendizado de máquina é o campo da ciência da computação que dá aos computadores

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

T6.1 Reconhecimento de Padrões

T6.1 Reconhecimento de Padrões T6.1 Reconhecimento de Padrões Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Introdução ao reconhecimento de padrões 2. Representação do conhecimento 3. Reconhecimento

Leia mais

Informática. Aprendizado de Máquina. Professor Márcio Hunecke.

Informática. Aprendizado de Máquina. Professor Márcio Hunecke. Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:

Leia mais

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar Introdução Comidas podem apresentar deformações e variações em sua forma, além de conter muitos ingredientes, nem todos visíveis; Métodos tradicionais de reconhecimento requerem a detecção de características

Leia mais

Data Analytics Prevenção e deteção de Fraude

Data Analytics Prevenção e deteção de Fraude www.pwc.pt Data Analytics Prevenção e deteção de Fraude 21 Agenda Auditoria Interna e Fraude Agenda Introdução à Fraude Papel da Auditoria Interna Cases Studies Data Analytics Exemplos Reconhecer 3 Conceito

Leia mais

Caracterização de Imagens via Redes Neurais Artificiais

Caracterização de Imagens via Redes Neurais Artificiais Caracterização de Imagens via Redes Neurais Artificiais Autor: Eduardo Ferreira Ribeiro 1, Orientadora: Celia Zorzo Barcelos 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal

Leia mais

Plano de Estudos. Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód.

Plano de Estudos. Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód. Plano de Estudos Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód. 264) 1. o Ano - 1. o Semestre INF9258D Iniciação à Investigação Informática

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

SUPPORT VECTOR MACHINE - SVM

SUPPORT VECTOR MACHINE - SVM SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento

Leia mais

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a 1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

CRI Minas Indústria 4.0. Case Vallourec: Golden Batch na produção de tubos

CRI Minas Indústria 4.0. Case Vallourec: Golden Batch na produção de tubos CRI Minas Indústria 4.0 Case Vallourec: Golden Batch na produção de tubos 02 05 2018 G o l d e n B a t c h A n a l y s i s Case Vallourec Líder mundial em soluções tubulares premium, a Vallourec assegura

Leia mais

Comparação de métodos de fingerprints para o rastreio virtual de inibidores da 5α-redutase

Comparação de métodos de fingerprints para o rastreio virtual de inibidores da 5α-redutase Pedro Rafael Mendes Reis Comparação de métodos de fingerprints para o rastreio virtual de inibidores da 5α-redutase Dissertação de Mestrado em Química Farmacêutica Industrial, orientada pela Doutora Cândida

Leia mais

Algarve. A2 Aprendizagem Automática ML Machine Learning 7/15/2013

Algarve. A2 Aprendizagem Automática ML Machine Learning 7/15/2013 Preparado para o curso de pós-graduação em Ciências da Computação da Universidade Federal do Ceará, Fortaleza, Brasil A2 Aprendizagem Automática ML Machine Learning Julho e Agosto de 2013 José Valente

Leia mais

Biometria Multimodalidade Íris + Face. Luiz Antonio Zanlorensi Junior

Biometria Multimodalidade Íris + Face. Luiz Antonio Zanlorensi Junior Biometria Multimodalidade Íris + Face Luiz Antonio Zanlorensi Junior Sumário Introdução Fusionamento Artigo 1 Seleção de características Multimodal Problemas Base de dados Artigo 2 Unimodal + Multimodal

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

K-Nearest Neighbours & RSTUDIO

K-Nearest Neighbours & RSTUDIO K-Nearest Neighbours & RSTUDIO Rodrigo Augusto Igawa Universidade Estadual de Londrina igawa@uel.br 17 de novembro de 2015 Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de 2015 1 / 16 Sumário

Leia mais

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Susana Rosich Soares Velloso SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.

Leia mais

Avaliação da qualidade de imagens 2D reconstruídas a partir de imagens holoscópicas 3D

Avaliação da qualidade de imagens 2D reconstruídas a partir de imagens holoscópicas 3D Avaliação da qualidade de imagens 2D reconstruídas a partir de imagens holoscópicas 3D A tecnologia de imagens holoscópica, também conhecidas como imagens plenópticas, imagens integrais ou imagens de campo

Leia mais

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina Ana Carolina Bras Costa 1, Êmile Cunha Lopes 1 1 Departamento de Informática Universidade Federal do Maranhão (UFMA)

Leia mais

6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA

6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA Universidade Federal do ABC Rua Santa Adélia, 166 - Bairro Bangu - Santo André - SP - Brasil CEP 09.210-170 - Telefone/Fax: +55 11 4996-3166 1. CÓDIGO E NOME DA DISCIPLINA MC5004 - APRENDIZADO DE MÁQUINA

Leia mais

Classificadores Lineares

Classificadores Lineares Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Classificadores Lineares David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Funções Discriminantes Lineares Perceptron Support

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

1 o Teste de Aprendizagem Automática

1 o Teste de Aprendizagem Automática o Teste de Aprendizagem Automática 3 páginas com 6 perguntas e 2 folhas de resposta. Duração: 2 horas DI, FCT/UNL, 22 de Outubro de 205 Pergunta [4 valores] As figuras abaixo mostram o erro de treino e

Leia mais

Recuperação de Informação em Bases de Texto

Recuperação de Informação em Bases de Texto Recuperação de Informação em Bases de Texto Mestrado em Engenharia Informática Universidade de Évora 2010/2011 Paulo Quaresma pq@di.uevora.pt http://www.moodle.uevora.pt 1 Objectivos Programa Avaliação

Leia mais

Mineração de Opinião Aplicada ao Cenário Político

Mineração de Opinião Aplicada ao Cenário Político Mineração de Opinião Aplicada ao Cenário Político Leandro Massetti Ribeiro Oliveira 1, Vandecia Rejane Monteiro Fernandes 1 1 Engenharia da Computação - Universidade Federal do Maranhão (UFMA) São Luis

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Descoberta de conhecimento em textos - Análise semântica Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Introdução Diversidade de textos não padronizados; Emails, artigos,

Leia mais

Thiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade

Thiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade Thiago Zavaschi (zavaschi@ppgia.pucpr.br) Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUC-PR) Conceitos relacionados a classificação

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Processamento e Análise de Imagem. Aplicações na Imagem Médica

Processamento e Análise de Imagem. Aplicações na Imagem Médica Processamento e Análise de Imagem Aplicações na Imagem Médica António M. Gonçalves Pinheiro Departamento de Física Covilhã - Portugal pinheiro@ubi.pt Tecnologia de Imagem Imagem de Entrada Processamento

Leia mais

PROCESSAMENTO DE TEXTO

PROCESSAMENTO DE TEXTO PROCESSAMENTO DE TEXTO (TEXT MINING) Jorge Teixeira, Gustavo Laboreiro, Luís Sarmento, Eugénio Oliveira SSIIM 2012/2013 AGENDA - Parte 1 1. Text Mining 2. Media na web: Dados Extracção Processamento Visualização

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

Mapeamento robótico. Mapeamento semântico. Metodologia. Maquinas de vetores de suporte. Maquinas de vetores de suporte. Modelos ocultos de Markov

Mapeamento robótico. Mapeamento semântico. Metodologia. Maquinas de vetores de suporte. Maquinas de vetores de suporte. Modelos ocultos de Markov Mapeamento robótico Exemplos de mapas: Mapeamento semântico Mapeamento semântico consiste na criação de mapas que não representam apenas a ocupação métrica do ambiente, mas também outras propriedades.

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,

Leia mais

parte da teoria Engº Luis Paulo Reis parte da teoria + aulas práticas Sítio Web:

parte da teoria Engº Luis Paulo Reis parte da teoria + aulas práticas Sítio Web: Docentes: Prof. parte da teoria Engº Luis Paulo Reis parte da teoria + aulas práticas Sítio Web: http://www.fe.up.pt/~eol/20032004/robotica/ Quadros powerpoint em pdf sobre alguns capítulos Ligação para

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

detecção de voz cantada em sinais de áudio polifônicos

detecção de voz cantada em sinais de áudio polifônicos detecção de voz cantada em sinais de áudio polifônicos Aplicações, Abordagens e Desafios Shayenne Moura 23. April 2018 Instituto de Matemática e Estatística Universidade de São Paulo o problema Detecção

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Introdução Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 19 Introdução

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

EEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução

EEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução 1 Introdução 1. Introdução 1.1. O que é Aprendizado de Máquina? 1.2. Por que Machine Learning é o Futuro? 1.3. Algumas Aplicações 1.4. Tipos de Aprendizado 1. Introdução 17 1. Introdução 1.1. O que é Aprendizado

Leia mais

Máquinas de Vetores de Suporte

Máquinas de Vetores de Suporte Máquinas de Vetores de Suporte Marcelo K. Albertini 14 de Setembro de 2015 2/22 Máquinas de Vetores de Suporte Support Vector Machines (SVM) O que é? Perceptron revisitado Kernels (núcleos) Otimização

Leia mais

Conditional random fields. Renato Assunção DCC - UFMG

Conditional random fields. Renato Assunção DCC - UFMG Conditional random fields Renato Assunção DCC - UFMG Named Entity Recognition A tarefa de reconhecimento de entidades nomeadas em textos e a a tarefa de identificar todos as instancias num texto de: locais

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

Fundamentos de Entropia Máxima para Aplicação na Modelagem de Distribuição Geográfica de Espécies

Fundamentos de Entropia Máxima para Aplicação na Modelagem de Distribuição Geográfica de Espécies Escola Politécnica da Universidade de São Paulo EPUSP Departamento de Engenharia de Computação e Sistemas Digitais PCS Laboratório de Linguagens e Técnicas Adaptativas LTA Laboratório de Automação Agrícola

Leia mais

Sumário. Trabalho que foi desenvolvido. Introdução

Sumário. Trabalho que foi desenvolvido. Introdução Proposta de um sistema de Classificação de Notícias utilizando técnicas de Aprendizagem de Máquina integrado com o ClippingBr Bruno Campagnolo de Paula PROJETO FINAL DA DISCIPLINA DE MACHINE LEARNING Mestrado

Leia mais

Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior

Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior Introdução ao Reconhecimento Prof. Dr. Geraldo Braz Junior O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos Vários 4 Pergunta:

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem Baseada em Instâncias Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática

Leia mais

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face. ESTUDO SOBRE MÉTODOS DE RECONHECIMENTO FACIAL EM FOTOGRAFIAS DIGITAIS Ana Elisa SCHMIDT¹, Elvis Cordeiro NOGUEIRA² ¹ Orientadora e docente do IFC-Campus Camboriú; ² Aluno do curso de Bacharelado em Sistemas

Leia mais

4 Experimentos. 4.1 Introdução

4 Experimentos. 4.1 Introdução Experimentos 4 Experimentos 4.1 Introdução Foram realizados experimentos com os dois algoritmos propostos no capítulo anterior em duas bases de documentos, Reuters-21578 e Ohsumed. Primeiramente serão

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os métodos baseados em instâncias guardam os

Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os métodos baseados em instâncias guardam os Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os métodos baseados em instâncias guardam os exemplos de treinamento A generalização é posposta até

Leia mais

DOCUMENTO DE ADEQUAÇÃO MESTRADO EM ENGENHARIA INFORMÁTICA FACULDADE DE CIÊNCIAS E TECNOLOGIA UNIVERSIDADE NOVA DE LISBOA PEÇA B

DOCUMENTO DE ADEQUAÇÃO MESTRADO EM ENGENHARIA INFORMÁTICA FACULDADE DE CIÊNCIAS E TECNOLOGIA UNIVERSIDADE NOVA DE LISBOA PEÇA B DOCUMENTO DE ADEQUAÇÃO DO MESTRADO EM ENGENHARIA INFORMÁTICA FACULDADE DE CIÊNCIAS E TECNOLOGIA UNIVERSIDADE NOVA DE LISBOA (ESTRUTURA CURRICULAR E PLANO DE ESTUDOS) B2 FORMULÁRIO 1. Estabelecimento de

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

RNA aplicadas. Sistemas que aprendem sobre tendências e regras de negócio

RNA aplicadas. Sistemas que aprendem sobre tendências e regras de negócio RNA aplicadas Sistemas que aprendem sobre tendências e regras de negócio Agenda: O que é RNA; Onde e quando utilizar; Como aplicar; Exemplo de código; Case; Cuidados e observações. O que é RNA? Redes Neurais

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Introdução 1 Introdução Aprendizado de Máquina Extração de conhecimento. Automatização de tarefas. Tomada de Decisões.

Leia mais

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Aline Dartora Prof. David Menotti Departamento de Informática Universidade Federal do Paraná (UFPR) 23 de outubro

Leia mais

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Máquinas de suporte vetorial e sua aplicação na detecção de spam e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

MCZA Processamento de Linguagem Natural Classificação de textos

MCZA Processamento de Linguagem Natural Classificação de textos MCZA017-13 Processamento de Linguagem Natural Classificação de textos Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin. Speech and language processing:

Leia mais

Aprendizado de Máquina para o Problema de Sentiment Classification

Aprendizado de Máquina para o Problema de Sentiment Classification Pedro Oguri Aprendizado de Máquina para o Problema de Sentiment Classification Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós

Leia mais

Identificação de alertas de segurança virtual veiculados no Twitter

Identificação de alertas de segurança virtual veiculados no Twitter Identificação de alertas de segurança virtual veiculados no Twitter Orientador: Daniel M. Batista Coorientadora: Elisabeti Kira Instituto de Matemática e Estatística IME-USP 27 de Janeiro de 2015 Introdução

Leia mais

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Color Eyes Detector. Duarte Petiz. DCC/FCUP Color Eyes Detector Duarte Petiz DCC/FCUP up201204625@fc.up.pt Resumo Este relatório descreve a implementação da aplicação desenvolvida Color Eyes Detector bem como mostra os resultados finais da execução

Leia mais

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos

Leia mais

4 Construção dos Classificadores

4 Construção dos Classificadores 4 Construção dos Classificadores 4.1. Modelagem O aprendizado supervisionado contém a etapa de modelagem, nessa etapa definimos quais serão as características encaminhadas ao classificador para o treinamento.

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendizagem de Máquina Bagging,, Support Vector Machines e Combinação de Classificadores Alessandro L. Koerich Uma visão geral de diversos tópicos relacionados à Aprendizagem de Máquina:

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina

Leia mais

biometria por digitação

biometria por digitação biometria por digitação Rudolf Copi Eckelberg 29 de Junho de 2018 Apresentação para a disciplina de Visão Computacional Sumário Introdução Biometria por digitação Features Biometria por digitação em teclado

Leia mais