Métodos de Análise de Dados (AO-802)
|
|
- Otávio Leveck
- 5 Há anos
- Visualizações:
Transcrição
1 Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel INTELIGÊNCIA
2 Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados Processo de KDD (1996) BI e BA Alguns eventos Analytics Data Science 2
3 A Terceira Revolução Industrial: A Revolução dos Serviços (1980 a?): Microinformática Tecnologia da informação Softwares Telecomunicações Setor financeiro Grandes varejistas Educação e ensino Internet (década de 90) 3
4 Um dilúvio de dados: Sistemas de Informação Call Centers Transações CRM Reclamações Artigos eletrônicos Mensagens ( s, ) Outros 4
5 O processo de KDD: Fonte: FAYYAD, U., PIATETSKY- SHAPIRO, G., SMYTH, P. From data mining to knowledge discovery: An overview. In: Advances in Knowledge Discovery and Data Mining, AAAI Press / The MIT Press, MIT, Cambridge, Massachusetts, 1996, p
6 Mineração de dados: 6
7 Business Intelligence: Objetivo: Transformar dados em conhecimento Dados Informação Conhecimento 7
8 Business Analytics: Métodos Prescritivos Métodos Preditivos BA Métodos Descritivos BI Dados Informação Conhecimento Inteligência 8
9 Alguns eventos (início dos anos 2000): DW failure rates range between 50% and 70% and range as high as 90% for the insurance industry (Conning and Co. em 2002) Fonte: 9
10 Alguns eventos (fracassos BI e BA): (integração dos dados) (qualidade dos dados) ( propriedade dos dados) (cultural - carreira) (grandes consultorias) (mais do mesmo) (incertezas nos resultados) 10
11 Alguns eventos: Dilúvio de dados Universo de dados Fonte: 11
12 Alguns eventos (Big Data Initiative): Fonte: 12
13 Analytics Data Science: 13
14 Programa da disciplina: Aula Conteúdo 1 Apresentação da disciplina. Avaliação (trabalhos). Caso 1: Análise Exploratória de dados. 2 Caso 2: Formação de agrupamentos hierárquicos. 3 Caso 3: Redução de dimensão + Formação de agrupamentos hierárquicos. 4 Caso 4: Formação de agrupamentos não-hierárquicos. 5 e 6 Aplicações em métodos não supervisionados (formação de agrupamentos e redução de dimensão). 7 e 8 Apresentação de trabalhos (métodos não supervisionados). 9 Caso 5: Classificador discriminante (Euclideano, linear e não-linear). 10 Caso 6: Classificador AID / CART. 11 Caso 7: Classificador por regressão logística. 12 Caso 8: Classificador por support vector machine (SVM). 13 e 14 Aplicações em métodos supervisionados. 15 e 16 Apresentação de trabalhos (métodos supervisionados). 14
15 Avaliação e bibliografia: Avaliação: 2 trabalhos individuais (apresentação e relatório): 1. APRESENTAÇÃO: 50% 2. RELATÓRIO: 50% Bibliografia: Ragsdale, C. T., Modelagem de planinha e análise de decisão uma introdução prática a business analytics, 7 a edição. Cencage, Gareth, J., Witten, D., Hastie, T. e Tibshirani, R. An Introduction to Statistical Learning with applications in R. Springer,
16 Caso 1: Análise exploratória de dados Objetivos da AED: 1. Mostrar comparações: evidenciar uma hipótese demanda comparações em relação a alguma hipótese alternativa (pergunta: comparada a que? ) 2. Mostrar causalidade, explicação: gerar evidências em relação a como o sistema (mundo considerado) funciona 3. Mostrar dados multivariados: o mundo real é multivariado, ou seja, é complexo e envolve muitas variáveis simultaneamente 4. Integrar várias formas para evidenciar: gráficos (de diferentes tipos), tabelas, Descrever e documentar evidências: contar histórias completas de forma convincente OBS: O conteúdo é soberano: a história sendo contada é o mais importante (AED não salva se o conteúdo não for bom) 16
17 Caso 1: Análise exploratória de dados Análise exploratória: cidades conforme seus índices de criminalidade Dados: Observações (linhas): 72 maiores cidades dos EUA Variáveis (colunas): índices de criminalidade (por habitantes) Processo: Murder (F): (1) 0 10; (2) 11 20; (3) 21 40; (4) 40+; Rape (E): (1) 0 40; (2) 41 60; (3) 61 80; (4) ; (5) 100+; Robbery (D): (1) 0 400; (2) ; (3) ; (4) 1000+; Assault (C): (1) 0 300; (2) ; (3) ; (4) ; (5) ; (6) 1251+; Burglary (B): (1) ; (2) ; (3) ; (4) ; (5) 2200+; Larceny (A): (1) ; (2) ; (3) ; (4) ; (5) ; (6) ; (7) ; (8) 7000+; Motor vehicle theft: (1) 0 500; (2) ; (3) ; (4) ; (5)
18 Caso 2: Formação de agrupamentos hierárquicos Agrupamentos hierárquicos: são utilizados para organizar observações / variáveis que estão próximas em agrupamentos. Questões: 1. Como nós definimos próximas? Precisamos definir alguma distância: Euclideana, Manhattan, correlação, 2. Como agrupar as observações? Precisamos definir algum critério de agrupamento: ligação simples, ligação média, ligação completa, centróide, Ward, entre outros 3. Como visualizar os agrupamentos gerados? Dendograma 4. Como interpretar os agrupamentos gerados? Análise exploratória de dados: gráficos e tabelas 18
19 Caso 2: Formação de agrupamentos hierárquicos Agrupamento de cidades conforme seus índices de criminalidade Dados: Observações (linhas): 72 maiores cidades dos EUA Variáveis (colunas): índices de criminalidade (por habitantes) Processo: Murder (F): (1) 0 10; (2) 11 20; (3) 21 40; (4) 40+; Rape (E): (1) 0 40; (2) 41 60; (3) 61 80; (4) ; (5) 100+; Robbery (D): (1) 0 400; (2) ; (3) ; (4) 1000+; Assault (C): (1) 0 300; (2) ; (3) ; (4) ; (5) ; (6) 1251+; Burglary (B): (1) ; (2) ; (3) ; (4) ; (5) 2200+; Larceny (A): (1) ; (2) ; (3) ; (4) ; (5) ; (6) ; (7) ; (8) 7000+; Motor vehicle theft: (1) 0 500; (2) ; (3) ; (4) ; (5)
20 Caso 2: Formação de agrupamentos hierárquicos Agrupamento de cidades conforme seus índices de criminalidade Resultados: Site:
21 Caso 3: Agrupamentos hierárquicos com RD Agrupamento de cidades (conforme seus índices de criminalidade) com redução de dimensão Dados: mesmos do caso 1 Processo: Objetivo da análise de componentes principais (PCA): encontrar um novo conjunto de variáveis, não correlacionadas, que expliquem o máximo possível da variância presente nos dados (princípio: data compression). 21
22 Caso 3: Agrupamentos hierárquicos com RD Resultados: Resultados - PCA: 22
23 Caso 3: Agrupamentos hierárquicos com RD Resultados: Resultados - Agrupamentos:
24 Caso 4: Agrupamentos não hierárquicos Agrupamento de cidades (conforme seus índices de criminalidade) com redução de dimensão Dados: mesmos do caso 3 (com redução de dimensão por ACP) Processo: Métodos não hierárquicos de formação de agrupamentos: alternativa quando há muitas observações. Demandam, a priori, a definição do número de agrupamentos. 24
25 Caso 4: Agrupamentos não hierárquicos Resultados: Resultados - Agrupamentos: 25
26 Caso 5: Classificador Discriminante Classificação cidades (conforme seus índices de criminalidade) nos agrupamentos gerados Dados: Observações (linhas): 72 maiores cidades dos EUA Variável explicada: agrupamento da cidade (resultado do método não hierárquico) Variáveis explicativas: índices de criminalidade (por habitantes) Murder (F): (1) 0 10; (2) 11 20; (3) 21 40; (4) 40+; Rape (E): (1) 0 40; (2) 41 60; (3) 61 80; (4) ; (5) 100+; Robbery (D): (1) 0 400; (2) ; (3) ; (4) 1000+; Assault (C): (1) 0 300; (2) ; (3) ; (4) ; (5) ; (6) 1251+; Burglary (B): (1) ; (2) ; (3) ; (4) ; (5) 2200+; Larceny (A): (1) ; (2) ; (3) ; (4) ; (5) ; (6) ; (7) ; (8) 7000+; Motor vehicle theft: (1) 0 500; (2) ; (3) ; (4) ; (5)
27 Caso 5: Classificador Discriminante Classificação cidades (conforme seus índices de criminalidade) nos agrupamentos gerados Processo: Transformação dos dados: geração das 2 primeiras componentes principais Mineração de dados: 27
28 Caso 5: Classificador Discriminante Análise Discriminante Linear X Análise Discriminante Quadrática TREINAMENTO: i (para cada uma das classes) (pooled) TREINAMENTO: i (para cada uma das classes) i (para cada uma das classes) 28
29 Caso 5: Classificador Discriminante Classificação cidades (conforme seus índices de criminalidade) nos agrupamentos gerados Matriz de confusão (validação leave-one-out) Discriminante Linear: Taxa de acerto: Discriminante Quadrática: Taxa de acerto: 29
30 Caso 6: Classificador CART / AID Classificação em abandono de clientes (Churn) Dados: 30
31 Caso 6: Classificador CART / AID Sistema de classificação que particiona o espaço de atributos de forma a criar regras para definir as classes Resultado: um conjunto de regras e uma árvore (diagrama) Algoritmos disponíveis: CART (Classification And Regression Trees) CHAID (Chi-Square Automatic Interaction Detection) Elementos da árvore de decisão Nó raiz (primeira questão) Ligações ou ramos (possíveis respostas) Outros nós Nó terminal (outras questões) (decisão final) A classificação de uma observação inicia no nó raiz e segue as ligações correspondentes às respostas corretas até chegar no nó terminal. 31
32 Renda anual (R$) Caso 6: Classificador CART / AID Ilustração: classificação em risco IDADE > 35 NÃO SIM Alto risco Renda anual maior que R$ ,00 NÃO SIM Médio risco Baixo risco Acurácia = % Idade (anos) Esse modelo é construído a partir de um conjunto de treinamento seguindo algumas regras: Partição: escolha da melhor partição Parada: quando parar de particionar A acurácia é obtida a partir de um conjunto de teste. 32
33 Caso 6: Classificador CART / AID Classificação em abandono de clientes (Churn) 33
34 Y Y Caso 7: Classificador por Regressão Logística Regressão Linear Regressão Logística Y i A B* X i C * X 2 1 i... Y i 1 e 1 ( A B* X1i C* X 2 i...) 1 1 0,9 0,9 0,8 0,8 0,7 0,7 0,6 0,6 0,5 0,4 0,3 0,2 0, X 0,5 0,4 0,3 0,2 0, X 34
35 Caso 8: Classificador por Support Vector Machine Support Vector Machine (SVM) CLASSIFICAÇÃO BINÁRIA (y i -1,1) PROBLEMA: achar uma função, linear ou não, para um hiperplano de separação dos pontos em dois conjuntos no R m, em que m é o número de dimensões existentes. Caso 1: populações separáveis por um hiperplano linear Dados: N observações no R M (M:dimensões) x i = x i1,, x im y i -1,+1 i = 1,,N Separable Linear Kernel Problem: Objetivo: Maximizar D(H 1, H 1 ) 2 w 2 t w w Minimizar 1 D t w w 2 Restrições: w t x + b +1 para y = +1 w t x + b -1 para y = -1 y(w t x + b) +1 35
36 Caso 8: Classificador por Support Vector Machine Support Vector Machine (SVM) CLASSIFICAÇÃO BINÁRIA (y i -1,1) Exemplo: X1 X2 Y Solução: w 1 = - 0,5 w 2 = 1,0 b = - 4,5 Min w 1 t w w w2 2 2 w w w ( w ) s.a. y(w t x + b) +1 y(w 1.x 1 +w 2.x 2 + b) +1-1(w 1.4+w b) +1 +1(w 1.6+w b) +1 Hiperplano de Separação (H 0 ): w t x + b = 0-0,5. x 1 +1,0. x 2 4,5 = 0 x 2 = 4,5 + 0,5. x 1 Hiperplano Superior (H +1 ): -1(w 1.6+w b) +1 +1(w 1.4+w b) +1 w t x + b = +1 x 2 = 5,5 + 0,5. x 1-1(w 1.3+w b) +1 +1(w 1.5+w b) +1 Hiperplano Inferior (H -1 ): -1(w 1.5+w b) +1 +1(w 1.3+w b) +1 w t x + b = -1 x 2 = 3,5 + 0,5. x 1 36
37 Caso 8: Classificador por Support Vector Machine Support Vector Machine (SVM) CLASSIFICAÇÃO BINÁRIA (y i -1,1) Caso 2: populações não separáveis por um hiperplano linear Modificações: Introduz-se N variáveis de folga i 0, i=1,,n Modifica-se as restrições para: w t x i + b +1 - i para y i = +1 w t x i + b -1 + i para y i = -1 Combinando as duas restrições: y i (w t x i + b) +1 - i Cria-se uma penalidade na função objetivo, obtendo-se um modelo com N + M + 1 incógnitas ( 1,, N,w 1,,w M,b): Min 1 2 t w w N C i 1 i onde C é uma constante de penalização (C 0) 37
38 Caso 8: Classificador por Support Vector Machine Support Vector Machine (SVM) CLASSIFICAÇÃO BINÁRIA (y i -1,1) Exemplo: (C=1) X1 X2 Y w 1 = - 0,5714 w 2 = 0,8571 b = - 3,2857 Solução: 1 = 0 2 = 0 3 = 0 4 = 0 5 = Min (w1 w2 ) ( ) 2 s.a. y(w 1.x 1 +w 2.x 2 + b) +1 - i -1.(w 1.4+w b) , 2, 3, 4, 5, 6, 7, (w 1.6+w b) = 2,286 7 = 0,286 8 = 0 Hiperplano de Separação (H 0 ): -0,57. x 1 +0,86. x 2 3,3 = 0-1.(w 1.6+w b) (w 1.4+w b) +1-6 x 2 = 3,83 + 0,67. x 1-1.(w 1.3+w b) (w 1.5+w b) +1-7 (H +1 ): x 2 = 4,83 + 0,67. x 1-1.(w 1.5+w b) (w 1.3+w b) +1-8 (H -1 ): x 2 = 2,83 + 0,67. x 1 38
39 OBSERVAÇÃO Este material refere-se às notas de aula do curso AO-802 (Métodos de Análise de Dados) do Instituto Tecnológico de Aeronáutica (ITA). Não substitui o livro texto, as referências recomendadas e nem as aulas expositivas. Este material não pode ser reproduzido sem autorização prévia do autor. Quando autorizado, seu uso é exclusivo para atividades de ensino e pesquisa em instituições sem fins lucrativos.
40 DADOS INFORMAÇÃO CONHECIMENTO INTELIGÊNCIA Rodrigo A. Scarpel http:
ANALYTICS: HISTÓRICO E DESAFIOS. Professor: Rodrigo A. Scarpel DADOS INFORMAÇÃO CONHECIMENTO INTELIGÊNCIA
ANALYTICS: HISTÓRICO E DESAFIOS DADOS INFORMAÇÃO CONHECIMENTO INTELIGÊNCIA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Apresentação: Rodrigo A. Scarpel Graduação: Engenharia de
Leia maisMB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel
MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana 1 2 Conteúdo Princípios de POAP : 1. O processo decisório
Leia maisMÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise
Leia maisMÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo APRESENTAÇÃO Métodos Multivariados: São métodos (ferramentas analíticas) utilizados na transformação de dados (várias medidas
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE DATA MINING
PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA
CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,
Leia mais18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA
18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio
Leia maisTrilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos
Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization
Leia maisProfissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada
MBA ANALYTICS OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de decisão com base nas
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 17 Support Vector Machines (SVM) Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Leia maisSUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Leia maisSupport Vector Machines
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Support Vector Machines Eduardo Vargas Ferreira Definição Support Vector Machines são baseados no conceito de planos de decisão
Leia maisUma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law
Uma Introdução a SVM Support Vector Machines Obs: Baseada nos slides de Martin Law Sumário Historia das SVMs Duas classes, linearmente separáveis O que é um bom limite para a decisão? Duas classes, não
Leia maisMineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.
Leia maisMáquinas de suporte vetorial e sua aplicação na detecção de spam
e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura
Leia maisMétodos de reamostragem
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos de reamostragem Eduardo Vargas Ferreira Função custo 2 Função custo Matriz de confusão: é um layout de tabela que
Leia mais1 o Teste de Aprendizagem Automática
o Teste de Aprendizagem Automática 3 páginas com 6 perguntas e 2 folhas de resposta. Duração: 2 horas DI, FCT/UNL, 22 de Outubro de 205 Pergunta [4 valores] As figuras abaixo mostram o erro de treino e
Leia maisData Mining. Felipe E. Barletta Mendes. 21 de maio de 2008
21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é
Leia maisFACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisTutorial básico de classificação em RapidMiner
Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisExame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores
Leia maisThiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade
Thiago Zavaschi (zavaschi@ppgia.pucpr.br) Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUC-PR) Conceitos relacionados a classificação
Leia mais19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA
19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ
Leia maisMáquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos
Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos Introdução * Método supervisionado de aprendizagem de máquina * Empregado em classificação de dados Classificação binária
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD. NeuroTech Ltda.
Descoberta de Conhecimento em Bancos de Dados - KDD NeuroTech Ltda. www.neurotech.com.br Descoberta de Conhecimento em Bancos de Dados (KDD) A descoberta de conhecimento em bancos de dados (Knowledge Discovery
Leia maisAprendizado de Máquina
Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos
Leia maisANÁLISE DE BIG DATA VIA MACHINE LEARNING E INTELIGÊNCIA ARTIFICIAL
CURTA DURAÇÃO ANÁLISE DE BIG DATA VIA MACHINE LEARNING E INTELIGÊNCIA ARTIFICIAL CARGA HORÁRIA: 76 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,
Leia maisDescoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
Leia maisProfessora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados
UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise
Leia maisCURTA DURAÇÃO MODELOS DE DATA MINING
CURTA DURAÇÃO MODELOS DE DATA MINING 1 OBJETIVO Este curso tem como objetivo aplicar conceitos de análise quantitativa de informação do ambiente econômico e de negócios; apresenta metodologias de tratamento
Leia maisProf. Daniela Barreiro Claro
O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
Leia maisFundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Leia maisMáquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino
Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,
Leia maisExame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores
Leia maisMBA ANALYTICS EM BIG DATA
MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação
Leia maisLaboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka
Laboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka Faça o download do dataset housing.arff*, e execute as seguintes tarefas: *disponível em: www.inf.ufpr.br/menotti/am-182/data.zip
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisIntrodução à Mineração de Dados com Aplicações em Ciências Espaciais
Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação
Leia maisANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS
ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Abrantes Diniz 1, Fabiano Rosemberg de Moura Silva 2, Roberto Douglas da Costa 3, Thiago
Leia maisBIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.
BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos
Leia maisExistem diversas formas de tratar dados e este conjunto de formas chama-se Data
INSTITUCIONAL/IFSP PROJETO DE PESQUISA TÍTULO DO PROJETO: Text Mining na classificação de notícias Área do Conhecimento (Tabela do CNPq): 1. 0 3. 0 3. 0 0-6 1. RESUMO O volume de informações disponíveis
Leia maisBIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.
BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda
Leia maisProfessor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;
Leia maisFigura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC
Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio
Leia maisMineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra
Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisClassificação: 1R e Naïve Bayes. Eduardo Raul Hruschka
Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada
Leia maisClassificadores Lineares
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Classificadores Lineares David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Funções Discriminantes Lineares Perceptron Support
Leia maisAPLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO
CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO CARGA HORÁRIA: 92 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS O curso tem como objetivo apresentar algumas técnicas
Leia maisInformática Parte 19 Prof. Márcio Hunecke
Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem
Leia maisMineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará
Universidade Federal do Pará Centro de Ciências Exatas e Naturais Departamento de Informática Mineração de Dados Profa. MSc. Miriam Lúcia Domingues Curso de Especialização em Sistemas de Banco de Dados
Leia maisCLASSIFICADORES ELEMENTARES
CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,
Leia maisArvores de decisão. O que é uma árvore de decisão? Victor Lobo
Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Nós (testes, ou conceitos)
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisAprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Leia maisMineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018
Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar
Leia maisMineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio
Mineração de Dados Eduardo Raul Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Introdução: motivação, aplicações, conceitos básicos. Agrupamento
Leia maisArvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1)
O que é a árvore de decisão? Arvores de decisão Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Victor Lobo Nós (testes, ou conceitos)
Leia maisKDD, Mineração de Dados e Algoritmo Apriori
Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.
Leia maisMétodos baseados em árvores
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos baseados em árvores Eduardo Vargas Ferreira Introdução Árvore de decisão é o conjunto de regras que envolvem a estratificação
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia mais6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA
Universidade Federal do ABC Rua Santa Adélia, 166 - Bairro Bangu - Santo André - SP - Brasil CEP 09.210-170 - Telefone/Fax: +55 11 4996-3166 1. CÓDIGO E NOME DA DISCIPLINA MC5004 - APRENDIZADO DE MÁQUINA
Leia mais10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR
10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir
Leia maisANÁLISE DE BIG DATA E DIGITAL ANALYTICS
CURTA DURAÇÃO ANÁLISE DE BIG DATA E DIGITAL ANALYTICS CARGA HORÁRIA: 80 horass COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS O curso de Digital Analytics tem como objetivo preparar o aluno
Leia maisAlgoritmos de Agrupamento - Aprendizado Não Supervisionado
Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth fabricio.barth@gmail.com Agosto de 2016 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento
Leia mais3 Técnicas de agrupamento
3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta
Leia maisOrganização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
Leia maisIntrodução à Mineração de Dados com Aplicações em Ciências Espaciais
Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 2: 1 /59 Programa Dia 1: Apresentação
Leia maisClustering: k-means e Agglomerative
Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering
Leia maisAprendizado não supervisionado
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Aprendizado não supervisionado Eduardo Vargas Ferreira Supervisionado vs não supervisionado 2 Análise de Componentes Principais
Leia maisAprendizagem de máquina
Aprendizagem de máquina Introdução Objetivos Fornecer o ferramental necessário ao entendimento e ao projeto de sistemas baseados em aprendizagem. A disciplina cobre os principais tópicos da aprendizagem
Leia maisAgenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios
Machine Learning Agenda Conceitos Iniciais Modelos de aprendizado Oportunidades e casos de uso Ferramentas Desafios Ronald Bertele Bacharelado em Ciências da Computação - UCS MBA em Gestão de Negócios
Leia mais2 Modelos Não Lineares
Modelos Não Lineares 17 2 Modelos Não Lineares 2.1. Introdução Nos últimos anos, muitos modelos não-lineares para a análise de séries temporais têm sido propostos. Na econometria clássica, os modelos de
Leia maisRepresentação esquemática de estruturas de dados
UNIVERSIDADE DE SÃO PAULO - USP Instituto de Química de São Carlos - IQSC Grupo de Química Medicinal do IQSC/USP 1 Representação esquemática de estruturas de dados 2 1 Tipos de variáveis Contínua Concentração,
Leia maisMineração de Dados Aplicada no Contexto Educacional
Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações
Leia maisÁrvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica
Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica Ithalo Coelho de Sousa ithalo.coelho@gmail.com Programa de Pós-Graduação em Estatística
Leia maisImplementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes
Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words
Leia maisTópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr
Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências
Leia maisEstratégias para Classificação Binária Um estudo de caso com classificação de s
CE064 - INTRODUÇÃO AO MACHINE LEARNING Estratégias para Classificação Binária Um estudo de caso com classificação de e-mails Eduardo Elias Ribeiro Junior * 04 de julho de 2016 Resumo Em Machine Learning
Leia maisGradiente descendente
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Gradiente descendente Eduardo Vargas Ferreira Solução de quadrados mínimos Teorema: Seja X M n p (R), com n > p e posto(x
Leia maisInformática. Aprendizado de Máquina. Professor Márcio Hunecke.
Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:
Leia maisEduardo Vargas Ferreira
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Considerações finais Eduardo Vargas Ferreira Como obter boas predições 1 Entenda os dados: explore as características, crie
Leia maisExtração de conhecimento a partir de bancos de dados oceanográficos mistos
www.scientiaplena.org.br VOL. 11, NUM. 08 2015 doi: 10.14808/sci.plena.2015.081326 Extração de conhecimento a partir de bancos de dados oceanográficos mistos Knowledge discovery using mixed oceanographic
Leia maisAprendizagem de Máquina
Plano de Aula Aprendizagem de Máquina Bagging,, Support Vector Machines e Combinação de Classificadores Alessandro L. Koerich Uma visão geral de diversos tópicos relacionados à Aprendizagem de Máquina:
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 22 Redes Neurais Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor (KNN). Support
Leia maisMineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth -
Mineração de Dados - Contextualização Fonte: Prof. Fabrício J. Barth - http://fbarth.net.br/ Mineração de Dados - Contextualização Uso da informação Síntese do conhecimento; Manter, disseminar, organizar,
Leia maisUm Estudo sobre Técnicas de Aprendizado de Máquina aplicadas à Mineração de Dados
Um Estudo sobre Técnicas de Aprendizado de Máquina aplicadas à Mineração de Dados Maicon de Brito do Amarante 1, Denise Regina Pechmann 1 1 Departamento de Engenharias e Ciência da Computação Universidade
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Leia mais