Roteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados

Tamanho: px
Começar a partir da página:

Download "Roteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados"

Transcrição

1 Roteiro PCC142 / BCC444 - Mineração de Dados Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Limpeza de Dados Integração de Dados Transformação de Dados Redução de Dados Discretização Processo de Descoberta de Conhecimento em Bases de Dados Por que pré-processar os dados? Dados Conhecimento 3 Regras e 2 Padrões Dados Dados Transformados Pré-processados Dados Selecionados Fonte: From data mining to knowledge discovery: An overview, U.M.Fayyad et. al., Bases de dados reais estão altamente suscetíveis a: Dados incompletos: atributos com ausência de valores, atributos de interesse ausentes ou contendo apenas dados agregados. Ruídos: dados errados, outliers (desvio com relação ao esperado). Inconsistências: discrepâncias com relação aos nomes ou códigos utilizados. Falta de qualidade dos dados resultado sem qualidade após a mineração!

2 Principais Tarefas de Pré-processamento Principais Tarefas de Pré-processamento Limpeza de dados: Preenchimento de valores ausentes. Suavização (smoothing) de ruídos (ltro da média). Identicação e/ou remoção de valores aberrantes (outliers). Tratamento de inconsistências. Integração de dados: Integração de diversas bases de dados ou arquivos. Transformação de dados: Normalização e agregação. Redução de dados: Obtenção de uma representação reduzida do conjunto de dados (redução em volume). Discretização de dados: Redução de dados particularmente importante para atributos contínuos. Pré-processamento de Dados Limpeza de Dados Técnicas de limpeza de dados são utilizadas para: Preencher valores ausentes. Identicar outliers e suavizar ruídos. Corrigir dados inconsistentes.

3 Ausência de Valores de Atributos Valores de atributos (dados) nem sempre estão disponíveis. Exemplo: vários registros de uma base de dados de vendas não possuem valores para o atributo salário do consumidor. A ausência de dados pode ser resultado de: Mau funcionamento de equipamento. Inconsistência com outros dados armazenados e, portanto, apagado. Dado não inserido devido a falta de entendimento. Dado foi considerado sem importância no momento do armazenamento. Como Lidar com os Valores Ausentes de Atributos? Ignorar o registro (instância): usualmente utilizado quando o atributo classe possui valor desconhecido. É recomendado quando a instância contém muitos valores de atributos desconhecidos. Preencher os valores ausentes manualmente: tedioso + inviável? Usar uma constante global para preencher os valores ausentes: desconhecido. Usar a média dos valores do atributo para preencher os valores ausentes. Usar a média dos valores das instâncias pertencentes à mesma classe da instância que possui o valor ausente. Utilizar o valor mais provável para preencher o valor ausente: inferência a partir da fórmula de Bayes ou árvores de decisão. Ruídos Como Lidar com os Ruídos? Ruído: é um erro aleatório ou um valor aberrante (outlier). Valores errôneos de atributos podem ocorrer devido a: Defeito no instrumento de coleta de dados. Problemas na transmissão de dados. Limitações tecnológicas. Inconsistências nas convenções de nomes. Técnicas para remoção de ruídos: Suavização. Regressão. Técnicas para identicação de valores aberrantes: Agrupamento (Clusterização). Inspeção manual auxiliada por computador.

4 Técnicas para Remoção de Ruídos Suavização: a partir de dados ordenados, a suavização de um valor ocorre a partir de uma consulta em sua vizinhança. Os valores ordenados devem ser distribuídos em caixas (bins). A suavização ocorre dentro de cada bin suavização local. Exemplo: atributo preço (ordenado): Técnicas para Remoção de Ruídos Regressão: os dados podem ser suavizados ajustando-os a uma função (p. ex.: regressão linear). y Regressão linear: uma variável pode ser utilizada para predizer a outra. Y1 4, 8, 15, 21, 21, 24, 25, 28, 34. Particionamento em bins: 4, 8, 15 21, 21, 24 25, 28, 34 Suavização pela média: 9, 9, 9 22, 22, 22 29, 29, 29 Suavização pela fronteira: 4, 4, 15 21, 21, 24 25, 25, 34 Outras alternativas de suavização: mediana,... Y1 X1 y = x + 1 x Regressão múltipla:uma variável pode ser modelada como uma função linear de um vetor multidimensional de variáveis. Técnicas para Identicação de Valores Aberrantes Técnicas para Identicação de Valores Aberrantes Clusterização: valores aberrantes são aqueles que cam fora dos clusters. Utilização de um método computacional para ajudar a encontrar valores aberrantes. Por inspeção manual, verica-se quais valores são realmente aberrantes, excluindo-os da base de dados.

5 Dados Inconsistentes Pré-processamento de Dados Erros no momento da inserção de dados. Erros provenientes da integração de diferentes bases de dados: Mesmo atributo contendo diferentes codicações. Duplicação de instâncias. Correção: Manual ou ferramentas computacionais. Integração de Dados Integração de Dados Questões a serem consideradas durante a integração: Integração de dados: combina dados de múltiplas fontes em um única fonte de forma coerente. As fontes podem ser bases de dados, cubos ou arquivos de texto. Problema da identicação de entidades: identicação das mesmas entidades do mundo real a partir de múltiplas fontes de dados. P. ex.: Como um analista saberá se customer_id em uma base de dados e cust_number em outra base de dados correspondem ao mesmo atributo? Uso de metadados.

6 Integração de Dados Pré-processamento de Dados Questões a serem consideradas durante a integração: Redundância: dados redundantes ocorrem com freqüência quando integramos dados de múltiplas fontes. O mesmo atributo pode ter nomes diferentes em bases de dados distintas. Um atributo pode ter sido derivado de outro atributo em outra tabela. Detecção de redundâncias: análise de correlação. Duplicação de instâncias. Transformação de Dados Normalização de Dados Objetivo: colocar os dados de forma apropriada para a mineração. A transformação de dados envolve: Suavização: para remoção de ruídos. Agregação: operações de sumarização dos dados. Generalização: dados primitivos são substituídos por conceitos de ordem superior utilizando-se uma hierarquia de conceitos. Ex.: atributo Rua conceitos de ordem superior: Cidade ou País. Normalização: ajuste de escala. Construção de atributos: novos atributos são construídos e adicionados ao conjunto já existente. Objetivo: Colocar os valores numa faixa pré-especicada, p. ex.:, entre 0 e 1. Importante para algoritmos de classicação envolvendo redes neurais ou cálculos de distâncias (k-nn). Métodos de normalização: Normalização min-max. Normalização z-score. Normalização por escala decimal.

7 Normalização min-max Normalização z-score Transformação linear nos dados originais. v = v mina (new_maxa new_mina) + new_mina maxa mina onde: mina: valor mínimo do atributo A. maxa: valor máximo do atributo A. new_mina: novo valor mínimo do atributo A. new_maxa: novo valor máximo do atributo A. v: valor original do atributo A. Valores do atributo são normalizados com base na média e no desvio padrão do atributo. onde: v = v meda desv_pada v: valor original do atributo A. meda: média do atributo A. desv_pada: desvio-padrão do atributo A. Normalização por Escala Decimal Pré-processamento de Dados Normalização movendo-se o ponto decimal dos valores do atributo. v = v 10 j onde j é o menor inteiro tal que Max( v ) < 1. Exemplo: Atributo A contendo valores entre 986 e 917. A normalização é realizada dividindo-se os valores do atributo por 1000 (j = 3), de modo que 986/1000 < 1.

8 Redução de Dados Estratégias de Redução de Dados Por que fazer a redução de dados? Repositórios podem conter uma quantidade absurda de dados. Exceder a capacidade de processamento dos programas de mineração de dados. Tempo de processamento muito longo. Objetivo: Obter uma representação reduzida do conjunto de dados (diminuir o volume) mantendo a integridade dos dados originais. Agregação em cubo de dados. Redução de dimensão. Compressão de dados. Redução de casos. Discretização e construção de hierarquias conceituais. Agregação em Cubo de Dados Redução de Dimensão Operações de agregação são aplicadas aos dados na construção dos cubos de dados. Podemos ter diversos níveis de agregação em cubos de dados. Quanto maior o nível de agregação, menor o volume de dados resultante. Bases de dados podem conter muitos atributos, alguns desses sendo irrelevantes ou redundantes para a tarefa de mineração de dados. Ex.: Classicar consumidor (comprador ou não comprador de um novo CD). Quais atributos devem ser considerados? Telefone? Idade? Gosto musical? Seleção de atributos!!!

9 Seleção de Atributos Compressão de Dados Seleção de atributos feita manualmente (baseada em conhecimento de especialistas) pode ser inviável devido: Tempo consumido nessa tarefa. Comportamento dos dados não ser bem conhecido. Vários métodos de seleção de atributos foram propostos. Deixar de fora atributos relevantes ou manter atributos irrelevantes pode implicar na descoberta de padrões de baixa qualidade. Dados são codicados ou transformados para se obter uma representação reduzida dos dados originais. Dados Dados originais Comprimidos Sem perda Aproximação dos dados originais Com perda Compressão de Dados Sem perdas: Diversos algoritmos para compressão de dados. Desvantagem: manipulação dos dados é muito limitada sem a expansão dos mesmos. Com perdas: Transformada Wavelet Discreta (Discrete Wavelet Transform - DWT): Representação esparsa dos dados. Análise de Componentes Principais (Principal Components Analysis - PCA): Combinação de atributos gerando um novo conjunto (menor) de variáveis. Compressão de Dados Transformada Wavelet Discreta É uma técnica de processamento de sinais que quando aplicada a um vetor X, transforma-o em um vetor numérico de coecientes de wavelet. No nosso contexto, o vetor n-dimensional X = {x1, x2,..., xn} contém os valores dos n atributos para uma instância da base de dados. Os vetores X e X têm o mesmo comprimento. Como essa técnica pode ser útil para redução da base de dados original se os dados transformados têm a mesma dimensão dos dados originais? Os dados transformados podem ser truncados. Armazena-se apenas uma fração dos dados (os maiores coecientes de wavelet). Todos os demais coecientes são mapeados para zero. Representação esparsa dos dados.

10 Redução de Casos Regressão Linear Redução do volume de dados por meio de uma representação econômica dos mesmos. Métodos paramétricos: Supõem que os dados se ajustam a um modelo. Armazenam apenas os parâmetros do modelo (outliers também podem ser armazenados). Exemplos: Regressão linear (simples e múltipla). Métodos não-paramétricos: Não estimam modelos. Exemplos: Histogramas, clusterização e amostragem. Y = α + βx Dois parâmetros, α e β denem a reta. Eles são estimados a partir dos dados que temos em mãos (Y1, Y2,..., X1, X2,... ). Em geral, utiliza-se o método dos mínimos quadrados para ajustar a curva. Histogramas Clusterização Divide o dados em subconjuntos disjuntos. A redução de dados: faixa de valores representada num único subconjunto. Os dados são particionados em grupos (clusters). Armazena-se apenas a representação de cada cluster.

11 Amostragem Discretização Um grande conjunto de dados pode ser representado por um subconjunto menor obtido por amostragem. Tipos de amostragem: Amostragem aleatória simples sem reposição. Amostragem aleatória simples com reposição. Amostragem por conglomerado. Amostragem estraticada. Reduz o número de valores de um dado atributo contínuo pela divisão da amplitude do atributo em intervalos. Os rótulos dos intevalos substituem os valores originais do atributo. Alguns algoritmos de classicação só trabalham com atributos discretos. Discretização Métodos Não Supervisionados Métodos Supervisionados Utilizam informações referentes às classes das instâncias da base de dados durante o processo de discretização de um atributo. Métodos Não Supervisionados Consideram somente os valores do atributo a ser discretizado. Partição em Intervalos Iguais Divide a faixa de valores de um atributo em k intervalos iguais (de mesma amplitude), atribuindo a cada intervalo um rótulo. Partição em Intervalos com Freqüências Iguais Divide os valores de um atributo contínuo em k partições, de modo que, considerando m instâncias na base de dados, cada partição deve conter m/k valores adjacentes (possivelmente duplicados). O parâmetro k deve ser informado pelo usuário dos métodos. Desvantagem: as fronteiras escolhidas para particionar os dados em intervalos podem colocar juntas muitas instâncias pertencentes a diferentes classes, afetando a precisão do classicador.

12 Métodos Supervisionados Perguntas? Algoritmo de discretização 1R. O objetivo é dividir o domínio de cada atributo contínuo em partições puras, ou seja, partições que sejam caracterizadas predominantemente por uma das classes da base de dados. Métodos estatísticos: ChiMerge e StatDisc. Métodos baseados em entropia: Heurística recursiva de minimização de entropia. FIM

Mineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados?

Mineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados? Mineração de Dados Pré-Processamento de Dados 1 Sumário Dados Escalar Cardinalidade Porque pré-processar dados? Limpeza de Dados Integração e Transformação Redução de Dados Discretização 2 1 Dados Medidas

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Classicadores Bayesianos. Representação dos Dados. Introdução

Roteiro. PCC142 / BCC444 - Mineração de Dados Classicadores Bayesianos. Representação dos Dados. Introdução Roteiro PCC142 / BCC444 - Mineração de Dados Classicadores Bayesianos Introdução Representação dos Dados Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto

Leia mais

Considerações de Desempenho

Considerações de Desempenho Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS Etapas do Processo de KDD Livro: Data Mining Conceitos, técnicas, algoritmos, Orientações e aplicações Ronaldo Goldschmidt, Eduardo Bezerra, Emmanuel Passos KDD Knowledge Discovery

Leia mais

Back Propagation. Dicas para o BP

Back Propagation. Dicas para o BP Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem

Leia mais

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis: Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Regressão. Modelos de Regressão. Introdução

Roteiro. PCC142 / BCC444 - Mineração de Dados Regressão. Modelos de Regressão. Introdução Roteiro PCC142 / BCC444 - Mineração de Dados Regressão Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) EXTRAÇÃO DE CARACTERÍSTICAS Definição Característica: variável ou atributo

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Extração de Características

Extração de Características Extração de Características Alceu S. Britto Jr. Alessandro L. Koerich Aprendizagem de Máquina Mestrado/Doutorado em Informática 2009 Definição Característica: variável ou atributo utilizado na descrição

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008 21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte A Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Agrupamento (Segmentação) Agrupamento (Segmentação) Introdução. Denição. Aplicações

Roteiro. PCC142 / BCC444 - Mineração de Dados Agrupamento (Segmentação) Agrupamento (Segmentação) Introdução. Denição. Aplicações Roteiro PCC142 / BCC444 - Mineração de Dados (Segmentação) Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@icebufopbr wwwdecomufopbr/luiz Introdução

Leia mais

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução 3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução Como já mencionado na seção 1.1, as SVMs geram, da mesma forma que redes neurais (RN), um "modelo caixa preta" de

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Arquitetura de um Ambiente de Data Warehousing

Arquitetura de um Ambiente de Data Warehousing Arquitetura de um Ambiente de Data Warehousing Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Arquitetura Típica usuário usuário... usuário

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

6 Clustering: Definindo Grupos Estratégicos

6 Clustering: Definindo Grupos Estratégicos 6 Clustering: Definindo Grupos Estratégicos 6.1 Introdução Não é difícil deduzir que as 60 empresas distribuidoras de energia elétrica, operantes no SEB, apresentam características heterogêneas. Entretanto,

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.1. Introdução às Redes Neurais Artificiais (RNAs) 2.1.1. Motivação

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO PROCESSAMENTO DE IMAGENS Introdução Conceitos básicos Pré-processamento Realce Classificação PROCESSAMENTO DE IMAGENS Extração de Informações

Leia mais

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Estatística Básica O que é Estatística? um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Aplicações em quase

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Aprendizagem Baseada em Instâncias Plano de Aula Introdução Espaço

Leia mais

Seleção de Atributos 1

Seleção de Atributos 1 Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

Técnicas de recuperação de informação: filtragem, agrupamento

Técnicas de recuperação de informação: filtragem, agrupamento Técnicas de recuperação de informação: filtragem, agrupamento 1 Nome usado para descrever uma variedade de processos envolvendo a entrega de informação para pessoas que precisam dela; Compreende um método

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

AULA 02 Distribuição de Probabilidade Normal

AULA 02 Distribuição de Probabilidade Normal 1 AULA 02 Distribuição de Probabilidade Normal Ernesto F. L. Amaral 20 de agosto de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario

Leia mais

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA VARIABILIDADE NA MEDIDA DE DADOS CIENTÍFICOS Se numa pesquisa, desenvolvimento de um processo ou produto, o valor

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Análise de Risco de Crédito Bancário

Análise de Risco de Crédito Bancário UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UFCG Curso de Mestrado em Informática Aluno: Francisco Fabian de Macedo Almeida Disciplina: Mineração de Dados Professor: Marcos Sampaio Data: 20 de dezembro de 2007

Leia mais

Motivação Por que estudar?

Motivação Por que estudar? Aula 04 Imagens Diogo Pinheiro Fernandes Pedrosa Universidade Federal Rural do Semiárido Departamento de Ciências Exatas e Naturais Curso de Ciência da Computação Motivação Por que estudar? Imagens digitais

Leia mais

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Universidade Federal do Rio de Janeiro - IM/DCC & NCE Universidade Federal do Rio de Janeiro - IM/DCC & NCE Processamento de Imagens Segmentação Antonio G. Thomé thome@nce.ufrj.br Sala AEP/133 Conceituação Segmentação é uma tarefa básica no processo de análise

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística

Leia mais

Data Mining. O Processo de KDD. Mauricio Reis

Data Mining. O Processo de KDD. Mauricio Reis 1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico

Leia mais

AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS

AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS Introdução Câncer de mama É uma das neoplasias mais comuns que afligem as mulheres Globalmente, a cada 3 min uma mulher é diagnosticada

Leia mais

Mais Informações sobre Itens do Relatório

Mais Informações sobre Itens do Relatório Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos

Leia mais

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011 CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Modelos Probabilísticos para a Computação Professora: Andréa Rocha UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011 CORRELAÇÃO Introdução Quando consideramos

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Resumo: Veremos nesta aula tabelas, cálculos de porcentagem e gráficos; amostras e tipo de amostragem; Medidas de tendência central e medidas

Leia mais

Organização de dados

Organização de dados Organização de dados Coletar dados podem envolver diversas atividades tais como experimentos em laboratório, observações de campo, pesquisa de opinião, exame de registros históricos,... A quantidade de

Leia mais

Arquitetura de um Ambiente de Data Warehousing

Arquitetura de um Ambiente de Data Warehousing Arquitetura de um Ambiente de Data Warehousing Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Arquitetura Típica usuário usuário... usuário

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar

Leia mais

Projeções Multi-dimensionais

Projeções Multi-dimensionais Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade de São Paulo (USP) 23 de setembro de 2010 Introdução

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação Física Geral - Laboratório Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de compreender as principais

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28

Leia mais

Introdução. Introdução. Quantização de Cor. Quantização de Cor. Efeitos da Discretização Espacial (redução da resolução espacial)

Introdução. Introdução. Quantização de Cor. Quantização de Cor. Efeitos da Discretização Espacial (redução da resolução espacial) Introdução Introdução Uma imagem bitmap está associada a dois processos de discretização: Efeitos da Discretização Espacial (redução da resolução espacial) Discretização Espacial (Processo de Amostragem

Leia mais

Profa. Lidia Rodella UFPE-CAA

Profa. Lidia Rodella UFPE-CAA Profa. Lidia Rodella UFPE-CAA O que é estatística? É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,

Leia mais

O QUE É O BIG DATA? Big Data é o termo que descreve uma quantidade enorme de informações (volume de dados). BIG DATA ALGORITMOS 2

O QUE É O BIG DATA? Big Data é o termo que descreve uma quantidade enorme de informações (volume de dados). BIG DATA ALGORITMOS 2 O QUE É O BIG DATA? Big Data é o termo que descreve uma quantidade enorme de informações (volume de dados). BIG DATA ALGORITMOS 2 O QUE É O BIG DATA? Os dados são o novo petróleo O Big Data, tal como o

Leia mais

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida GESTÃO DE DADOS NAS ORGANIZAÇÕES Prof. Robson Almeida INFRA-ESTRUTURA DE SISTEMAS DE INFORMAÇÃO 3 CONCEITOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único

Leia mais

Data Mining. Rodrigo Leite Durães

Data Mining. Rodrigo Leite Durães Rodrigo Leite Durães rodrigo_l_d@yahoo.com.br Processo de mineração de dados e descoberta de informações relevantes em grandes volumes de dados. "... processo não-trivial de identificar, em dados, padrões

Leia mais

T4 Processamento de Imagem

T4 Processamento de Imagem T4 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Hélder Filipe Pinto de Oliveira Resumo 1. Manipulação ponto a ponto 2. Conetividade 3. Filtros espaciais 4. Extração de estruturas

Leia mais

Indexação de dados espaciais R-Tree. CCO229 Bancos de dados Espaciais e Biológicos Prof. Ricardo Rodrigues Ciferri Debora Marrach

Indexação de dados espaciais R-Tree. CCO229 Bancos de dados Espaciais e Biológicos Prof. Ricardo Rodrigues Ciferri Debora Marrach CCO229 Bancos de dados Espaciais e Biológicos Prof. Ricardo Rodrigues Ciferri Debora Marrach Introdução É o método de acesso espacial mais referenciado na literatura É o mais importante dentre os métodos

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Sistemas de Informação Inteligente Prof. Leandro C. Fernandes Adaptação dos materiais de: Thiago A. S. Pardo, Daniel Honorato e Bianca Zadrozny APRENDIZADO SIMBÓLICO: ÁRVORES DE

Leia mais

Prof. Dr. Engenharia Ambiental, UNESP

Prof. Dr. Engenharia Ambiental, UNESP INTRODUÇÃO A ESTATÍSTICA ESPACIAL Análise Exploratória dos Dados Estatística Descritiva Univariada Roberto Wagner Lourenço Roberto Wagner Lourenço Prof. Dr. Engenharia Ambiental, UNESP Estrutura da Apresentação

Leia mais

Seleção e Otimização de Fontes

Seleção e Otimização de Fontes Seleção e Otimização de Fontes 1. Introdução Muitos dados disponíveis Não há garantia de relevância Muitos acessos (custoso) O Autor propõe uma ideia para otimizar o processamento: A indexação e seleção

Leia mais

Métodos de Ordenação

Métodos de Ordenação Métodos de Ordenação Conceitos básicos sobre ordenação Ordenar corresponde ao processo de rearranjar um conjunto de objetos em uma ordem específica. Objetivo da ordenação: facilitar a recuperação posterior

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR 10 Coleção de objetos de dados e seus atributos Atributos Um atributo é uma propriedade ou característica de um objeto Exemplos: cor dos olhos de uma pessoa, temperatura, etc. Atributo também é conhecido

Leia mais

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total. INSTRUÇÕES Para a realização desta prova, você recebeu este Caderno de Questões. 1. Caderno de Questões Verifique se este Caderno de Questões contém a prova de Conhecimentos Específicos referente ao cargo

Leia mais

Banco de dados Brasil

Banco de dados Brasil Banco de dados Brasil Elemento de resolução: célula de 100x100m Conteúdo: linhas de transmissão, casas, quadras, distritos, municípios, estados, país Quais distritos são cortados pela linha de transmissão

Leia mais

Cálculo Numérico. Erros em processamento Numéricos

Cálculo Numérico. Erros em processamento Numéricos Cálculo Numérico Erros em processamento Numéricos Agenda Introdução a Erros Mudança de Base Erros de representação Erro de arredondamento Erro de absoluto Erro relativo Erro de truncamento Propagação do

Leia mais

2 Seleção de características

2 Seleção de características 2 Seleção de características 2. Introdução Na maioria das aplicações reais de classificação, previsão, aproximação e otimização, as bases de dados contêm um grande número de caraterísticas, muitas delas

Leia mais

Compressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:

Compressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso: Compressão de Textos Estrutura de Dados II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM O volume

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina A necessidade de inserir aprendizado nas máquinas surgiu após a construção dos Sistemas Especialistas (SEs). Os primeiros SEs não possuíam mecanismo de aprendizado e tornavam-se

Leia mais

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância Amostragem e Distribuição Amostral Tipos de amostragem, distribuição amostral de média, proporção e variância 1 AMOSTRAGEM Amostragem Probabilística ou Aleatória Amostragem Não Probabilística Amostragem

Leia mais

Rede RBF (Radial Basis Function)

Rede RBF (Radial Basis Function) Rede RBF (Radial Basis Function) André Tavares da Silva andre.silva@udesc.br Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Introdução Laboratório de Computação para Ciências Módulo II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional

Leia mais