Metodologia Aplicada a Computação.

Tamanho: px
Começar a partir da página:

Download "Metodologia Aplicada a Computação."

Transcrição

1 Metodologia Aplicada a Computação gaudenciothais@gmail.com

2 Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos, inconsistentes, duplicados ou ausentes. Podem ainda tornar os dados mais adequados para sua utilização por um determinado algoritmo.

3 Eliminação Manual de Atributos Quando um atributo não contribui para a estimativa do valor do atributo alvo, ele é considerado irrelevante. O conjunto de dados final deve ser definido de acordo com a experiência de especialistas no domínio dos dados.

4 Eliminação Manual de Atributos Id. Nome Idade Sexo Peso Manchas Temp. #Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP 3217 Maria 18 F 67 39,5 4 MG 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 38,5 8 MG 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F 72 38,0 3 RJ 1322 Marta 19 F 87 Espalhadas 39,0 6 AM 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável

5 Eliminação Manual de Atributos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 28 M 79 Concentradas 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 M 43 38, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39, M 67 Uniformes 38,4 2 Saudável

6 Integração de Dados Busca por atributos comuns nos conjuntos a serem combinados. Atributos utilizados para combinação deve(m) ter um valor único para cada objeto. CUIDADO: nome do atributo e atualização dos dados.

7 Amostragem de Dados A amostra deve ser representativa do conjunto de dados original. Diferentes amostras de uma mesma população podem gerar modelos diferentes. Os dados devem obedecer a mesma distribuição estatística que gerou o conjunto de dados original.

8 Amostragem de Dados A média dos valores para cada atributo dos dados originais deve ser semelhante a da amostra. Existem basicamente três abordagens para amostragem: Amostragem aleatória simples Amostragem estratificada Amostragem progressiva

9 Amostragem aleatória simples Sem reposição de exemplos: os exemplos são extraídos do conjunto original para a amostra a ser utilizada. Cada exemplo pode ser selecionado apenas uma vez. Com reposição de exemplos: a probabilidade de escolher qualquer objeto se mantém constante.

10 Amostra estratificada Usada quando as classes apresentam propriedades diferentes (Ex. Números de objetos bastante diferentes). Manter o mesmo número de objetos para cada classe. Manter o número de objetos em cada classe proporcional ao número de objetos da classe no conjunto original.

11 Amostra progressiva Começa com uma amostra pequena e aumenta progressivamente o tamanho da amostra extraída. A amostra vai aumentando enquanto a acurácia preditiva continuar a aumentar. Define-se a menor quantidade de dados necessária.

12 Limpeza de Dados Problemas relacionados a qualidade dos dados. Dados ruidosos (que possuem erros ou valores que são diferentes do esperado) Inconsistentes (que não combinam ou contradizem valores de outros atributos do mesmo objeto)

13 Limpeza de Dados Problemas relacionados a qualidade dos dados. Redundantes (quando dois ou mais objetos tem os mesmos valores para todos os atributos ou dois ou mais atributos tem os mesmos valores para dois ou mais objetos) Incompletos (com ausência de valores para alguns dos atributos em parte dos dados)

14 Dados incompletos Ausência de valores para alguns atributos de alguns objetos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico M 79 38,0 18 F 67 39, M 92 Espalhadas 38,0 2 Saudável , F 52 Uniformes 37,6 1 Saudável 22 F 72 38,0 3 F 87 Espalhadas 39, M 67 Uniformes 38,4 2 Saudável

15 Dados incompletos Eliminar os objetos com valores ausentes. Definir e preencher manualmente valores para os atributos com valores ausentes. Empregar algoritmos de AM que lidam internamente com valores ausentes (algoritmos indutores de árvores de decisão) Utilizar algum método ou heurística para automaticamente definir valores para os atributos com valores ausentes.

16 Dados incompletos Criar para o atributo um novo valor que indique que o atributo possuía um valor desconhecido. Utilizar a média, moda ou mediana dos valores conhecidos para esse atributo. Empregar um indutor para estimar o valor do atributo. É a mais popular!!! Utilização do valor utilizado em objetos semelhantes

17 Dados incompletos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 F 43 38, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39, M 67 Uniformes 38,4 2 Saudável Média = 60

18 Dados inconsistentes Aqueles que possuem valores conflitantes em seus atributos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 F 43 38, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39, F 72 38,0 3 Saudável

19 Dados redundantes Objeto muito semelhante a um outro objeto do mesmo conjunto de dados. Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 F 67 39, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39,0 6

20 Dados redundantes Boosting = duplica-se a quantidade de exemplos difíceis de ser classificados. Redundância de atributos (idade x data de nascimento). Alta correlação entre atributos.

21 Dados com ruídos Dados que contem objetos que, aparentemente, não pertencem a distribuição que gerou os dados analisados. Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F , M 92 Espalhadas 38,0 2 Saudável 21 F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39,0 6

22 Dados com ruídos Ruídos são identificados como observações que diferem de uma distribuição utilizada na modelagem dos dados. Dados organizados em camadas. Os ruídos são identificados como objetos pertencentes a níveis superficiais.

23 Redução do ruído Técnicas de encestamento Valores encontrados para esse atributo em todos os objetos são ordenados Os valores são divididos em faixas ou cestas, cada uma com o mesmo número de valores Os valores em uma mesma cesta são substituídos pela média ou mediana dos valores presentes

24 Redução do ruído Técnicas baseadas em agrupamento dos dados Os valores dos atributos são agrupados por uma técnica de agrupamento Valores que não formarem um grupo com outros valores são considerados ruídos ou outliers O mesmo é dito de objetos que forem colocados em uma grupo no qual os demais objetos pertencem a uma outra classe

25 Redução do ruído Técnicas baseadas em distâncias Verificação da classe que pertecem os objetos mais próximos de cada objeto x Se esses objetos mais próximos pertencem a uma outra classe, podem apresentar ruído ou são borderline

26 Redução do ruído Técnicas baseadas em regressão ou classificação Utilizam uma função de regressão para, dado um valor com ruído, estimar seu valor verdadeiro Se o valor for simbólico, utilizar uma técnica de classificação

27 Transformação de dados Conversão simbólico-numérico Ausente: 0 Presente: 1 Menor valor: 0 Outro valor: 1 Cada valor nominal corresponde a uma sequência de c bits, onde c é igual ao número de possíveis valores ou categorias.

28 Codificação 1 de c (canônica ou topológica) Atributo Nominal Código 1 de c Azul Amarelo Verde Preto Marrom Branco

29 Pseudoatributos e seus possíveis valores Pseudoatributo Continente PIN População Temperatura Média Anual Área #Valores 7 (b) 1 (i) 1 (i) 1 (i) 1 (i)

30 Valor ordinal para inteiro Valor ordinal Valor inteiro Primeiro 0 Segundo 1 Terceiro 2 Quarto 3 Quinto 4 Sexto 5

31 Valor ordinal para binário Valor ordinal Código cinza Código termômetro Primeiro Segundo Terceiro Quarto Quinto Sexto

32 Conversão Numérico-Simbólico Métodos de discretização permitem transformar atributos quantitativos em qualitativos. Os valores numéricos são transformados em intervalos ou categorias.

33 Conversão Numérico-Simbólico Métodos paramétricos = o usuário influencia na definição dos intervalos, selecionando parâmetros, como número máximo de intervalos. Métodos não-paramétricos = os intervalos são definidos utilizando apenas as informações presentes nos valores do atributo.

34 Métodos de discretização Larguras iguais: divide o intervalo original de valores em subintervalos com mesma largura. Frequências iguais: atribui o mesmo número de objetos a cada subintervalo. Uso de um algoritmo de agrupamento de dados. Inspeção visual.

35 Transformação de Atributos Numéricos Quando os limites inferior e superior de valores dos atributos são muito diferentes ou estão em escalas diferentes. Normalização = evita que um atributo predomine sobre outro. Amplitude Distribuição

36 Amplitude Por reescala = define uma nova escala de valores, limites mínimo e máximo, para todos os atributos. υ NOVO = min+ υ ATUAL menor maior menor (max min)

37 Amplitude Padronização = define um valor central e um valor de espalhamento comuns para todos os atributos. υ NOVO = υ ATUAL µ Lida melhor com outliers. σ

38 Distribuição Muda a escala de valores de um atributo. 1, 5, 9 e 3 1, 3, 4 e 2

Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo.

Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo. Conjunto de Dados Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo. No entanto, tem aumentando também a distância entre a quantidade de dados

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS Etapas do Processo de KDD Livro: Data Mining Conceitos, técnicas, algoritmos, Orientações e aplicações Ronaldo Goldschmidt, Eduardo Bezerra, Emmanuel Passos KDD Knowledge Discovery

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte A Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Mineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados?

Mineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados? Mineração de Dados Pré-Processamento de Dados 1 Sumário Dados Escalar Cardinalidade Porque pré-processar dados? Limpeza de Dados Integração e Transformação Redução de Dados Discretização 2 1 Dados Medidas

Leia mais

Estatística Descritiva

Estatística Descritiva C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados

Roteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados Roteiro PCC142 / BCC444 - Mineração de Dados Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis: Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização

Leia mais

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Resumo: Veremos nesta aula tabelas, cálculos de porcentagem e gráficos; amostras e tipo de amostragem; Medidas de tendência central e medidas

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

Considerações de Desempenho

Considerações de Desempenho Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem

Leia mais

Estatística Descritiva

Estatística Descritiva Estatística Descritiva 1 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos

Leia mais

Profa. Lidia Rodella UFPE-CAA

Profa. Lidia Rodella UFPE-CAA Profa. Lidia Rodella UFPE-CAA O que é estatística? É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 8 Análise de Dados 2 de 23 Sumário Introdução Caracterização de Dados

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

Back Propagation. Dicas para o BP

Back Propagation. Dicas para o BP Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

ANÁLISE DE RESULTADOS

ANÁLISE DE RESULTADOS ANÁLISE DE RESULTADOS Conteúdo 2 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados

Leia mais

Banco de dados Brasil

Banco de dados Brasil Banco de dados Brasil Elemento de resolução: célula de 100x100m Conteúdo: linhas de transmissão, casas, quadras, distritos, municípios, estados, país Quais distritos são cortados pela linha de transmissão

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Estatística Básica O que é Estatística? um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Aplicações em quase

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Análise de Dados Sylvio Barbon Junior barbon@uel.br 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Sumário Introdução Caracterização de Dados Exploração de

Leia mais

Dados Simbólicos. Universidade Federal de Pernambuco. CIn.ufpe.br

Dados Simbólicos. Universidade Federal de Pernambuco. CIn.ufpe.br Dados Simbólicos Universidade Federal de Pernambuco CIn.ufpe.br Dados Simbólicos Dados simbólicos são informações complexas que são expressas por intervalos, conjuntos, frequências distribuições de probabilidade.

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

TIPOS DE VARIÁVEIS E AMOSTRAGEM PROBABILÍSTICA

TIPOS DE VARIÁVEIS E AMOSTRAGEM PROBABILÍSTICA TIPOS DE VARIÁVEIS E AMOSTRAGEM PROBABILÍSTICA lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 26 de abril de 2017 É o que está sendo medido em uma população, como por

Leia mais

Conceitos centrais em análise de dados

Conceitos centrais em análise de dados Conceitos centrais em análise de dados Conceitos básicos em Estatística Estatística Ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação dos dados. Divide-se

Leia mais

CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I

CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/ CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística

Leia mais

Prof. Francisco Crisóstomo

Prof. Francisco Crisóstomo Unidade II ESTATÍSTICA BÁSICA Prof. Francisco Crisóstomo Unidade II Medidas de posição Medidas de posição Tem como característica definir um valor que representa um conjunto de valores (rol), ou seja,

Leia mais

Estudando com o MATLAB

Estudando com o MATLAB Estudando com o MATLAB Curso de Extensão Docentes: > Fabiano Araujo Soares > Marcelino M. de Andrade Monitor: >Luan Felipe Aula 4: Aplicações - Parte II 1ª Parte - Estatística Aula 4-1ª Parte: Estatística

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos

Leia mais

CONTROLE ESTATÍSTICO DE PROCESSOS

CONTROLE ESTATÍSTICO DE PROCESSOS CONTROLE ESTATÍSTICO DE PROCESSOS ANEXOS INTRODUÇÃO ANEXO 1 TABELA I Fator para estimar o desvio padrão ANEXO 2 TABELA II Valores padronizados para distribuição normal ANEXO 3 TABELA III Distribuição de

Leia mais

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís ICMC-USP Lista de Exercícios - Capítulo 8 [1] SCC-630 - Inteligência Artificial 1o. Semestre de 2011 - Prof. João Luís 1. Seja breve na resposta às seguintes questões: (a) o que você entende por Aprendizado

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) EXTRAÇÃO DE CARACTERÍSTICAS Definição Característica: variável ou atributo

Leia mais

Extração de Características

Extração de Características Extração de Características Alceu S. Britto Jr. Alessandro L. Koerich Aprendizagem de Máquina Mestrado/Doutorado em Informática 2009 Definição Característica: variável ou atributo utilizado na descrição

Leia mais

Professora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo

Professora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo Estatística Básica Professora conteudista: Maria Ester Domingues de Oliveira Revisor: Francisco Roberto Crisóstomo Sumário Estatística Básica Unidade I 1 CICLO SEMPRE CRESCENTE...2 2 ESTATÍSTICA: CIÊNCIA

Leia mais

Prof. Dr. Engenharia Ambiental, UNESP

Prof. Dr. Engenharia Ambiental, UNESP INTRODUÇÃO A ESTATÍSTICA ESPACIAL Análise Exploratória dos Dados Estatística Descritiva Univariada Roberto Wagner Lourenço Roberto Wagner Lourenço Prof. Dr. Engenharia Ambiental, UNESP Estrutura da Apresentação

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Tipos de variáveis e amostragem

Tipos de variáveis e amostragem Tipos de variáveis e amostragem probabiĺıstica Prof. Dr. Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ 28 de março de 2018 Londrina 1 / 19 Definição Tipos de variáveis

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar

Leia mais

Algoritmos Genéticos

Algoritmos Genéticos Algoritmos Genéticos Roteiro Introdução Algoritmos Genéticos Otimização Representação Seleção Operadores Genéticos Aplicação Caixeiro Viajante Introdução Algoritmos Genéticos (AGs), são métodos de otimização

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28

Leia mais

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância Amostragem e Distribuição Amostral Tipos de amostragem, distribuição amostral de média, proporção e variância 1 AMOSTRAGEM Amostragem Probabilística ou Aleatória Amostragem Não Probabilística Amostragem

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Tutorial para o desenvolvimento das Oficinas

Tutorial para o desenvolvimento das Oficinas Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina

Leia mais

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

6EMA Lucas Santana da Cunha   17 e 19 de abril de Universidade Estadual de Londrina ESTATÍSTICA ECONÔMICA 6EMA020-1000 lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 17 e 19 de abril de 2017 1 o Bimestre Cronograma Critério de Avaliação Bibliografia

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

Estatítica Descritiva e Exploratória

Estatítica Descritiva e Exploratória Gledson Luiz Picharski e Wanderson Rodrigo Rocha 3 de Abril de 2008 Estatística Descritiva e exploratória 1 Introdução à análise exploratória de dados 2 Análise exploratória de dados: Medidas-resumo 3

Leia mais

CAPÍTULO 4 CONCEITOS BÁSICOS DE ESTATÍSTICA E PROBABILIDADES

CAPÍTULO 4 CONCEITOS BÁSICOS DE ESTATÍSTICA E PROBABILIDADES CAPÍTULO 4 CONCEITOS BÁSICOS DE ESTATÍSTICA E PROBABILIDADES. INTRODUÇÃO - Conceito de população desconhecida π e proporção da amostra observada P. π P + pequeno erro Perguntas: - Qual é o pequeno erro?

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 6 Algoritmos Genéticos M.e Guylerme Velasco Roteiro Introdução Otimização Algoritmos Genéticos Representação Seleção Operadores Geneticos Aplicação Caixeiro Viajante Introdução

Leia mais

PROCESSAMENTO DIGITAL DE IMAGENS

PROCESSAMENTO DIGITAL DE IMAGENS UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE ENGENHARIA DE BIOSSISTEMAS DISCIPLINA: LEB450 TOPOGRAFIA E GEOPROCESSAMENTO II PROF. DR. CARLOS ALBERTO VETTORAZZI

Leia mais

DISCIPLINA: EPIDEMIOLOGIA E BIOESTATÍSTICA LICENCIATURA: ENFERMAGEM; FISIOTERAPIA

DISCIPLINA: EPIDEMIOLOGIA E BIOESTATÍSTICA LICENCIATURA: ENFERMAGEM; FISIOTERAPIA Aula nº 1 Data: 3 de Outubro de 2002 1. INTRODUÇÃO: POPULAÇÕES, AMOSTRAS, VARIÁVEIS E OBSERVAÇÕES Conceito de Bioestatística e importância da disciplina no âmbito da investigação biológica. Limitações

Leia mais

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Agora,

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

CAPÍTULO 3 POPULAÇÃO E AMOSTRA DEPARTAMENTO DE GEOCIÊNCIAS GCN 7901 ANÁLISE ESTATÍSTICA EM GEOCIÊNCIAS PROFESSOR: Dr. ALBERTO FRANKE CONTATO: alberto.franke@ufsc.br F: 3721 8595 CAPÍTULO 3 POPULAÇÃO E AMOSTRA As pesquisas de opinião

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas.

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas. UNIVERSIDADE FEDERAL DA PARAÍBA ESTATÍSTICA DESCRITIVA Departamento de Estatística Luiz Medeiros CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística significa para você? Pesquisas eleitorais Taxa

Leia mais

Tratamento de informação

Tratamento de informação Tratamento de informação Margarida Cardoso ISCTE IUL 2 Amostragem Aprendizagem na aula: Conceitos básicos em amostragem Distinguir amostragem probabilística de não probabilística A amostragem aleatória

Leia mais

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS:

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS: TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Técnicas de amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade

Leia mais

Estatística 1. Resumo Teórico

Estatística 1. Resumo Teórico Estatística 1 Resumo Teórico Conceitos do Curso 1. Tipos de Variáveis e Representações Gráficas a. Tipos de Variáveis b. Distribuição de Frequências c. Histograma 2. Estatística Descritiva Medidas Estatísticas

Leia mais

Aprendizagem de Dados Simbólicos e/ou Numéricos

Aprendizagem de Dados Simbólicos e/ou Numéricos Aprendizagem de Dados Simbólicos e/ou Numéricos Francisco de A.T. de Carvalho Usuais / Notação Y: variável categórica (nominal ou ordinal) ou quantitativa discreta E {,, n} : conjunto de n itens Y(), E

Leia mais

Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes

Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes 1 de 29 Tipos de Conjuntos de dados Registro Tabela do BD Matriz de dados Document 1 Document 2 team coach pla y ball score game wi n lost timeout 3 0

Leia mais

Métodos para Classificação: - Naïve Bayes.

Métodos para Classificação: - Naïve Bayes. Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo

Leia mais

UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I

UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I Departamento de Estatística Tarciana Liberal CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística significa para você? Pesquisas

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos

Leia mais

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes 1 Estatística População Características Técnicas de amostragem Amostra Análise descritiva Conclusões sobre as características da

Leia mais

Estatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências.

Estatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências. Estatística 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências Renata Souza Técnicas de Estatística Descritiva técnicas para extrair informações

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um

Leia mais

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos Aula 2 ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos 1. DEFINIÇÕES FENÔMENO Toda modificação que se processa nos corpos pela ação de agentes físicos ou químicos. 2. Tudo o que pode ser percebido

Leia mais

Mineração de Dados. Análise e Seleção de Variáveis

Mineração de Dados. Análise e Seleção de Variáveis Mineração de Dados Análise e Seleção de Variáveis 1 Análise e Seleção de Variáveis Parte da uma área chamada de Redução de Dados Obtenção de uma representação reduzida em volume mas que produz resultados

Leia mais

COMPRESSÃO E CODIFICAÇÃO SEM PERDAS. Mauro Nogueira Mônica Festa Paulo Antiquera

COMPRESSÃO E CODIFICAÇÃO SEM PERDAS. Mauro Nogueira Mônica Festa Paulo Antiquera COMPRESSÃO E CODIFICAÇÃO SEM PERDAS Mauro Nogueira Mônica Festa Paulo Antiquera Introdução Armazenamento ou transmissão compressão (compactação) de dados Compressão sem perdas Imagens médicas documentos

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Estatística: Conceitos e Organização de Dados

Estatística: Conceitos e Organização de Dados Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Disciplina: Estatística Básica Professor: Fabrício Bueno Introdução

Leia mais

17/04/2017. Tipos de dados. Primários. Secundários

17/04/2017. Tipos de dados. Primários. Secundários 1 Tipos de dados Primários Secundários 2 1 Dados primários Recolhidos, observados ou experienciados junto ao evento 3 Dados secundários Fontes que interpretam os dados primários. Tendem a ser menos fiáveis

Leia mais

Modelos Lineares Medidas de tendência central e de variabilidade. Professora Ariane Ferreira

Modelos Lineares Medidas de tendência central e de variabilidade. Professora Ariane Ferreira Medidas de tendência central e de variabilidade Professora 2 Dados Empíricos Os dados empíricos coletados de um processo devem formar a base para as decisões e ações. Uma vez que os dados brutos tenham

Leia mais

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados. ESTATÍSTICA Termo vem de status Aspectos de um país (tamanho da população, taxas de mortalidade, taxas de desemprego, renda per capita). Estatística é o conjunto de métodos para a obtenção, organização,

Leia mais

Estatística Descritiva

Estatística Descritiva Flávio B. Gonçalves Baseado no material do Prof. Marcos Prates 2018/01 1 Introdução O que é Estatística População e Amostra O papel da Inferência Estatística 2 Tipos de Variáveis Gráficos e Tabelas Sintese

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Jairo Garcia. Jairo Garcia

Jairo Garcia. Jairo Garcia Componente curricular no Plano de Curso CURSO TÉCNICO ADMINISTRAÇÃO Qualificação no 2º Módulo: ASSISTENTE ADMINISTRATIVO Algumas das atividades: Coletar dados estatísticos; e Controlar atividades por meio

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Seção 2.3 Uma Variável Quantitativa: Medidas de Dispersão

Seção 2.3 Uma Variável Quantitativa: Medidas de Dispersão Seção 2.3 Uma Variável Quantitativa: Medidas de Dispersão Sumário Uma variável quantitativa: Desvio padrão Escore z Resumo dos cinco números Amplitude e AIQ Percentis FilmesHollywood2011.xls Desvio Padrão

Leia mais

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população. CPAR - UFMS A Estatística: é a ciência que estuda, mediante métodos quantitativos, as populações que se obtém com síntese da observação de unidades estatísticas (Ibarrola et. Al, 2006). População: qualquer

Leia mais

5 TORIA ELEMENTAR DA AMOSTRAGEM

5 TORIA ELEMENTAR DA AMOSTRAGEM 5 TORIA ELEMENTAR DA AMOSTRAGEM É errôneo pensar que, caso tivéssemos acesso a todos os elementos da população, seríamos mais precisos. Os erros de coleta e manuseio de um grande número de dados são maiores

Leia mais

Seleção de Atributos 1

Seleção de Atributos 1 Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas

Leia mais

Bioestatística e Computação I

Bioestatística e Computação I Bioestatística e Computação I Distribuição Amostral da Média Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M.

Leia mais

Análise Descritiva de Dados

Análise Descritiva de Dados Análise Descritiva de Dados 1 Estatística estatística descritiva estatística inferencial 2 Estatística descritiva Envolve técnicas que permitem representar, mensurar e analisar um conjunto de dados 3 Estatística

Leia mais

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada

Leia mais

5 Experimentos Corpus

5 Experimentos Corpus 5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade

Leia mais

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM Noções básicasb de Inferência Estatística descritiva inferencial População - Parâmetros desconhecidos (reais) Amostra

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais