Metodologia Aplicada a Computação.
|
|
- Antônia Alvarenga Canela
- 6 Há anos
- Visualizações:
Transcrição
1 Metodologia Aplicada a Computação gaudenciothais@gmail.com
2 Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos, inconsistentes, duplicados ou ausentes. Podem ainda tornar os dados mais adequados para sua utilização por um determinado algoritmo.
3 Eliminação Manual de Atributos Quando um atributo não contribui para a estimativa do valor do atributo alvo, ele é considerado irrelevante. O conjunto de dados final deve ser definido de acordo com a experiência de especialistas no domínio dos dados.
4 Eliminação Manual de Atributos Id. Nome Idade Sexo Peso Manchas Temp. #Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP 3217 Maria 18 F 67 39,5 4 MG 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 38,5 8 MG 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F 72 38,0 3 RJ 1322 Marta 19 F 87 Espalhadas 39,0 6 AM 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
5 Eliminação Manual de Atributos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 28 M 79 Concentradas 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 M 43 38, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39, M 67 Uniformes 38,4 2 Saudável
6 Integração de Dados Busca por atributos comuns nos conjuntos a serem combinados. Atributos utilizados para combinação deve(m) ter um valor único para cada objeto. CUIDADO: nome do atributo e atualização dos dados.
7 Amostragem de Dados A amostra deve ser representativa do conjunto de dados original. Diferentes amostras de uma mesma população podem gerar modelos diferentes. Os dados devem obedecer a mesma distribuição estatística que gerou o conjunto de dados original.
8 Amostragem de Dados A média dos valores para cada atributo dos dados originais deve ser semelhante a da amostra. Existem basicamente três abordagens para amostragem: Amostragem aleatória simples Amostragem estratificada Amostragem progressiva
9 Amostragem aleatória simples Sem reposição de exemplos: os exemplos são extraídos do conjunto original para a amostra a ser utilizada. Cada exemplo pode ser selecionado apenas uma vez. Com reposição de exemplos: a probabilidade de escolher qualquer objeto se mantém constante.
10 Amostra estratificada Usada quando as classes apresentam propriedades diferentes (Ex. Números de objetos bastante diferentes). Manter o mesmo número de objetos para cada classe. Manter o número de objetos em cada classe proporcional ao número de objetos da classe no conjunto original.
11 Amostra progressiva Começa com uma amostra pequena e aumenta progressivamente o tamanho da amostra extraída. A amostra vai aumentando enquanto a acurácia preditiva continuar a aumentar. Define-se a menor quantidade de dados necessária.
12 Limpeza de Dados Problemas relacionados a qualidade dos dados. Dados ruidosos (que possuem erros ou valores que são diferentes do esperado) Inconsistentes (que não combinam ou contradizem valores de outros atributos do mesmo objeto)
13 Limpeza de Dados Problemas relacionados a qualidade dos dados. Redundantes (quando dois ou mais objetos tem os mesmos valores para todos os atributos ou dois ou mais atributos tem os mesmos valores para dois ou mais objetos) Incompletos (com ausência de valores para alguns dos atributos em parte dos dados)
14 Dados incompletos Ausência de valores para alguns atributos de alguns objetos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico M 79 38,0 18 F 67 39, M 92 Espalhadas 38,0 2 Saudável , F 52 Uniformes 37,6 1 Saudável 22 F 72 38,0 3 F 87 Espalhadas 39, M 67 Uniformes 38,4 2 Saudável
15 Dados incompletos Eliminar os objetos com valores ausentes. Definir e preencher manualmente valores para os atributos com valores ausentes. Empregar algoritmos de AM que lidam internamente com valores ausentes (algoritmos indutores de árvores de decisão) Utilizar algum método ou heurística para automaticamente definir valores para os atributos com valores ausentes.
16 Dados incompletos Criar para o atributo um novo valor que indique que o atributo possuía um valor desconhecido. Utilizar a média, moda ou mediana dos valores conhecidos para esse atributo. Empregar um indutor para estimar o valor do atributo. É a mais popular!!! Utilização do valor utilizado em objetos semelhantes
17 Dados incompletos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 F 43 38, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39, M 67 Uniformes 38,4 2 Saudável Média = 60
18 Dados inconsistentes Aqueles que possuem valores conflitantes em seus atributos Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 F 43 38, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39, F 72 38,0 3 Saudável
19 Dados redundantes Objeto muito semelhante a um outro objeto do mesmo conjunto de dados. Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F 67 39, M 92 Espalhadas 38,0 2 Saudável 18 F 67 39, F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39,0 6
20 Dados redundantes Boosting = duplica-se a quantidade de exemplos difíceis de ser classificados. Redundância de atributos (idade x data de nascimento). Alta correlação entre atributos.
21 Dados com ruídos Dados que contem objetos que, aparentemente, não pertencem a distribuição que gerou os dados analisados. Idade Sexo Peso Manchas Temp. #Int. Diagnóstico 27 M 79 38, F , M 92 Espalhadas 38,0 2 Saudável 21 F 52 Uniformes 37,6 1 Saudável 22 F 72 38, F 87 Espalhadas 39,0 6
22 Dados com ruídos Ruídos são identificados como observações que diferem de uma distribuição utilizada na modelagem dos dados. Dados organizados em camadas. Os ruídos são identificados como objetos pertencentes a níveis superficiais.
23 Redução do ruído Técnicas de encestamento Valores encontrados para esse atributo em todos os objetos são ordenados Os valores são divididos em faixas ou cestas, cada uma com o mesmo número de valores Os valores em uma mesma cesta são substituídos pela média ou mediana dos valores presentes
24 Redução do ruído Técnicas baseadas em agrupamento dos dados Os valores dos atributos são agrupados por uma técnica de agrupamento Valores que não formarem um grupo com outros valores são considerados ruídos ou outliers O mesmo é dito de objetos que forem colocados em uma grupo no qual os demais objetos pertencem a uma outra classe
25 Redução do ruído Técnicas baseadas em distâncias Verificação da classe que pertecem os objetos mais próximos de cada objeto x Se esses objetos mais próximos pertencem a uma outra classe, podem apresentar ruído ou são borderline
26 Redução do ruído Técnicas baseadas em regressão ou classificação Utilizam uma função de regressão para, dado um valor com ruído, estimar seu valor verdadeiro Se o valor for simbólico, utilizar uma técnica de classificação
27 Transformação de dados Conversão simbólico-numérico Ausente: 0 Presente: 1 Menor valor: 0 Outro valor: 1 Cada valor nominal corresponde a uma sequência de c bits, onde c é igual ao número de possíveis valores ou categorias.
28 Codificação 1 de c (canônica ou topológica) Atributo Nominal Código 1 de c Azul Amarelo Verde Preto Marrom Branco
29 Pseudoatributos e seus possíveis valores Pseudoatributo Continente PIN População Temperatura Média Anual Área #Valores 7 (b) 1 (i) 1 (i) 1 (i) 1 (i)
30 Valor ordinal para inteiro Valor ordinal Valor inteiro Primeiro 0 Segundo 1 Terceiro 2 Quarto 3 Quinto 4 Sexto 5
31 Valor ordinal para binário Valor ordinal Código cinza Código termômetro Primeiro Segundo Terceiro Quarto Quinto Sexto
32 Conversão Numérico-Simbólico Métodos de discretização permitem transformar atributos quantitativos em qualitativos. Os valores numéricos são transformados em intervalos ou categorias.
33 Conversão Numérico-Simbólico Métodos paramétricos = o usuário influencia na definição dos intervalos, selecionando parâmetros, como número máximo de intervalos. Métodos não-paramétricos = os intervalos são definidos utilizando apenas as informações presentes nos valores do atributo.
34 Métodos de discretização Larguras iguais: divide o intervalo original de valores em subintervalos com mesma largura. Frequências iguais: atribui o mesmo número de objetos a cada subintervalo. Uso de um algoritmo de agrupamento de dados. Inspeção visual.
35 Transformação de Atributos Numéricos Quando os limites inferior e superior de valores dos atributos são muito diferentes ou estão em escalas diferentes. Normalização = evita que um atributo predomine sobre outro. Amplitude Distribuição
36 Amplitude Por reescala = define uma nova escala de valores, limites mínimo e máximo, para todos os atributos. υ NOVO = min+ υ ATUAL menor maior menor (max min)
37 Amplitude Padronização = define um valor central e um valor de espalhamento comuns para todos os atributos. υ NOVO = υ ATUAL µ Lida melhor com outliers. σ
38 Distribuição Muda a escala de valores de um atributo. 1, 5, 9 e 3 1, 3, 4 e 2
Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo.
Conjunto de Dados Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo. No entanto, tem aumentando também a distância entre a quantidade de dados
Leia maisAula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU
Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos
Leia maisSCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS Etapas do Processo de KDD Livro: Data Mining Conceitos, técnicas, algoritmos, Orientações e aplicações Ronaldo Goldschmidt, Eduardo Bezerra, Emmanuel Passos KDD Knowledge Discovery
Leia maisSCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte A Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente
Leia maisMineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados?
Mineração de Dados Pré-Processamento de Dados 1 Sumário Dados Escalar Cardinalidade Porque pré-processar dados? Limpeza de Dados Integração e Transformação Redução de Dados Discretização 2 1 Dados Medidas
Leia maisEstatística Descritiva
C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados
Roteiro PCC142 / BCC444 - Mineração de Dados Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisTCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados
Leia maisModelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:
Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização
Leia maisProbabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)
Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Resumo: Veremos nesta aula tabelas, cálculos de porcentagem e gráficos; amostras e tipo de amostragem; Medidas de tendência central e medidas
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos
Leia maisConsiderações de Desempenho
Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem
Leia maisEstatística Descritiva
Estatística Descritiva 1 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos
Leia maisProfa. Lidia Rodella UFPE-CAA
Profa. Lidia Rodella UFPE-CAA O que é estatística? É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,
Leia maisFundamentos de Inteligência Artificial [5COP099]
Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 8 Análise de Dados 2 de 23 Sumário Introdução Caracterização de Dados
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se
Leia maisBack Propagation. Dicas para o BP
Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem
Leia mais2 Processo de Agrupamentos
20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y
Leia maisANÁLISE DE RESULTADOS
ANÁLISE DE RESULTADOS Conteúdo 2 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados
Leia maisBanco de dados Brasil
Banco de dados Brasil Elemento de resolução: célula de 100x100m Conteúdo: linhas de transmissão, casas, quadras, distritos, municípios, estados, país Quais distritos são cortados pela linha de transmissão
Leia maisSCC0173 Mineração de Dados Biológicos
SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de
Leia maisum conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de
Estatística Básica O que é Estatística? um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Aplicações em quase
Leia maisMOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisTópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Análise de Dados Sylvio Barbon Junior barbon@uel.br 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Sumário Introdução Caracterização de Dados Exploração de
Leia maisDados Simbólicos. Universidade Federal de Pernambuco. CIn.ufpe.br
Dados Simbólicos Universidade Federal de Pernambuco CIn.ufpe.br Dados Simbólicos Dados simbólicos são informações complexas que são expressas por intervalos, conjuntos, frequências distribuições de probabilidade.
Leia maisPor que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Leia maisTIPOS DE VARIÁVEIS E AMOSTRAGEM PROBABILÍSTICA
TIPOS DE VARIÁVEIS E AMOSTRAGEM PROBABILÍSTICA lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 26 de abril de 2017 É o que está sendo medido em uma população, como por
Leia maisConceitos centrais em análise de dados
Conceitos centrais em análise de dados Conceitos básicos em Estatística Estatística Ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação dos dados. Divide-se
Leia maisCÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I
UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/ CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística
Leia maisProf. Francisco Crisóstomo
Unidade II ESTATÍSTICA BÁSICA Prof. Francisco Crisóstomo Unidade II Medidas de posição Medidas de posição Tem como característica definir um valor que representa um conjunto de valores (rol), ou seja,
Leia maisEstudando com o MATLAB
Estudando com o MATLAB Curso de Extensão Docentes: > Fabiano Araujo Soares > Marcelino M. de Andrade Monitor: >Luan Felipe Aula 4: Aplicações - Parte II 1ª Parte - Estatística Aula 4-1ª Parte: Estatística
Leia maisEstatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos
Leia maisCONTROLE ESTATÍSTICO DE PROCESSOS
CONTROLE ESTATÍSTICO DE PROCESSOS ANEXOS INTRODUÇÃO ANEXO 1 TABELA I Fator para estimar o desvio padrão ANEXO 2 TABELA II Valores padronizados para distribuição normal ANEXO 3 TABELA III Distribuição de
Leia maisLista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís
ICMC-USP Lista de Exercícios - Capítulo 8 [1] SCC-630 - Inteligência Artificial 1o. Semestre de 2011 - Prof. João Luís 1. Seja breve na resposta às seguintes questões: (a) o que você entende por Aprendizado
Leia maisAprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) EXTRAÇÃO DE CARACTERÍSTICAS Definição Característica: variável ou atributo
Leia maisExtração de Características
Extração de Características Alceu S. Britto Jr. Alessandro L. Koerich Aprendizagem de Máquina Mestrado/Doutorado em Informática 2009 Definição Característica: variável ou atributo utilizado na descrição
Leia maisProfessora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo
Estatística Básica Professora conteudista: Maria Ester Domingues de Oliveira Revisor: Francisco Roberto Crisóstomo Sumário Estatística Básica Unidade I 1 CICLO SEMPRE CRESCENTE...2 2 ESTATÍSTICA: CIÊNCIA
Leia maisProf. Dr. Engenharia Ambiental, UNESP
INTRODUÇÃO A ESTATÍSTICA ESPACIAL Análise Exploratória dos Dados Estatística Descritiva Univariada Roberto Wagner Lourenço Roberto Wagner Lourenço Prof. Dr. Engenharia Ambiental, UNESP Estrutura da Apresentação
Leia mais1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27
Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4
Leia maisTipos de variáveis e amostragem
Tipos de variáveis e amostragem probabiĺıstica Prof. Dr. Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ 28 de março de 2018 Londrina 1 / 19 Definição Tipos de variáveis
Leia maisUniversidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar
Leia maisAlgoritmos Genéticos
Algoritmos Genéticos Roteiro Introdução Algoritmos Genéticos Otimização Representação Seleção Operadores Genéticos Aplicação Caixeiro Viajante Introdução Algoritmos Genéticos (AGs), são métodos de otimização
Leia maisTópicos Especiais em Informática Fatec Indaiatuba 13/07/2017
Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas
Leia maisAprendizado de Máquina
Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28
Leia maisAmostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância
Amostragem e Distribuição Amostral Tipos de amostragem, distribuição amostral de média, proporção e variância 1 AMOSTRAGEM Amostragem Probabilística ou Aleatória Amostragem Não Probabilística Amostragem
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção
Leia maisAula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
Leia maisTutorial para o desenvolvimento das Oficinas
Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina
Leia mais6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina
ESTATÍSTICA ECONÔMICA 6EMA020-1000 lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 17 e 19 de abril de 2017 1 o Bimestre Cronograma Critério de Avaliação Bibliografia
Leia maisPrograma do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas
Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação
Leia maisEstatítica Descritiva e Exploratória
Gledson Luiz Picharski e Wanderson Rodrigo Rocha 3 de Abril de 2008 Estatística Descritiva e exploratória 1 Introdução à análise exploratória de dados 2 Análise exploratória de dados: Medidas-resumo 3
Leia maisCAPÍTULO 4 CONCEITOS BÁSICOS DE ESTATÍSTICA E PROBABILIDADES
CAPÍTULO 4 CONCEITOS BÁSICOS DE ESTATÍSTICA E PROBABILIDADES. INTRODUÇÃO - Conceito de população desconhecida π e proporção da amostra observada P. π P + pequeno erro Perguntas: - Qual é o pequeno erro?
Leia maisInteligência Artificial
Inteligência Artificial Aula 6 Algoritmos Genéticos M.e Guylerme Velasco Roteiro Introdução Otimização Algoritmos Genéticos Representação Seleção Operadores Geneticos Aplicação Caixeiro Viajante Introdução
Leia maisPROCESSAMENTO DIGITAL DE IMAGENS
UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE ENGENHARIA DE BIOSSISTEMAS DISCIPLINA: LEB450 TOPOGRAFIA E GEOPROCESSAMENTO II PROF. DR. CARLOS ALBERTO VETTORAZZI
Leia maisDISCIPLINA: EPIDEMIOLOGIA E BIOESTATÍSTICA LICENCIATURA: ENFERMAGEM; FISIOTERAPIA
Aula nº 1 Data: 3 de Outubro de 2002 1. INTRODUÇÃO: POPULAÇÕES, AMOSTRAS, VARIÁVEIS E OBSERVAÇÕES Conceito de Bioestatística e importância da disciplina no âmbito da investigação biológica. Limitações
Leia maisIntrodução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística
Introdução ao Planejamento e Análise Estatística de Experimentos Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Agora,
Leia maisSumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47
CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................
Leia maisCAPÍTULO 3 POPULAÇÃO E AMOSTRA
DEPARTAMENTO DE GEOCIÊNCIAS GCN 7901 ANÁLISE ESTATÍSTICA EM GEOCIÊNCIAS PROFESSOR: Dr. ALBERTO FRANKE CONTATO: alberto.franke@ufsc.br F: 3721 8595 CAPÍTULO 3 POPULAÇÃO E AMOSTRA As pesquisas de opinião
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisApós essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas.
UNIVERSIDADE FEDERAL DA PARAÍBA ESTATÍSTICA DESCRITIVA Departamento de Estatística Luiz Medeiros CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística significa para você? Pesquisas eleitorais Taxa
Leia maisTratamento de informação
Tratamento de informação Margarida Cardoso ISCTE IUL 2 Amostragem Aprendizagem na aula: Conceitos básicos em amostragem Distinguir amostragem probabilística de não probabilística A amostragem aleatória
Leia maisTIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS:
TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Técnicas de amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade
Leia maisEstatística 1. Resumo Teórico
Estatística 1 Resumo Teórico Conceitos do Curso 1. Tipos de Variáveis e Representações Gráficas a. Tipos de Variáveis b. Distribuição de Frequências c. Histograma 2. Estatística Descritiva Medidas Estatísticas
Leia maisAprendizagem de Dados Simbólicos e/ou Numéricos
Aprendizagem de Dados Simbólicos e/ou Numéricos Francisco de A.T. de Carvalho Usuais / Notação Y: variável categórica (nominal ou ordinal) ou quantitativa discreta E {,, n} : conjunto de n itens Y(), E
Leia maisAula 03: Dados Profa. Ms. Rosângela da Silva Nunes
Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes 1 de 29 Tipos de Conjuntos de dados Registro Tabela do BD Matriz de dados Document 1 Document 2 team coach pla y ball score game wi n lost timeout 3 0
Leia maisMétodos para Classificação: - Naïve Bayes.
Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo
Leia maisUNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I
UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I Departamento de Estatística Tarciana Liberal CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística significa para você? Pesquisas
Leia maisEstatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos
Leia maisEstatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes
Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes 1 Estatística População Características Técnicas de amostragem Amostra Análise descritiva Conclusões sobre as características da
Leia maisEstatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências.
Estatística 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências Renata Souza Técnicas de Estatística Descritiva técnicas para extrair informações
Leia maisEstatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um
Leia maisAula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos
Aula 2 ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos 1. DEFINIÇÕES FENÔMENO Toda modificação que se processa nos corpos pela ação de agentes físicos ou químicos. 2. Tudo o que pode ser percebido
Leia maisMineração de Dados. Análise e Seleção de Variáveis
Mineração de Dados Análise e Seleção de Variáveis 1 Análise e Seleção de Variáveis Parte da uma área chamada de Redução de Dados Obtenção de uma representação reduzida em volume mas que produz resultados
Leia maisCOMPRESSÃO E CODIFICAÇÃO SEM PERDAS. Mauro Nogueira Mônica Festa Paulo Antiquera
COMPRESSÃO E CODIFICAÇÃO SEM PERDAS Mauro Nogueira Mônica Festa Paulo Antiquera Introdução Armazenamento ou transmissão compressão (compactação) de dados Compressão sem perdas Imagens médicas documentos
Leia maisFundamentos de Inteligência Artificial [5COP099]
Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de
Leia maisEstatística: Conceitos e Organização de Dados
Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Disciplina: Estatística Básica Professor: Fabrício Bueno Introdução
Leia mais17/04/2017. Tipos de dados. Primários. Secundários
1 Tipos de dados Primários Secundários 2 1 Dados primários Recolhidos, observados ou experienciados junto ao evento 3 Dados secundários Fontes que interpretam os dados primários. Tendem a ser menos fiáveis
Leia maisModelos Lineares Medidas de tendência central e de variabilidade. Professora Ariane Ferreira
Medidas de tendência central e de variabilidade Professora 2 Dados Empíricos Os dados empíricos coletados de um processo devem formar a base para as decisões e ações. Uma vez que os dados brutos tenham
Leia maisESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.
ESTATÍSTICA Termo vem de status Aspectos de um país (tamanho da população, taxas de mortalidade, taxas de desemprego, renda per capita). Estatística é o conjunto de métodos para a obtenção, organização,
Leia maisEstatística Descritiva
Flávio B. Gonçalves Baseado no material do Prof. Marcos Prates 2018/01 1 Introdução O que é Estatística População e Amostra O papel da Inferência Estatística 2 Tipos de Variáveis Gráficos e Tabelas Sintese
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas
Leia maisClassificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Leia maisJairo Garcia. Jairo Garcia
Componente curricular no Plano de Curso CURSO TÉCNICO ADMINISTRAÇÃO Qualificação no 2º Módulo: ASSISTENTE ADMINISTRATIVO Algumas das atividades: Coletar dados estatísticos; e Controlar atividades por meio
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisSeção 2.3 Uma Variável Quantitativa: Medidas de Dispersão
Seção 2.3 Uma Variável Quantitativa: Medidas de Dispersão Sumário Uma variável quantitativa: Desvio padrão Escore z Resumo dos cinco números Amplitude e AIQ Percentis FilmesHollywood2011.xls Desvio Padrão
Leia maisVariáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.
CPAR - UFMS A Estatística: é a ciência que estuda, mediante métodos quantitativos, as populações que se obtém com síntese da observação de unidades estatísticas (Ibarrola et. Al, 2006). População: qualquer
Leia mais5 TORIA ELEMENTAR DA AMOSTRAGEM
5 TORIA ELEMENTAR DA AMOSTRAGEM É errôneo pensar que, caso tivéssemos acesso a todos os elementos da população, seríamos mais precisos. Os erros de coleta e manuseio de um grande número de dados são maiores
Leia maisSeleção de Atributos 1
Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas
Leia maisBioestatística e Computação I
Bioestatística e Computação I Distribuição Amostral da Média Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M.
Leia maisAnálise Descritiva de Dados
Análise Descritiva de Dados 1 Estatística estatística descritiva estatística inferencial 2 Estatística descritiva Envolve técnicas que permitem representar, mensurar e analisar um conjunto de dados 3 Estatística
Leia maisClassificação: 1R e Naïve Bayes. Eduardo Raul Hruschka
Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada
Leia mais5 Experimentos Corpus
5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.
Leia mais1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade
Leia maisProf. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM
Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM Noções básicasb de Inferência Estatística descritiva inferencial População - Parâmetros desconhecidos (reais) Amostra
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia mais