DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
|
|
- Alexandre Azeredo Carvalhal
- 7 Há anos
- Visualizações:
Transcrição
1 DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar o desempenho relativo entre modelos diferentes? 2 Métricas para avaliação de desempenho O foco deve estar na capacidade preditiva do modelo E não no tempo que leva para classificar ou criar um modelo, na escalabilidade, etc. Matriz de confusão: Positivo (VP) Positivo (FP) Negativo (FN) Negativo (VN) Métricas para avaliação de desempenho... Métricas mais usadas: Acurácia (mais usada), Erro Acurácia: VP + VN n Positivo (VP) Positivo (FP) Erro: n = VP + VN + FP + FN Negativo (FN) Negativo (VN) FP + FN n 3 4
2 Taxa de VP : (sensibilidade, abrangência) Outras métricas para avaliação de desempenho Taxa de VN (especificidade): VP VP + FN VN VN + FP VP Precisão: 100 % VP + FP VP FP FN VN Limitação da acurácia Considere um problema de 2 classes Número de exemplos da classe 0 = 9990 Número de exemplos da classe 1 = 10 Se o modelo predizer que qualquer amostra é da clsse 0, a acurácia é 9990/10000 = 99,9 % A acurácia é enganosa porque o modelo não detecta nenhum exemplo da classe 1! Solução: levar em consideração custos por classe para erros de classificação 5 6 Matriz de custo Cálculo de custos de classificação C(i j) C( ) C( ) C( ) C( ) C(i j): custo de classificar exemplos da classe j, como sendo da classe i Modelo M1 Matriz de Custo C(i j) Modelo M Acurácia = 80% Custo = 3910 Acurácia = 90% Custo =
3 Métodos para avaliação de modelos Quão preditivo é o modelo aprendido? Erro sobre os dados de treinamento não é um bom indicador de desempenho sobre dados futuros Senão, um classificador por vizinho mais próximo seria o classificador ótimo Solução simples pode ser usada se existirem muitos dados rotulados: Dividir dados em conjuntos de treinamento e de teste Mas: normalmente o número de dados rotulados é limitado São necessárias técnicas mais sofisticadas de avaliação 9 10 Questões sobre avaliação Confiabilidade estatística das diferenças estimadas sobre o desempenho (testes de significância) Escolha de métricas de desempenho: Número de classificações corretas Exatidão das estimativas de probabilidades Erro das previsões numéricas Custos atribuídos a diferentes tipos de erros Muitas aplicações práticas envolvem custos 11 12
4 Treinamento e teste Prevendo desempenho Medida natural de desempenho para problemas de classificação: taxa de erro Sucesso: classe do exemplo é prevista corretamente (S) Erro: classe do exemplo é prevista erradamente (E) Taxa de sucesso: proporção de sucessos obtidos sobre todo o conjunto de exemplos: (S/N) Taxa de erro: proporção de erros feitos sobre todo o conjunto de exemplos: (E/N) Erro de substituição: taxa de erro obtida dos dados de treinamento Erro de substituição é demasiadamente otimista! A confiança na previsão da taxa de sucesso (ou erro) cai com a diminuição do número de exemplos utilizados. Existem fórmulas que calculam o intervalo em que a taxa de erro deve estar, com dada confiança, a partir da taxa de erro estimada com um determinado tamanho de amostra. Exemplo: (f : taxa de sucesso estimada, N: tamanho da amostra, c: confiança na estimativa, p: taxa de erro ) f = 75%, N = 1000, c = 80%: p [0,732, 0,767] f = 75%, N = 100, c = 80%: p [0,691, 0,801] f = 75%, N = 10, c = 80%: p [0,549, 0,881] Treinamento e teste Conjunto de teste: conjunto de exemplos independentes que não foram usados na geração do modelo Suposição: os dados de treinamento e os dados de teste são amostras representativas do problema Arquivos de teste e de treinamento podem ter naturezas diferentes Exemplo: classificadores construídos usando dados de consumidores de duas cidades diferentes A e B Para estimar o desempenho do classificador, gerado com os dados da cidade A, numa cidade diferente, testá-lo com dados de B Nota sobre ajuste de parâmetros É importante que os dados de teste não sejam usados para criar o modelo Alguns esquemas de aprendizagem operam em dois estágios: Estágio 1: constrói a estrutura básica Estágio 2: otimiza os parâmetros da estrutura Os dados de teste não podem ser usados para ajustar parâmetros! Neste caso são precisos três conjuntos: de treinamento, de validação (ou configuração) e de teste. Conjunto de validação é usado para otimizar parâmetros 15 16
5 Tirando o máximo dos dados Após a avaliação, todos os dados podem ser usados para construir o classificador final Geralmente, quanto maior o arquivo de treinamento melhor o classificador Quanto maior o arquivo de teste mais exata será a estimativa de erro Procedimento holdout (retenção): dividir os dados originais em conjuntos de treinamento e de teste Dilema: queremos tanto um grande arquivo de treinamento quanto um grande arquivo de teste Estimação por retenção (holdout) O que fazer se a quantidade de dados é limitada? Método holdout reserva uma certa quantidade dos dados para teste e usa o resto para o treinamento Usualmente 1/3 para teste, o resto para treinamento Mas: as amostras podem não ser representativas Exemplo: pode não haver amostras de uma classe nos dados de teste Versão avançada usa estratificação Assegura que cada classe esteja representada com proporções aproximadamente iguais em ambos os conjuntos Validação cruzada (cross-validation) Validação cruzada evita superposição dos conjuntos de teste Primeiro passo: conjunto de dados é dividido em k subconjuntos de tamanhos iguais Segundo passo: cada subconjunto é usado para teste e os demais para treinamento. O segundo passo é repetido k vezes Esta é a chamada validação cruzada por k vezes Muitas vezes os subconjuntos são estratificados antes de izar a validação cruzada A estimativa de erro global é calculada como a média das k estimativas de erro de cada iteração teste four-fold-cross-validation Conjunto de Exemplos subconj 1 Modelo 1 Modelo 2 Modelo 3 Modelo 4 subconj 1 teste subconj 1 subconj 1 teste subconj 1 teste 19 20
6 Mais sobre validação cruzada Método padrão de avaliação: validação cruzada por dez vezes estratificada Por que dez? Experimentos demonstraram que esta é a melhor escolha para se obter uma estimativa precisa Estratificação reduz a variância da estimativa Melhor ainda: validação cruzada estratificada repetida P. ex. se repete dez vezes a validação cruzada por dez vezes e se calcula a média (reduz variância) Validação cruzada deixando um fora A validação cruzada deixando um fora (leave-one-out c-v): O número de vezes é escolhido como o número de exemplos de treinamento Isto é, deve-se construir n classificadores, onde n é o número de exemplos de treinamento Aproveita ao máximo os dados envolve sub-amostragem aleatória Computacionalmente muito custoso 21 22
Descoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Modelos preditivos A tarefa de classificação Modelos Preditivos A tarefa de geração de um modelo preditivo consiste em aprender um mapeamento de entrada para a saída. Neste caso,
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Kuncheva pg. 8 a 25 (seções 1.3 e 1.4) Roteiro da aula Cálculo do erro de um classificador Técnicas de treinamento, avaliação e teste
Leia maisAvaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE
Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando
Leia maisInteligência Artificial
Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação
Leia maisAprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia
Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br
Leia maisSCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos
Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências
Leia maisMétodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem
e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores
SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..
Leia maisAula 9. Prof. Adilson Gonzaga
Aula 9 Prof. Adilson Gonzaga Mapeamento Atribuir uma Instância a uma classe. Cada Instância é mapeada para um elemento do conjunto de Rótulos de Classe {p,n} p positivo n negativo Atribui uma Instância
Leia maisSCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos
Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisBoas Maneiras em Aprendizado de Máquinas
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas
Leia mais2284-ELE/5, 3316-IE/3
INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem
Leia maisTutorial básico de classificação em RapidMiner
Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.
Leia maisMétodos Quantitativos para Ciência da Computação Experimental
Métodos Quantitativos para Ciência da Computação Experimental Revisão Virgílio A. F. Almeida Maio de 2008 Departamento de Ciência da Computação Universidade Federal de Minas Gerais FOCO do curso Revisão
Leia maisMétodos de reamostragem
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos de reamostragem Eduardo Vargas Ferreira Função custo 2 Função custo Matriz de confusão: é um layout de tabela que
Leia maisCurso de Data Mining
Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos
Leia maisAp A r p e r n e d n i d z i a z ge g m e m Es E t s a t tí t s í t s i t c i a c de d e Dado d s Francisco Carvalho
Apredizagem Estatística de Dados Fracisco Carvalho Avaliação e Comparação de Classificadores Existem poucos estudos aalíticos sobre o comportameto de algoritmos de apredizagem. A aálise de classificadores
Leia maisEstatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação
Estatística: Aplicação ao Sensoriamento Remoto SER 204 - ANO 2018 Avaliação de Classificação Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ Classificação e Incerteza
Leia maisModelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:
Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Leia maisUniversidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia. Testes Diagnósticos ANA PAULA SAYURI SATO
Universidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia Testes Diagnósticos ANA PAULA SAYURI SATO Objetivos da aula Definir validade de testes de rastreamento (screening) e diagnóstico
Leia maisAMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.
AMOSTRAGEM É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. Nos planejamentos amostrais, a coleta dos dados deve ser realizada
Leia maisEstimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)
Estimação parâmetros e teste de hipóteses Prof. Dr. Alberto Franke (48) 91471041 Intervalo de confiança para média É um intervalo em que haja probabilidade do verdadeiro valor desconhecido do parâmetro
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas
Leia maisClassificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Leia maisAULA 03 Estimativas e tamanhos amostrais
1 AULA 03 Estimativas e tamanhos amostrais Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade
Leia maisRafael Izbicki 1 / 38
Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)
Leia maisCombinação de Classificadores (fusão)
Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se
Leia maisCLASSIFICADORES ELEMENTARES
CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,
Leia mais5 Experimentos Corpus
5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.
Leia maisImplementação de um sistema de validação estatística configurável de dados
Implementação de um sistema de validação estatística configurável de dados Eduardo Dias Filho Supervisores: João Eduardo Ferreira e Pedro Losco Takecian 16 de novembro de 2014 Introdução Table of Contents
Leia maisHP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.
HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)
Leia maisINTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição
Leia maisO SABER ESTATÍSTICO ALÉM DE TABELAS, GRÁFICOS E FÓRMULAS
O SABER ESTATÍSTICO ALÉM DE TABELAS, GRÁFICOS E FÓRMULAS ESTATÍSTICO pauloafonsolopes@uol.com.br (21) 8163-1978 1º. Ato Começos Profissionais: entender Estatística? Momentos diferentes formações lidam
Leia maisAPRENDIZAGEM DE MÁQUINA
APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.
Leia maisAvaliando o que foi Aprendido
Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função
Leia maisAULA 04 Teste de hipótese
1 AULA 04 Teste de hipótese Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal
Leia maisAjustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.
Glossário Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Análise de co-variância: Procedimento estatístico utilizado para análise de dados que
Leia maisRedes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Aluno: Fabricio Aparecido Breve Prof.: Dr. André Ponce
Leia maisCap. 8 - Intervalos Estatísticos para uma Única Amostra
Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO
Leia maisAULA 05 Teste de Hipótese
1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução
Leia maisMapeamento do uso do solo para manejo de propriedades rurais
1/28 Mapeamento do uso do solo para manejo de propriedades rurais Teoria Eng. Allan Saddi Arnesen Eng. Frederico Genofre Eng. Marcelo Pedroso Curtarelli 2/28 Conteúdo programático: Capitulo 1: Conceitos
Leia maisMONTAGEM DE HIPÓTESES
MONTAGEM DE HIPÓTESES Metodologia Científica Graduação Tecnológica O Enunciado das Hipóteses * Toda pesquisa científica consiste em enunciar e verificar hipóteses... Hipótese é: * uma suposição que se
Leia maisCapítulo 4 Inferência Estatística
Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a diferença de
Leia maisvariável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência
REGRESSÃO LOGÍSTICA É uma técnica recomendada para situações em que a variável dependente é de natureza dicotômica ou binária. Quanto às independentes, tanto podem ser categóricas ou não. A regressão logística
Leia maisValidade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo
Validade interna e externa em estudos epidemiológicos Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo Qualidade da Informação Existem dois conceitos fundamentais, em termos
Leia maisCap. 4 - Estimação por Intervalo
Cap. 4 - Estimação por Intervalo Amostragem e inferência estatística População: consiste na totalidade das observações em que estamos interessados. Nº de observações na população é denominado tamanho=n.
Leia maisSeleção de Atributos 1
Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas
Leia maisThiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21
MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos
Leia maisMétodos de Amostragem Populações de Animais Silvestres Amostragem
Métodos de Amostragem de Populações de Animais Silvestres Amostragem Sistema Natural Estrutura da amostragem: Lista das unidades para a amostragem (mapa da área por exemplo) Estrutura da amostragem População
Leia maisTécnicas de Amostragem
Técnicas de Amostragem 1 Amostragem é o processo de seleção de uma amostra, que possibilita o estudo das características da população. Quando obtemos informações a partir de amostras e tentamos atingir
Leia maisInferência Estatística:
Inferência Estatística: Amostragem Estatística Descritiva Cálculo de Probabilidade Inferência Estatística Estimação Teste de Hipótese Pontual Por Intervalo Conceitos básicos Estimação É um processo que
Leia maisPor que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Leia maisConceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional
Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos
Leia maisθ depende de um parâmetro desconhecido θ.
73 Método de Máxima Verosimilhança (Maximum Likelihood) Seja uma variável aleatória (v. a.) cuja densidade de probabilidade depende de um parâmetro desconhecido. Admite-se conhecida a forma de Exemplo
Leia maisEstimação de valores. Luiz Carlos Terra
Luiz Carlos Terra Nesta aula, você conhecerá a parte mais importante da estatística, que é conhecida como inferência estatística, ou seja, você aprenderá como usar os dados de uma amostra para estimar
Leia maisInferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva
Inferência Estatística: Prof.: Spencer Barbosa da Silva Amostragem Estatística Descritiva Cálculo de Probabilidade Inferência Estatística Estimação Teste de Hipótese Pontual Por Intervalo Conceitos básicos
Leia maisCAPÍTULO 3 POPULAÇÃO E AMOSTRA
DEPARTAMENTO DE GEOCIÊNCIAS GCN 7901 ANÁLISE ESTATÍSTICA EM GEOCIÊNCIAS PROFESSOR: Dr. ALBERTO FRANKE CONTATO: alberto.franke@ufsc.br F: 3721 8595 CAPÍTULO 3 POPULAÇÃO E AMOSTRA As pesquisas de opinião
Leia maisPlanejamento e Otimização de Experimentos
Planejamento e Otimização de Experimentos Um Pouco de Estatística Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br anselmo.disciplinas@gmail.com Populações, Amostras e Distribuições População Amostra
Leia maisAula 8: Árvores. Rafael Izbicki 1 / 33
Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum
Leia maisAula 01 Planejamento de uma Pesquisa
Aula 01 Planejamento de uma Pesquisa Stela Adami Vayego - DEST/UFPR 1 Etapas usuais de uma pesquisa empírica Tema, definição do problema, objetivos,... Planejamento da pesquisa Metolo- -logia estatística
Leia maisJAI 6 - Deep Learning Teoria e Prática
JAI 6 - Deep Learning Teoria e Prática Esteban Clua e Cristina Nader Vasconcelos Universidade Federal Fluminense Fundamentos Computação baseada em modelos crisnv@ic.uff.br 2 Computação baseada em aprendizado
Leia maisMineração em Data Streams - Avaliação. Profa. Elaine Faria UFU
Mineração em Data Streams - Avaliação Profa. Elaine Faria UFU - 2018 Avaliação em Agrupamento Validação de Agrupamento Em tarefas de classificação A avaliação dos resultados do modelo de classificação
Leia maisAULA 07 Inferência a Partir de Duas Amostras
1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,
Leia maisInteligência Artificial
Aprendizagem por que? lnteligência Artificial Aprendizagem em IA Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com
Leia maisDEFCUL- Metodologia da Investigação I. Amostragem. Maria João Lagarto Nuno Longle Sílvia Dias
DEFCUL- Metodologia da Investigação I Amostragem Maria João Lagarto Nuno Longle Sílvia Dias 18 de Novembro de 2005 Mais do que ouvir muitas vozes, interessa ouvir as vozes certas. População e amostra População
Leia maisRegressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada
Leia maislnteligência Artificial Aprendizagem em IA
lnteligência Artificial Aprendizagem em IA 1 Aprendizagem por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com
Leia maisDistribuição Amostral e Estimação Pontual de Parâmetros
Roteiro Distribuição Amostral e Estimação Pontual de Parâmetros 1. Introdução 2. Teorema Central do Limite 3. Conceitos de Estimação Pontual 4. Métodos de Estimação Pontual 5. Referências Estatística Aplicada
Leia maisO que é população? O que é amostra? Curso de Bacharelado em Educação Física e Saúde
Curso de Bacharelado em Educação Física e Saúde Disciplina de Epidemiologia da Atividade Física Prof. Alex Antonio Florindo Prof. Douglas Andrade População e amostra O que é população e amostra; Tipos
Leia maisMétodos de Amostragem. Carla Varão Cláudia Batista Vânia Martinho
Métodos de Amostragem Carla Varão Cláudia Batista Vânia Martinho Objecto de interesse Objectivos finais da pesquisa Esquema Geral da Investigação Empírica Objecto teórico Enquadramento teórico Fases do
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções
Leia maisClóvis de Araújo Peres Cargo: Professor Titular de Estatística da USP UNIFESP Formação: PhD em Estatística pela Universidade WISCONSIN - USA
TÍTULO: ESTUDO ESTATÍSTICO PARA DETERMINAÇÃO DO ERRO DE MICROMEDIÇÃO DAS ÁREAS PILOTO DE CONTROLE E REDUÇÃO DE PERDAS DO SISTEMA DE ABASTECIEMNTO DE ÁGUA DO MUNICÍPIO DE GUARULHOS. TEMA DO TRABALHO: ABASTECIMENTO
Leia maisProbabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança
Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://páginapessoal.utfpr.edu.br/ngsilva Estimação de Parâmetros Intervalo de Confiança Introdução A inferência estatística é o processo
Leia maisMetodologia de simulação
Metodologia de simulação OBJETIVOS E DEFINIÇÃO DO SISTEMA FORMULAÇÃO DO MODELO ANÁLISE E REDEFINIÇÃO MODELO ABSTRATO RESULTADOS EXPERIMENTAIS (Capítulo 6) MODELO CONCEITUAL (Capítulo 3) REPRESENTAÇÃO DO
Leia maisComparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos
Comparação entre intervalos de confiança calculados com métodos strap e intervalos assintóticos Selene Loibel Depto. de Estatística, Matemática Aplicada e Computação, IGCE, UNESP, Rio Claro, SP E-mail:sloibel@rc.unesp.br,
Leia maisP. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Amostragem: Em pesquisas científicas, quando se deseja conhecer características de uma população, é comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter
Leia maisPrincípios de Bioestatística
Princípios de Bioestatística Cálculo do Tamanho de Amostra Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Depto. Estatística - ICEx - UFMG 1 / 32 2 / 32 Cálculo do Tamanho de Amostra Parte fundamental
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisEstatística. O que é Estatística? Estatística pode ser: Estatística Descritiva. Ivonete Melo de Carvalho. Conteúdo
Estatística Estatística Descritiva Ivonete Melo de Carvalho Conteúdo Definições; Tabelas e Gráficos; Medidas de tendência central; Medidas de dispersão. Objetivos Diferenciar população e amostra. Elaborar
Leia maisInferência Estatística
Metodologia de Diagnóstico e Elaboração de Relatório FASHT Inferência Estatística Profa. Cesaltina Pires cpires@uevora.pt Plano da Apresentação Duas distribuições importantes Normal T- Student Estimação
Leia mais3 INTERVALOS DE CONFIANÇA
3 INTEVALOS DE CONFIANÇA 3.1 Introdução A estimativa de intervalos de confiança é utilizada para se obter medidas de incerteza dos dados analisados. A análise da incerteza de uma previsão, por exemplo,
Leia maisIntervalos Estatísticos para uma única Amostra - parte I
Intervalos Estatísticos para uma única Amostra - parte I Intervalo de confiança para média 14 de Janeiro Objetivos Ao final deste capítulo você deve ser capaz de: Construir intervalos de confiança para
Leia maisK-Nearest Neighbours & RSTUDIO
K-Nearest Neighbours & RSTUDIO Rodrigo Augusto Igawa Universidade Estadual de Londrina igawa@uel.br 17 de novembro de 2015 Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de 2015 1 / 16 Sumário
Leia maisTÉCNICAS DE AMOSTRAGEM
TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Amostragem estratificada Divisão da população em
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Leia maisSistema de Informações e Pesquisa de Marketing Aula 12 24/10/17
Sistema de Informações e Pesquisa de Marketing Aula 12 24/10/17 2º semestre / 2017 Profa Kavita Hamza kavita@usp.br População Soma de todos os elementos que compartilham algum conjunto comum de características
Leia maisPesquisa Operacional II. Professor: Roberto César
Pesquisa Operacional II Professor: Roberto César POPULAÇÃO E AMOSTRA População: refere-se ao grupo total. Amostra: é toda fração obtida de uma população (independente de seu tamanho). Quando usar Amostragem?
Leia maisSimulação de Sistemas. Adaptado de material de Júlio Pereira Machado (AULA 17)
Simulação de Sistemas Adaptado de material de Júlio Pereira Machado (AULA 17) Análise dos Dados de Saída Além das tarefas de modelagem e validação, devemos nos preocupar com a análise apropriada dos resultados
Leia maisCURSO DE ESPECIALIZAÇÃO EM FISIOTERAPIA TRAUMATO- ORTOPÉDICA METODOLOGIA DA
CURSO DE ESPECIALIZAÇÃO EM FISIOTERAPIA TRAUMATO- ORTOPÉDICA METODOLOGIA DA INVESTIGAÇÃO CIENTÍFICA Profa. Dra. Paula Silva de Carvalho Chagas Faculdade de Fisioterapia UFJF Doutora em Ciências da Reabilitação
Leia maisDistribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros ESQUEMA DO CAPÍTULO 7.1 INTRODUÇÃO 7.2 DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL 7.3 CONCEITOS GERAIS DE ESTIMAÇÃO PONTUAL 7.3.1 Estimadores
Leia mais