Reconhecimento de Padrões

Tamanho: px
Começar a partir da página:

Download "Reconhecimento de Padrões"

Transcrição

1 Reconhecimento de Padrões André Tavares da Silva Kuncheva pg. 8 a 25 (seções 1.3 e 1.4)

2 Roteiro da aula Cálculo do erro de um classificador Técnicas de treinamento, avaliação e teste com Z 1, Z 2 e Z 3 Matrizes de confusão e perda Comparação experimental de classificadores Dicas de projeto

3 Erro de classificação Seja D(x j ) = s j a saída de um classificador D para um objeto z j de Z 3 cujo rótulo é l(z j ), e seja I(l(z j ),s j )=1, se l(z j )=s j, e I(l(z j ),s j )=0 no caso contrário. Então a taxa de erro aparente de D é dada por: N 3 1/N 3 {1 - I(l(z j ),s j )} j=1 onde N 3 é o número de objetos em Z 3. Este erro pode ser usado como uma estimativa (errada, mas útil) da probabilidade P D de D cometer um erro de classificação.

4 Intervalo de confiança O número de erros segue uma distribuição binomial com parâmetros (P D, N 3 ): P D = N erros N 3 Se N 3 > 30, P D x N 3 > 5 e (1-P D ) x N 3 > 5, podemos assumir uma distribuição normal com intervalo de confiança de 95% para o erro, calculado por: [ P D 1,96 P D (1 P D ) N 3, P D +1,96 P D (1 P D ) N 3 ]

5 Treinamento, Avaliação e Teste Resubstituição (R-method) Hold-out (H-method) Validação cruzada (método da rotação,? method) Bootstrap Podemos assumir que 50% das N amostras de Z (i.e., N 1 +N 2 = 1/2 N) serão usadas para treinamento e avaliação (pseudo-teste), e 50% para teste (i.e., N 3 =1/2 N).

6 Resubtitution (R-method) O classificador usa todo o Conjunto Z tanto para treinamento quanto teste. P D é tendenciosamente otimista. Obs.: não conheço trabalhos sérios que façam isso.

7 Bootstrap Gera L conjuntos com tamanho N' a partir do conjunto Z com sobreposição. Treinamos e avaliamos D com cada subconjunto (por resubstituição). A média dos K valores de erro é usada como estimativa de P D. O método tenta corrigir (ou diminuir) a estimativa otimista do método resubstituição.

8 Hold-Out (2-fold cross-validation) Tradicionalmente, Z é dividido ao meio e uma das metades é usada para treinamento (Z 1 U Z 2 ) e outra (Z 3 ) para teste. Depois elas são trocadas para enfim calcular P D (média dos dois testes). Podemos também executar L trocas entre Z 1 U Z 2 e Z 3 para obtermos L estimativas de P D (data shuffle). O valor médio de P D é então tomado como o erro do classificador.

9 Validação Cruzada (cross-validation) Escolhemos um inteiro K, fator de N, e dividimos aleatoriamente Z em K subconjuntos de tamanho N/K amostras. Avaliamos D com cada subconjunto e treinamos com a união dos demais. A média dos K valores de erro é usada como estimativa de P D. O método é denominado leave-one-out quando K=N (U-method).

10 Matriz de confusão A matriz de confusão associa a cada célula a ij o número de amostras que o classificador classificou como w j, mas que são da classe w i. D Real w 1 w 2 w 1 w 2 a 11 a 12 a 21 a 22 a 11 + a 22 = acertos a 12 + a 21 = erros A exatidão está associada ao traço da matriz.

11 Matriz de perda A matriz de perda atribui a cada célula p ij uma penalização associada à decisão por uma classe w j, quando a classe correta é w i. D Real w 1 w 2 w 1 w 2 p 11 p 12 p 21 p 22 p 11 = p 22 = 0

12 Comparação experimental entre classificadores Considere dois classificadores, D 1 e D 2, sendo testados sobre um mesmo conjunto Z 3, onde P D1 e P D2 são calculados. Podemos dizer que P D1 P D2? H 0 (Hipótese Nula): D 1 e D 2 são equivalentes.

13 Teste de McNemar Considere a tabela com os acertos e erros de cada classificador (N 3 =N 00 + N 10 + N 01 + N 11 ) D 1 acertos erros acertos D 2 erros N 11 N 10 N 01 N 00 x 2 = ( N 01 N 10-1) 2 N 01 + N 10 Distribuição x 2 de grau 1: Se x 2 tiver valor maior que o tabulado (e.g., 3.841) para um dado nível de significância (e.g., 0.05), então rejeitamos H 0. Obs: O nível de significância é a probabilidade de rejeitarmos H 0 (erro I), quando ela é verdadeira.

14 Diferença entre proporções Considere agora que D 1 e D 2 estão sendo testados em dados diferentes, mas o tamanho N 3 de Z 3 é o mesmo. A ideia é verificar se os intervalos de confiança de 95% para P D1 e P não se superpõem para que H D2 0 seja rejeitada. Isto equivale a verificar se o valor z é maior que 1.96 para significância z= P D1 P D2 (2p(1 p))/(n 3 ), p= 1 2 ( p D 1 + p D2 ) p D1 = N 11 + N 10 N 3 ; p D 2 = N 11 +N 01 N 3

15 F-test Considere agora L classificadores independentes D i, i=1,2,...,l, sendo testados sobre o mesmo conjunto Z 3. Seja M i o total de acertos de i classificadores simultaneamente. L 2 SSA = N 3 i=1 P Di L p 2 L SSB = 1/L i= 1 L 2 L N i 3 p2 SST = N 3 L p (1 p) SSAB = SST SSA - SSB MSA = SSA/(L-1) MSAB = SSAB/((L-1)(N 3-1)) F cal = MSA/MSAB H 0 é rejeitado se F cal for maior que o valor tabulado de uma distribuição F de graus (L-1) e (L-1)x(N 3-1) usando teste Q de Cochran.

16 Testes com validação cruzada Teste t com validação cruzada k-hold-out Método mais utilizado em aprendizado de máquina. Considerando 2 classificadores A e B, os dados são separados em treinamento (1/3) e teste (2/3). Ambos os classificadores são testados no mesmo conjunto. O teste é repetido K vezes (normalmente 30) e a performance é comparada pela média das execuções. Teste t com validação cruzada k-fold Os dados são divididos em K partes iguais. Os classificadores são treinados em uma das partes e testado nas demais (K-1). O objetivo é evitar sobreposições dos dados de teste.

17 Teste t de Dietterich com validação cruzada 5x2-fold Dietterich sugere um método que consiste em repetir um 2-fold 5 vezes, dividindo a base ao meio: Os classificadores são treinados/projetados em uma metade e testados na outra. Depois os conjuntos de treinamento e teste são trocados, repetindo o processo. Isto é repetido 5 vezes, calculando as médias e variâncias dos experimentos, populando uma tabela e calculando H 0. A motivação para esta variante vem do fato que o ideal no teste t tradicional seria não haver sobreposição entre amostras de projeto e teste em cada etapa da execução.

18 Dica Ao projetar um classificador seria interessante avaliar seu desempenho para diferentes configurações de classes no espaço de características. Portanto, você pode fazer um programa para gerar amostras de cada classe com diferentes formas, com e sem superposição, e avaliar o desempenho do seu classificador em cada caso.

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

Combinação de Classificadores (seleção)

Combinação de Classificadores (seleção) Combinação de Classificadores (seleção) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Seleção de classificadores Estimativa independente de decisão Estimativa dependente de decisão

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação

Leia mais

Combinação de Classificadores (fusão)

Combinação de Classificadores (fusão) Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os

Leia mais

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Boas Maneiras em Aprendizado de Máquinas

Boas Maneiras em Aprendizado de Máquinas Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Aluno: Fabricio Aparecido Breve Prof.: Dr. André Ponce

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Análise de Imagens. Aula 20: Sistemas com Múltiplos Classificadores. Prof. Alexandre Xavier Falcão.

Análise de Imagens. Aula 20: Sistemas com Múltiplos Classificadores. Prof. Alexandre Xavier Falcão. A.X. Falcão p.1/17 Análise de Imagens Aula 20: Sistemas com Múltiplos Classificadores (Fusão) Prof. Alexandre Xavier Falcão afalcao@ic.unicamp.br. IC - UNICAMP A.X. Falcão p.2/17 Roteiro da Aula Sistemas

Leia mais

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes. HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Duda e Hart Capítulo 1 Reconhecimento de Padrões (imagem) Objetivo: Interpretar um conjunto de dados através de um mapeamento (classificação)

Leia mais

AULA 04 Teste de hipótese

AULA 04 Teste de hipótese 1 AULA 04 Teste de hipótese Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal

Leia mais

AULA 05 Teste de Hipótese

AULA 05 Teste de Hipótese 1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

MAB-515 Avaliação e Desempenho (DCC/UFRJ)

MAB-515 Avaliação e Desempenho (DCC/UFRJ) MAB-515 Avaliação e Desempenho (DCC/UFRJ) Aula 7: Intervalos de Confiança 13 de novembro de 2012 1 2 3 4 Percentil 100p%-percentil O ponto t 0 tal que t 0 = F 1 X (p) = min{t : F X (t) p}, 0 < p < 1 é

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Métodos de reamostragem

Métodos de reamostragem Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos de reamostragem Eduardo Vargas Ferreira Função custo 2 Função custo Matriz de confusão: é um layout de tabela que

Leia mais

5 Experimentos Corpus

5 Experimentos Corpus 5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.

Leia mais

Introdução em Probabilidade e Estatística II

Introdução em Probabilidade e Estatística II Introdução em Probabilidade e Estatística II Lista 7 Exercicio Em estudo genético um gene A foi destacado para detectar uma doença. Se dita que em pessoas doentes (pacientes) este gene mostra atividade

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

Inferência para duas populações

Inferência para duas populações Inferência para duas populações Capítulo 13, Estatística Básica (Bussab&Morettin, 8a Edição) 7a AULA 27/04/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 7a aula (27/04/2015) MAE229 1 / 27 1.

Leia mais

Tutorial básico de classificação em RapidMiner

Tutorial básico de classificação em RapidMiner Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.

Leia mais

MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS

MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS Camilo Daleles Rennó Referata Biodiversidade 8 novembro 2007 Modelagem lençol freático rocha de origem Modelagem O que faz uma planta

Leia mais

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma

Leia mais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação Estatística: Aplicação ao Sensoriamento Remoto SER 204 - ANO 2018 Avaliação de Classificação Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ Classificação e Incerteza

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Modelos preditivos A tarefa de classificação Modelos Preditivos A tarefa de geração de um modelo preditivo consiste em aprender um mapeamento de entrada para a saída. Neste caso,

Leia mais

Aula 9. Prof. Adilson Gonzaga

Aula 9. Prof. Adilson Gonzaga Aula 9 Prof. Adilson Gonzaga Mapeamento Atribuir uma Instância a uma classe. Cada Instância é mapeada para um elemento do conjunto de Rótulos de Classe {p,n} p positivo n negativo Atribui uma Instância

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H NOÇÕES DE TESTE DE HIPÓTESES (II) Nível Descritivo valor P Resumo X ~ Binomial (n ; p) (1) Estabelecer as hipóteses sobre p: H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) (2) Escolher um nível de

Leia mais

CLASSIFICADORES ELEMENTARES

CLASSIFICADORES ELEMENTARES CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,

Leia mais

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA) 1. Sabe-se que o nível de significância é a probabilidade de cometermos um determinado tipo de erro quando da realização de um teste de hipóteses. Então: a) A escolha ideal seria um nível de significância

Leia mais

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1)

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1) Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 154/150 Química Analítica V Análise Instrumental Aula 1 Estatística (parte 1) Prof. Julio C. J. Silva Juiz

Leia mais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais

Leia mais

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1)

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1) Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 154/150 Química Analítica V Análise Instrumental Aula 1 Estatística (parte 1) Prof. Julio C. J. Silva Juiz

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

MONTAGEM DE HIPÓTESES

MONTAGEM DE HIPÓTESES MONTAGEM DE HIPÓTESES Metodologia Científica Graduação Tecnológica O Enunciado das Hipóteses * Toda pesquisa científica consiste em enunciar e verificar hipóteses... Hipótese é: * uma suposição que se

Leia mais

Planejamento e Otimização de Experimentos

Planejamento e Otimização de Experimentos Planejamento e Otimização de Experimentos Um Pouco de Estatística Descritiva Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br elcana@quimica.ufg.br Populações, Amostras e Distribuições População

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..

Leia mais

Planejamento e Otimização de Experimentos

Planejamento e Otimização de Experimentos Planejamento e Otimização de Experimentos Um Pouco de Estatística Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br anselmo.disciplinas@gmail.com Populações, Amostras e Distribuições População Amostra

Leia mais

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO Ana Paula Araujo Correa Eder Queiroz Newton Trevisan DEFINIÇÃO É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas

Leia mais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais

Leia mais

Projeto da Disciplina

Projeto da Disciplina Projeto da Disciplina Germano C. Vasconcelos Centro de Informática - UFPE Germano C.Vasconcelos 1 Objetivo Realizar um estudo experimental sobre a aplicação de modelos de redes neurais em um problema do

Leia mais

Curso de Data Mining

Curso de Data Mining Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos

Leia mais

Testes de Hipótese para uma única Amostra - parte II

Testes de Hipótese para uma única Amostra - parte II Testes de Hipótese para uma única Amostra - parte II 2012/02 1 Teste para média com variância conhecida 2 3 Objetivos Ao final deste capítulo você deve ser capaz de: Testar hipóteses para média de uma

Leia mais

Estatística Aplicada. Teste de hipóteses ou teste de significância Cap. 11

Estatística Aplicada. Teste de hipóteses ou teste de significância Cap. 11 Estatística Aplicada Teste de hipóteses ou teste de significância Cap. 11 Conceito Objetivo: decidir se uma afirmação sobre um parâmetro populacional é verdadeira a partir de informações obtidas de uma

Leia mais

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA Caro aluno, Disponibilizo abaixo a resolução resumida das questões de Estatística da prova de Auditor da SEFAZ/PI 2015. Vale dizer que utilizei a numeração da prova

Leia mais

QUI 072 Química Analítica V Análise Instrumental. Aula 1 - Estatística

QUI 072 Química Analítica V Análise Instrumental. Aula 1 - Estatística Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 072 Química Analítica V Análise Instrumental Aula 1 - Estatística Prof. Dr. Julio C. J. Silva Juiz de For

Leia mais

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas Tópicos Extras 1ª parte Testes Não Paramétricos, Análise Multivariada, Outras Técnicas 1 2 Técnicas de dependência 3 4 Situações Comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo

Leia mais

Laboratório de Inteligência Computacional (LABIC)

Laboratório de Inteligência Computacional (LABIC) Laboratório de Inteligência Computacional (LABIC) http://labic.icmc.sc.usp.br/ 1/70 Avaliação da Precisão de Hipóteses Maria Carolina Monard & Gustavo Batista Universidade de São Paulo Campus de São Carlos

Leia mais

DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM Morgana Pizzolato, Dr a. Aula 20 Introdução à otimização experimental e experimentos de um fator DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM TÓPICOS DESTA AULA Projetos de Experimentos

Leia mais

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM ANÁLISE DE VARIÂNCIA - ANOVA Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM UM EXEMPLO DE APLICAÇÃO Digamos que temos 6 métodos de ensino aplicados a 30 crianças

Leia mais

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48) Estimação parâmetros e teste de hipóteses Prof. Dr. Alberto Franke (48) 91471041 Intervalo de confiança para média É um intervalo em que haja probabilidade do verdadeiro valor desconhecido do parâmetro

Leia mais

Testes de hipóteses. Estatística Aplicada à Agricultura Mario Andrade Lira Junior, /10/2017

Testes de hipóteses. Estatística Aplicada à Agricultura Mario Andrade Lira Junior, /10/2017 Testes de hipóteses Mario Andrade Lira Junior WhatsApp da turma https://chat.whatsapp.com/b8phpubnimql7dyful9wtw AVA da turma http://ava.ufrpe.br/course/view.php?id=21036 Todo o material oficial será distribuído

Leia mais

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1)

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1) Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 154/150 Química Analítica V Análise Instrumental Aula 1 Estatística (parte 1) Prof. Julio C. J. Silva Juiz

Leia mais

AULA 11 Teste de Hipótese

AULA 11 Teste de Hipótese 1 AULA 11 Teste de Hipótese Ernesto F. L. Amaral 20 de setembro de 2012 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo

Leia mais

Professora Ana Hermínia Andrade. Período

Professora Ana Hermínia Andrade. Período Teste de Hipóteses Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2016.1 Teste de Hipóteses O Teste de Hipóteses

Leia mais

Testes de Hipóteses I

Testes de Hipóteses I Testes de Hipóteses I Capítulo 12, Estatística Básica (Bussab&Morettin, 8a Edição) 5a AULA 23/04/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 1. Introdução Neste capítulo pretendemos resolver

Leia mais

7 Teste de Hipóteses

7 Teste de Hipóteses 7 Teste de Hipóteses 7-1 Aspectos Gerais 7-2 Fundamentos do Teste de Hipóteses 7-3 Teste de uma Afirmação sobre a Média: Grandes Amostras 7-4 Teste de uma Afirmação sobre a Média : Pequenas Amostras 7-5

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Testes de Hipótese para uma única Amostra - parte II

Testes de Hipótese para uma única Amostra - parte II Testes de Hipótese para uma única Amostra - parte II 01 de Julho de 2014 Objetivos Ao final deste capítulo você deve ser capaz de: Testar hipóteses para média de uma população. Serão usadas as distribuições

Leia mais

Rafael Izbicki 1 / 38

Rafael Izbicki 1 / 38 Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Em uma grande escola, 10% dos alunos são comprovadamente fracos. Um teste educacional conseguiu identificar corretamente 80% entre aqueles que são fracos e 85% entre aqueles que

Leia mais

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida

Leia mais

MAE116 Noções de Estatística

MAE116 Noções de Estatística Exercício 1 (Estimação) Um agente de viagens deseja estimar a proporção de clientes satisfeitos com os serviços da agência. (a) Determine o tamanho da amostra necessário para que o erro cometido na estimação

Leia mais

Christopher Bishop, Pattern Recognition and Machine Learning, Springer, 2006 capítulo 14

Christopher Bishop, Pattern Recognition and Machine Learning, Springer, 2006 capítulo 14 Combinação de modelos Christopher Bishop, Pattern Recognition and Machine Learning, Springer, 2006 capítulo 4 Motivação Habitualmente, experimenta-se vários algoritmos (ou o mesmo com diferentes hiperparâmetros)

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia 1 / 44 Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Referência: Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 44

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo

Leia mais

Métodos Quantitativos para Ciência da Computação Experimental Aula #4

Métodos Quantitativos para Ciência da Computação Experimental Aula #4 Métodos Quantitativos para Ciência da Computação Experimental Aula #4 Jussara Almeida DCC-UFMG 2014 Measurements are not to provide numbers, but insights Metodologia de Comparação de Sistemas Experimentais

Leia mais

QUI 072/150 Química Analítica V Análise Instrumental. Aula 1 Introdução A Disciplina

QUI 072/150 Química Analítica V Análise Instrumental. Aula 1 Introdução A Disciplina Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 072/150 Química Analítica V Análise Instrumental Aula 1 Introdução A Disciplina Prof. Julio C. J. Silva Juiz

Leia mais

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância Amostragem e Distribuição Amostral Tipos de amostragem, distribuição amostral de média, proporção e variância 1 AMOSTRAGEM Amostragem Probabilística ou Aleatória Amostragem Não Probabilística Amostragem

Leia mais

Delineamento e Análise Experimental Aula 3

Delineamento e Análise Experimental Aula 3 Aula 3 Castro Soares de Oliveira Teste de hipótese Teste de hipótese é uma metodologia estatística que permite tomar decisões sobre uma ou mais populações baseando-se no conhecimento de informações da

Leia mais

Inferência via abordagens computacionalmente intensivas. Walmes Zeviani

Inferência via abordagens computacionalmente intensivas. Walmes Zeviani Inferência via abordagens computacionalmente intensivas Walmes Zeviani Introdução A lógica dos testes de hipótese frequentistas: 1. Definir a hipótese nula e hipótese alternativa. 2. Determinar uma estatística

Leia mais

1 o Teste de Aprendizagem Automática

1 o Teste de Aprendizagem Automática o Teste de Aprendizagem Automática 3 páginas com 6 perguntas e 2 folhas de resposta. Duração: 2 horas DI, FCT/UNL, 22 de Outubro de 205 Pergunta [4 valores] As figuras abaixo mostram o erro de treino e

Leia mais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari amanda.perticarrari@unesp.br INTRODUÇÃO Um dos principais objetivos da estatística é a tomada de decisões a respeito da população,

Leia mais

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas Matheus Rosso e Camila Steffens 19 de Março de 2018 Independência de variáveis aleatórias Duas V.A. são independentes se, e somente

Leia mais

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Glossário Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Análise de co-variância: Procedimento estatístico utilizado para análise de dados que

Leia mais

- Testes Qui-quadrado - Aderência e Independência

- Testes Qui-quadrado - Aderência e Independência - Testes Qui-quadrado - Aderência e Independência 1 1. Testes de Aderência Objetivo: Testar a adequabilidade de um modelo probabilístico a um conjunto de dados observados Exemplo 1: Segundo Mendel (geneticista

Leia mais

Chamamos de evento qualquer subconjunto do espaço amostral: A é um evento A Ω.

Chamamos de evento qualquer subconjunto do espaço amostral: A é um evento A Ω. PROBABILIDADE 1.0 Conceitos Gerais No caso em que os possíveis resultados de um experimento aleatório podem ser listados (caso discreto), um modelo probabilístico pode ser entendido como a listagem desses

Leia mais

5 Experimentos Conjunto de Dados

5 Experimentos Conjunto de Dados Experimentos 48 5 Experimentos Este capítulo apresenta o ambiente experimental utilizado para validar o método de predição do CTR proposto neste trabalho. Na seção 5.1, descrevemos a geração do conjunto

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

Teste de Hipótese. Comparação entre médias de dois grupos de dados 22/05/2009. Conteúdo. Valor de P. Tipos de Erro. Tipos de Erro

Teste de Hipótese. Comparação entre médias de dois grupos de dados 22/05/2009. Conteúdo. Valor de P. Tipos de Erro. Tipos de Erro Conteúdo Teste de hipótese Erros tipo I e II Teste t de Student ANOVA Qui-quadrado Teste de Hipótese Hipótese de Pesquisa (H 1 ) Prediz a relação entre variáveis Diferenças entre grupos Não é testada estatisticamente

Leia mais

Princípios de Bioestatística

Princípios de Bioestatística Princípios de Bioestatística Análise de Variância Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/~enricoc 2011 1 / 25 Introdução Existem muitas

Leia mais

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1)

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1) Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 154/150 Química Analítica V Análise Instrumental Aula 1 Estatística (parte 1) Prof. Julio C. J. Silva Juiz

Leia mais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari amanda@fcav.unesp.br INTRODUÇÃO Um dos principais objetivos da estatística é a tomada de decisões a respeito da população,

Leia mais

Lista de Exercícios #8 Assunto: Teste de Hipóteses

Lista de Exercícios #8 Assunto: Teste de Hipóteses . ANPEC 8 - Questão 5 Indique se as seguintes considerações sobre a teoria dos testes de hipótese são verdadeiras (V) ou falsas (F): () No teste de hipótese para proporções, se a variância da proporção

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Tópicos 1. Seleção de atributos 2. Redução de

Leia mais

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas 1 / 30 Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 30 Exemplo típico: Resistência de uma nova fibra sintética

Leia mais