Curso de Data Mining

Tamanho: px
Começar a partir da página:

Download "Curso de Data Mining"

Transcrição

1 Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos falsos de vários modelos de um classificador. É um enfoque empregado quando se dispõe de duas classes não-balanceadas. Através do gráfico da curva ROC tem-se uma nítida idéia da qualidade preditiva do classificador, uma vez que a curva contém dados estatísticos de diferentes modelos induzidos pelo classificador. Através das curvas ROC, podemos comparar a qualidade de dois classificadores medindo a área abaixo de suas respectivas curvas: quanto maior a área maior a qualidade do classificador. Trade-off entre TPR e FPR A taxa de true-positivos (TPR) corresponde à medida Revocação (ou sensitividade ou Recall). É definida como a porcentagem de elementos CORRETAMENTE CLASSIFICA- DOS COMO POSITIVOS pelo modelo dentre todos os POSITIVOS REAIS. A taxa de falsepositivos (FPR) é definida como a porcentagem de elementos ERRONEAMENTE CLAS- SIFICADOS COMO POSITIVOS pelo modelo dentre todos os NEGATIVOS REAIS. T P R = T P T P + F N F P R = F P F P + T N Obviamente, um modelo de classificação ideal teria TPR = 1 e FPR = 0 (taxa de acerto = 1 e taxa de erro = 0). Um modelo aleatório teria TPR = 0,5 e FPR = 0,5. E um modelo totalmente contraditório teria TPR = 0 e FPR = 1 (taxa de acerto = 0 e taxa de erro = 1). A curva ROC de um classificador é um gráfico contendo no eixo x valores de FPR (taxas de erro) de diferentes modelos do classificador e no eixo y os valores de TPR (taxas de acerto) dos mesmos modelos. Assim, a curva ROC de um classificador consiste na plotagem da seguinte tabela: Modelo FPR TPR 1 f 1 t 1 2 f 2 t 2 3 f 3 t n f n t n A maneira como tais modelos são escolhidos é descrita a seguir. Como é construída uma curva ROC de um classificador? 1

2 Um classificador corresponde a um método de classificação, por exemplo o classificador ID3, o classificador J48, o classificador Bayesiano, o classificador SVM, o classificador AdaBoost, etc. Cada classificador C induz diferentes modelos, da seguinte maneira: Seja D um banco de dados de amostras classificadas. Uma amostragem de D é um par A = (T r, T e ) tal que T r D, T e D e T r T e = D. T r é chamado de Amostras de Treinamento e T e é chamado de Amostras de Testes. Cada amostragem A i induz um modelo M i do classificador: o conjunto T r é usado para construir o modelo de classificação e o conjunto T e é usado para testar o modelo. A acurácia do modelo M i é calculada como a porcentagem de amostras de T e corretamente classificadas dentre o total de amostras de T e. A acurácia do classificador C é calculada como sendo a média das acurácias dos modelos induzidos. Diversas técnicas de construir as diferentes amostragens (T r, T e ) são consideradas (Hold-out, cross-validation, bootstrap, etc), de modo a se ter uma medida de acurácia o mais confiável possivel. Dados diferentes modelos induzidos pelo classificador, como o classificador classifica uma amostra X? Para cada modelo induzido M i determina-se a classe que este modelo associa à amostra X. Após este cálculo, dispõe-se de uma função que associa a cada classe c a porcentagem de modelos que associaram esta classe à amostra X. Considera-se a classe com a maior porcentagem como sendo a classe associada a X pelo classificador. Por exemplo, suponha que tenhamos dez modelos M 1, M 2,..., M 10 e duas classes: c 1, c 2. Suponhamos que c 1 foi escolhida por 3 modelos, c 2 foi escolhida 7. Então X é classificada na classe c 2 com probabilidade 0,7. Para a construção da curva ROC do classificador C, procede-se da seguinte maneira: 1. considera-se a massa de dados de amostras D, os diferentes modelos M 1,..., M n induzidos, e um número m de amostras de D escolhidas aleatoriamente x 1, x 2,..., x m, de modo que se tenha exatamente o mesmo número de amostras de cada classe ( m 2 de cada classe). 2. Calcula-se a probabilidade de cada amostra ser classificada na classe positiva. 3. Ordena-se as amostras em ordem crescente de probabilidade de ser classificada na classe positiva. 4. Como se considerou um número muito grande de modelos induzidos para se efetuar a classificação das amostras x 1,..., x m, é razoável que existam modelos M 1, M 2,..., M m, M m+1 tais que: M 1 classifica todos as amostras na classe positiva, M 2 classifica m 1 amostras na classe positiva e uma na negativa, M 3 classifica m 2 amostras na classe positiva e duas na negativa,..., M m classifica 1 amostra na classe positiva e m 1 na negativa e M m+1 classifica m amostras na classe negativa e nenhuma na positiva. 5. Como as amostras estão ordenadas por ordem crescente de probabilidade de serem classificadas na classe positiva, é razoável de afirmar que o único elemento classificado como 2

3 negativo pelo modelo M 2 é o x 1 (já que a probabilidade de x 1 ser classificada como positiva é a mais baixa de todas), que os únicos dois elementos a serem classificados como negativos pelo modelo M 3 são x 1 e x 2 (já que estes dois elementos são os que têm a menor probabilidade de serem classificados na classe positiva - portanto a maior probabilidade de serem classificados na classe negativa), etc. 6. Resumindo, temos a seguinte tabela: Modelo Negativos Positivos M 1 nenhum {x 1,..., x m } M 2 {x 1 } {x 2,..., x m } M 2 {x 1, x 2 } {x 3,..., x m } M m {x 1,..., x m 1 } {x m } M m+1 {x 1,..., x m } nenhum 7. Para cada um dos modelos M i calcula-se as taxas TPR e FPR, calculando as medidas TP, FP, TN e FN da seguinte maneira: Exercícios Para o M 1 : T P = número de amostras positivas e F P = número de amostras negativas. T N = 0 e F N = 0. Logo TPR = 1 e FPR = 1. Para cada M i (i > 1): verifica-se a classe real da amostra x i 1 : se for positiva: TP de M i = TP de M i 1 1 FP de M i = FP de M i 1. TN de M i = TN de M i 1 FN de M i = FN de M i se for negativa: TP de M i = TP de M i 1 FP de M i = FP de M i 1 1. TN de M i = TN de M i FN de M i = FN de M i Explique as fórmulas para o cálculo de TP, FP, TN e FN de cada modelo M i. 2. Suponha dois classificadores C 1 e C 2 e uma massa de dados de amostras D que foi utilizada para avaliar a qualidade dos dois classificadores. Foram escolhidas 20 amostras x 1, x 2,..., x 20 de D e as seguintes informações foram obtidas: 3

4 (a) Classificador C 1 : Amostra Probabilidade da classe ser positiva Valor real da classe x 1 0,93 + x 2 0,24 - x 3 0,53 - x 4 0,72 + x 5 0,82 - x 6 0,85 - x 7 0,47 - x 8 0,33 - x 9 0,69 - x 10 0,78 + x 11 0,99 + x 12 0,97 + x 13 0,56 + x 14 0,79 + x 15 0,87 - x 16 0,94 + x 17 0,25 - x 18 0,43 + x 19 0,66 + x 20 0,89-4

5 (b) Classificador C 2 : Pede-se: Amostra Probabilidade da classe ser positiva Valor real da classe x 1 0,83 + x 2 0,26 - x 3 0,45 - x 4 0,65 + x 5 0,18 + x 6 0,85 - x 7 0,67 - x 8 0,20 - x 9 0,69 + x 10 0,75 + x 11 0,98 + x 12 0,95 - x 13 0,23 + x 14 0,77 + x 15 0,82 + x 16 0,94 - x 17 0,21 - x 18 0,12 - x 19 0,18 + x 20 0,97 - (a) Faça as tabelas contendo as medidas TP, TN, FP, FN, TPR e FPR de cada um dos 21 modelos dos classificadores C 1 e C 2, referentes às amostras x 1,..., x 20. (b) Faça as curvas ROC dos dois classificadores C 1 e C 2. (c) Qual é, em sua opinião, o melhor classificador? 5

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto [email protected]

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Validade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo

Validade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo Validade interna e externa em estudos epidemiológicos Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo Qualidade da Informação Existem dois conceitos fundamentais, em termos

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando

Leia mais

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada

Leia mais

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os

Leia mais

Avaliação de testes diagnósticos

Avaliação de testes diagnósticos Avaliação de testes diagnósticos De volta ao exemplo do benzenismo Mapeamento da população sob risco (7.356 trabalhadores) 1 a triagem hematológica 2 a triagem hematológica 216 indivíduos considerados

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Testes Diagnósticos. HEP Cassia Maria Buchalla

Testes Diagnósticos. HEP Cassia Maria Buchalla Testes Diagnósticos HEP 176 2017 Cassia Maria Buchalla Os testes são utilizados no diagnóstico clínico, na triagem e na pesquisa Concebido como um teste laboratorial, também se aplica à informação obtida

Leia mais

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Aluno: Fabricio Aparecido Breve Prof.: Dr. André Ponce

Leia mais

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís ICMC-USP Lista de Exercícios - Capítulo 8 [1] SCC-630 - Inteligência Artificial 1o. Semestre de 2011 - Prof. João Luís 1. Seja breve na resposta às seguintes questões: (a) o que você entende por Aprendizado

Leia mais

Modelos Lineares Generalizados - Regressão Logística

Modelos Lineares Generalizados - Regressão Logística Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede

Leia mais

Estatística e Matemática Aplicadas a Data Science. Diógenes Justo BM&FBOVESPA & Professor FIAP

Estatística e Matemática Aplicadas a Data Science. Diógenes Justo BM&FBOVESPA & Professor FIAP Estatística e Matemática Aplicadas a Data Science Diógenes Justo BM&FBOVESPA & Professor FIAP Agenda Modelagem para Data Science (Matemática e Estatística) Detecção de Fraudes Forecast (financeiro) Conclusões

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 MINERAÇÃO DE DADOS Thiago Marzagão 1 1 [email protected] ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva [email protected] Kuncheva pg. 8 a 25 (seções 1.3 e 1.4) Roteiro da aula Cálculo do erro de um classificador Técnicas de treinamento, avaliação e teste

Leia mais

Análise ROC. 1 Introdução. 2 Performance dos Classicadores. Felipe Castro da Silva São José dos Campos, 6 de Dezembro de 2006

Análise ROC. 1 Introdução. 2 Performance dos Classicadores. Felipe Castro da Silva São José dos Campos, 6 de Dezembro de 2006 Análise ROC Felipe Castro da Silva [email protected] São José dos Campos, 6 de Dezembro de 2006 1 Introdução ROC 1 é uma técnica para visualizar, avaliar, organizar e selecionar classicadores baseado

Leia mais

Probabilidades em Biomedicina: Uma Aplicação da Regra de Bayes

Probabilidades em Biomedicina: Uma Aplicação da Regra de Bayes Probabilidades em Biomedicina: Uma Aplicação da Regra de Bayes Introdução Os seguintes parágrafos foram retirados do artigo Uncertainty and Decisions in Medical Informatics, de P. Szolovitz, publicado

Leia mais

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva [email protected] Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição

Leia mais

Técnicas de classificação Análise discriminante & Regressão logística. Abraham Laredo Sicsú

Técnicas de classificação Análise discriminante & Regressão logística. Abraham Laredo Sicsú Técnicas de classificação Análise discriminante & Regressão logística Abraham Laredo Sicsú Leituras (ênfase em REGRESSÃO LOGÍSTICA) http://www.uk.sagepub.com/burns/website%20mat erial/chapter%2024%20-

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística

UNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelo estatístico ligado a tipos de vinhos e classificação de qualidade CE225 - Modelos Lineares Generalizados Prof. Cesar Augusto Taconeli Andrea

Leia mais

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS:

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS: TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Técnicas de amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade

Leia mais

1 Classificadores Bayseanos Simples

1 Classificadores Bayseanos Simples Aula 12 - Classificadores Bayseanos Curso de Data Mining Sandra de Amo Classificadores Bayseanos são classificadores estatísticos que classificam um objeto numa determinada classe baseando-se na probabilidade

Leia mais

Aprendizagem Bayesiana

Aprendizagem Bayesiana Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Aprendizagem Bayesiana David Menotti www.inf.ufpr.br/menotti/ci171-182 Aprendizagem Bayesiana Agenda Introdução Teorema de Bayes

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Resumo: Veremos nesta aula tabelas, cálculos de porcentagem e gráficos; amostras e tipo de amostragem; Medidas de tendência central e medidas

Leia mais

ESQUEMA FATORIAL: DESDOBRAMENTO

ESQUEMA FATORIAL: DESDOBRAMENTO ESQUEMA FATORIAL: DESDOBRAMENTO Lucas Santana da Cunha http://wwwuelbr/pessoal/lscunha Universidade Estadual de Londrina Departamento de Estatística 22 de julho de 2017 Interação Significativa Quando a

Leia mais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Testes de Hipóteses Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Validação de métodos diagnósticos

Validação de métodos diagnósticos Validação de métodos diagnósticos Medicina é a arte da incerteza e a ciência da probabilidade William Osler George Luiz Lins Machado Coelho Validação (Tornar válido, legítimo; legitimar). A validade de

Leia mais

AULA 03 Estimativas e tamanhos amostrais

AULA 03 Estimativas e tamanhos amostrais 1 AULA 03 Estimativas e tamanhos amostrais Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade

Leia mais

1 TESTE OPÇÃO II - TEORIA DE NÚMEROS COMPUTACIONAL

1 TESTE OPÇÃO II - TEORIA DE NÚMEROS COMPUTACIONAL 1 TESTE OPÇÃO II - TEORIA DE NÚMEROS COMPUTACIONAL Licenciatura em Matemática 30 de março de 2012 duração 1h 45m Responda, justificando cuidadosamente, às seguintes questões: 1. Calcule uma estimativa

Leia mais

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Gilberto Rodrigues Liska 1 5 Fortunato Silva de Menezes 2 5 Marcelo Ângelo Cirillo 3 5 Mario Javier Ferrua

Leia mais

Combinação de Classificadores (fusão)

Combinação de Classificadores (fusão) Combinação de Classificadores (fusão) André Tavares da Silva [email protected] Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado

Leia mais

Tutorial básico de classificação em RapidMiner

Tutorial básico de classificação em RapidMiner Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.

Leia mais

Mineração de dados educacionais: avaliação e interpretação de modelos de classificação

Mineração de dados educacionais: avaliação e interpretação de modelos de classificação Capítulo 12 Mineração de dados educacionais: avaliação e interpretação de modelos de classificação Cristian Cechinel (UFSC), Sandro da Silva Camargo (UNIPAMPA) Objetivo do Capítulo Este capítulo tem como

Leia mais

Universidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia. Testes Diagnósticos ANA PAULA SAYURI SATO

Universidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia. Testes Diagnósticos ANA PAULA SAYURI SATO Universidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia Testes Diagnósticos ANA PAULA SAYURI SATO Objetivos da aula Definir validade de testes de rastreamento (screening) e diagnóstico

Leia mais

Estatística. Probabilidade. Conteúdo. Objetivos. Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal.

Estatística. Probabilidade. Conteúdo. Objetivos. Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal. Estatística Probabilidade Profa. Ivonete Melo de Carvalho Conteúdo Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal. Objetivos Utilizar a probabilidade como estimador

Leia mais

EST029 Cálculo de Probabilidade I Cap. 4: Variáveis Aleatórias Unidimensionais

EST029 Cálculo de Probabilidade I Cap. 4: Variáveis Aleatórias Unidimensionais EST029 Cálculo de Probabilidade I Cap. 4: Variáveis Aleatórias Unidimensionais Prof. Clécio da Silva Ferreira Depto Estatística - UFJF Introdução Considere o experimento: Lançamento de uma moeda. Resultados

Leia mais

8. permanência de vazão

8. permanência de vazão 8. permanência de vazão 8.1. CURVA DE PERMANÊNCIA DE VAZÃO: GENERALIDADES Uma curva de permanência de vazão, também conhecida como curva de duração, é um traçado gráfico que informa com que frequência

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar

Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar Uma Estratégia de Preparação de Dados para Aumento de Precisão de Modelos de Classificação da Produtividade de Cana-de-açucar Maria das Graças J.M. Tomazela¹, Luiz Antônio Daniel¹ ¹Faculdade de Tecnologia

Leia mais

Universidade Federal de Viçosa Departamento de Estatística

Universidade Federal de Viçosa Departamento de Estatística Universidade Federal de Viçosa Departamento de Estatística Prova Seletiva para o Programa de Pós-Graduação em Estatística Aplicada e Biometria. Nível Doutorado - 22/nov/2013 Nome: Assinatura:. Número do

Leia mais

Conceitos básicos: Variável Aleatória

Conceitos básicos: Variável Aleatória : Variável Aleatória Variável aleatória (v.a.) valor numérico que é resultado de uma eperiência aleatória. Podemos ter variáveis aleatórias contínuas ou discretas. Eemplo 1: Suponha que lança duas moedas

Leia mais

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes 1 Estatística População Características Técnicas de amostragem Amostra Análise descritiva Conclusões sobre as características da

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Teste de hipótese Queremos saber se a evidência que temos em mãos significa que encontramos

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Roteiro. Métodos diagnósticos: conceitos gerais. Download da aula e links. Introdução. Fases de um programa sanitário. Parâmetros. PCR ou ELISA?

Roteiro. Métodos diagnósticos: conceitos gerais. Download da aula e links. Introdução. Fases de um programa sanitário. Parâmetros. PCR ou ELISA? Roteiro Métodos diagnósticos: conceitos gerais. Apresentação de conceitos e suas inter relações. Reação de Elisa e PCR como exemplos. Prof. Dr. Fábio Gregori Laboratório de Biologia Molecular Aplicada

Leia mais

DIAGNÓSTICO. Processo de decisão clínica que baseia-se, conscientemente ou não, em probabilidade. Uso dos testes diagnósticos

DIAGNÓSTICO. Processo de decisão clínica que baseia-se, conscientemente ou não, em probabilidade. Uso dos testes diagnósticos Universidade Federal do Rio de Janeiro Centro de Ciências da Saúde Faculdade de Medicina / Instituto de Estudos em Saúde Coletiva - IESC Departamento Medicina Preventiva Disciplina de Epidemiologia Testes

Leia mais

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS COIMBRA 12º ANO DE ESCOLARIDADE MATEMÁTICA A FICHA DE AVALIAÇÃO 12º B1 Grupo I

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS COIMBRA 12º ANO DE ESCOLARIDADE MATEMÁTICA A FICHA DE AVALIAÇÃO 12º B1 Grupo I ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS COIMBRA 2º ANO DE ESCOLARIDADE MATEMÁTICA A FICHA DE AVALIAÇÃO 2º B Grupo I As cinco questões deste grupo são de escolha múltipla. Para cada uma delas são indicadas

Leia mais

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte Dr. Stenio Fernando Pimentel Duarte Exemplo Distribuição de 300 pessoas, classificadas segundo o sexo e o tabagismo Tabagismo Fumante (%) Não Fumante (%) Masculino 92 (46,0) 108 (54,0) Sexo Feminino 38

Leia mais

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. De forma geral, a prova manteve o padrão das questões da

Leia mais