Ajuste e validação de modelos preditivos

Tamanho: px
Começar a partir da página:

Download "Ajuste e validação de modelos preditivos"

Transcrição

1 Ajuste e validação de modelos preditivos 1

2 O modelo de regressão logística é frequentemente utilizado com o objetivo de predizer (classificar) indivíduos com base nos valores de suas covariáveis. Modelos preditivos são utilizados em diversos contextos: o Predição do comportamento de clientes que solicitam empréstimo ( pagadores ou não pagadores ); o Predição do desfecho clínico de pacientes com certa doença ( curados ou não curados ); o Predição da condição real de acusados, na área criminal ( culpados ou inocentes ); o Predição dos resultados de jogos de basquete ( vitória ou derrota de um particular time). 2

3 Nota - Embora nos concentremos no uso do modelo de regressão logística para predição e classificação, fique claro que os métodos apresentados servem para qualquer tipo de modelagem preditiva, como árvores de classificação, análise discriminante, redes neurais, ponderação de modelos... Uma vez ajustado um modelo de regressão logística, teremos, para qualquer indivíduo, uma probabilidade estimada para a resposta de interesse. Exemplo ilustrativo: Considere, num problema de predição, dez indivíduos para os quais se dispõe da probabilidade estimada do desfecho de interesse ( ˆ P( Y = 1) ou 1). i = i π ) e dos reais desfechos (0 3

4 Indivíduo (i) πˆ i 0,89 0,25 0,54 0,29 0,44 0,74 0,95 0,05 0,12 0,66 y i Uma possível regra de classificação seria classificar todos os indivíduos para os quais fracasso e os demais, para os quais seria o ponto de corte de nossa regra. πˆ p como πˆ p, como sucesso, para algum valor 0 < p < 1. Então, p i i < 4

5 Cenário 1 Ponto de corte: p = 0, 5. Indivíduo (i) πˆ i 0,89 0,25 0,54 0,29 0,44 0,74 0,95 0,05 0,12 0,66 y i ŷ i Cenário 2 Ponto de corte: p = 0, 6. Indivíduo (i) πˆ i 0,89 0,25 0,54 0,29 0,44 0,74 0,95 0,05 0,12 0,66 y i ŷ i

6 Cenário 2 Ponto de corte: p = 0, 4. Indivíduo (i) πˆ i 0,89 0,25 0,54 0,29 0,44 0,74 0,95 0,05 0,12 0,66 y i ŷ i Questão: cada valor de p produz uma diferente regra de classificação. Qual regra de classificação considerar? 6

7 A escolha de uma regra de classificação adequada deve ser baseada em indicadores de qualidade preditiva avaliados para cada possível regra. Dois indicadores amplamente utilizados na avaliação de modelos preditivos são a sensibilidade e a especificidade: o Sensibilidade: probabilidade de o indivíduo ser classificado como sucesso, dado que ele realmente é um sucesso ; o Especificidade: probabilidade de o indivíduo ser classificado como fracasso, dado que ele realmente é um fracasso. Na prática, a sensibilidade e a especificidade de um modelo preditivo são desconhecidas. 7

8 O mais recomendável é usarmos os resultados de uma amostra de validação (dados não utilizados no ajuste do modelo) para estimá-las. Medidas de qualidade preditiva calculadas com base nos dados do ajuste tendem a ser excessivamente otimistas. Suponha que n indivíduos, para os quais se conhece a resposta e que não tenham sido utilizados no ajuste do modelo. Considere que estes indivíduos tenham suas probabilidades de sucesso ( π i ) estimadas pelo modelo e que eles sejam classificados em fracasso ou sucesso segundo uma regra do tipo πˆ p ou πˆ p, para algum valor de p entre 0 e 1. i < i 8

9 Podemos apresentar os resultados reais e as predições numa tabela de dupla entrada: Predição Sucesso Fracasso Total Sucesso Realidade Fracasso Total n SS n SF n S n FS n FF n F n S n F n Assim, teríamos as seguintes estimativas para a sensibilidade e a especificidade do modelo: o o Sens = n n Espec = SS S n n ; FF F. 9

10 Voltando ao exemplo ilustrativo: o Para o ponto de corte p = 0, 5: Predição Realidade Sucesso Fracasso Total Sucesso Fracasso Total nss 4 Sens = = = 0,67. n 6 S nff 3 Espec = = = 0,75. n 4 F 10

11 o Para o ponto de corte p = 0, 6: Predição Realidade Sucesso Fracasso Total Sucesso Fracasso Total nss 4 Sens = = = 0,67. n 6 S nff 4 Espec = = = 1. n 4 F 11

12 o Para o ponto de corte p = 0, 4: Predição Realidade Sucesso Fracasso Total Sucesso Fracasso Total nss 5 Sens = = = 0,83. n 6 S nff 3 Espec = = = 0,75. n 4 F É importante notar que a medida que aumentamos o ponto de corte, a regra de classificação tem sua sensibilidade diminuída e sua especificidade aumentada. 12

13 Como para cada valor de p tem-se uma regra de classificação distinta, é usual estimar a sensibilidade e a especificidade para diferentes valores de p. Uma forma de se fazer isso é através da construção da curva ROC. Na curva ROC representamos, no eixo horizontal, 1-Especificidade, e no eixo vertical a Sensibilidade, calculados com base em diferentes valores para o ponto de corte. Os pontos de corte são representados no interior do gráfico. Uma boa regra de decisão, em casos gerais, concilia elevadas sensibilidade e especificidade. Assim, pontos de corte localizados no canto superior esquerdo da curva ROC são preferíveis. 13

14 Sensibilidade Especificidade Figura Ilustração de uma curva ROC. 14

15 Nota 1 A área sob a curva ROC é uma medida de qualidade preditiva do modelo. Diferentes modelos preditivos podem ser comparados com base em suas sensibilidades, especificidades, áreas sob a curva ROC... Nota Em alguns problemas têm-se custos de má-classificação diferentes decorrentes da classificação de um sucesso como fracasso e vice-versa. Nestes casos, tais custos podem ser incorporados na busca por uma regra de classificação / modelo preditivo adequados. 15

Rafael Izbicki 1 / 38

Rafael Izbicki 1 / 38 Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)

Leia mais

Avaliação de testes diagnósticos

Avaliação de testes diagnósticos Avaliação de testes diagnósticos De volta ao exemplo do benzenismo Mapeamento da população sob risco (7.356 trabalhadores) 1 a triagem hematológica 2 a triagem hematológica 216 indivíduos considerados

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR 20149072 RODOLFO PIROLO GATZKE - GRR 20149150 THAYS COSTA S. SOUZA - GRR 20159231 MODELAGEM PARA O SUCESSO DE CAMPANHA DE MARKETING CURITIBA

Leia mais

Aula 8: Árvores. Rafael Izbicki 1 / 33

Aula 8: Árvores. Rafael Izbicki 1 / 33 Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum

Leia mais

Epidemiologia Analítica TESTES DIAGNÓSTICOS

Epidemiologia Analítica TESTES DIAGNÓSTICOS Epidemiologia Analítica TESTES DIAGNÓSTICOS Introdução Busca do diagnóstico Conscientemente ou não usa-se um raciocínio probabilístico Uso de testes diagnósticos para reduzir ao máximo o grau de incerteza

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. André Luiz Grion GRR Bruno Henrique Abreu GRR Maria Tereza Neves de Oliveira GRR

UNIVERSIDADE FEDERAL DO PARANÁ. André Luiz Grion GRR Bruno Henrique Abreu GRR Maria Tereza Neves de Oliveira GRR UNIVERSIDADE FEDERAL DO PARANÁ André Luiz Grion GRR20159284 Bruno Henrique Abreu GRR20159983 Maria Tereza Neves de Oliveira GRR20159323 Predição de vitória de times mandantes no campeonato brasileiro 2017

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE SAÚDE PÚBLICA AULA TESTES DIAGNÓSTICOS Eleonora D Orsi Lúcio

UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE SAÚDE PÚBLICA AULA TESTES DIAGNÓSTICOS Eleonora D Orsi Lúcio UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE SAÚDE PÚBLICA AULA TESTES DIAGNÓSTICOS Eleonora D Orsi Lúcio Botelho Sérgio Freitas DIAGNÓSTICO Processo de decisão clínica

Leia mais

Análise dados de diagnóstico de câncer de mama

Análise dados de diagnóstico de câncer de mama Análise dados de diagnóstico de câncer de mama Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR ) UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE

Leia mais

Princípios de Bioestatística

Princípios de Bioestatística Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Princípios de Bioestatística Aula 6: Avaliação da Qualidade de Testes de Diagnóstico PARTE 1: Avaliando um

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Avaliação do Risco de Crédito: Modelos de Regressão Logística com amostras de diferentes proporções

Avaliação do Risco de Crédito: Modelos de Regressão Logística com amostras de diferentes proporções Avaliação do Risco de Crédito: Modelos de Regressão Logística com amostras de diferentes proporções Mariana Nolde Pacheco 1 Lisiane Priscila Roldão Selau 2 Resumo: O objetivo do estudo é propor um modelo

Leia mais

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina UFMG EST171-2ª Lista de exercícios Eduardo Elias Ribeiro Junior 04 de outubro de 2016 Exercício 1 Baixe o conjunto de dados titanic.txt. Cada observação deste banco é relativa a

Leia mais

3.33pt. AIC Introdução

3.33pt. AIC Introdução 1 3.33pt 1 Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 01 de Julho de 2016 2 3.33pt 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo 1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística

Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística José Edson Rodrigues Guedes Gondim 1 Joab de Oliveira Lima 2 1 Introdução

Leia mais

Modelos Lineares Generalizados - Regressão Logística

Modelos Lineares Generalizados - Regressão Logística Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede

Leia mais

Análise do acidente do Titanic

Análise do acidente do Titanic Análise do acidente do Titanic Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná,

Leia mais

DIAGNÓSTICO. Processo de decisão clínica que baseia-se, conscientemente ou não, em probabilidade. Uso dos testes diagnósticos

DIAGNÓSTICO. Processo de decisão clínica que baseia-se, conscientemente ou não, em probabilidade. Uso dos testes diagnósticos Universidade Federal do Rio de Janeiro Centro de Ciências da Saúde Faculdade de Medicina / Instituto de Estudos em Saúde Coletiva - IESC Departamento Medicina Preventiva Disciplina de Epidemiologia Testes

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Seção 18 Performance e validação Marcel de Souza Borges Quintana marcel.quintana@ini.fiocruz.br 2018 Estrutura 1. Avaliação do desempenho do modelo (Cap 15) Medidas

Leia mais

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Gilberto Rodrigues Liska 1 5 Fortunato Silva de Menezes 2 5 Marcelo Ângelo Cirillo 3 5 Mario Javier Ferrua

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Ferramentas para o controle de qualidade

Ferramentas para o controle de qualidade Ferramentas para o controle de qualidade Tiago M. Magalhães Departamento de Estatística - ICE-UFJF Juiz de Fora, 21 de março de 2019 Tiago M. Magalhães (ICE-UFJF) Ferramentas para o controle de qualidade

Leia mais

Análise de Regressão EST036

Análise de Regressão EST036 Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem

Leia mais

Universidade Federal de Ouro Preto. Probabilidade e avaliação de testes diagnósticos

Universidade Federal de Ouro Preto. Probabilidade e avaliação de testes diagnósticos Universidade Federal de Ouro Preto Professor: Ricardo Tavares 1. Introdução Probabilidade e avaliação de testes diagnósticos Uma das experiências mais rotineiras da prática médica é a solicitação de um

Leia mais

UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA. Eduardo Yoshio Nakano 1

UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA. Eduardo Yoshio Nakano 1 1 UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA Eduardo Yoshio Nakano 1 1 Professor do Departamento de Estatística da Universidade de Brasília, UnB. RESUMO. Em estudos médicos, o comportamento

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

CÁLCULO I. Lista Semanal 01 - Gabarito

CÁLCULO I. Lista Semanal 01 - Gabarito CÁLCULO I Prof. Márcio Nascimento Prof. Marcos Diniz Questão 1. Nos itens abaixo, diga se o problema pode ser resolvido com seus conhecimentos de ensino médio (vamos chamar de pré-cálculo) ou se são necessários

Leia mais

Modelos de Regressão Linear Simples parte I

Modelos de Regressão Linear Simples parte I Modelos de Regressão Linear Simples parte I Erica Castilho Rodrigues 27 de Setembro de 2017 1 2 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir modelos

Leia mais

Modelos de Regressão Linear Simples - parte I

Modelos de Regressão Linear Simples - parte I Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir

Leia mais

Introdução à Bioestatística Turma Nutrição

Introdução à Bioestatística Turma Nutrição Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Introdução à Bioestatística Turma Nutrição Aula 8: Intervalos de Confiança para Média e Proporção Distribuição

Leia mais

3 PREVISÃO DE RESERVAS

3 PREVISÃO DE RESERVAS 3 PREVISÃO DE RESERVAS Diferente dos métodos de estimativa que buscam apenas determinar a quantidade original de hidrocarbonetos de um reservatório e verificar seu comportamento durante todo o processo

Leia mais

Discriminação e Classificação

Discriminação e Classificação Semana da Estatística 2016 - Roteiro 1. Introdução 2. Classificação e Discriminação 3. Análise Discriminante 4. Regressão Logística Multinomial 5. Outras Abordagens 6. Referências Lupércio França Bessegato

Leia mais

Erro e Tamanho Amostral

Erro e Tamanho Amostral Erro e Lucas Santana da Cunha http://www.uel.br/pessoal/lscunha/ 30 de agosto de 2018 Londrina 1 / 17 Estimação é o nome técnico para o processo que consiste em se utilizar os dados de uma amostra para

Leia mais

est171 - Aprendizado de Máquina Departamento de Estatística Universidade Federal de Minas Gerais Lista 2 Outubro de 2016 Sumário Exercício I 2

est171 - Aprendizado de Máquina Departamento de Estatística Universidade Federal de Minas Gerais Lista 2 Outubro de 2016 Sumário Exercício I 2 est171 - Aprendizado de Máquina Departamento de Estatística Universidade Federal de Minas Gerais Lista 2 Henrique Aparecido Laureano Matheus Henrique Sales Outubro de 2016 Sumário Exercício I 2 1 Exercício

Leia mais

Testes de triagem e provas diagnósticas

Testes de triagem e provas diagnósticas Testes de triagem e provas Qual é o valor do teste em distinguir pessoas doentes daquelas não doentes? Triagem Diagnóstico Prof. Dra Marisa M. MussiPinhata Princípios da triagem populacional Doença elevada

Leia mais

5 Modelagem e análise dos resultados

5 Modelagem e análise dos resultados 5 Modelagem e análise dos resultados Neste capítulo serão detalhados os resultados da modelagem realizada por meio de árvores de decisão, a escolha final do modelo das variáveis que melhor definem o perfil

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Exemplos: Correlação linear Estudar a relação entre duas variáveis quantitativas Ou seja, a força da relação entre elas, ou grau de associação linear. Idade e altura das crianças

Leia mais

Unidade: Risco e Retorno. Unidade I:

Unidade: Risco e Retorno. Unidade I: Unidade I: 0 Unidade: Risco e Retorno A análise de investimentos está baseada nas estimativas dos fluxos de caixa de um projeto. Nem sempre essas previsões de fluxo de caixa coincidem com os resultados

Leia mais

Estratégias para Classificação Binária Um estudo de caso com classificação de s

Estratégias para Classificação Binária Um estudo de caso com classificação de  s CE064 - INTRODUÇÃO AO MACHINE LEARNING Estratégias para Classificação Binária Um estudo de caso com classificação de e-mails Eduardo Elias Ribeiro Junior * 04 de julho de 2016 Resumo Em Machine Learning

Leia mais

Lucas Santana da Cunha 27 de setembro de 2017

Lucas Santana da Cunha  27 de setembro de 2017 ESTIMAÇÃO PONTUAL Lucas Santana da Cunha http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 27 de setembro de 2017 Estimativas pontuais Estimação é o nome técnico para o processo que

Leia mais

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos

Leia mais

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013 1 AULA 07 Regressão Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas

Leia mais

Princípios de Bioestatística Inferência e Intervalo de Confiança

Princípios de Bioestatística Inferência e Intervalo de Confiança 1/24 Princípios de Bioestatística Inferência e Intervalo de Confiança Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Depto. Estatística - ICEx - UFMG Tabela Normal Padrão 2/24 3/24 Inferência

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. André Luiz Grion GRR Bruno Henrique Abreu GRR Maria Tereza Neves de Oliveira GRR

UNIVERSIDADE FEDERAL DO PARANÁ. André Luiz Grion GRR Bruno Henrique Abreu GRR Maria Tereza Neves de Oliveira GRR UNIVERSIDADE FEDERAL DO PARANÁ André Luiz Grion GRR20159284 Bruno Henrique Abreu GRR20159983 Maria Tereza Neves de Oliveira GRR20159323 Predição dos resultados dos jogos do campeonato brasileiro via modelagem

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Exercício 4 Desempenho Diagnóstico

Exercício 4 Desempenho Diagnóstico XIII Curso de Revisão de Tópicos de Epidemiologia, Bioestatística e Bioética Exercício 4 Desempenho Diagnóstico Regente Dr. Mário B. Wagner, MD PhD DLSHTM Prof. FAMED/UFRGS e PUCRS 2013 Porto Alegre, RS

Leia mais

Análise de regressão linear simples. Diagrama de dispersão

Análise de regressão linear simples. Diagrama de dispersão Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente

Leia mais

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017 Trabalho de GLM 2 Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER 17 de outubro de 2017 1 - Resumo Para o trabalho, foi extraída do site kaggle.com uma base com uma amostra

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..

Leia mais

Parte 3 Probabilidade

Parte 3 Probabilidade Parte 3 Probabilidade A probabilidade tem origem no século XVII, motivada, inicialmente, pelos jogos de azar. De maneira bastante informal, refere-se à probabilidade como uma medida de chance de algum

Leia mais

Inferência Estatística:

Inferência Estatística: Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Inferência Estatística: Princípios de Bioestatística decidindo na presença de incerteza Aula 8: Intervalos

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

TAMANHO AMOSTRAL. Lucas Santana da Cunha 31 de julho de Universidade Estadual de Londrina. Tamanho da Amostra

TAMANHO AMOSTRAL. Lucas Santana da Cunha  31 de julho de Universidade Estadual de Londrina. Tamanho da Amostra TAMANHO AMOSTRAL Lucas Santana da Cunha http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 31 de julho de 2017 Tamanho da Amostra É muito comum ao pesquisador indagar sobre o número de

Leia mais

9. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

9. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada 9. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada Quiquadrado de Pearson: mede a associação de tabelas de dupla entrada, sendo definida por: c (e e ij n ij ij ), em que é

Leia mais

Exemplos de Telas de Supervisórios

Exemplos de Telas de Supervisórios Exemplos de Sistemas Especiais Exemplos de Sistemas Especiais Exemplos de Sistemas Especiais Exemplos de Sistemas Especiais Exemplos de Sistemas Especiais Exemplos de Sistemas Especiais Exemplos de Sistemas

Leia mais

Universidade Federal do Ceará Pós-Graduação em Modelagem e Métodos Quantitativos Mestrado Acadêmico na Área Interdisciplinar

Universidade Federal do Ceará Pós-Graduação em Modelagem e Métodos Quantitativos Mestrado Acadêmico na Área Interdisciplinar Universidade Federal do Ceará Pós-Graduação em Modelagem e Métodos Quantitativos Mestrado Acadêmico na Área Interdisciplinar Prova Escrita - Estatística e Matemática Pós-Graduação em Modelagem e Métodos

Leia mais

Aplicação da análise de regressão na contabilidade do custo de produção do milho

Aplicação da análise de regressão na contabilidade do custo de produção do milho Aplicação da análise de regressão na contabilidade do custo de produção do milho Janser Moura Pereira 1 Quintiliano Siqueira Schroden Nomelini 1 Andréa Clélia da Rocha Moura 2 Nathane Eva dos Santos Peixoto

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Modelos preditivos A tarefa de classificação Modelos Preditivos A tarefa de geração de um modelo preditivo consiste em aprender um mapeamento de entrada para a saída. Neste caso,

Leia mais

Mapeamento robótico. Mapeamento semântico. Metodologia. Maquinas de vetores de suporte. Maquinas de vetores de suporte. Modelos ocultos de Markov

Mapeamento robótico. Mapeamento semântico. Metodologia. Maquinas de vetores de suporte. Maquinas de vetores de suporte. Modelos ocultos de Markov Mapeamento robótico Exemplos de mapas: Mapeamento semântico Mapeamento semântico consiste na criação de mapas que não representam apenas a ocupação métrica do ambiente, mas também outras propriedades.

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Posição financeira Uma

Leia mais

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33 Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto

Leia mais

Aspectos quantitativos e qualitativos para a modelagem de Riscos Operacionais

Aspectos quantitativos e qualitativos para a modelagem de Riscos Operacionais Aspectos quantitativos e qualitativos para a modelagem de Riscos Operacionais Risco Operacional Risco de perda resultante processos internos falhos ou inadequados, pessoas e sistemas ou ainda por eventos

Leia mais

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008 21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR -20149072 DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DA QUANTIDADE DE MATRÍCULAS NO ENSINO REGULAR NO ESTADO DO

Leia mais

Alternativas à Regressão Logística para análise de dados

Alternativas à Regressão Logística para análise de dados XVIII Congresso Mundial de Epidemiologia VII Congresso Brasileiro de Epidemiologia EIDEMIOLOGIA NA CONSTRUÇÃO DA SAÚDE ARA TODOS: MÉTODOS ARA UM MUNDO EM TRANSFORMAÇÃO Alternativas à Regressão Logística

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções

Leia mais

Combinação de Classificadores (fusão)

Combinação de Classificadores (fusão) Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado

Leia mais

Estatística Aplicada

Estatística Aplicada Estatística Aplicada Intervalos de Confiança Professor Lucas Schmidt www.acasadoconcurseiro.com.br Estatística Aplicada INTERVALOS DE CONFIANÇA Processos de estimação Estimação por ponto: o processo em

Leia mais

Curso de Data Mining

Curso de Data Mining Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Modelagem de Risco de Crédito

Modelagem de Risco de Crédito Modelagem de Risco de Crédito Douglas Beserra Pinheiro 23/02/2017 Agenda Papel da Área de Risco de Crédito Exemplo de desenvolvimento de um modelo de previsão de inadimplência Perfil dos profissionais

Leia mais

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Glossário Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Análise de co-variância: Procedimento estatístico utilizado para análise de dados que

Leia mais

MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS

MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS Camilo Daleles Rennó Referata Biodiversidade 8 novembro 2007 Modelagem lençol freático rocha de origem Modelagem O que faz uma planta

Leia mais

ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS

ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS 1. A tabela a seguir apresenta o tempo, em dias, até a ocorrência dos primeiros sinais de alterações indesejadas no estado geral de saúde de 45 pacientes

Leia mais

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre. UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/

Leia mais

REGRESSÃO LINEAR SIMPLES E MÚLTIPLA

REGRESSÃO LINEAR SIMPLES E MÚLTIPLA REGRESSÃO LINEAR SIMPLES E MÚLTIPLA Curso: Agronomia Matéria: Metodologia e Estatística Experimental Docente: José Cláudio Faria Discente: Michelle Alcântara e João Nascimento UNIVERSIDADE ESTADUAL DE

Leia mais

Prof. Dr. Lucas Barboza Sarno da Silva

Prof. Dr. Lucas Barboza Sarno da Silva Prof. Dr. Lucas Barboza Sarno da Silva Medidas de grandezas físicas Valor numérico e sua incerteza, unidades apropriadas Exemplos: - Velocidade (10,02 0,04) m/s - Tempo (2,003 0,001) µs - Temperatura (273,3

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Permite avaliar se existe relação entre o comportamento de duas ou mais variáveis e em que medida se dá tal interação. Gráfico de Dispersão A relação entre duas variáveis pode ser

Leia mais

Transformações e Ponderação para corrigir violações do modelo

Transformações e Ponderação para corrigir violações do modelo Transformações e Ponderação para corrigir violações do modelo Diagnóstico na análise de regressão Relembrando suposições Os erros do modelo tem média zero e variância constante. Os erros do modelo tem

Leia mais

3 Sistemas de Recomendação baseados em Filtragem Colaborativa

3 Sistemas de Recomendação baseados em Filtragem Colaborativa Sistemas de Recomendação baseados em Filtragem Colaborativa 28 3 Sistemas de Recomendação baseados em Filtragem Colaborativa Os sistemas de recomendação tornaram-se uma importante área de pesquisa desde

Leia mais

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Introdução a Química Analítica Instrumental Parte 2

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Introdução a Química Analítica Instrumental Parte 2 Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas Depto. de Química QUI 154/150 Química Analítica V Análise Instrumental Aula 1 Introdução a Química Analítica Instrumental Parte

Leia mais

Classificação. Eduardo Raul Hruschka

Classificação. Eduardo Raul Hruschka Classificação Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada Combinação de Modelos

Leia mais

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média µ = 505g e desvio padrão σ = 9g. a) Selecionado ao acaso um pacote embalado

Leia mais

CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA

CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA OBJETIVO O curso tem como objetivo apresentar algumas técnicas de estatística aplicada utilizar a na análise de dados. PERFIL DO ALUNO Destina-se a executivos das

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Métodos Estatísticos Avançados em Epidemiologia Modelo de Poisson e Análise de Dados Longitudinais Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/

Leia mais

Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008

Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008 Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008 Daniela Bandeira, Paulo Germano, Filipe Formiga e Jeremias Leão Universidade Federal do Piauí

Leia mais

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR 10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir

Leia mais

Mensurando o Risco de Micro e Pequenas Empresas. Fabio Wendling M. de Andrade

Mensurando o Risco de Micro e Pequenas Empresas. Fabio Wendling M. de Andrade Mensurando o Risco de Micro e Pequenas Empresas Fabio Wendling M. de Andrade Agenda O perfil das MPEs O que é importante no crédito para MPEs Metodologia de quantificação de risco de MPEs Gerenciamento

Leia mais