Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial
|
|
- Cláudio Paranhos
- 5 Há anos
- Visualizações:
Transcrição
1 UNIVERSIDADE FEDERAL DO PARANÁ Rafael Morciani Alves da Silva Maike Willian Martins dos Santos Mateus Gemelli Ramos Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial CURITIBA 14 de Novembro de 2018
2 Resumo O presente relatório tem como objetivo aplicar o modelo de regressão linear generalizado (GLM) ajustado pela distribuição Binomial com função de ligação canônica (logito) para predição de doênça coronária cardíaca em pacientes num período de 10 anos, sendo nossa variável resposta se o paciente possui ou não doença coronária cardíaca. Com nosso escopo definido conseguimos partir para análise exploratória de todas as variáveis disponíveis e viáveis do nosso banco de dados. Assim vamos utilizar os métodos como inferência, testes para verificar os pressupostos exigidos pelo tipo de modelo escolhido, obtendo quais variáveis que são realmente significativas agregando valor ao modelo. Passando por vários testes e registrando evidências, todos os passos devem ter sempre uma justificativa plausível e coerente para que as tomadas de decisões sejam de fato eficaz, assim desta forma chegando no modelo mais adequado para predição da doênça. Introdução Modelos de regressão linear generalizados são uma generalização de modelos de regressão lineares, tendo a variável resposta pertencente a qualquer distribuição da família exponencial. É um conjunto de métodos estatísticos para construção de modelos que descrevem parcialmente a relação entre uma variável resposta com duas ou mais variáveis explicativas. Neste estudo será utilizado o modelo de regressão linear generalizado com resposta Binomial e função de ligação canônica (logito), que terá como objetivo a predição de doença coronária cardíaca, levando em consideração as demais variáveis da base de dados. 2
3 Materiais e Métodos Materiais A base de dados analisada foi adquirida do site ( heart-disease-prediction-using-logistic-regression/data). A análise será realizada considerando todas as variáveis da base de dados, uma primeira seleção de variáveis para o modelo será via método stepwise e após avaliaremos a significância de cada variável pré-selecionada decidindo quais variáveis permanecerão no modelo final. Foi utilizado também como suporte ao estudo os materiais apresentados em sala de aula pelo professor Cesar Taconeli que estão disponíveis em ( CE22518.html). Para aplicação dos métodos se fez necessária a utilização do software R, onde nele ainda foram utilizados quatro pacotes adicionais: Pacote car, statmod, ROCR e hnp. 3
4 Métodos Os modelos lineares generalizados são definidos por: Onde: ε: Distribuição da família exponencial. y i x i ε(µ i ; σ 2 ) g(µ i ) = η i = β 0 + β 1 x i1 + β 2 x i β p x ip µ i = g 1 (η i ) y i : Valor da variável resposta na i-ésima observação dado as covariáveis x i. β 0 : Intercépto do modelo. β i, 0 < i < p: Preditores do modelo. g(.): Função de ligação que liga o componente aleatório (y i ) ao sistemático (η i ) (função real, diferenciável e monótona). Função de ligação Logito: ln( µ 1 µ ), onde µ 1 µ é chamado de chance. Dado que o modelo é ajustado para distribuições da família exponencial, temos que: f(y i ; θ i ; φ) = Exp { y iθ i b(θ i ) a(φ) E(y i ) = b (θ) Var(y i ) = φb (θ) Var(µ) = b (θ) + c(y i ; φ)} 4
5 Importação e organização da base de dados: Após a base de dados ser importada no R, foi necessário organizá-la para melhor aplicação dos métodos, para isso a seguinte mudança foi feita na base de dados: Foram omitidas todas as linhas que possuíam observações faltando (NA s)(582 linhas omitidas). Variáveis: Componente aleatório: TenYearCHD: Se o paciente teve doença coronária cardíaca nos últimos 10 anos (Resposta Binária, 0 se não, 1 se sim). Componentes Sistemáticos: male: 1 se o paciente é do sexo masculino, 0 se feminino (Nominal); age: Idade em anos (Contínua); cigsperday: Média de cigarros fumados por dia (Contínua); prevalenthyp: 1 se o paciente é hipertenso, 0 caso não (Nominal); totchol: Nível de colesterol (Contínua); sysbp: Pressão sanguínea (Contínua); glucose: Nível de glícose (Contínua); prevalentstroke: 1 se o paciente já teve ou não um acidente vascular cerebral (Nominal). 5
6 Construção do modelo: O modelo foi construído utilizando a distribuição Binomial e função de ligação canônica (logito). O 1º modelo foi ajustado pelo método stepwise com todas as covariáveis da base, e os respectivos β s foram estimados com a função glm do R, resultando no seguinte GLM: y i x i ~ Bin(n, π i ) log( µ i 1 µ i ) = η i = (Homem) +0.06(Idade) +0.02(Cigarros por dia) +0.75(já Teve Acid. Vasc. Cerebral) +0.23(Paciente Hipertenso) (Nível Colesterol Total) (Pressão Arterial) (Glicose) AIC: Deviance Residual: com 3649 GL. Porém, pelo summary do modelo 1, foi observado que a covariável já Teve Acid. Vasc. Cerebral é não significativa, para isso um 2º modelo foi gerado retirando essa covariável. 2º modelo ajustado: y i x i ~ Bin(n, π i ) log( µ i 1 µ i ) = η i = (Homem) (Idade) (Cigarros por dia) +0.23(Paciente Hipertenso) (Nível Colesterol Total) (Pressão Arterial) (Glicose) AIC: Deviance Residual: com 3650 GL. 6
7 Definido o modelo, realizaremos seu diagnóstico: P-valor Shapiro.test = Pelo teste de Shapiro & Wilk, não rejeitamos a hipótese nula, ou seja, os resíduos possuem distribuição normal. Concluímos o mesmo quando observamos o gráfico Q-Q Plot. Normal Q Q Plot Sample Quantiles Theoretical Quantiles 7
8 Foram construídas as bandas de confiança pela função hnp Resíduos Vs Quantis Teóricos, resultado no gráfico abaixo: Residuals Theoretical quantiles Foram gerados os gráficos Densidade e Q-Q Norm via simulação Bootstrap com 999 reamostras, resultando nos gráficos abaixo: Histogram of t Density t* t* Quantiles of Standard Normal 8
9 Também via Bootstrap, foram estimados os intervalos de confiança (95%) para os β s: ## Bootstrap percent confidence intervals ## ## 2.5 % 97.5 % ## (Intercept) ## male ## age ## cigsperday ## prevalentstroke ## prevalenthyp ## totchol ## sysbp ## glucose Calculada a acurácia do modelo via função predict, produzindo a melhor acurácia no ponto de corte 0.5, gerando uma acurácia de Abaixo a matrix de falsos positivos/negativos e verdadeiros positivos/negativos. ## ## FALSE TRUE ## ## Acurária = = Sensibilidade = = Especificidade = = Eficiência = Sensibilidade+Especificidade 2 = =
10 O poder predição do modelo foi calculada via curva Roc, resultando em um poder de predição de 0.74, como mostra a figura abaixo: Area abaixo da curva = 0.74 True positive rate False positive rate 10
11 Resultados e Discussões Neste estudo foram aplicadas as ferramentas e técnicas apresentadas em sala de aula na discilina de modelos lineares generalizados em um problema real, dentro dos limites de conhecimento foi possível ajustar um GLM para previsão de doença cardíaca. Comparando os ajustes: Ajuste 1: Ajustado via stepwise y i x i ~ Bin(n, π i ) log( µ i 1 µ i ) = η i = (Homem) +0.06(Idade) +0.02(Cigarros por dia) +0.75(já Teve Acid. Vasc. Cerebral) +0.23(Paciente Hipertenso) (Nível Colesterol Total) (Pressão Arterial) (Glucose) AIC: Deviance Residual: com 3649 GL. Ajuste 2: Variável prevalentstroke removida y i x i ~ Bin(n, π i ) log( µ i 1 µ i ) = η i = (Homem) (Idade) (Cigarros por dia) +0.23(Paciente Hipertenso) (Nível Colesterol Total) (Pressão Arterial) (Glucose) AIC: Deviance Residual: com 3650 GL. Com a remoção da variável prevalentstroke ocorreu um decréscimo do AIC em 0.3 e aumento da Deviance residual de 2.3, ambos não significativos para 1 grau de liberdade, logo o modelo com menos covariáveis foi escolhido. 11
12 Interpretações: Razão de chances Masculino/Feminino (OR M F ): OR M F = Chance M Chance F = Exp{β 1 } = Exp{ } = Para cada paciente do sexo feminino com doênça coronária cardíaca espera-se em média encontar 1.7 pacientes do sexo masculino com a doênça, ou para cada 4 mulheres 7 homems apresentam a doênça, fixadas todas as demais covariáveis. Razão de chances Idoso(60 anos)/meia Idade(40 anos) (OR 60 Age 40 Age ): OR 60 Age 40 Age = Chance 60 Age Chance 40 Age = Exp{β 2 20} = Exp{ *20} = Exp{1.3121} = Para cada paciente com 40 anos com doênça coronária cardíaca, espera-se em média encontrar 3.7 pacientes com 60 anos que tenham a doênça, fixadas todas as demais covariáveis. A cada 20 anos a mais a chance de ter a doênça aumenta em aproximadamente 271.4% Razão de chances Fumante/Não fumante (OR 0 CigDay 1 CigDay ): OR 0 CigDay 1 CigDay = Chance 0 cigsp erday Chance 1 cigsp erday = Exp{β 3 } = Exp{ } = Para cada cigarro em média fumado por dia, a chance de doênça coronária cardíaca aumenta em 1.96%, fixadas todas as demais covariáveis. Razão de chances Hipertensos/Não Hipertensos (OR Hip. OR Hip. Hip. = Chance H Chance Hip. Hip.): = Exp{β 4 } = Exp{ } = Para cada paciente sem hipertensão com doênça coronária cardiaca espera-se encontrar em média 1.3 pacientes hipertensos com a doênça, fixadas todas as demais covariáveis. 12
Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná
Quantis residuais Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná Orientador: Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Resumo Uma etapa importante
Leia maisA Importância da Estatística na Pesquisa Científica e na Tomada de Decisão
A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão Ricardo Alves de Olinda Universidade Estadual da Paraíba - UEPB Centro de Ciências e Tecnologia - CCT Departamento de Estatística
Leia maisAnalise de sobreviventes em acidentes de carros
Analise de sobreviventes em acidentes de carros Modelos Lineares Generalizados Lais Hoffmam GRR20159455 Simone Matsubara GRR20124663 Willian Meira GRR20159077 Yasmin Fernandes ISO20180365 Curitiba 2018
Leia maisRegressão para Dados Binários - Estudo de Dengue
Universidade Federal do Paraná Departamento de Estatística Regressão para Dados Binários - Estudo de Dengue CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE
Leia maisÓbitos por Acidentes de Transporte em Santa Catarina no ano de 2016
Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016 Modelos Lineares Generalizados Lais Hoffmam Simone Matsubara Willian Meira Yasmin Fernandes Curitiba 2018 Sumário 1. Resumo... 3 2. Introdução...
Leia maisNúmero de Consultas ao Médico
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA João Matheus S. K. T. Hneda Lineu Alberto Cavazani de Freitas Número de Consultas ao Médico Análise
Leia maisModelo de regressão Beta
Modelo de regressão Beta Fernando Lucambio Pérez Departamento de Estatística Universidade Federal do Paraná Agosto de 2004 1 Consideremos uma situação em que a variável resposta contínua é restrita ao
Leia maisModelos Lineares Generalizados
Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20
Leia maisRegressão de Poisson e parentes próximos
Janeiro 2012 Família Exponencial Seja Y uma variável aleatória. A distribuição de probabilidade de Y pertence à família exponencial se a sua função densidade de probabilidade é da forma ( ) yθ b(θ) f (y
Leia maisTrabalho de Modelos Lineares Generalizados
Universidade Federal do Paraná Trabalho de Modelos Lineares Generalizados Ananda Bordignon 1, Brendha Lima 2, Giovanna Lazzarin 3 12 de Novembro de 2018 1 GRR20149157 2 GRR20149163 3 GRR20149088 1 SUMÁRIO
Leia maisAnálise dados de diagnóstico de câncer de mama
Análise dados de diagnóstico de câncer de mama Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido
Leia maisINCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO CE225 - Modelos Lineares Generalizados Eduardo
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelo estatístico ligado a tipos de vinhos e classificação de qualidade CE225 - Modelos Lineares Generalizados Prof. Cesar Augusto Taconeli Andrea
Leia maisModelos Lineares Generalizados - Componentes do Modelo
Modelos Lineares Generalizados - Componentes do Modelo Erica Castilho Rodrigues 01 de Abril de 2014 3 Vejamos agora quais as componentes de um Modelo Linear Generalizado. Temos um conjunto de variáveis
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DE DADOS DE ÓBITOS POR AGRESSÕES NO ESTADO DE SÃO PAULO NO ANO DE 2016 CURITIBA Novembro
Leia maisModelos Lineares Generalizados - Regressão Logística
Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede
Leia maisRegressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba CE225 - Modelos Lineares Generalizados
Leia maisCE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42
CE062c - GAMLSS Silva, J.P; Taconeli, C.A. 09 de outubro, 2018 Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, 2018 1 / 42 Por que GAMLSS? Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro,
Leia maisModelos Binomial e Poisson
Objetivos Motivação BIE5781 - Pós-Graduação em Ecologia USP Setembro de 2016 Objetivos Motivação Objetivo da Aula Os objetivos dessa aula são: Objetivos Motivação Objetivo da Aula Os objetivos dessa aula
Leia maisModelos Binomial e Poisson
Objetivos Motivação BIE5781 - Pós-Graduação em Ecologia USP setembro de 2012 Objetivo da Aula Objetivos Motivação Os objetivos dessa aula são: Objetivos Motivação Objetivo da Aula Os objetivos dessa aula
Leia maisAnálise do acidente do Titanic
Análise do acidente do Titanic Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná,
Leia maisLista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ).
Lista 1 - Gabarito Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados 29 de Abril 1. (Concurso Petrobrás - 2011) Em um modelo de regressão logística, o que indica se o modelo se
Leia maisRegressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha
Universidade Federal do Paraná Departamento de Estatística Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha CE22 - Modelos Lineares Generalizados Francielle Przibiciem
Leia mais3.33pt. AIC Introdução
1 3.33pt 1 Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 01 de Julho de 2016 2 3.33pt 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos
Leia maisAnálise de dados de Contagem
Análise de dados de Contagem Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido ao professor
Leia maisTrabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017
Trabalho de GLM 2 Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER 17 de outubro de 2017 1 - Resumo Para o trabalho, foi extraída do site kaggle.com uma base com uma amostra
Leia maisModelos Lineares Generalizados - Verificação do Ajuste do Modelo
1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR -20149072 DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DA QUANTIDADE DE MATRÍCULAS NO ENSINO REGULAR NO ESTADO DO
Leia maisModelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018
Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018 1. Introdução O objetivo deste trabalho é apresentar uma análise estatística,
Leia maisGAM. Ilka Afonso Reis
GAM Ilka Afonso Reis Modelo Estatístico O objetivo de um modelo estatístico é fornecer a base matemática para responder às seguintes questões: As variáveis preditoras/explicativas explicam adequadamente
Leia maisAnálise de Dados Categóricos
1/43 Análise de Dados Categóricos Modelo de Regressão de Poisson Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Departamento de Estatística Universidade Federal de Minas Gerais 2/43 Revisão:
Leia maisAnálise de dados de contagem para jogadores de futebol americano
Análise de dados de contagem para jogadores de futebol americano Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225),
Leia maisExemplos Equações de Estimação Generalizadas
Exemplos Equações de Estimação Generalizadas Bruno R. dos Santos e Gilberto A. Paula Departamento de Estatística Universidade de São Paulo, Brasil giapaula@ime.usp.br Modelos Lineares Generalizados dos
Leia mais4 Modelos Lineares Generalizados
4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA
06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE
Leia maisModelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados
Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:
Leia mais1 z 1 1 z 2. Z =. 1 z n
Gabarito Lista 3. Tópicos de Regressão. 2016-2. 1. Temos que y i ind N (µ, φi ), com log φ i = α + γz i, para i = 1,..., n, portanto (i) para o γ = (α, γ) a matriz modelo ca Z = 1 z 1 1 z 2.. 1 z n (ii)
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010
Leia maisEFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA
Universidade Federal do Paraná Departamento de Estatística EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA CE225 - Modelos Lineares Generalizados Jhenifer Caetano Veloso - GRR20137558 Rogério
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA BRUNO GERONYMO - GRR20159232 HERMANN MOGIZ DELGADO - GRR20159211 MARIA HELENA OLIVEIRA - GRR20159213 VINICIUS CESAR PEDROSO
Leia maisAdriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS
Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS Relatório técnico apresentado como atividade avaliativa
Leia maisMLG. 16 de outubro de Curso de Modelos Lineares Generalizado - DEST/UFMG Marcos Oliveira Prates. Marcos Oliveira Prates
MLG Curso de Modelos Lineares Generalizado - DEST/UFMG 16 de outubro de 2017 Modelo Linear Generalizado Família Exponencial Seja Y a variável de resposta. A distribuição de Y é membro da família exponencial
Leia maisINFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE
INFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE A análise de deviance é uma generalização, para modelos lineares generalizados, da análise de variância. No caso de modelos lineares, utiliza-se
Leia maisModelagem de dados complexos por meio de extensões do modelo de
Modelagem de dados complexos por meio de extensões do modelo de regressão clássico Luiz R. Nakamura Departamento de Informática e Estatística Universidade Federal de Santa Catarina luiz.nakamura@ufsc.br
Leia maisExame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil
Exame da OAB Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2017 G. A. Paula (IME-USP) Exame da OAB 2 o Semestre 2017 1 / 29 Exame da OAB Sumário 1 Exame
Leia maisModelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2. Veremos
Leia maisExemplos Regressão Dados Binários
Exemplos Regressão Dados Binários p. 1/28 Exemplos Regressão Dados Binários Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011 Exemplos
Leia maisMODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS
MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS 1 Diversas distribuições podem ser consideradas para a modelagem de dados positivos com distribuição contínua e assimétrica, como, por exemplo, as
Leia maisCONHECIMENTOS ESPECÍFICOS
CESPE/UnB FUB/03 fa 5 4 3 CONHECIMENTOS ESPECÍFICOS 60 As distribuições B e C possuem os mesmos valores para os quartis Q e Q, e o quartil superior em B corresponde ao quartil central (Q ) da distribuição
Leia maisModelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto Introdução 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2.
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter
UNIVERSIDADE FEDERAL DO PARANÁ Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter ESTUDO DO NÚMERO DE PONTOS EFETUADOS EM UMA TEMPORADA DE BASQUETEBOL CURITIBA 27 de novembro
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário (bootstrap) Este método foi proposto por Efron
Leia maisAplicação dos modelos lineares generalizados na análise do
Aplicação dos modelos lineares generalizados na análise do número de ácaros Ana Paula Coelho Madeira Silva 12 Fabrício Oliveira Fernandes 12 Marcos Antonio Matiello Fadini 12 1 Introdução O estudo das
Leia maisMétodos Quantitativos para Avaliação de Políticas Públicas
ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26
Leia maisModelo de regressão estável aplicado a econometria
Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos
Leia maisAnálise de Sobrevivência
Análise de Sobrevivência Modelagem paramétrica Valeska Andreozzi 1 valeska.andreozzi@fc.ul.pt & Marilia Sá Carvalho 2 cavalho@fiocruz.br 1 Centro de Estatística e Aplicações da Universidade de Lisboa,
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR 20149072 RODOLFO PIROLO GATZKE - GRR 20149150 THAYS COSTA S. SOUZA - GRR 20159231 MODELAGEM PARA O SUCESSO DE CAMPANHA DE MARKETING CURITIBA
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisAnálise de Dados Longitudinais Modelos Lineares Generalizados Longitudinais
1/55 Análise de Dados Longitudinais Modelos Lineares Generalizados Longitudinais Enrico A. Colosimo-UFMG www.est.ufmg.br/ enricoc 2/55 Respostas Longitudinal Não-Gaussiana 1 Y ij, i = 1,..., N; j = 1,...,
Leia maisDisciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Leia maisdiferença não aleatória na distribuição dos fatores de risco entre os dois grupos
Confundimento erro devido a uma diferença não aleatória na distribuição dos fatores de risco entre os dois grupos. A variável de confundimento está distribuída desigualmente entre os grupos comparados.
Leia maisExemplo Preferência de Automóveis
Exemplo Preferência de Automóveis Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 1 /
Leia maisModelos Lineares Generalizados - Verificação do Ajuste do Modelo
Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 21 de Junho de 2013 3 Uma outra medida usada para verificar o ajuste do modelo. Essa estatística é dada por X
Leia maisIntrodução à Regressão Logística Quantílica
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA Introdução à Regressão Logística Quantílica Autor: Tiago Buchweitz Correa Orientador: Professor
Leia maisTécnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.
Leia maisModelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Leia maisModelo Linear Generalizado Exponencial Potência
Modelo Linear Generalizado Exponencial Potência Cristian Villegas 1 2 1 Introdução Os modelos lineares normais são amplamente aplicados em diversas áreas do conhecimento para modelar a média de dados contínuos
Leia maisMODELANDO A TAXA DE NEOPLASIA PULMONAR NO BRASIL VIA MODELOS LINEARES GENERALIZADOS
Revista da Estatística UFOP, Vol III, 2014 - ISSN 2237-8111 MODELANDO A TAXA DE NEOPLASIA PULMONAR NO BRASIL VIA MODELOS LINEARES GENERALIZADOS Thiago Rezende dos Santos 1,2, Roger William Câmara Silva
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152) Cinthia Zamin Cavassola (GRR20149075) Luiza Hoffelder da Costa (GRR20149107) INFLUÊNCIA DE CARACTERÍSTICAS RELACIONADAS À ESCOLA, DEMOGRÁFICAS
Leia maisEsse material foi extraído de Barbetta (2007 cap 13)
Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos
Leia maisESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES CE225 - Modelos Lineares Generalizados
Leia maisCE071 - Análise de Regressão Linear
CE071 - Análise de Regressão Linear Cesar Augusto Taconeli 30 de maio, 2018 Cesar Augusto Taconeli CE071 - Análise de Regressão Linear 30 de maio, 2018 1 / 21 Aula 7 - Regressão linear com covariáveis
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA
06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE
Leia maisAnálise de Regressão EST036
Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem
Leia maisMEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS
Universidade Federal do Paraná Departamento de Estatística MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme
Leia maisCapacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.
UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/
Leia maisMétodos Estatísticos Avançados em Epidemiologia
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Métodos Estatísticos Avançados em Epidemiologia Aula 2-2 Regressão de Poisson: Modelando Contagens Distribuição
Leia maisExperimentos Balanceados com Dois Fatores
Experimentos Balanceados com Dois Fatores Experimentos com dois fatores cruzados fixos Exemplo1. Objetivo. Investigar os efeitos do preço de venda e do tipo de campanha promocional nas vendas de certo
Leia maisModelos lineares generalizados: aplicação a dados de acidentes rodoviários
UNIVERSIDADE DE LISBOA FACULDADE DE CIÊNCIAS DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO OPERACIONAL Modelos lineares generalizados: aplicação a dados de acidentes rodoviários Dissertação Mestrado em Gestão
Leia maisAULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012
1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à
Leia maisModelos de Regressão Linear Simples - parte I
Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir
Leia maisREGRESSÃO LINEAR Parte I. Flávia F. Feitosa
REGRESSÃO LINEAR Parte I Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 Onde Estamos Para onde vamos Inferência Esta5s6ca se resumindo a uma equação
Leia maisEstimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson
Estimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson Wagner Hugo Bonat - LEG/DEST, UFPR 1 Resumo: Este texto descreve de forma rápida o processo de estimação baseado em Verossimilhança
Leia maisTESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA EM MODELOS LINEARES GENERALIZADOS
TESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA EM MODELOS LINEARES GENERALIZADOS Antes de apresentar alguns dos testes de hipóteses e intervalos de confiança mais usuais em MLG, segue a definição de modelos
Leia maisBioestatística e Computação I
Bioestatística e Computação I Inferência por Teste de Hipótese Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M.
Leia maisUNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo
Leia mais3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25
3. Estimação pontual USP-ICMC-SME 2013 USP-ICMC-SME () 3. Estimação pontual 2013 1 / 25 Roteiro Formulação do problema. O problema envolve um fenômeno aleatório. Interesse em alguma característica da população.
Leia maisClassificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística
Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Gilberto Rodrigues Liska 1 5 Fortunato Silva de Menezes 2 5 Marcelo Ângelo Cirillo 3 5 Mario Javier Ferrua
Leia maisExemplo Vida Útil de Ferramentas
Exemplo Vida Útil de Ferramentas Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Vida útil de Ferramentas 2 o Semestre 2016 1 /
Leia maisModelos Lineares Generalizados - Análise de Resíduos
Modelos Lineares Generalizados - Análise de Resíduos Erica Castilho Rodrigues 28 de Junho de 2013 3 Assim como em Regressão Linear, também precisamos fazer Análise de Resíduos para os MLG s. São semelhantes
Leia maisAplicação do modelo de Quase-Verossimilhança
Aplicação do modelo de Quase-Verossimilhança Fábio Hideto Oki 1 1 Introdução O câncer é uma doença de proporção mundial, atingindo só no Brasil cerca de 350 mil pessoas por ano e é caracterizado pela mutação
Leia maisRegressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei
Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico
Leia maisCapítulo 9 - Regressão Linear Simples (RLS): Notas breves
Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou
Leia maisRegressão linear simples
Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação
Leia maisRafael Izbicki 1 / 38
Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)
Leia maisExemplos Modelos de Quase-Verossimilhança
Exemplos Modelos de Quase-Verossimilhança p. 1/40 Exemplos Modelos de Quase-Verossimilhança Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de
Leia maisAnálise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013
Análise da Regressão múltipla: Inferência Revisão da graduação Aula 4 6 de maio de 2013 Hipóteses do modelo linear clássico (MLC) Sabemos que, dadas as hipóteses de Gauss- Markov, MQO é BLUE. Para realizarmos
Leia maisEXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística EXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO CE225 - Modelos Lineares Generalizados
Leia mais