Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba

Tamanho: px
Começar a partir da página:

Download "Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba"

Transcrição

1 UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba CE225 - Modelos Lineares Generalizados Aline Benatti, GRR: Andryas Waurzenczak, GRR: Larissa Ferreira, GRR:

2 Resumo A fim de investigar o uso de tabaco e fatores associados entre graduandos da Universidade Federal do Paraná - Curitiba, realizou-se um estudo transversal com questionários autoaplicáveis. A análise estatística foi realizada no Software R. Responderam aos questionários 168 alunos. A prevalência de tabagismo entre os acadêmicos foi de 23,2%. A idade média foi de 22,6 anos, sendo 54,2% do sexo masculino. As variáveis significativas para o modelo foram o consumo de cerveja, a existência de outros familiares fumantes e o gênero do universitário. O tabagismo foi significativamente associado à alunos que consomem cerveja e que tem algum tabagista na família. 1

3 Sumário 1 Introdução 3 2 Materiais & Métodos Material Conjunto de dados Métodos Modelagem Análise descritiva e exploratória Modelo Linear Generalizado com Distruição Binomial Seleção de variáveis Modelo proposto Análise de diagnóstico Medidas influentes Qualidade do ajuste Resultados e discussão 14 5 Considerações finais 15 6 Referências 15 2

4 1 Introdução O tabagismo é considerado hoje a principal causa de morte evitável em países desenvolvidos, representando o maior fator de risco para o desenvolvimento de tumores malignos (um terço de todos os casos), doenças pulmonares, doenças cardiovasculares, doenças cerebrais entre outras. Calcula-se que 100 milhões de mortes foram causadas pelo tabaco no século XX segundo dados da Organização Mundial de Saúde. Estima-se que um em cada quatro homens e uma em cada 20 mulheres fumem hoje em dia, estima-se também que os fumantes atuais consumam cerca de seis trilhões de cigarros todos os anos. São cerca de 1,3 bilhão de fumantes atualmente no mundo. Este artigo tem como foco de estudo o uso de tabaco entre alunos da Universidade Federal do Paraná, Curitiba. Avaliando o consumo de cigarro entre os universitários e os fatores associados e analisando os dados através do modelo linear generalizado com distribuição Binomial. O objetivo deste trabalho é avaliar quais covariáveis estão ligadas com uma maior ou menor probabilidade de fumar. 2 Materiais & Métodos 2.1 Material Os dados foram coletados através de um questionário autoplicável, anônimo e desenvolvido pelos autores, composto de perguntas estruturadas sobre as variáveis envolvidas no estudo. Esse conjunto de dados possui ao todo 8 variáveis explicativas, sendo cinco variáveis dicotômicas, duas variáveis discretas e uma variável nominal. A variável dependente (desfecho) estudada foi o uso de tabaco entre estudantes da Universidade Federal do Paraná - Curitiba Conjunto de dados O conjunto de dados é apresentado da seguinte maneira: idade: Idade do indivíduo (em anos) genero: Gênero do indivíduo (masculino/feminino) curso: Graduação cursada pelo indivíduo na Universidade Federal do Paraná - Curitiba atv.ext: Variável dicotômica (sim/não), que indica se o indivíduo exerce atividades extracurriculares. exerweek: Variável dicotômica (sim/não), que indica se o indivíduo realiza atividade física. beerweek: Variável discreta que quantifica quantas vezes o indivíduo bebe na semana. smokefamily: Variável dicotômica (sim/não), que indica se o indivíduo possui membros fumantes na família. smokeqt: Variável discreta que quantifica o número de cigarros consumidos pelo indivíduo por dia. smoke: Variável dicotômica (sim/não), que indica se o indivíduo é fumante 3

5 As 6 primeiras linhas do conjunto de dados. Tabela 1: Descrição das Variáveis Variável Tipo Domínio idade Discreta [0 ; +Inf] genero Fator [0 ; 1] curso Nominal - atv.ext Fator [0 ; 1] exerweek Discreta [0 ; 7] beerweek Discreta [0 ; 7] smokefamily Fator [0 ; 1] smokeqt Discreta [0 ; +Inf] smoke Fator [0 ; 1] Tabela 2: Conjunto de dados idade genero curso atv.ext exerweek beerweek smokefamily smokeqt smoke 22 Masculino Estatística Sim 3 2 Não NA Não 20 Masculino Geologia Sim 0 1 Não NA Não 37 Masculino Filosofia Sim 3 1 Sim NA Não 21 Feminino Relações Públicas Sim 3 1 Sim NA Não 21 Masculino Filosofia Sim 0 0 Não NA Não 20 Feminino Arquitetura e Urbanismo Sim 1 1 Não NA Não 2.2 Métodos Para a análise de dados foi utilizado o programa estatístico R. Primeiramente, foi realizada uma análise exploratória contendo a estatística descritiva do dados. Para verificar a relação entre o fumo e as demais covariáveis foi implementado o modelo linear generalizado com distribuição Binomial, visualizado abaixo: y i x i Binomial(n i, π i ) π i g(π i ) = ln( ) = β 0 + β 1 x i1 + β 2 x i2 + β 3 x i3 + β 4 x i4 + β 5 x i5 + β 6 x i6 + βx i7 1 π i Após isso, foi feita a verificação de quais covariáveis são significativas e retiradas do modelo as que não apresentaram relevância para o estudo. Por fim, foi realizada a análise de diagnóstico do modelo e obtidas as conclusões. 3 Modelagem 3.1 Análise descritiva e exploratória Para iniciar a exploração dos dados é necessário fazer uma análise descritiva. De acordo com a Tabela 3 pode-se observar uma simetria na variável idade, porém esta apresenta valores extremos à direita. Tem-se uma proporção maior de homens na variável genero, maior concentração de 4

6 Tabela 3: Medidas descritivas idade genero curso atv.ext Min. :17.00 Feminino :77 Agronomia :78 Não: 66 1st Qu.:20.00 Masculino:91 Estatística :26 Sim:102 Median :22.00 NA Letras : 7 NA Mean :22.62 NA Ciências Biológicas: 6 NA 3rd Qu.:24.00 NA Engenharia Mecânica: 5 NA Max. :50.00 NA Direito : 4 NA NA NA (Other) :42 NA exerweek beerweek smokefamily smokeqt smoke Min. :0.000 Min. :0.000 Não:84 Min. : 0.00 Não:129 1st Qu.: st Qu.:0.000 Sim:84 1st Qu.: 4.00 Sim: 39 Median :1.500 Median :1.000 NA Median : 7.00 NA Mean :1.982 Mean :1.359 NA Mean :10.79 NA 3rd Qu.: rd Qu.:2.000 NA 3rd Qu.:15.00 NA Max. :7.000 Max. :7.000 NA Max. :40.00 NA NA NA NA NA s :129 NA alunos dos cursos de agronomia e estatística, também há uma maior proporção de alunos que participam de atividades extracurriculares (atv.ext). Existe uma leve assimetria à direita na variável exerweek e na variável beerweek. A variável smokefamily apresenta mesma proporção de sim e não. Tem-se na variável smokeqt variável complementar, respondida apenas por aqueles que eram fumantes uma assimetria a direita. E para a variável resposta temos uma proporção de Não três vezes a proporção de Sim. 3.2 Modelo Linear Generalizado com Distruição Binomial Primeiramente é ajustado um modelo aditivo saturado, ou seja, inclui-se todas as covariáveis sem considerar as interações. smoke i x i Binomial(n, ˆπ i ) ˆπ i g(π i ) = ln( ) = 1 ˆπ ˆβ 0 + ˆβ idade x i1 + ˆβ genero x i2 + ˆβ curso x i3 + ˆβ atv.ext x i4 + ˆβ exercw eek x i5 + ˆβ beerw eek x i6 + ˆβ smokef amily x i7 i Devido o resumo do modelo ser extenso, pois a variável curso possui 32 níveis, optou-se por remover a tabela resumo desta variável. A tabela não apresentou nenhum nível significativo na variável curso, somente as variáveis genero, beerweek e SmokeFamily foram significativas. Antes de retirar as outras covariáveis, é interessante elaborar uma nova cováriavel a partir da variável curso, com três níveis: Exatas, Humanas e Ciências Biológicas. As primeiras 6 linhas com a covariável curso2, na Tabela 4 abaixo: 5

7 Tabela 4: Primeiras 6 linhas da tabela com a nova variável idade genero curso atv.ext exerweek 22 Masculino Estatística Sim 3 20 Masculino Geologia Sim 0 37 Masculino Filosofia Sim 3 21 Feminino Relações Públicas Sim 3 21 Masculino Filosofia Sim 0 20 Feminino Arquitetura e Urbanismo Sim 1 beerweek smokefamily smokeqt smoke curso2 2 Não NA Não exatas 1 Não NA Não ciencias 1 Sim NA Não humanas 1 Sim NA Não humanas 0 Não NA Não humanas 1 Não NA Não humanas Ajusta-se um novo modelo trocando a covariável curso pela nova covariável curso2, que é simplesmente o agrupamento dos níveis da covariável curso em três categorias. Nas tabelas abaixo visualiza-se o resumo do modelo com diferentes funções de ligação. Estimate Std. Error z value Pr(> z ) (Intercept) idade generomasculino atv.extsim exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 5: Resumo do modelo com função de ligação logito Estimate Std. Error z value Pr(> z ) (Intercept) idade generomasculino atv.extsim exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 6: Resumo do modelo com função de ligação probit 6

8 Estimate Std. Error z value Pr(> z ) (Intercept) idade generomasculino atv.extsim exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 7: Resumo do modelo com função de ligação cloglog Estimate Std. Error z value Pr(> z ) (Intercept) idade generomasculino atv.extsim exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 8: Resumo do modelo com função de ligação cauchit Mesmo com o agrupamento dos níveis da váriavel curso, ela não foi significativa em nenhuma das tabelas acima. As covariáveis beerweek e smokefamily foram significativas em todas as tabelas, e a covariável genero foi significativa somente na tabela 8. Tabela 9: Deviances dos modelos ajustados Logito Probit Cloglog Cauchit Utilizando a deviance como critério para escolha da função de ligação, ficamos então com a função de ligação Cauchit, que será utilziada na próxima seção para seleção das variáveis pelo método stepwise. 3.3 Seleção de variáveis Para ajustar o modelo final utiliza-se o algoritmo stepwise, que fará a inclusão e a exclusão das covariáveis do modelo simultaneamente. O critério para o melhor modelo será aquele que apresentar o menor AIC (Critério de Informação de Akaike). Nesse ajuste considera-se o último modelo ajustado, ou seja, aquele com os cursos agrupados em 3 categorias. O método utilizado é backward e forward (both). Abaixo tem-se o resumo da última iteração do algoritmo com as covariáveis selecionadas: 7

9 Estimate Std. Error z value Pr(> z ) (Intercept) generomasculino exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 10: Resumo do modelo ajustado pelo algoritmo stepwise Pela tabela 10 tem-se que as variáveis selecionadas pelo algoritmo foram genero, exerweek,beerweek, smoke- Family e curso2 com um AIC igual à Nota-se que a variável curso2 e exerweek não foi significativa em nenhuma das tabelas 5, 6, 7 e 8 mas pelo critério de informação de akaike, utilizando a função de ligação cauchit, tem-se que essas variáveis são relevantes para explicar se o estudante é fumante ou não. Na seção seguinte ajusta-se o modelo proposto pelo algoritmo stepwise. 3.4 Modelo proposto Modelo proposto com função de ligação cauchit. smoke i x i Binominal(n, ˆ pi i ) ˆπ i g( ˆπ i ) = l( ) = 1 ˆπ ˆβ 0 + ˆβ genero x i1 + ˆβ exerw eek x i2 + ˆβ beerw eek x i3 + ˆβ smokef amily x i4 + ˆβ curso2 x i5 i Na tabela 11, é exibido o resumo do modelo proposto, com os parâmetros estimados e respectivos testes marginais (considerando a distribuição normal) para verificar a significância dos efeitos estimados. Quadro 2: Resumo do modelo proposto Estimate Std. Error z value Pr(> z ) (Intercept) generomasculino exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 11: Resumo do modelo proposto Foram necessárias 12 iterações para a estimação dos parâmetros e tem-se que as covariáveis exerweek e curso2exatas contribuem para uma diminuição da probabilidade de fumar, as outras contribuem para um aumento da probabilidade de fumar. 3.5 Análise de diagnóstico Medidas influentes Para começar a análise de diagnóstico, foi gerado um gráfico para visualizar possíveis medidas influentes. 8

10 Diagnostic Plots Cook's distance Studentized residuals hat values Index Pelo gráfico acima verifica-se que para studentized residuals apresentou 3 medidas influentes, são elas 49, 57 e 116. Agora para cook s distance tem-se três medidas influentes, são elas 7, 15 e 107 e por último para medida hat-values as medidas influentes foram 7, 15 e 107. Nota-se que cook s distance e hat-values resultaram nos mesmos pontos. Abaixo tem-se a tabela com essas três observações. Ajustando um novo modelo sem essas observações e comparando os coeficientes. 9

11 Tabela 12: Medidas influentes genero exerweek beerweek smokefamily smoke curso2 7 Masculino 0 1 Sim Sim humanas genero exerweek beerweek smokefamily smoke curso2 15 Feminino 0 3 Sim Sim humanas genero exerweek beerweek smokefamily smoke curso2 107 Masculino 0 6 Não Não exatas Coefficient Plot curso2exatas curso2ciencias Coefficient smokefamilysim beerweek Model m2 m3 exerweek generomasculino (Intercept) 10 5 Value Pelo gráfico acima percebe-se que existe uma diferença significativa, entre os modelos, quando comparado os coeficientes do modelo ajustado com todas observações (m2) com o modelo ajustado sem as observações 7,15 e 107 (m3). Logo abaixo tem-se o resumo do novo modelo e as medidas de influências deste, sem as observações 7,15 e

12 Estimate Std. Error z value Pr(> z ) (Intercept) generomasculino exerweek beerweek smokefamilysim curso2ciencias curso2exatas Tabela 13: Modelo ajustado sem as observações 7,15 e 107 Medidas influentes para o novo modelo. Studentized residua Cook's distance Diagnostic Plots hat values Index Logo temos 2 novas observações discrepantes, sendo a observação 35 apontada pela medida studentized residuals e pela cook s distance, e a observação 141 aparecendo na medida cook s distance e hat-values. Logo segue-se o mesmo procedimento de ajuste de um novo modelo sem essas observações comparando os seus respectivos coeficientes. Tabela com as duas observações discrepantes. Tabela 14: Medidas influentes genero exerweek beerweek smokefamily smoke curso2 37 Masculino 5 0 Sim Sim ciencias genero exerweek beerweek smokefamily smoke curso2 144 Masculino 3 1 Não Não ciencias Ajustando um novo modelo sem as observações da tabela 14 e comparando os coeficientes do novo modelo ajustado com o anterior. 11

13 Coefficient Plot curso2exatas curso2ciencias Coefficient smokefamilysim beerweek Model m3 m4 exerweek generomasculino (Intercept) 10 5 Value Podemos observar pelo gráfico acima que não existe diferenças, visualmente, significativas entre os dois modelos. Opta-se então pelo modelo anterior. Prossegue-se verificando a qualidade do ajuste Qualidade do ajuste Gráfico dos resíduos quantílicos aleatorizados. 12

14 Normal Q Q Plot Sample Quantiles Theoretical Quantiles Pelo gráfico acima pode-se dizer que os resíduos quantílicos aleatorizados seguem uma distribuição normal com uma leve fulga nas caudas. Outra medida de qualidade de ajuste é o envelope simulado, o qual é apresentado logo abaixo. Residuals Theoretical quantiles Novamente, não observa-se nenhum ponto fora das bandas, o que é um bom indicativo da qualidade de ajuste. 13

15 4 Resultados e discussão Tem-se que o modelo final apresentou como variáveis significativas gênero, quantas vezes que pratica exercícios físico na semana, quantas vezes bebe cerveja na semana, se conviveu/convive com familiares fumantes e a variável curso categorizada em três níveis. Algumas considerações sobre a relação que as covariáveis tiveram com a variável resposta: O gênero masculino apresentou um acréscimo na probabilidade do indivíduo ser fumante. A quantidade de exercícios físico durante a semana apresentou um coeficiente negativo o que indica que quanto menor a quantidade de exercícios físicos praticados ao longo da semana maior a probabilidade do estudante ser fumante. A quantidade de ingestão de bebidas alcoólicas apresentou um coeficiente positivo, o que nos indica que quanto mais vezes o estudante ingere bebidas alcoólicas maior a probabilidade do estudante ser fumante. Tem-se que estudantes que convivem ou conviveram com familiares ou amigos fumantes apresentaram uma maior probabilidade de ser fumante. E por último temos que o curso de ciências apresentou o maior acréscimo na probabilidade do estudante ser fumante. Abaixo temos os gráficos das predições marginais, aonde cada covariável varia enquanto fixa-se as demais em suas respectivas médias. Predicted value Predicted value Masculino Feminino genero exerweek Predicted value Predicted value Não Sim beerweek smokefamily 14

16 Predicted value exatas ciencias humanas curso2 5 Considerações finais O modelo que apresentou melhor ajuste foi o modelo com função de ligação cauchit. Além disso, durante o processo de análise de diagnóstico observou-se algumas medidas influentes, que resultaram na exclusão das mesmas e um novo ajuste do modelo. O modelo sem a exclusão das observações influentes resultou em um AIC de e o novo modelo, com a exclusão das observações influentes, apresentou um AIC de Referências Instituto Nacional de Câncer INCA. Tabagismo: dados e números. Disponível em Acesso em 18 de out de US Department of Health and Human Services. The health consequences of smoking: a report of the Surgeon General [Internet].US Department of Health and Human Services, CDC. Disponível em Acesso em 18 de out de Revista Veja. O tabagismo no mundo e no Brasil. Disponível em Acesso em 18 de out de

Regressão para Dados Binários - Estudo de Dengue

Regressão para Dados Binários - Estudo de Dengue Universidade Federal do Paraná Departamento de Estatística Regressão para Dados Binários - Estudo de Dengue CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme

Leia mais

Trabalho de Modelos Lineares Generalizados

Trabalho de Modelos Lineares Generalizados Universidade Federal do Paraná Trabalho de Modelos Lineares Generalizados Ananda Bordignon 1, Brendha Lima 2, Giovanna Lazzarin 3 12 de Novembro de 2018 1 GRR20149157 2 GRR20149163 3 GRR20149088 1 SUMÁRIO

Leia mais

EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA

EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA Universidade Federal do Paraná Departamento de Estatística EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA CE225 - Modelos Lineares Generalizados Jhenifer Caetano Veloso - GRR20137558 Rogério

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR ) UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE

Leia mais

Modelos lineares generalizados: um estudo sobre leilões de veículos

Modelos lineares generalizados: um estudo sobre leilões de veículos UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelos lineares generalizados: um estudo sobre leilões de veículos CE5 - Modelos Lineares Generalizados Aline Benatti, GRR: 454 Andryas Waurzenczak,

Leia mais

INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO

INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO CE225 - Modelos Lineares Generalizados Eduardo

Leia mais

Modelos de Regressão para Dados de Contagem

Modelos de Regressão para Dados de Contagem UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelos de Regressão para Dados de Contagem CE225 - Modelos Lineares Generalizados Professor Cesar Taconelli Andrea A Alves, GRR: 20096668 NathanM

Leia mais

Número de Consultas ao Médico

Número de Consultas ao Médico UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA João Matheus S. K. T. Hneda Lineu Alberto Cavazani de Freitas Número de Consultas ao Médico Análise

Leia mais

Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018

Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018 Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018 1. Introdução O objetivo deste trabalho é apresentar uma análise estatística,

Leia mais

Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha

Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha Universidade Federal do Paraná Departamento de Estatística Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha CE22 - Modelos Lineares Generalizados Francielle Przibiciem

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DE DADOS DE ÓBITOS POR AGRESSÕES NO ESTADO DE SÃO PAULO NO ANO DE 2016 CURITIBA Novembro

Leia mais

Analise de sobreviventes em acidentes de carros

Analise de sobreviventes em acidentes de carros Analise de sobreviventes em acidentes de carros Modelos Lineares Generalizados Lais Hoffmam GRR20159455 Simone Matsubara GRR20124663 Willian Meira GRR20159077 Yasmin Fernandes ISO20180365 Curitiba 2018

Leia mais

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017 Trabalho de GLM 2 Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER 17 de outubro de 2017 1 - Resumo Para o trabalho, foi extraída do site kaggle.com uma base com uma amostra

Leia mais

MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS

MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS Universidade Federal do Paraná Departamento de Estatística MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010

Leia mais

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE CE225 - Modelos

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR ) UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152) Cinthia Zamin Cavassola (GRR20149075) Luiza Hoffelder da Costa (GRR20149107) INFLUÊNCIA DE CARACTERÍSTICAS RELACIONADAS À ESCOLA, DEMOGRÁFICAS

Leia mais

RELAÇÃO ENTRE EXPECTATIVA DE VIDA E CARACTERÍSTICAS DOS ESTADOS NORTE-AMERICANOS ENTRE OS ANOS DE 1969 E 1970

RELAÇÃO ENTRE EXPECTATIVA DE VIDA E CARACTERÍSTICAS DOS ESTADOS NORTE-AMERICANOS ENTRE OS ANOS DE 1969 E 1970 Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística RELAÇÃO ENTRE EXPECTATIVA DE VIDA E CARACTERÍSTICAS DOS ESTADOS NORTE-AMERICANOS ENTRE OS ANOS DE 1969 E 1970 CE225 -

Leia mais

Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial

Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial UNIVERSIDADE FEDERAL DO PARANÁ Rafael Morciani Alves da Silva Maike Willian Martins dos Santos Mateus Gemelli Ramos Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA 06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA BRUNO GERONYMO - GRR20159232 HERMANN MOGIZ DELGADO - GRR20159211 MARIA HELENA OLIVEIRA - GRR20159213 VINICIUS CESAR PEDROSO

Leia mais

EXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO

EXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística EXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO CE225 - Modelos Lineares Generalizados

Leia mais

Análise de dados de Contagem

Análise de dados de Contagem Análise de dados de Contagem Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido ao professor

Leia mais

ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES

ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES CE225 - Modelos Lineares Generalizados

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA 06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 7 Introducing statistical modeling Part 3 (Multivariable linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR -20149072 DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DA QUANTIDADE DE MATRÍCULAS NO ENSINO REGULAR NO ESTADO DO

Leia mais

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ).

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ). Lista 1 - Gabarito Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados 29 de Abril 1. (Concurso Petrobrás - 2011) Em um modelo de regressão logística, o que indica se o modelo se

Leia mais

Modelo de regressão Beta

Modelo de regressão Beta Modelo de regressão Beta Fernando Lucambio Pérez Departamento de Estatística Universidade Federal do Paraná Agosto de 2004 1 Consideremos uma situação em que a variável resposta contínua é restrita ao

Leia mais

Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016

Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016 Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016 Modelos Lineares Generalizados Lais Hoffmam Simone Matsubara Willian Meira Yasmin Fernandes Curitiba 2018 Sumário 1. Resumo... 3 2. Introdução...

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Métodos Estatísticos Avançados em Epidemiologia Aula 2-2 Regressão de Poisson: Modelando Contagens Distribuição

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR 20149072 RODOLFO PIROLO GATZKE - GRR 20149150 THAYS COSTA S. SOUZA - GRR 20159231 MODELAGEM PARA O SUCESSO DE CAMPANHA DE MARKETING CURITIBA

Leia mais

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018 CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018 Examplo usando gamlssnp(): dados de cérebros de animais O tamanho do cérebro (brain) e peso corporal (body) foram registrados

Leia mais

Análise de dados em Geociências

Análise de dados em Geociências Análise de dados em Geociências Regressão Susana Barbosa Mestrado em Ciências Geofísicas 2014-2015 Resumo Introdução Regressão linear dados independentes séries temporais Regressão de quantis Regressão

Leia mais

b) Teste a hipótese de efeito significante do tamanho da população sobre a venda do produto, na presença de renda per capita

b) Teste a hipótese de efeito significante do tamanho da população sobre a venda do produto, na presença de renda per capita Exemplo 1 (continuação a Estime por intervalo de 95% de confiança, o aumento do número médio de lotes vendidos devido a 1000 pessoas a mais na população, mantendo a renda per capita fixa b Teste a hipótese

Leia mais

Constipação José Luiz Padilha da Silva 21 de outubro de 2018

Constipação José Luiz Padilha da Silva 21 de outubro de 2018 Constipação José Luiz Padilha da Silva 21 de outubro de 2018 Descrição dos dados No banco de dados foram incluídos 151 recém-nascidos acompanhados nos primeiros 12 meses de vida. Foram previstos um total

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter

UNIVERSIDADE FEDERAL DO PARANÁ. Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter UNIVERSIDADE FEDERAL DO PARANÁ Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter ESTUDO DO NÚMERO DE PONTOS EFETUADOS EM UMA TEMPORADA DE BASQUETEBOL CURITIBA 27 de novembro

Leia mais

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela:

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela: Gabarito Lista 2 LES0773 Estatística III Exercício 1) Utilizando a ferramenta Análise de Dados e a sua função Regressão, foi realizada uma regressão levando em consideração os gastos com PD como variável

Leia mais

Modelagem de dados complexos por meio de extensões do modelo de

Modelagem de dados complexos por meio de extensões do modelo de Modelagem de dados complexos por meio de extensões do modelo de regressão clássico Luiz R. Nakamura Departamento de Informática e Estatística Universidade Federal de Santa Catarina luiz.nakamura@ufsc.br

Leia mais

1 z 1 1 z 2. Z =. 1 z n

1 z 1 1 z 2. Z =. 1 z n Gabarito Lista 3. Tópicos de Regressão. 2016-2. 1. Temos que y i ind N (µ, φi ), com log φ i = α + γz i, para i = 1,..., n, portanto (i) para o γ = (α, γ) a matriz modelo ca Z = 1 z 1 1 z 2.. 1 z n (ii)

Leia mais

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG Robson de Souza Vieira 1 ; Rogério Silva Pimentel 1 ; Emerson Wruck 2

Leia mais

Regressão linear múltipla. Regressão linear múltipla

Regressão linear múltipla. Regressão linear múltipla Regressão linear múltipla 35 R 2 = 61% Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M. Pagano e Gravreau e Geraldo

Leia mais

Modelos Lineares Generalizados - Regressão Logística

Modelos Lineares Generalizados - Regressão Logística Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede

Leia mais

Modelo Linear Generalizado Distribuição de Poisson

Modelo Linear Generalizado Distribuição de Poisson Valeska Andreozzi 1 Modelo Linear Generalizado Distribuição de Poisson Problema 1 O objetivo desta aula é exemplificar a modelagem de dados de contagem. Vamos ilustrar como os modelos lineares generalizados

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística

UNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelo estatístico ligado a tipos de vinhos e classificação de qualidade CE225 - Modelos Lineares Generalizados Prof. Cesar Augusto Taconeli Andrea

Leia mais

Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS

Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS Relatório técnico apresentado como atividade avaliativa

Leia mais

Aplicação do modelo de Quase-Verossimilhança

Aplicação do modelo de Quase-Verossimilhança Aplicação do modelo de Quase-Verossimilhança Fábio Hideto Oki 1 1 Introdução O câncer é uma doença de proporção mundial, atingindo só no Brasil cerca de 350 mil pessoas por ano e é caracterizado pela mutação

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA RAFAEL BUTTINI SALVIATO GRR - 20160206 IGOR HOLTRUP HORROCKS GRR - 20160230 GUSTAVO SCHILLING SCHUTT GRR - 20160215 PREVISÃO DE ÊXITO NO VESTIBULAR A PARTIR

Leia mais

Precificação de apartamentos para o bairro Água Verde em Curitiba

Precificação de apartamentos para o bairro Água Verde em Curitiba Precificação de apartamentos para o bairro Água Verde em Curitiba Chuck Norris Arnold Schwarzenegger 18 de julho de 2013 O preço de imóveis depende principalmente do seu tamanho e localização. A infraestrutura

Leia mais

Análise dados de diagnóstico de câncer de mama

Análise dados de diagnóstico de câncer de mama Análise dados de diagnóstico de câncer de mama Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido

Leia mais

4 Modelos Lineares Generalizados

4 Modelos Lineares Generalizados 4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da

Leia mais

3.33pt. AIC Introdução

3.33pt. AIC Introdução 1 3.33pt 1 Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 01 de Julho de 2016 2 3.33pt 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos

Leia mais

REGRESSÃO E CORRELAÇÃO

REGRESSÃO E CORRELAÇÃO REGRESSÃO E CORRELAÇÃO A interpretação moderna da regressão A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis explanatórias,

Leia mais

Introdução à Regressão Logística Quantílica

Introdução à Regressão Logística Quantílica UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA Introdução à Regressão Logística Quantílica Autor: Tiago Buchweitz Correa Orientador: Professor

Leia mais

Exemplo Preferência de Automóveis

Exemplo Preferência de Automóveis Exemplo Preferência de Automóveis Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 1 /

Leia mais

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa Regressão Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Regressão linear x : variável explanatória y : variável resposta Gráfico primeiro! Gráfico primeiro! Gráfico primeiro! Modelo linear x

Leia mais

DETERMINAÇÃO DA DL50 PARA O CONTROLE BIOLÓGICO DA C.VESTIGIALIS EM PLANTAS DO ÁLAMO. EMBRAPA Pesquisadora: EDILENE MACHADO

DETERMINAÇÃO DA DL50 PARA O CONTROLE BIOLÓGICO DA C.VESTIGIALIS EM PLANTAS DO ÁLAMO. EMBRAPA Pesquisadora: EDILENE MACHADO DETERMINAÇÃO DA DL50 PARA O CONTROLE BIOLÓGICO DA C.VESTIGIALIS EM PLANTAS DO ÁLAMO EMBRAPA Pesquisadora: EDILENE MACHADO O ÁLAMO Família: Salicaceae Gênero: Populus Características Ausência de resinas

Leia mais

Modelos Lineares Generalizados

Modelos Lineares Generalizados unificação metodológica Alexandre Adalardo de Oliveira PlanECO 2017 1 of 43 03/29/2017 11:47 AM Conceitos estrutura do erro preditora linear função de ligação 2 of 43 03/29/2017 11:47 AM Função de ligação

Leia mais

SELEÇÃO DE VARIÁVEIS

SELEÇÃO DE VARIÁVEIS SELEÇÃO DE VARIÁVEIS objetivo incluir tantas covariáveis quantas forem necessárias para auxiliar na predição do modelo? (1) buscar o menor subconjunto de covariáveis capaz de explicar adequadamente a variação

Leia mais

Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de regressão para dados correlacionados. Cibele Russo Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo

Leia mais

INTRODUÇÃO A ECONOMETRIA

INTRODUÇÃO A ECONOMETRIA INTRODUÇÃO A ECONOMETRIA Análise de regressão e uso do Eviews Introdução O modelo de regressão linear se utiliza para estudar a relação que existe entre uma variável dependente e uma ou várias variáveis

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

Exame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

Exame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil Exame da OAB Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2017 G. A. Paula (IME-USP) Exame da OAB 2 o Semestre 2017 1 / 29 Exame da OAB Sumário 1 Exame

Leia mais

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS Thalita do Bem Mattos Clécio da

Leia mais

AULA 17 - Variáveis binárias

AULA 17 - Variáveis binárias AULA 17 - Variáveis binárias Susan Schommer Econometria I - IE/UFRJ Variáveis binárias A variável binária (ou dummy) é um simples exemplo de variável aleatória, o qual é chamada de função indicadora de

Leia mais

Regressão linear múltipla

Regressão linear múltipla Regressão linear múltipla Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução A regressão múltipla é uma generalização da regressão simples, visto que, há mais de uma variável explicativa

Leia mais

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES BIE5782 Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES ROTEIRO 1.Motivação 2. Método dos mínimos quadrados 3. Ajuste no R: função lm 4. Resultado no R: objeto lm 5. Premissas, interpretação e diagnóstico 6.

Leia mais

ANOVA com modelos encaixados

ANOVA com modelos encaixados ANOVA com modelos encaixados Motivação 1 Testar a significância de β j ( j = 0, 1,, p na presença das demais regressoras, usando o teste t, é trabalho, pois precisa de: ^β e ^Var (^β j = ^σ 2 j c ( j+1(

Leia mais

Uso de modelos lineares generalizados para estimar germinação carpogênica de escleródios de S. sclerotioroum

Uso de modelos lineares generalizados para estimar germinação carpogênica de escleródios de S. sclerotioroum Uso de modelos lineares generalizados para estimar germinação carpogênica de escleródios de S. sclerotioroum Marceli Hikishima, Embrapa Arroz e Feijão 1 Aline de Holanda Nunes Maia, Embrapa Meio Ambiente

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Estatística Descritiva (III) Associação entre Variáveis

Estatística Descritiva (III) Associação entre Variáveis Estatística Descritiva (III) Associação entre Variáveis 1 Associação entre variáveis qualitativas Tabelas de Contingência 2 Podemos construir tabelas de frequências conjuntas (tabelas de contingência),

Leia mais

Exemplos Regressão Dados Binários

Exemplos Regressão Dados Binários Exemplos Regressão Dados Binários p. 1/28 Exemplos Regressão Dados Binários Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011 Exemplos

Leia mais

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018 A função plot.gamlss() CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018 Considere os dados de circunferência abdominal discutido anteriormente. relacionamos a circunferência

Leia mais

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre. UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/

Leia mais

i j i i Y X X X i j 1 i 2 i i

i j i i Y X X X i j 1 i 2 i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

MRLM COM COVARIÁVEIS CATEGÓRICAS. criar uma variável dummy para representar uma categoria da variável. variável dummy: assume só dois valores: 0 ou 1

MRLM COM COVARIÁVEIS CATEGÓRICAS. criar uma variável dummy para representar uma categoria da variável. variável dummy: assume só dois valores: 0 ou 1 MRLM COM COVARIÁVEIS CATEGÓRICAS Como quantificar o efeito das categorias de uma variável sobre a resposta Y? (exemplo: efeito de sexo masculino/feminino sobre salário) criar uma variável dummy para representar

Leia mais

Exemplo Regressão Robusta

Exemplo Regressão Robusta Exemplo Regressão Robusta Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1 o Semestre 2013 G. A. Paula (IME-USP) Abastecimento de Refrigerantes 1 o Semestre 2013 1 /

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo 1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Exemplo Abastecimento de Refrigerantes

Exemplo Abastecimento de Refrigerantes Exemplo Abastecimento de Refrigerantes Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1 o Semestre 2016 G. A. Paula (IME-USP) Abastecimento de Refrigerantes 1 o Semestre

Leia mais

Teste F-parcial 1 / 16

Teste F-parcial 1 / 16 Teste F-parcial Ingredientes A hipótese nula, H 0, define o modelo restrito. A hipótese alternativa, H a : H 0 é falsa, define o modelo irrestrito. SQR r : soma de quadrado dos resíduos associada à estimação

Leia mais

Introdução ao modelo de Regressão Linear

Introdução ao modelo de Regressão Linear Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: gilbertoliska@unipampa.edu.br Local: Sala dos professores (junto ao administrativo)

Leia mais

Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA

Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA ANÁLISE DE DADOS Os dados foram analisados na versão R 2.13.1. Foi realizada uma análise descritiva exaustiva de todas as variáveis em estudo, usando

Leia mais

Modelo Linear Generalizado Distribuição Normal

Modelo Linear Generalizado Distribuição Normal Valeska Andreozzi 1 Modelo Linear Generalizado Distribuição Normal O objetivo deste exercício é familiarizar o aluno com os modelos lineares generalizados (MLG). PROBLEMA 1: Pressão arterial A pressão

Leia mais

Teste F-parcial 1 / 16

Teste F-parcial 1 / 16 Teste F-parcial A hipótese nula, H 0, define o modelo restrito. Ingredientes SQR r : soma de quadrado dos resíduos sob H 0. R 2 r: coeficiente de determinação sob H 0. g: número de restrições a serem testadas

Leia mais

Regressão Linear Múltipla no R MAE-0217: ESTATÍSTICA DESCRITIVA MAIO DE 2017 PROFESSORA: MÁRCIA D ELIA BRANCO

Regressão Linear Múltipla no R MAE-0217: ESTATÍSTICA DESCRITIVA MAIO DE 2017 PROFESSORA: MÁRCIA D ELIA BRANCO Regressão Linear Múltipla no R MAE-0217: ESTATÍSTICA DESCRITIVA MAIO DE 2017 PROFESSORA: MÁRCIA D ELIA BRANCO MONITORA PAE: SIMONE HARNIK Regressão Linear Simples > O modelo de regressão linear simples

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 21 de Junho de 2013 3 Uma outra medida usada para verificar o ajuste do modelo. Essa estatística é dada por X

Leia mais

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos Confundimento erro devido a uma diferença não aleatória na distribuição dos fatores de risco entre os dois grupos. A variável de confundimento está distribuída desigualmente entre os grupos comparados.

Leia mais

Consumo de álcool entre adolescentes: uma aplicação de regressão logística

Consumo de álcool entre adolescentes: uma aplicação de regressão logística Universidade de Brasília Instituto de Ciências Exatas Departamento de Estatística Caroline Rodrigues Lopes Consumo de álcool entre adolescentes: uma aplicação de regressão logística Brasília - DF 2017

Leia mais

Alexandre Morales Diaz Eduardo Pereira Lima Vinicius Larangeiras

Alexandre Morales Diaz Eduardo Pereira Lima Vinicius Larangeiras Análise de Desempenho de Jogadores de Basquete Alexandre Morales Diaz Eduardo Pereira Lima Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido

Leia mais

Análise do acidente do Titanic

Análise do acidente do Titanic Análise do acidente do Titanic Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná,

Leia mais

Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais. ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07

Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais. ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07 Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07 28.Maio.2007 José Filipe Rafael I Um colega seu está a tentar explicar o salário

Leia mais

A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão

A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão Ricardo Alves de Olinda Universidade Estadual da Paraíba - UEPB Centro de Ciências e Tecnologia - CCT Departamento de Estatística

Leia mais

Disciplina de Modelos Lineares

Disciplina de Modelos Lineares Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique

Leia mais

ESTUDO SOBRE A EVASÃO E O TEMPO ATÉ A FORMATURA DOS ALUNOS DO CURSO DE ESTATÍSTICA DA UFPR

ESTUDO SOBRE A EVASÃO E O TEMPO ATÉ A FORMATURA DOS ALUNOS DO CURSO DE ESTATÍSTICA DA UFPR UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA Bruno Rosevics Estevão Batista do Prado ESTUDO SOBRE A EVASÃO E O TEMPO ATÉ A FORMATURA DOS ALUNOS

Leia mais