UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Documentos relacionados
UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Modelos de Regressão para Dados de Contagem

Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016

Número de Consultas ao Médico

Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR

Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )

Regressão para Dados Binários - Estudo de Dengue

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Análise de dados de Contagem

Analise de sobreviventes em acidentes de carros

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

Trabalho de Modelos Lineares Generalizados

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE

Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS

Análise de dados de contagem para jogadores de futebol americano

Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba

Renda x Vulnerabilidade Ambiental

Trabalho 1 Regressão para dados binários

Aplicação do modelo de Quase-Verossimilhança

Análise do acidente do Titanic

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR

Aplicação dos modelos lineares generalizados na análise do

Análise dados de diagnóstico de câncer de mama

Métodos Quantitativos para Avaliação de Políticas Públicas

INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )

Alexandre Morales Diaz Eduardo Pereira Lima Vinicius Larangeiras

CONHECIMENTOS ESPECÍFICOS

1 z 1 1 z 2. Z =. 1 z n

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

CONHECIMENTOS ESPECÍFICOS

CE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42

UNIVERSIDADE FEDERAL DO PARANÁ. Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter

Coleta e Modelagem dos Dados de Entrada

ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES

Aplicação de modelos lineares generalizados na captura de atum da espécie Thunnus albacares.

Análise de Resíduos. investigar características que comprometem a validade do MRLS:

Coleta e Modelagem dos Dados de Entrada

Correlação e Regressão

Modelos de Regressão Múltipla - Parte VI

Análise de Resíduos. investiga características que comprometem a validade do MRLS:

10 FATOS SOBRE A SEGURANÇA DO PACIENTE

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

UNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística

Mais Informações sobre Itens do Relatório

A Segurança das Mulheres nas Cidades

Análise de Dados Categóricos

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS

Exemplos Equações de Estimação Generalizadas

MAE0219 Introdução à Probabilidade e Estatística I

EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA

Exemplos Modelos de Quase-Verossimilhança

Regressão múltipla: Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG

Modelos Binomial e Poisson

Modelos de Análise de Variância

Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de Regressão Linear Simples parte I

Cap. 5 Dados quantitativos

Análise de Regressão EST036

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

Esse material foi extraído de Barbetta (2007 cap 13)

Modelos de Regressão Linear Simples - parte I

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

EXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Exemplos Regressão Dados de Contagem

Utilizando a função auto.arima em modelos de séries temporais

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017

Análise de correlação e regressão da mortalidade por acidentes de transporte e homicídios da cidade do Rio de Janeiro, 1990 a 2002

INSTITUTO FEDERAL DE SANTA CATARINA CÂMPUS SÃO JOSÉ ENGENHARIA DE TELECOMUNICAÇÕES ESTATÍSTICA E PROBABILIDADES

Modelagem de dados complexos por meio de extensões do modelo de

VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS. Capítulo 1 VARIÁVEIS E AMOSTRAS 1

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

AVALIAÇÃO DE INTERNAÇÕES POR CONDIÇÃO SENSÍVEL À APS, SEUS DETERMINATES E DESAFIOS NO PROJETO TELESSAÚDE RS

Regressão múltipla: problemas adicionais. Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

Precificação de apartamentos para o bairro Água Verde em Curitiba

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo

Filho, não é um bicho: chama-se Estatística!

1 Introdução aos Métodos Estatísticos para Geografia 1

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

Modelos para dados de contagem

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Transcrição:

06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE DO NÚMERO DE ÓBITOS POR COMPLICAÇÕES NA ASSISTÊNCIA MÉDICA E CIRÚRGICA EM SANTA CATARINA NO ANO DE 2016 Base de dados (DATASUS) Departamento de Informática do Sistema Único de Saúde http://tabnet.datasus.gov.br Relatório apresentado à Disciplina de Modelos Lineares Generalizados da Universidade Federal do Paraná, como requisito parcial para aprovação na disciplina. Professor: Dr. Cesar Augusto Taconeli CURITIBA

2018 1 SUMÁRIO 1 INTRODUÇÃO. 3 2 MATERIAIS E MÉTODOS. 4 2.1 AMOSTRA... 4 2.2 VARIÁVEIS OBSERVADAS... 4 2.3 MÉTODOS ESTATÍSTICOS... 5 3 RESULTADOS E DISCUSSÃO. 5 3.1 ANÁLISE DESCRITIVA 5 3.2 AJUSTE DO MODELO. 8 3.3 ANÁLISE DE RESÍDUOS 10 4 EFEITO DAS COVARIÁVEIS........ 13 5 CONCLUSÕES. 14

2 RESUMO O aumento no número de cirurgias foi possível por meio de extraordinário avanço tecnológico e das práticas médicas, que trouxe benefícios consideráveis para os pacientes porém todo esse avanço tornou o ambiente cirúrgico mais inseguro. Foi obtida uma amostra composta de 269 observações, divididas em 10 variáveis; Resposta: Número de óbitos devido a complicações na assistência médica e cirurgia; município, renda per capita, despesas (de saúde e saneamento), população, número de beneficiários do Bolsa Família, educação I (Média de alunos por turma - Creche, Pré-Escola), educação II (Média de alunos por turma - Ensino Fundamental), educação III (Média de alunos por turma - Ensino Médio), investimento municipal. O método estatístico utilizado foi o de Regressão Linear Generalizada. Ao longo do trabalho foi notado que as variáveis Renda e Log População tem relação positiva com a variável resposta, número médio de óbitos. Palavras-chave: Regressão Linear. Dados de Contagem. Saúde.

3 1 INTRODUÇÃO Complicações cirúrgicas são consequências involuntárias da assistência, e ocorrem com frequência alarmante, as chances de complicações aumentam o tempo de permanência no hospital e o risco de óbito para o paciente. (Thomas. BMJ. 200 e Bellomo. MJA. 2002). Anualmente há 234 milhões de cirurgias (realizadas em regime de internação) sendo que uma porcentagem significativa resulta em complicações geralmente com risco de vida ao paciente evitáveis, cerca de 7 milhões apresentam complicações sérias e 1 milhão morre antes, durante ou após a cirurgia. (Surgical Care Improvement Project). Um grande número destas complicações poderia ser evitada pela adoção confiável de práticas baseadas em evidências e pela implementação de medidas de segurança, como por exemplo, padronização e simplificação dos processos principais, redesenhando o sistema através da utilização de princípios reconhecidos de fatores humanos, estabelecendo parcerias com pacientes e criando uma cultura de segurança que maximize a comunicação e o trabalho em equipe. (MedicinaNet).

4 2 MATERIAL E MÉTODOS 2.1 AMOSTRA A amostra é composta de 269 observações independentes, adquiridas na base de acesso público DATASUS. 2.2 VARIÁVEIS OBSERVADAS Resposta : Contagem, por município, de pacientes que vieram à óbito devido a complicações médicas e cirurgia; Município: Municípios de Santa Catarina; Renda: Renda per capita, por município (R$); Despesas: Despesas em Saúde e Saneamento básico (R$); População: População por município; Benefícios: Número de beneficiários do programa Bolsa Família; Educação I: Média de alunos por turma no Ensino Básico (Creche, Pré-Escola); Educação II: Média de alunos por turma no Ensino Fundamental(5ª Série a 9ª série); Educação III: Média de alunos por turma no Ensino Médio (1º Ano a 3º Ano); Investimentos: Investimento Municipal (R$).

5 2.3 MÉTODO ESTATÍSTICO Para análise, utilizou-se o software estatístico R, e o método estatístico utilizado foi o de Regressão Linear Generalizado. 3 RESULTADOS E DISCUSSÃO 3.1 ANÁLISE DESCRITIVA Primeiramente foi feita uma breve análise exploratória dos dados utilizando box-plot e gráficos de barra como mostram as figuras 1 e 2. (Figura 1 - Box-plot das variáveis explicativas)

6 (Figura 2 - Histograma das variáveis explicativas) Cerca de 75% dos Municípios têm renda per capita menor que o salário mínimo atual, em contrapartida há 64 municípios com renda superior, chegando em até R$2.096. Ao analisar a variável Despesa vemos que, em média, se é gasto cerca de R$10.171.198,00 em investimentos na saúde e em Saneamento básico. Vale ressaltar que esses valores chegam á R$340.038.230,00. A maioria dos municípios apresenta população de 1.341 a 18.905 habitantes, cidades maiores como Florianópolis, Joinville e Blumenau, apresentam valores bem mais expressivos, com 569.645,477.798, 373.415 habitantes, respectivamente. O benefício Bolsa Família é um auxílio distribuído para famílias carentes com filho de até 17 anos. Ao analisar os dados desta variável, vemos que, curiosamente os municípios Florianópolis, Joinville e Blumenau, que tem as maiores populações apresentam um número muito pequeno de beneficiários deste programa, indicando um alto nível de vida. E quando cruzamos os dados com a Renda per capita, vemos que as três cidades em questão têm um salário maior que R$1300,00.

7 As variáveis Educação I, II, III, apresentam valores parecidos, embora quanto mais avançado o ensino maiores são as turmas. A média de alunos por turma é de 15, 19, 23 alunos, para o estudo básico, fundamental e médio, respectivamente. Na última variável vemos o investimento dos municípios em obras, compra de materiais e instalações. Tais investimentos variam de R$380.145,00 a R$107.522.664,00, porém a maioria dos municípios tem investimentos menores de R$4.731.265,00. Ao focar nas variáveis Despesa, População, Investimento e Benefícios, vemos uma grande assimetria, logo foi realizado uma transformação para a escala logarítmica, como mostra a figura 3.. (Figura 3 - Histograma e Box-plot das variáveis transformadas) Uma vez as variáveis ajustadas, a análise prossegue..

8 3.2 AJUSTE DO MODELO Em seguida foram ajustados 2 modelos de regressão linear generalizados, um usando distribuição Poisson com função ligação logarítmica e outro com distribuição Binomial Negativa e função ligação logarítmica, a Tabela 1 mostra o valor do AIC e da Verossimilhança para cada uma delas. (Tabela 1 - Valores de AIC e Verossimilhança dos modelos ajustados) Função Ligação AIC Verossimilhança Poisson Logarítmica 148.2169-65.10845 Binomial Negativa Logarítmica 136.1076-58.05382 Considerando o índice de Akaike (AIC) e verossimilhança, notamos que o modelo que apresentou menor AIC e maior Verossimilhança foi o com distribuição Binomial Negativa com função de ligação logarítmica. A Figura 4 nos mostra que o modelo com distribuição Poisson não apresenta normalidade uma vez que seus pontos fogem da envelope simulado, já o modelo com distribuição Binomial Negativa aparenta estar bem ajustado. (Figura 4 - Gráfico normal de probabilidades de cada um dos modelos ajustados)

9 Logo o modelo selecionado para realizar a análise dos dados é o modelo com distribuição Binomial Negativa e função de ligação logarítmica. Determinado o modelo que será utilizado, foi feito um resumos de resultados do mesmo.(tabela 2) (Tabela 2: ANOVA do modelo com todas as variáveis com α = 0,05.) Variáveis Coeficientes Erro Padrão Valor Z Pr (> z ) Intercept -12.864754 4.824965-2.666 0.00767 ** Renda 0.003643 0.001152 3.163 0.00156 ** Log Despesas -0.221994 0.208331-1.066 0.28661 Log População 1.628360 0.630564 2.582 0.00981 ** Log Benefícios 0.430112 0.242676 1.772 0.07633. Educação I -0.020988 0.097886-0.214 0.83023 Educação II -0.012269 0.190567-0.064 0.94867 Educação III 0.015222 0.126941 0.120 0.90455 Log Investimento -0.545349 0.619679-0.880 0.37883 Para uma análise com 95% de confiança apenas as variáveis Renda, e Log População tiveram efeito significativo, como mostra a Tabela 2, portanto realizamos uma nova análise somente com essas variáveis. Como mostra a Tabela 3. (Tabela 3. ANOVA do modelo apenas com as variáveis significativas com α = 0,05.) Variáveis Coeficientes Erro Padrão Valor Z Pr (> z ) Intercept -16.329561 2.436308-6.703 2.05e-11 *** Renda 0.003318 0.001113 2.981 0.00288 ** Log População 1.044666 0.263081 3.971 7.16e-05 *** Podemos notar que a cada uma unidade acrescida na variável renda, a contagem média de óbitos cresce em 1,0033. O modelo também mostra que a variável Log População tem relação positiva com o número de óbitos especificados.

10 3.3 ANÁLISE DE RESÍDUOS Através da análise resíduos dos modelo, podemos verificar um comportamento atípico dos dados, contudo em modelos GLM se espera modelos mais complicados de se avaliar na prática (Figura 4). (Figura 4. Análise de resíduos do modelo) Como os gráficos da figura 4 ficaram de uma complexidade difícil de analisar, foi feito um gráfico com base nos resíduos quantílicos aleatorizados na Figura 5 e outro com normal de probabilidade com envelope simulado na Figura 6.

11 (Figura 5. Análise Resíduos Quantílicos Aleatorizados) Com base no gráfico da esquerda a dispersão está entre -3 e 3, e no gráfico da direita há uma boa aderência à distribuição Normal. Na figura 6 podemos verificar um modelo bem ajustado, pois todos os pontos estão distribuídos dentro do envelope.

12 (Figura 6 - Gráfico de probabilidades do modelo ajustado) Fazendo uma análise geral dos resíduos eles parecem não demonstrar nenhum sinal de alerta, os dados parecem estar bem acomodados no modelo.

13 4 EFEITOS DAS VARIÁVEIS Na figura 6 podemos ver como os efeitos marginais das variáveis Renda e Log População afetam a variável resposta. (Figura 6 - Efeitos das variáveis explicativas sobre a resposta) Podemos verificar que ambas as variáveis possuem relação crescente com a variável resposta ou seja quanto maior a população e a renda maior o número médio de óbitos.

14 5 CONCLUSÕES Podemos constatar com base no nosso estudo que o número de óbitos em pacientes do estado de Santa Catarina durante o ano de 2016 foi influenciado por algumas variáveis sendo elas: Renda - Foi observado uma relação positiva com a resposta, ou seja, quanto maior a renda, maior a contagem média de óbitos. Log População - Foi observado uma relação positiva com a resposta, ou seja, quanto maior a Log população, maior a contagem média de óbitos. Para um próximo estudo seria interessante incluir variáveis como quantidade de pacientes atendidos em cada cidade, e grau de excelência dos hospitais,pois podemos imaginar que o aumento da renda per capita da cidade está relacionado positivamente com o aumento no número de óbitos possa estar relacionada ao fato de que cidades mais ricas e mais populosas costumam ter hospitais mais requisitados e em consequência atendem um número muito maior de pacientes, sendo assim o número de óbitos nas cidades mais ricas e populosas tende a ser maior. Pois podemos imaginar que em grandes cidades, principalmente naqueles com uma renda per capita alta, há uma vasta chance de migração de pacientes do interior para estas cidades.