Grácos CUSUM Ajustados ao Risco Para Monitoramento de Tempos de Sobrevivência: Uma Aplicação em Dados da Área Médica

Tamanho: px
Começar a partir da página:

Download "Grácos CUSUM Ajustados ao Risco Para Monitoramento de Tempos de Sobrevivência: Uma Aplicação em Dados da Área Médica"

Transcrição

1 Universidade Federal do Rio Grande do Norte Centro de Ciências Exatas e da Terra Departamento de Estatística Bacharelado em Estatística Grácos CUSUM Ajustados ao Risco Para Monitoramento de Tempos de Sobrevivência: Uma Aplicação em Dados da Área Médica Jocelânio Wesley de Oliveira Natal-RN Dezembro de 2013

2 Jocelânio Wesley de Oliveira Grácos CUSUM Ajustados ao Risco Para Monitoramento de Tempos de Sobrevivência: Uma Aplicação em Dados da Área Médica Monograa de Graduação apresentada ao Departamento de Estatística do Centro de Ciências Exatas e da Terra da Universidade Federal do Rio Grande do Norte como requisito parcial para a obtenção do grau de bacharel em Estatística. Orientadora: Prof. Dr a. Dione Maria Valença Co-orientador: Prof. Dr. Pledson Guedes de Medeiros Universidade Federal do Rio Grande do Norte UFRN Departamento de Estatística DEst Natal-RN Dezembro de 2013

3 Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial Centro de Ciências Exatas e da Terra CCET. Oliveira, Jocelânio Wesley de. Gráficos CUSUM ajustados ao risco para monitoramento de tempos de sobrevivência: uma aplicação em dados da área médica / Jocelânio Wesley de Oliveira. - Natal, f. : il. Orientadora: Profª. Drª. Dione Maria Valença. Co-Orientador: Prof. Dr. Pledson Guedes de Medeiros. Monografia (Graduação) Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Departamento de Estatística. 1. Análise de sobrevivência Monografia. 2. Controle estatístico de processos Monografia. 3. Controle de qualidade Monografia. 4. Gráfico RAST CUSUM Monografia. I. Valença, Dione Maria. II. Medeiros, Pledson Guedes de. III. Título. RN/UF/BSE-CCET CDU: :61

4

5 Agradecimentos À minha família pela imensa contribuição na minha formação como pessoa, e que me ofereceu suporte em cada diculdade com que me deparei. À cada professor do Departamento de Estatística que participou de algum modo na minha formação, seja na sala de aula ou fora dela. Aos professores mais presentes na minha jornada: Carla Vivacqua, André Pinho, Bernardo Borba, Joanlise Andrade, Idemauro Rodrigues e Jeanete Alves. Aos professores Pledson Guedes de Medeiros e Dione Maria Valença que foram meus orientadores neste trabalho, mas que conhecem bastante a minha batalha deste o momento inicial, e me ajudaram a traçar cada passo da melhor forma. Aos colegas de curso que se tornaram grandes amigos, em especial Cintya, Marilia, Jessica, Regina, Mariana, Ligia e Samuel, que me acompanham desde às disciplinas básicas do curso até os momentos de grande pressão e necessidade de estudar até altas horas. Aos amigos da residência universitária que conheci nesses vários anos e com quem dividi diversos momentos de alegria, em especial as que estão comigo desde os primeiros dias: Rosivânia, Raliny, Hortência e Rafaele. A todos que direta ou indiretamente me ajudaram a trilhar esse caminho.

6 Resumo Este trabalho envolve o uso de técnicas de Controle Estatístico de Processos (CEP) para monitoramento de tempos de sobrevivência. Diferentemente de aplicações na área industrial, em que a população em estudo é considerada homogênea, o CEP na área de saúde admite a heterogeneidade e deseja levar em consideração características particulares de pacientes que, antes de se submeterem a um procedimento médico, podem apresentar diferentes riscos de morte. Nessa perspectiva, alguns autores propõem o uso de um gráco de controle CUSUM ajustado ao risco (RAST CUSUM), para monitorar resultados clínicos em que a resposta é o tempo até a ocorrência de um evento e está sujeita a censura à direita. Nesta abordagem as diferenças entre as observações são consideradas por meio de um modelo de regressão de tempo de falha acelerado. Neste estudo simulamos um caso em que há duas características associadas aos indivíduos em estudo (covariáveis), a saber, idade e sexo, as quais inuenciam na resposta, para observar o comportamento deste grá- co de controle na detecção de diferentes desvios de qualidade. Além disso, ilustramos o uso do gráco em uma aplicação com dados da área médica encontrados na literatura. Palavras-chave: RAST CUSUM, Análise de Sobrevivência, Controle Estatístico de Processos.

7 Abstract This work involves the use of techniques of Statistical Process Control (SPC) to monitoring survival times. Unlike applications in the industrial area, in which the study population is considered homogeneous, the SPC in healthcare admits heterogeneity and wants to take into account particular characteristics of patients who, before undergoing a medical procedure, may present dierent risks of death. In this perspective, some authors propose the use of a Risk-Adjusted Survival Time CUSUM Chart (RAST CUSUM), to monitor clinical outcomes in which the response is the time until the occurrence of an event and is subject to right censoring. In this approach, the dierences between the observations are considered with an accelerated failure time regression model. In this work we simulated a case where there are two characteristics associated with individuals in the study (covariates), age and gender, which aect the response, to observe the behavior of this control chart in detecting dierent quality deviations. In addition, we illustrate the use of the RAST CUSUM in an application with medical data found in literature. Keywords: RAST CUSUM, Survival Analysis, Statistical Process Control.

8 Lista de guras 1 Ilustração de um esquema de censura de dados p Função de sobrevivência de uma Weibull com parâmetro de forma α = 2 e parâmetro de escala λ = p Dados simulados de uma distribuição log-logística com λ = 40, α = 8, ρ 1 = 0.7, γ = ( 0.01, 0.5), e censura xa em p Gráco RAST CUSUM monitorando a amostra exibida na gura 3... p Dados simulados de uma distribuição log-logística com λ = 40, α = 8, ρ 1 = 0.9, γ = ( 0.01, 0.5), e censura xa em p Gráco RAST CUSUM monitorando a amostra exibida na gura 5... p Tempos observados para os pacientes dos dados Worcester Heart Attack Study (WHAS) organizados de forma cronológica p Gráco RAST CUSUM monitorando os dados com ρ 1 = p Gráco RAST CUSUM monitorando os dados com ρ 1 = p. 29

9 Lista de tabelas 1 Tabela com os coecientes estimados do MTFA, erro padrão e p-valor associado p. 28

10 Lista de abreviaturas e siglas WHAS Worcester Heart Attack Study CEP Controle Estatístico de Processos CUSUM Cumulative Sum IM Infarto do Miocárdio WHAS Worcester Heart Attack Study AIC Critério de Informação de Akaike RAST CUSUM Risk-adjusted Survival Time CUSUM

11 Lista de símbolos δ i Indicador de censura dos dados α Parâmetro de forma da distribuição Weibull ou log-logística λ Parâmetro de escala da distribuição Weibull ou log-logística γ Vetor de coecientes de regressão associado ao MTFA λ 0 Valor do parâmetro de escala das distribuições sob controle λ 1 Valor do parâmetro de escala das distribuições fora de controle ρ 1 Valor da intensidade da mudança de qualidade

12 Sumário 1 Introdução p Considerações Iniciais p Objetivos p Análise de Sobrevivência p Fundamentação Teórica p Distribuições Utilizadas p Modelo de Tempo de Falha Acelerado p Gráco de Controle CUSUM p O Gráco CUSUM Usual p O Gráco CUSUM Ajustado ao Risco p Gráco RAST CUSUM Weibull p Gráco RAST CUSUM log-logístico p Exemplos Computacionais p Aplicação p Descrição dos Dados p Gráco RAST CUSUM p Considerações Finais p. 30 Referências p. 32

13 10 1 Introdução 1.1 Considerações Iniciais O Controle Estatístico de Processos (CEP) consiste em uma ferramenta estatística útil na investigação e monitoramento de processos ou fenômenos das mais variadas naturezas, especialmente na área industrial. Por exemplo, é de utilidade manter sob controle a qualidade de determinada mercadoria em uma linha de produção, o que pode ser feito observando os resultados de alguma variável de interesse com respeito ao produto. Com o passar do tempo o CEP, que era mais relacionado com a indústria, passou a ser considerado para variáveis relacionadas à área da saúde. Claramente, é de grande importância assegurar a qualidade dos procedimentos efetuados por hospitais e/ou da atuação de médicos individualmente. Com isso, os grácos de controle podem desempenhar um papel notável para constatar uma redução na qualidade dos serviços de um hospital, de forma geral, ou de alguma técnica especíca por este realizada, de modo que se possa intervir o quanto antes para descobrir as causas da perda de qualidade e assim poder repará-la. Várias utilizações do CEP na área relacionada à saúde são brevemente exemplicadas por Woodall (2006). Ele discorre que o uso do CEP no monitoramento e melhoria do desempenho de hospitais pode incluir variáveis como taxas de infecção, taxas de quedas de pacientes, ou tempos de espera de vários tipos, e cita alguns trabalhos que envolvem estas características. Também atenta para a diferença entre monitorar doenças crônicas e doenças contagiosas, ressaltando que estas últimas requerem a consideração de modelos de séries temporais para tratar dos efeitos sazonais. O autor ainda comenta que em muitas aplicações é necessário ajustar ao risco os resultados obtidos nos dados antes de construir um gráco de controle. Por exemplo, tempos de sobrevivência de pacientes após terem sido submetidos a uma cirurgia devem ser modelados adequadamente de acordo com a heterogeneidade dos indivíduos que realizam o procedimento cirúrgico. É importante levar em consideração, por exemplo, o sexo, a idade, as condições de saúde do paciente antes de se submeter à cirurgia, entre outras características particulares que podem estar ligadas

14 11 ao tempo de sobrevida. Faz-se necessária, portanto, a proposição de um modelo para os dados de sobrevivência que inclua as covariáveis de interesse associadas aos indivíduos. Com um modelo apropriado podemos então determinar métodos para monitorar ao longo do tempo a eciência da técnica cirúrgica. Nessa perspectiva, Sego et al. (2009) desenvolveram uma abordagem que utiliza o gráco de controle CUSUM (Cumulative Sum) ajustado para que incorpore o risco especíco de morte por complicações da cirurgia cardíaca que cada pessoa apresenta, o que é feito por meio de um modelo de regressão de tempo de falha acelerado. Neste trabalho fazemos uma apresentação dessa metodologia de controle de qualidade voltada para a área de análise de sobrevivência, ilustrando exemplos com dados simulados e dados reais. 1.2 Objetivos O objetivo principal deste trabalho é estudar a abordagem de Sego et al. (2009) para inspeção de qualidade voltada para a área médica e realizar algumas simulações a m de compreender o comportamento deste gráco. Temos ainda os seguintes objetivos especícos: Ilustrar a importância do uso de grácos de controle para avaliar a qualidade na área de saúde. Desenvolver o gráco CUSUM Ajustado ao Risco que trata de cada observação de modo particular, considerando as características individuais que são importantes na explicação da resposta, neste caso o tempo de sobrevivência. Elaborar no software R rotinas computacionais que executem esta tarefa do monitoramento ajustado ao risco. Aplicar as técnicas construídas em dados simulados e também em dados reais a m de ilustrar o método.

15 12 2 Análise de Sobrevivência 2.1 Fundamentação Teórica Dados de sobrevivência são constituídos por tempos até a ocorrência de um evento (geralmente chamado de falha) ou de sua censura, isto é, quando não obtemos de fato um valor da variável aleatória que está sendo observada. Por exemplo, em estudos com um tempo limite em que pode haver indivíduos para os quais o evento em observação não ocorreu até este tempo. Essas observações representam censuras à direita, já que o evento poderia ocorrer depois daquele tempo limite, ou seja se observássemos por mais tempo estes indivíduos, poderíamos alcançar o verdadeiro tempo de ocorrência. No caso contínuo, a variável T = tempo até falha possui portanto uma função de densidade f(t) e uma função de distribuição acumulada F (t) = P (T t). Dene-se então as seguintes funções: Função de Sobrevivência A função de sobrevivência da variável aleatória T é denida como: S(t) = P (T > t) = t f(x)dx = 1 F (t), para t 0 Esta função é não crescente e seu limite quando t tende a innito é zero. Função Risco A função risco, também chamada de função taxa de falha, da variável T, indicada por h(t) é denida como: h(t) = P (t < T t + t T > t) lim t 0 + t Esta função representa o risco instantâneo de que um indivíduo venha a falhar em um determinado tempo t, condicionado ao fato de que já sobreviveu até este tempo.

16 13 Mostra-se que as funções f, h, e S estão relacionadas da seguinte forma: h(t) = f(t) S(t) log(s(t)) = d ; dt f(t) = d(s(t)) dt Em um contexto prático, temos que os tempos observados em uma amostra (que podem ser de falha ou censura) nem sempre representam de fato observações da variável aleatória T i, para cada observação i, mas sim de uma variável denida como T i = min(t i, C i ), sendo C i uma variável aleatória que é o tempo de censura do indivíduo, associada à uma variável indicadora δ i denida como: δ i = { 1, se Ti C i (falha) 0, se T i > C i (censura) A ideia de censura é inerente a dados de sobrevivência e neste trabalho consideramos nas simulações a censura do tipo I, que é um caso particular da censura aleatória. Esta censura do tipo I ocorre quando no estudo há um tempo limite, e ao chegar esse momento o evento não ocorreu para alguns indivíduos. Neste caso o tempo observado é o próprio tempo da censura, e não verdadeiro valor da variável aleatória de interesse T. Se a distribuição de C não incorpora parâmetros de interesse do estudo, diz-se então que esta censura é não informativa. A Figura 1 a seguir ilustra um esquema de censura de dados. Figura 1: Ilustração de um esquema de censura de dados. Como podemos ver, a não observação do verdadeiro valor da variável T pode ocorrer

17 14 por diferentes motivos. As observações 3, 4 e 6, por exemplo, são censuras do tipo I, já que o tempo observado foi o tempo de duração do estudo, mas se este tivesse durado um pouco mais, a falha seria observada em algum momento para estes indivíduos (no caso da observação 6, seria necessário esperar um pouco mais que as outras para ocorrer a falha). O indivíduo 2 falhou exatamente no nal do estudo, o que faz desta observação um valor de fato da variável T e não uma censura. As observações 1 e 5 falharam bem antes do m do estudo, cando livres de censura. Já o indivíduo 7 falharia antes do m do estudo, entretanto por algum motivo foi observada uma censura antes do momento da falha, e neste caso temos um exemplo de censura aleatória. É comum na prática o interesse em explicar o tempo de sobrevivência de um determinado indivíduo com base em informações especícas do mesmo, daí surge a necessidade de atribuir um modelo de regressão que englobe as covariáveis em questão. 2.2 Distribuições Utilizadas Duas distribuições de probabilidade comumente empregadas na Análise de Sobrevivência, e que serão objeto de estudo neste trabalho, são a distribuição Weibull e a distribuição log-logística. Considerando a parametrização usada por Sego et al. (2009), se a variável aleatória T possui distribuição Weibull, sua função de densidade de probabilidade é dada por: f(t) = α λ ( ) α 1 [ ( ) α ] t t exp, para t 0 (2.1) λ λ sendo α > 0 e λ > 0 os parâmetros de forma e escala, respectivamente. Para esta variável aleatória, o valor esperado é λ Γ(1 + 1/α), e mostra-se que a função de sobrevivência de T é S(t) = exp [ ( t λ) α ]. Associada à esta distribuição Weibull temos uma distribuição conhecida como Valor Extremo ou Gumbel. Se T W eibull(α, λ), então Y = log(t ) possui distribuição Valor Extremo com parâmetros µ = log(λ) e σ = 1/α, e sua função de densidade de probabilidade é expressa por: f(y) = 1 σ exp [( y µ σ ) ( )] y µ exp σ (2.2) com σ > 0 e y e µ assumindo valores reais. Segue uma ilustração do comportamento da função de sobrevivência de uma variável com distribuição Weibull, na qual podemos notar

18 15 o seu perl decrescente. Sobrevivência Tempo Figura 2: Função de sobrevivência de uma Weibull com parâmetro de forma α = 2 e parâmetro de escala λ = 40. Considerando agora que a variável aleatória T possui distribuição log-logística, sua função de densidade de probabilidade é dada por: f(t) = α λ ( ) α 1 [ t 1 + λ ( ) α ] 2 t, para t 0 (2.3) λ sendo α > 0 e λ > 0 os parâmetros de forma e escala, respectivamente. Para esta variável aleatória, o valor esperado é λ π α(π/α) (se α > 1), e obtém-se que a função de sobrevivência de T é S(t) = [ 1 + ( t λ) α ] 1. Se tomarmos a variável Y = log(t ), temos que Y segue uma distribuição logística com parâmetros µ = log(λ) e σ = 1/α, e sua função de densidade de probabilidade é expressa por f(y) = 1 ( ) [ ( )] 2 y µ y µ σ exp 1 + exp. (2.4) σ σ A m de estimar parâmetros com base em uma amostra, é utilizado o método da máxima verossimilhança, que consiste basicamente em um problema de otimização de uma função objetivo. Seja D um conjunto de dados de sobrevivência constituído de tempos (t i ), indicadores de falha/censura (δ i ) e covariáveis (x i ), com os tempos referentes a uma

19 16 variável aleatória T, cuja distribuição depende de um vetor de parâmetros θ. Temos que a função de verossimilhança é dada por: L(θ) = n f(t i ; θ, x i ) δ i S(t i ; θ, x i ) 1 δ i (2.5) i=1 Assim, basta obter o valor (vetor de valores) ˆθ que maximiza esta função para termos estimativas de máxima verossimilhança para o verdadeiro θ. Por motivos computacionais, é preferível otimizar o logaritmo desta função, o que igualmente retorna o mesmo resultado. Segue que a função log-verossimilhança é calculada como: L (θ) = log(l(θ)) = i F log f(t i ; θ, x i ) + i C log S(t i ; θ, x i ) (2.6) em que F é o conjunto de índices relativos a indivíduos que falharam (δ i = 1), e C refere-se a indivíduos que tiveram os tempos censurados (δ i = 0). 2.3 Modelo de Tempo de Falha Acelerado Para entender a construção deste modelo, primeiro denimos uma variável aleatória Y = log(t ). Esta nova variável que depende da variável de interesse T pertence à família de posição e escala, e então vale a seguinte relação: Y = µ + σw sendo µ o parâmetro de posição, σ > 0 o parâmetro de escala, e W uma variável com uma determinada distribuição referida como distribuição padrão. Se consideramos σ constante, mas que o parâmetro de posição pode ser visto como uma função de covariáveis associadas aos indivíduos, é possível então determinar um modelo de regressão para este parâmetro do tipo µ(x) = xβ, em que x é um vetor de covariáveis e β é um vetor de parâmetros de regressão correspondente, o que resulta em um modelo log-linear para T com resíduo W. Para o caso em que T segue uma distribuição Weibull com parâmetros λ(x) = exp(xβ) e α = 1/σ, o modelo é da forma: Y = xβ + σw com W seguindo uma distribuição valor extremo padrão, que possui densidade baseada

20 17 em (2.2), tomando µ = 0 e σ = 1. No caso em que T segue uma distribuição log-logística com parâmetros λ(x) = exp(xβ) e α = 1/σ, o modelo segue de forma análoga, com W seguindo uma distribuição logística padrão, que possui densidade baseada em (2.4), tomando µ = 0 e σ = 1. No software R (R Development Core Team (2012)) está disponibilizado o pacote intitulado survival que realiza procedimentos de estimação pelo método da máxima verossimilhança em modelo de tempo de falha acelerado para as distribuições Weibull e log-logística (e também para outras possibilidades), e mostra como resultado os parâmetros da distribuição referente a Y = log(t ), o que pode ser facilmente retornado para os parâmetros originais da variável T, tendo em vista a relação log-linear estabelecida.

21 18 3 Gráco de Controle CUSUM Grácos de controle têm sido amplamente empregados como uma ferramenta para checar a estabilidade de processos industriais, e também de outras naturezas. O gráco CUSUM é uma alternativa interessante devido a sua característica de avaliar o processo como um todo, acumulando informações de todos os indivíduos, e não cada observação como algo isolado da amostra. A seguir temos esclarecimentos acerca desta técnica de controle de qualidade. 3.1 O Gráco CUSUM Usual A ideia central do gráco CUSUM para detecção de irregularidade no processo baseiase no escore calculado que representa a diferença entre a variável observada e o que se espera desta em condições de estacionariedade. Quanto mais vezes este escore for superior a zero, mais acumula erros na estatística CUSUM (estatística de teste), que pode então ultrapassar um limite superior, o que indicará um alerta de que o processo observado está retornando valores mais altos do que o normal. Analogamente, se os escores ocorrem mais vezes com valores negativos trazendo a estatística CUSUM abaixo de um limite inferior, temos um indício de que o processo está resultando em valores menores do que o normal. Em condições de controle, espera-se que esta estatística utue aleatoriamente em torno de zero. Em geral se utiliza a construção do CUSUM tabular para detectar mudanças em um parâmetro µ 0 referente a uma variável aleatória X, da seguinte forma: C + i = max{0, x i (µ 0 + K) + C + i 1 } (3.1) C i = max{0, (µ 0 + K) x i + C i 1 } (3.2) e os valores iniciais são C 0 + = C0 = 0. A constante K é referida como um valor de tolerância ou folga, e ca visível que o gráco pode sinalizar um desvio do parâmetro verdadeiro tanto para um valor maior quanto um menor. Mais detalhes sobre este gráco, sua utilização e melhoramentos podem ser encontrados em Montgomery (2004).

22 O Gráco CUSUM Ajustado ao Risco Diferentemente da forma usual de se calcular o escore para o gráco CUSUM simplesmente com base na diferença entre o valor observado e um valor médio da variável observada, Sego et al. (2009) utilizam-se da estipulação de um modelo para os tempos de sobrevivência que leva em conta as covariáveis associadas aos indivíduos, o que resulta em uma verossimilhança para cada observação, e desta forma é possível então utilizar a razão entre a verossimilhança para o estado fora de controle e a verossimilhança sob controle como forma de ponderar o afastamento do parâmetro com relação ao valor esperado sob controle para cada indivíduo. Como a razão de verossimilhanças assume apenas valores positivos, é utilizado como escore CUSUM o logaritmo natural desta razão, que compreende tanto negativos como positivos. Igualmente ao CUSUM usual, quanto mais vezes ocorrerem razões maiores do que 1 (que ao aplicar o logaritmo retornam um valor positivo), mais acumulamos a estatística de teste a ponto de ultrapassar um limite superior de aceitação, o que nos dá indícios de que o processo avaliado esteja acima do normal, e a mesma ideia ocorre para razões inferiores a 1 (resultados negativos do logaritmo) que acumulam valores negativos podendo tornar a estatística de teste menor que um limite inferior, o que aponta um processo com resultados abaixo do normal. A seguir temos um detalhamento da proposta de Sego et al. (2009) que descreve inicialmente uma forma geral de representar um gráco CUSUM Ajustado ao Risco (RA CUSUM): Considerando i = 1, 2,... os índices dos pacientes (em ordem de execução da operação) que serão monitorados pelo RA CUSUM, denimos L(θ i r i ) como a verossimilhança para o paciente i, sendo θ i um vetor de parâmetros e r i a medida de resposta (mortalidade, tempo de sobrevivência, etc.). Um modelo ajustado ao risco para dados históricos sob controle (training) é usado para predizer θ i0 para cada novo paciente que chega. No estado de controle, espera-se que θ i seja igual a θ i0. O modelo ajustado ao risco é escrito abaixo: θ i0 = g(ψ, U i ) (3.3) sendo U i um vetor de covariáveis que reete os fatores de risco para o paciente i e Ψ um vetor de parâmetros de regressão correspondentes. A forma básica do gráco CUSUM é dada por: Z 0 = 0 Z i = max(0, Z i 1 + W i ), i = 1, 2,... (3.4)

23 20 sendo Z i a estatística CUSUM, que é a estatística de teste usada para avaliar se o processo sai de controle, que acumula a cada nova observação na amostra uma contribuição do indivíduo que é contemplada pelo escore CUSUM descrito como W i, o qual engobla suas informações particulares. Um alarme é sinalizado se Z i > h, sendo h > 0 o limite de controle. A log-verossimilhança do escore RA CUSUM, baseada na fórmula original de Page (1954), quem primeiramente elaborou métodos de CUSUM, é dada por: [ ] L(θi1 r i ) W i = log L(θ i0 r i ) (3.5) sendo θ i1 o valor fora de controle nominal do parâmetro para o paciente i. O RA CUSUM é projetado para detectar uma mudança de θ i = θ i0 para θ i = θ i1. A mudança de θ i0 para θ i1 deve ser um desvio signicativo (e interpretável) na qualidade do processo que pretendemos detectar rapidamente. Sego et al. (2009) citam os estudos de Steiner et al. (2000, 2001) nos quais o gráco CUSUM é considerado para uma variável aleatória com distribuição Bernoulli, que indica se o indivíduo sobrevive mais que 30 dias após a operação ou não. Os autores propõem a utilização de um modelo de regressão logística para estimar as chances de cada indivíduo de sobreviver mais que 30 dias (o que caracteriza o sucesso da cirurgia), e tomam como base a razão da chance de sobreviver até 30 dias e a chance de sobreviver mais de 30 dias para determinar uma log-verossimilhança para o escore do gráco CUSUM. Finalmente, Sego et al. (2009) vericaram que o gráco CUSUM ajustado com um modelo de sobrevivência é mais eciente pelo fato de sinalizar um alarme mais rápido do que a proposta Bernoulli para diversos níveis de censura e principalmente quando o aumento na chance de mortalidade era pequeno. De fato, o gráco CUSUM é uma boa alternativa na detecção de pequenos desvios do parâmetro, com relação aos grácos de controle usuais, sendo portanto recomendado para este tipo de aplicação, em que se tem interesse em detectar desvios sutis na qualidade. Grigg e Farewell (2004) descrevem uma visão geral sobre grácos de controle ajustados ao risco. 3.3 Gráco RAST CUSUM Weibull Com base na notação usada por Sego (2006), para o caso em que T W eibull(α, λ) o modelo de tempo de falha acelerado é da forma: log(t ) = µ + γ x + σv (3.6)

24 21 em que α = 1/σ e λ = e µ são os parâmetros de forma e escala de T ignorando a inuência de covariáveis (x = 0), γ é um vetor de coecientes de regressão e V segue uma distribuição valor extremo padrão. Dessa maneira, tomando β = γ, a função de sobrevivência condicionada às covariáveis do indivíduo i é dada por: { [ ] ti exp(β α } x i ) S(t i x i ) = exp λ (3.7) Com o processo sob controle, consideramos que o parâmetro de forma α é constante, e o parâmetro de escala assume um valor λ 0, ambos estimados a partir de dados históricos, e temos interesse em detectar uma mudança de λ 0 para λ 1 = p 1 λ 0 à medida que novos indivíduos são observados. Sego (2006) calculou, então, o escore CUSUM, espelhado em (3.5) que recai na seguinte fórmula: [ ] W i = (1 ρ α ti exp(β α x i ) 1 ) δ i α log ρ 1 (3.8) λ 0 Finalmente podemos monitorar o parâmetro λ a partir da estatística CUSUM descrita em (3.4) com auxílio de W i. 3.4 Gráco RAST CUSUM log-logístico Prosseguindo com notação similar à empregada por Sego (2006), para o caso em que T log-logística(α, λ) o modelo de tempo de falha acelerado aparece de forma quase idêntica ao caso Weibull, com a diferença que a distribuição da variável V é logística padrão. A função de sobrevivência condicionada às covariáveis é dada por: S(t i x i ) = [ 1 + ( ) ti exp(β α ] 1 x i ) (3.9) λ e o escore CUSUM obtido é nalmente descrito por: W i = αδ i log ρ δ i { [ log 1 + ( ) ti exp(β α ] x i ) λ 0 [ log 1 + ( ) ti exp(β α ]} x i ) ρ 1 λ 0 (3.10) De posse desta expressão, podemos então fazer o monitoramento do parâmetro λ a partir da estatística CUSUM descrita em (3.4).

25 22 4 Exemplos Computacionais Com o propósito de compreender o método apresentando por Sego (2006), foram realizadas simulações de dados no software R para testar o uso do gráco RAST CUSUM. Os dados são gerados para atender ao modelo especicado em (3.6). Para o modelo Weibull, xamos valores sob controle para os parâmetros µ e σ, e consideramos duas covariáveis (sexo e idade) às quais está associado o vetor de parâmetros de regressão γ também xado previamente (Sego (2006) considera em seu trabalho apenas uma covariável, o escore Parsonnet). Tomando um tamanho de amostra n 0, são gerados n 0 valores de uma distribuição Bernoulli com parâmetro 0.5 para representar a variável sexo, de modo a ter aproximadamente a mesma quantidade de pessoas para cada sexo, e n 0 valores de idade são gerados a partir de uma distribuição Normal(40, 10 2 ), tomando apenas a parte inteira do resultado. Em seguida, n 0 valores da variável V são obtidos de uma distribuição valor extremo padrão, e nalmente, utilizamos a relação log-linear para retornar os valores da variável T. Neste exemplo a censura é considerada xa no tempo 30, a m de reetir a aplicação considerada pelo autor, em que os pacientes são acompanhados por 30 dias após a realização de uma cirurgia. Assim, obtemos o conjunto de dados nal sob controle, com os tempos observados T i = min{t i, 30}, o indicador δ i e o vetor de covariáveis para sexo e para idade. Feito isso, obtemos dados fora de controle para anexar com estes sob controle, e para tanto consideramos alguns valores de ρ 1 para representar a mudança na qualidade que queremos detectar (neste caso ρ 1 é um número menor que 1, já que uma redução no parâmetro de escala (tanto no caso da distribuição log-logística quanto da Weibull) acarreta um tempo médio de sobrevivência menor, e com isso, o processo passa a ter uma qualidade inferior), e então geramos um conjunto de dados com n 1 indivíduos, com base nesse mesmo procedimento, mas tomando µ 1 = log(λ 1 ) = log(ρ 1 λ 0 ), em que λ 0 é o valor sob controle para o parâmetro de escala. Utilizando o método de estimação implementado no pacote survival com os dados sob controle, obtemos as estimativas de cada parâmetro, que são tidas como valores verdadei-

26 23 ros para aplicar posteriormente no gráco CUSUM. Para gerar dados de uma log-logística o procedimento é semelhante, diferindo apenas na variável V, que é tomada de uma distribuição logística padrão. Seguem abaixo ilustrações de alguns comportamentos do RAST CUSUM para o modelo log-logístico, nos quais foi considerado um tamanho de amostra n 0 = n 1 = 100, sendo assim, o ponto de mudança de qualidade é no índice 101. Ao observar o gráco apenas dos tempos de sobrevivência não ca evidente que houve uma mudança de qualidade, principalmente porque isso não se deve apenas ao valor observado para o tempo, mas também a uma série de fatores associados aos indivíduos que explicam o tempo de sobrevida. Com isso, ca clara a importância de se usar métodos que detectem de forma numérica uma mudança de qualidade com base em informações obtidas nos dados, de modo a eliminar subjetividades no julgamento de que ocorreu uma mudança no desempenho do processo que está sob avaliação. Tempo Paciente Figura 3: Dados simulados de uma distribuição log-logística com λ = 40, α = 8, ρ 1 = 0.7, γ = ( 0.01, 0.5), e censura xa em 30. A seguir temos o gráco RAST CUSUM monitorando essa amostra, o qual pretende detectar uma redução de 30% no parâmetro λ (o que corresponde ao valor de ρ 1 = 0.7) e se mostra eciente já que não demorou a ultrapassar o limite de controle, e a estatística de teste continuou crescendo indenidamente após o ponto de alerta. A linha vermelha horizontal marca o valor 5 no eixo y, que é um limite de controle geralmente considerado como alerta (mas é importante estudar cada caso a m de obter um limite ideal que torne o gráco mais eciente em seu propósito), e a linha vertical marca o ponto 100, onde a última observação sob controle foi registrada.

27 24 Escore Z Paciente Figura 4: Gráco RAST CUSUM monitorando a amostra exibida na gura 3. Espera-se que para mudanças mais intensas (ρ 1 = 0.3 ou ρ 1 = 0.5, por exemplo), o gráco consiga rapidamente identicar o desvio da qualidade, podendo ocorrer um alarme já na primeira observação. Mudanças mais sutis (ρ 1 0.9, por exemplo) são mais difíceis de detectar, levando mais tempo, mas ainda assim o método se mostra capaz nestes casos, como se pode ver nas ilustrações seguintes. Tempo Paciente Figura 5: Dados simulados de uma distribuição log-logística com λ = 40, α = 8, ρ 1 = 0.9, γ = ( 0.01, 0.5), e censura xa em 30.

28 25 Novamente, vemos que é difícil perceber a mudança de qualidade com base apenas nos tempos, mas o gráco RAST CUSUM consegue detectar com rmeza a ocorrência dessa mudança que representa uma redução de apenas 10% no parâmetro de escala da distribuição, o qual é diretamente ligado ao tempo médio de sobrevivência da variável em estudo. O gráco demora em torno de 10 observações para sinalizar um alarme de que houve uma mudança no processo, o que é satisfatório. Escore Z Paciente Figura 6: Gráco RAST CUSUM monitorando a amostra exibida na gura 5. De modo geral, vemos que o método proposto é de fato capaz de constatar diferentes desvios de qualidade ρ 1, e embora demore mais para os casos em que este valor é próximo de 1 (o que representa mudanças de qualidade sutis), ele consegue sinalizar um alerta de mudança. Deve-se atentar também para o fato de que o valor estipulado para o limite de controle h = 5 é apenas um exemplo da utilização do gráco, e que é possível determinar um valor ideal para cada situação estudada, de forma a se obter um desempenho ótimo do método de detecção.

29 26 5 Aplicação 5.1 Descrição dos Dados Os dados aqui utilizados são descritos em Hosmer et al. (2008), e referem-se a um estudo realizado pelo Departamento de Cardiologia da Escola de Medicina da Universidade de Massachusetts, o qual foi conduzido pelo Dr. Robert J. Goldberg. Eles observaram o tempo de sobrevida de pacientes internados em hospitais de Worcester que apresentaram infarto do miocárdio (IM) e foram submetidos a um procedimento médico. Os dados contém os tempos de sobrevivência observados de 500 pacientes e também características particulares dos indivíduos as quais podem ter inuência nestes tempos. Neste trabalho zemos uma análise destas variáveis que sugere o modelo Weibull como representativo e consideramos as variáveis mais signicativas, de acordo com o procedimendo de seleção de variáveis stepwise, algumas do tipo numérico, como idade (age, em anos), frequência cardíaca inicial (hr, medida em batidas por minuto), índice de massa corporal (bmi). Há também variáveis binárias que indicam algumas condições de saúde do paciente: histórico de doença cardiovascular (cvd, 0 = Não; 1 = Sim), brilação atrial (afb, 0 = Não; 1 = Sim), choque cardiogênico (sho, 0 = Não; 1 = Sim), complicações cardíacas congestivas (chf, 0 = Não; 1 = Sim), e bloqueio cardíaco completo (av3, 0 = Não; 1 = Sim). Inicialmente podemos observar um comportamento decrescente ao longo do tempo que pode ser indício de que houve em algum momento uma redução na qualidade do atendimento, acarretando tempos de sobrevivência menores do que o esperado para os pacientes, como pode ser visualizado na Figura 7 exibida na página seguinte. Até em torno da observação 150 o comportamento dos tempos parece ser similar e superior às observações seguintes na amostra, o que nos faz considerar esses dados como a amostra sob controle usada no propósito de monitoramento da qualidade. Como vimos nos exemplos com dados simulados, o comportamento da série de tempos de sobrevivência observados não necessariamente denuncia a ocorrência de um desvio de qualidade. O gráco dos tempos para esses dados parece sugerir que com o passar

30 27 Tempo Paciente Figura 7: Tempos observados para os pacientes dos dados Worcester Heart Attack Study (WHAS) organizados de forma cronológica. do tempo os tempos observados estão sendo menores, e é de interesse então investigar se isso está ocorrendo devido à redução na qualidade do atendimento, ou se pode ser explicado por características particulares dos indivíduos em questão que justicam a observação de tempos inferiores. Sendo assim, o gráco RAST CUSUM, que é baseado na verossimilhança do MTFA pode ser útil e ideal no julgamento destes dados. 5.2 Gráco RAST CUSUM Utilizamos o gráco para detectar diferentes desvios de qualidade ρ 1, tomando as primeiras 150 observações como a amostra sob controle, como cou sugerido ao se observar o comportamento da série de tempos de sobrevivência observados na amostra. Para tanto, os coecientes do MTFA ajustado com a distribuição Weibull são dados na tabela mostrada na página seguinte. Foi utilizado o procedimento de seleção de variáveis stepwise (combinação de forward com backward) iniciando com o modelo completo, com auxílio de uma rotina disponibilizada no software R, que leva em conta o AIC (Critério de Informação de Akaike), e ao nal retorna o modelo que apresenta o menor AIC.

31 28 Tabela 1: Tabela com os coecientes estimados do MTFA, erro padrão e p-valor associado. Coeciente Valor estimado Erro padrão p-valor (Intercepto) e-10 age e-06 hr e-03 bmi e-02 cvd e-03 afb e-02 sho e-02 chf e-03 av e-02 Log(scale) e-08 Testamos 5 valores para ρ 1 (0.1, 0.3, 0.5, 0.7 e 0.9), e nestes casos o mais chamativo é o primeiro, que representa uma mudança de qualidade muito forte, uma redução de 90% no parâmetro de escala da distribuição. O gráco RAST CUSUM é exibido a seguir: Escore Z Paciente Figura 8: Gráco RAST CUSUM monitorando os dados com ρ 1 = 0.1. O primeiro sinal é detectado na observação 430 (na amostra completa), e corresponde a um indivíduo do sexo masculino com 62 anos de idade, o qual foi internado em 22 de setembro de 2001, permaneceu internado por 6 dias, e sobreviveu 12 dias além disso. Entende-se que esse tempo de sobrevivência é de fato pequeno, podendo já representar

32 29 uma deciência na qualidade de atendimento à este paciente (embora a idade já avançada presuma um tempo esperado de sobrevida baixo), mas vale salientar que o gráco acumulou anteriormente informações de diversos indivíduos até sinalizar um alarme nesse ponto. O gráco permanece por algumas observações indicando que o processo está fora de controle, mas volta ao estado sob controle na observação 433, o que indica que esta provável falha de qualidade possa ter sido percebida pela equipe dos hospitais e foi então reparada. Tendo em vista que o gráco apresenta também uma pequena probabilidade de sinalizar um alarme falso, é necessário de fato investigar com cautela a situação a m de descobrir causas que podem ter levado à redução de qualidade dos serviços. Escore Z Paciente Figura 9: Gráco RAST CUSUM monitorando os dados com ρ 1 = 0.3. Para o RAST CUSUM considerando ρ 1 = 0.3, o sinal é detectado somente na observação 493, e corresponde a um indivíduo do sexo feminino com 55 anos de idade, o qual foi internado em 13 de dezembro de 2001, tendo sobrevivido apenas 2 dias ainda no hospital. Assim como o gráco anterior, este acaba voltando a indicar que o processo está sob controle em algum momento. Contudo, tais constatações sugerem a atenção dos responsáveis pela qualidade dos serviços quanto à investigação de possíveis problemas que podem explicar o que foi observado com o gráco. Vemos que em ambos os grácos não há detecção de mudança até a observação 400, algo que parecia muito sugestivo na Figura 7 com a queda gradativa nos tempos registrados, isto é, uma análise subjetiva que desconsidera as informações especícas dos pacientes pode levar à conclusões errôneas.

33 30 6 Considerações Finais Com as aplicações em dados simulados podemos ver que esta técnica de controle baseada em verossimilhança de modelos é competente. Entendemos ainda que o limite de controle 5 comumente utilizado em grácos CUSUM não é sempre ideal para o monitoramento em dados de sobrevivência, por retardar a detecção de mudança em certos casos, o que sugere a realização de simulações a m de compreender que limites devem ser usados em situações diversas. Na análise nos dados reais de pacientes internados por problema cardíaco o gráco RAST CUSUM detectou em algum momento uma mudança ρ 1 = 0.1, que representa uma redução de 90% no valor do parâmetro de escala λ 0, o que compremete drasticamente o tempo médio de sobrevivência. Claramente isso chama a atenção para investigação de problemas de ordem técnica que possam ter ocasionado o fenômeno, e evidencia a capacidade do gráco de apontar uma mudança de qualidade com base em informações especícas dos pacientes, e não só o tempo de sobrevida registrado. Vale ressaltar que embora o limite de controle adotado h = 5 pode não ser um valor ótimo para a situação, mas é uma exemplicação da capacidade do gráco de constatar desvios no parâmetro de interesse. Outro ponto a ser considerado é a característica retrospectiva do estudo, e que os indivíduos que entraram mais cedo são contemplados com um maior tempo de observação, sendo assim é natural que os tempos de sobrevivência observados para os últimos pacientes fossem um pouco menores. Ainda assim, o gráco é construído para levar em conta as covariáveis associadas à esses tempos, e isso ajuda a eliminar uma interpretação indevida na avaliação da qualidade com base apenas no valor observado da variável tempo desconsiderando características particulares dos indivíduos. Outra discussão relevante diz respeito à organização dos dados. Nesse exemplo levamos em conta a data de internação de cada paciente, tendo em vista que é esse o momento em que o hospital realizou o procedimento de emergência, e é essa qualidade que queremos avaliar. Contudo, é necessário acompanhar o indivíduo até observar sua falha ou censura em algum momento, e é só nesse ponto que suas informações podem ser incluídas no

34 31 gráco de controle. Essa aplicação reete portanto uma visão retrospectiva de controle de processos, mas obviamente é possível utilizar essa ferramenta para um propósito de monitoramento da qualidade prospectivamente, e tal ideia traz diversos questionamentos sobre de que maneira esta tarefa deve ser executada de modo a retornar resultados conáveis. Sego et al. (2009) evidenciam diversos aspectos que podem comprometer a habilidade do gráco RAST CUSUM, tais como o tamanho da amostra de treinamento usada para obter estimativas dos parâmetros sob controle, que deve ser grande o suciente para fornecer estimativas conáveis, e que de preferência deve ser constituída por indivíduos com tempos de sobrevivência não muito longos, pois isso pode confundir o modelo com a ideia de riscos competitivos. Com isso, surge a ideia de considerar modelos mais apropriados para levar em conta indivíduos com longos tempos de sobrevivência, o que pode ser feito com modelos de sobrevivência com fração de cura. Tendo em vista que a principal utilidade de um gráco de controle é no aspecto prospectivo, os autores também comentam sobre a atualização do modelo a cada nova observação, ressaltando que é preferível manter um modelo bem ajustado com uma amostra xa a m de evitar mistura de indivíduos sob controle e fora de controle na construção do modelo, o que seria inadequado. Portanto, é importante avaliar se o modelo obtido é bem adequado à situação a m de obter conclusões úteis com o gráco de controle. Como sugestão para trabalhos futuros, pode ser feita uma análise de desempenho para obtenção de limites de controle ótimos em diferentes ocasiões, no intuito de melhorar o poder de detecção do gráco. Também é interessante estudar qual a melhor forma de inserir uma nova observação no gráco, no propósito de monitoramento prospectivo. Além disso, surge também o interesse em considerar outros modelos de sobrevivência em vez do MTFA, como por exemplo, modelos que levam em conta a possibilidade de uma fração de cura nos dados, algo que ocorre na prática em algumas situações. Também podem ser considerados outros grácos de controle capazes de sinalizar pequenos desvios, como exemplo, o gráco EWMA.

35 32 Referências GRIGG, O.; FAREWELL, V. An overview of risk-adjusted charts. Journal of the Royal Statistical Society: Series A (Statistics in Society), v. 167, n. 3, p , HOSMER, David W. et al. Applied Survival Analysis: Regression Modeling of Time to Event Data. Second Edition, John Wiley and Sons Inc., New York, NY MONTGOMERY, D. C. Introdução ao Controle Estatístico da Qualidade. LTC, PAGE, E. S. Continuous inspection schemes. Biometrika, p , R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, ISBN Disponível em: < SEGO, Landon H. Applications of control charts in medicine and epidemiology Tese de Doutorado. Virginia Polytechnic Institute and State University. SEGO, Landon H.; REYNOLDS JR, Marion R.; WOODALL, William H. Risk adjusted monitoring of survival times. Statistics in medicine, v. 28, n. 9, p , STEINER, Stefan H. et al. Monitoring surgical performance using risk-adjusted cumulative sum charts. Biostatistics, v. 1, n. 4, p , STEINER, Stefan H.; COOK, Richard J.; FAREWELL, Vern T. Risk-adjusted monitoring of binary surgical outcomes. Medical Decision Making, v. 21, n. 3, p , WOODALL, William H. The use of control charts in health-care and public-health surveillance. Journal of Quality Technology, v. 38, n. 2, p , 2006.

Ajuste e comparação de modelos para dados grupados e censurados

Ajuste e comparação de modelos para dados grupados e censurados Ajuste e comparação de modelos para dados grupados e censurados 1 Introdução José Nilton da Cruz 1 Liciana Vaz de Arruda Silveira 2 José Raimundo de Souza Passos 2 A análise de sobrevivência é um conjunto

Leia mais

MONITORAMENTO DA SOBREVIVÊNCIA DE PORTADORES DE CÂNCER DE BOCA E OROFARINGE NO RN VIA GRÁFICO RAST CUSUM

MONITORAMENTO DA SOBREVIVÊNCIA DE PORTADORES DE CÂNCER DE BOCA E OROFARINGE NO RN VIA GRÁFICO RAST CUSUM UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO MONITORAMENTO DA SOBREVIVÊNCIA DE PORTADORES DE CÂNCER DE BOCA E OROFARINGE NO RN VIA GRÁFICO RAST

Leia mais

UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA. Eduardo Yoshio Nakano 1

UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA. Eduardo Yoshio Nakano 1 1 UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA Eduardo Yoshio Nakano 1 1 Professor do Departamento de Estatística da Universidade de Brasília, UnB. RESUMO. Em estudos médicos, o comportamento

Leia mais

Estimadores, pontual e intervalar, para dados com censuras intervalar

Estimadores, pontual e intervalar, para dados com censuras intervalar Estimadores, pontual e intervalar, para dados com censuras intervalar Débora Ohara, Estela Maris Pereira Bereta, Teresa Cristina Martins Dias Resumo Dados com censura intervalar ocorrem com frequência

Leia mais

Exemplos Equações de Estimação Generalizadas

Exemplos Equações de Estimação Generalizadas Exemplos Equações de Estimação Generalizadas Bruno R. dos Santos e Gilberto A. Paula Departamento de Estatística Universidade de São Paulo, Brasil giapaula@ime.usp.br Modelos Lineares Generalizados dos

Leia mais

Dimensionamento de amostras para regressão logística

Dimensionamento de amostras para regressão logística Dimensionamento de amostras para regressão logística Arminda Lucia Siqueira 1 Flávia Komatsuzaki 1 Introdução Regressão logística é hoje padrão de análise para muitos estudos da área da saúde cuja variável

Leia mais

Modelo de regressão estável aplicado a econometria

Modelo de regressão estável aplicado a econometria Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos

Leia mais

Disciplina de Modelos Lineares Professora Ariane Ferreira

Disciplina de Modelos Lineares Professora Ariane Ferreira Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável

Leia mais

Análise de Sobrevivência. Exercícios - Capítulo 1

Análise de Sobrevivência. Exercícios - Capítulo 1 Análise de Sobrevivência Profa. Suely Ruiz Giolo Departamento de Estatística - UFPR Exercícios - Capítulo 1 1. Suponha que seis ratos foram expostos a um material cancerígeno. Os tempos até o desenvolvimento

Leia mais

2 FUNDAMENTACÃO TEÓRICA

2 FUNDAMENTACÃO TEÓRICA 2 FUNDAMENTACÃO TEÓRICA Este capítulo apresenta os modelos de séries temporais chamados estruturais, nos quais o valor das observações é visto como composto de uma parte sistemática, modelada por uma equação

Leia mais

Teste de % de defeituosos para 1 amostra

Teste de % de defeituosos para 1 amostra DOCUMENTO OFICIAL DO ASSISTENTE DO MINITAB Este documento é de uma série de papéis que explicam a pesquisa conduzida por estatísticos da Minitab para desenvolver os métodos e as verificações de dados usadas

Leia mais

Utilizando a função auto.arima em modelos de séries temporais

Utilizando a função auto.arima em modelos de séries temporais Utilizando a função auto.arima em modelos de séries temporais Erasnilson Vieira Camilo 1 2 Marina Rodrigues Maestre 1 Rick Anderson Freire Mangueira 1 Elias Silva de Medeiros 1 Cristian Villegas 1 1 Introdução

Leia mais

Para ajudar a interpretar os resultados, o Cartão de Relatórios do Assistente do teste de % de defeituosos para 1 amostra exibe os seguintes

Para ajudar a interpretar os resultados, o Cartão de Relatórios do Assistente do teste de % de defeituosos para 1 amostra exibe os seguintes Este documento é de uma série de papéis que explicam a pesquisa conduzida por estatísticos da Minitab para desenvolver os métodos e as verificações de dados usadas no assistente no software estatístico

Leia mais

Aplicação do modelo de Quase-Verossimilhança

Aplicação do modelo de Quase-Verossimilhança Aplicação do modelo de Quase-Verossimilhança Fábio Hideto Oki 1 1 Introdução O câncer é uma doença de proporção mundial, atingindo só no Brasil cerca de 350 mil pessoas por ano e é caracterizado pela mutação

Leia mais

Uma investigação de métodos para o estudo da influência da incerteza em dados experimentais de vida acelerada

Uma investigação de métodos para o estudo da influência da incerteza em dados experimentais de vida acelerada Uma investigação de métodos para o estudo da influência da incerteza em dados experimentais de vida acelerada Autores Maria Celia de Oliveira Papa Orientador Alvaro Jose Abackerli 1. Introdução Uma das

Leia mais

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Gilberto Rodrigues Liska 1 5 Fortunato Silva de Menezes 2 5 Marcelo Ângelo Cirillo 3 5 Mario Javier Ferrua

Leia mais

Erros com Distribuição Log-Beta-Weibull em Regressões Lineares

Erros com Distribuição Log-Beta-Weibull em Regressões Lineares UNIVERSIDADE DE BRASÍLIA DEPARTAMENTO DE ESTASTÍSTICA Monograa Erros com Distribuição Log-Beta-Weibull em Regressões Lineares Helson Barcelos Resende Orientador: Antônio Eduardo Gomes Brasília, 9 de dezembro

Leia mais

Meta-análise: comparação de proporções para o caso de duas amostras independentes

Meta-análise: comparação de proporções para o caso de duas amostras independentes Meta-análise: comparação de proporções para o caso de duas amostras independentes Arminda Lucia Siqueira 1 Edna Afonso Reis 1 Ilka Afonso Reis 1 Luana Sílvia dos Santos 1 Pollyanna Vieira Gomes da Silva

Leia mais

Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações

Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações Introdução Arminda Lucia Siqueira Dimensionamento de amostras, importante elemento

Leia mais

Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem

Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem Olinda Fátima dos Santos 1 Carla Regina Guimarães Brighenti 1 1-Introdução A utilização de informação a priori em inferência

Leia mais

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG Robson de Souza Vieira 1 ; Rogério Silva Pimentel 1 ; Emerson Wruck 2

Leia mais

Modelos de fração de cura de mistura e não-mistura na distribuição Weibull Modicada Generalizada

Modelos de fração de cura de mistura e não-mistura na distribuição Weibull Modicada Generalizada Modelos de fração de cura de mistura e não-mistura na distribuição Weibull Modicada Generalizada Eduardo Cardoso de Oliveira Orientador: Prof. Dr. Jorge Alberto Achcar Coorientador: Prof. Dr. Mario Hissamitsu

Leia mais

Eficiência do gráfico de controle EWMA em função de diferentes quantidades e posições de causas especiais

Eficiência do gráfico de controle EWMA em função de diferentes quantidades e posições de causas especiais Eficiência do gráfico de controle EWMA em função de diferentes quantidades e posições de causas especiais João Marcos Ramos de Moraes (UFV) jaum_55@hotmail.com José Ivo Ribeiro Júnior (UFV) jivo@ufv.br

Leia mais

XIX CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 27 de Setembro a 01 de Outubro

XIX CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 27 de Setembro a 01 de Outubro COMPARAÇÃO DOS MÉTODOS DE VERIFICAÇÃO DO AJUSTE DA DISTRIBUIÇÃO GUMBEL A DADOS EXTREMOS CARLOS JOSÉ DOS REIS 1, LUIZ ALBERTO BEIJO 2,GILBERTO RODRIGUES LISKA 3 RESUMO A distribuição Gumbel é muito aplicada

Leia mais

Gráficos de controle Cusum e MMEP

Gráficos de controle Cusum e MMEP Gráficos de controle Cusum e MMEP CE219 - Controle Estatístico de Qualidade Prof. Cesar Taconeli taconeli@ufpr.br Prof. Walmes Zeviani walmes@ufpr.br Laboratório de Estatística e Geoinformação Departamento

Leia mais

TEORIA DE VALORES EXTREMOS APLICADA NA ANÁLISE DE TEMPERATURA MÁXIMA EM URUGUAIANA, RS.

TEORIA DE VALORES EXTREMOS APLICADA NA ANÁLISE DE TEMPERATURA MÁXIMA EM URUGUAIANA, RS. TEORIA DE VALORES EXTREMOS APLICADA NA ANÁLISE DE TEMPERATURA MÁXIMA EM URUGUAIANA, RS. 1. INTRODUÇÃO Nosso planeta seguiu uma evolução desde sua origem, passando por transformações significativas em sua

Leia mais

3 Modelos Comparativos: Teoria e Metodologia

3 Modelos Comparativos: Teoria e Metodologia 3 Modelos Comparativos: Teoria e Metodologia Para avaliar o desempenho do modelo STAR-Tree, foram estimados os modelos Naive, ARMAX e Redes Neurais. O ajuste dos modelos ARMAX e das redes neurais foi feito

Leia mais

ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS

ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS 1. A tabela a seguir apresenta o tempo, em dias, até a ocorrência dos primeiros sinais de alterações indesejadas no estado geral de saúde de 45 pacientes

Leia mais

Métodos estatísticos em epidemiologia: algumas observações sobre pesquisa cĺınica

Métodos estatísticos em epidemiologia: algumas observações sobre pesquisa cĺınica Métodos estatísticos em epidemiologia: algumas observações sobre pesquisa Programa de Computação Científica - PROCC ENSP - Dept. de Epidemiologia e Métodos Quantitativos em Saúde 1/12/2006 Outline Um exemplo

Leia mais

Um Estudo do Comportamento dos Gráficos de Controle Construídos Via Metodologia de Geoestatística

Um Estudo do Comportamento dos Gráficos de Controle Construídos Via Metodologia de Geoestatística XIII SIMPEP - Bauru, SP, Brasil, 6 a 8 de Novembro de 006 Um Estudo do Comportamento dos Gráficos de Controle Construídos Via Metodologia de Geoestatística Fabiane Renata de Santana Yassukawa (UFMG) fabianesy@yahoo.com.br

Leia mais

MODELOS ARIMA PARA MONITORAÇÃO DA QUALIDADE DA PRODUÇÃO DA INDÚSTRIA TÊXTIL OESTE LTDA

MODELOS ARIMA PARA MONITORAÇÃO DA QUALIDADE DA PRODUÇÃO DA INDÚSTRIA TÊXTIL OESTE LTDA MODELOS ARIMA PARA MONITORAÇÃO DA QUALIDADE DA PRODUÇÃO DA INDÚSTRIA TÊXTIL OESTE LTDA Orientadora: Dra. Maria Emília Camargo Co-Orientadora: Dra. Suzana Leitão Russo Bolsistas de Apoio Técnico: Jonas

Leia mais

Modelos Lineares Mistos

Modelos Lineares Mistos Modelos Lineares Mistos Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 131 99, Brasil email: lucambio@ufpr.br Setembro de 1 Introdução O modelo de regressão linear

Leia mais

DIFERENTES ESTRATÉGIAS DE AMOSTRAGENS PARA REDUZIR O EFEITO DA AUTOCORRELAÇÃO NO DESEMPENHO DO GRÁFICO DA MÉDIA

DIFERENTES ESTRATÉGIAS DE AMOSTRAGENS PARA REDUZIR O EFEITO DA AUTOCORRELAÇÃO NO DESEMPENHO DO GRÁFICO DA MÉDIA XXX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO Maturidade e desafios da Engenharia de Produção: competitividade das empresas, condições de trabalho, meio ambiente. São Carlos, SP, Brasil, 2 a5 de outubro

Leia mais

Inferência Bayesiana Exata para Processos de Cox Level-Set

Inferência Bayesiana Exata para Processos de Cox Level-Set Inferência Bayesiana Exata para Processos de Cox Level-Set Bárbara da Costa Campos Dias 1 Flávio Bambirra Gonçalves 2 Resumo Este trabalho propõe uma metodologia de inferência exata para processos de Cox

Leia mais

Disciplina de Modelos Lineares

Disciplina de Modelos Lineares Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique

Leia mais

Mais Aplicações sobre cálculo de probabilidades

Mais Aplicações sobre cálculo de probabilidades Mais Aplicações sobre cálculo de probabilidades Prof. Hemílio Fernandes Campos Coêlho Departamento de Estatística - Universidade Federal da Paraíba - UFPB Noções de Epidemiologia Em algumas aplicações

Leia mais

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas. 1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento

Leia mais

Palavras-Chave: Gráficos de Controle Especiais, Geoestatística.

Palavras-Chave: Gráficos de Controle Especiais, Geoestatística. Estudo de Cartas Especiais e Geoestatística no Controle Estatístico de Processos Bruna Fernanda Viotto Oliveira¹ Edilson Ferreira Flores² RESUMO O presente estudo teve como objetivo explorar as técnicas

Leia mais

4 Análise de Desempenho dos Gráficos tipo Shewhart para o Controle Estatístico da Dispersão

4 Análise de Desempenho dos Gráficos tipo Shewhart para o Controle Estatístico da Dispersão 4 Análise de Desempenho dos Gráficos tipo Shewhart para o Controle Estatístico da Dispersão Neste capítulo são obtidas as medidas desempenho dos gráficos de controle de Shewhart descritos no Capítulo 2

Leia mais

Predição do preço médio anual do frango por intermédio de regressão linear

Predição do preço médio anual do frango por intermédio de regressão linear Predição do preço médio anual do frango por intermédio de regressão linear João Flávio A. Silva 1 Tatiane Gomes Araújo 2 Janser Moura Pereira 3 1 Introdução Visando atender de maneira simultânea e harmônica

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

ANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP

ANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP ANÁLISE DE SOBREVIVÊNCIA Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP Objetivo Estudar o tempo desde um instante inicial até a ocorrência de um evento (alha). Estudar o tempo de sobrevida de

Leia mais

Exemplos Regressão Dados Binários

Exemplos Regressão Dados Binários Exemplos Regressão Dados Binários p. 1/28 Exemplos Regressão Dados Binários Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011 Exemplos

Leia mais

Modelo de regressão log-weibull-exponenciada para dados com censura intervalar

Modelo de regressão log-weibull-exponenciada para dados com censura intervalar XIII SEMANA da ESTATÍSTICA Universidade Estadual de Maringá Modelo de regressão log-weibull-exponenciada para dados com censura intervalar Elizabeth Mie Hashimoto Departamento Acadêmico de Matemática -

Leia mais

Controle Estatístico de Qualidade para Processos Climatológicos Autocorrelacionados

Controle Estatístico de Qualidade para Processos Climatológicos Autocorrelacionados Controle Estatístico de Qualidade para Processos Climatológicos Autocorrelacionados Luiz André R. dos Santos 1, Fábio C. Conde 1, Mozar de A. Salvador 1, Andrea M. Ramos 1, Larissa S. F. C. dos Santos

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Considere o problema de encontrar o valor que

Leia mais

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Padrão Pontual

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Padrão Pontual Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia Estatística espacial Padrão Pontual Padrão de Pontos A análise de padrão de pontos, é o tipo mais simples de análise

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE

UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE Aluna: Scheylla Calazans Orientadora: Profa. Dra. Nívea S. Matuda

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais

Modelos Lineares Generalizados

Modelos Lineares Generalizados Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20

Leia mais

O tempo de sobrevivência é uma variável aleatória T, contínua e positiva.

O tempo de sobrevivência é uma variável aleatória T, contínua e positiva. ESPECIFICAÇÃO DO TEMPO DE SOBREVIVÊNCIA O tempo de sobrevivência é uma variável aleatória T, contínua e positiva. Os valores que T pode assumir têm alguma distribuição de probabilidade que pode ser especificada

Leia mais

DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA RESUMO

DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA RESUMO APLICAÇÕES DE DISTRIBUIÇÕES DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA Danielle Peralta 1, Josmar Mazucheli 1, Isabelle Picada Emanuelli 2 e Robson Marcelo Rossi 1 1 Departamento de Estatística,

Leia mais

Regressão Linear - Parte I

Regressão Linear - Parte I UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: ET-406 Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior Regressão Linear - Parte I 1 Introdução Podemos

Leia mais

5. Carta de controle e homogeneidade de variância

5. Carta de controle e homogeneidade de variância 5. Carta de controle e homogeneidade de variância O desenvolvimento deste estudo faz menção a dois conceitos estatísticos: as cartas de controle, de amplo uso em controle estatístico de processo, e a homogeneidade

Leia mais

_ Desviopadrão

_ Desviopadrão 53 5. Resultados Os resultados serão apresentados separadamente para cada um dos quatro casos em estudo, correspondentes à combinação entre dois tipos de cobertura e dois sexos. 5.1. Cobertura por Morte

Leia mais

MAE532 Controle Estatístico de Qualidade

MAE532 Controle Estatístico de Qualidade Exercício 1. O número de interruptores não-conformes em amostras de tamanho 150 são mostrados na planilha Lista 6 2013.xls. Construa um gráfico de controle para a fração não-conforme para esses dados.

Leia mais

Funções Geradoras de Variáveis Aleatórias. Simulação Discreta de Sistemas - Prof. Paulo Freitas - UFSC/CTC/INE

Funções Geradoras de Variáveis Aleatórias. Simulação Discreta de Sistemas - Prof. Paulo Freitas - UFSC/CTC/INE Funções Geradoras de Variáveis Aleatórias 1 Funções Geradoras de Variáveis Aleatórias Nos programas de simulação existe um GNA e inúmeras outras funções matemáticas descritas como Funções Geradoras de

Leia mais

Modelo para estimativa de risco operacional e previsão de estoque para equipamentos da Comgás

Modelo para estimativa de risco operacional e previsão de estoque para equipamentos da Comgás Modelo para estimativa de risco operacional e previsão de estoque para equipamentos da Comgás 1. Introdução Marcos Henrique de Carvalho 1 Gabriel Alves da Costa Lima 2 Antonio Elias Junior 3 Sergio Rodrigues

Leia mais

Análise do volume útil do reservatório de Furnas via modelos de séries temporais

Análise do volume útil do reservatório de Furnas via modelos de séries temporais Análise do volume útil do reservatório de Furnas via modelos de séries temporais Cristina Henriques Nogueira 1 3 Thelma Sáfadi 2 1 Introdução A energia elétrica é, sem dúvida, um recurso indispensável

Leia mais

INTRODUÇÃO A INFERÊNCIA BAYESIANA. Beatriz Cristina Flamia de Azevedo (PIBIC Jr./ Fundação Araucária - UTFPR),

INTRODUÇÃO A INFERÊNCIA BAYESIANA. Beatriz Cristina Flamia de Azevedo (PIBIC Jr./ Fundação Araucária - UTFPR), INTRODUÇÃO A INFERÊNCIA BAYESIANA Beatriz Cristina Flamia de Azevedo (PIBIC Jr./ Fundação Araucária - UTFPR), Roberto Molina de Souza (Orientador), e-mail: rmolinasouza@utfpr.edu.br. Universidade Tecnológica

Leia mais

MAE Modelos Lineares Generalizados 2 o semestre 2017

MAE Modelos Lineares Generalizados 2 o semestre 2017 MAE5763 - Modelos Lineares Generalizados 2 o semestre 2017 Prof. Gilberto A. Paula 3 a Lista de Exercícios 1. Supor y i ind FE(µ, φ i ) com φ i = α + γz i, para i = 1,..., n. Como ca a matriz modelo Z?

Leia mais

Modelo marginal de odds proporcionais para dados longitudinais: um estudo de simulação

Modelo marginal de odds proporcionais para dados longitudinais: um estudo de simulação Modelo marginal de odds proporcionais para dados longitudinais: um estudo de simulação Nívea B. da Silva 1 Enrico A. Colosimo 2 Leila A. F. Amorim 3 1 Introdução Nos últimos anos muitas metodologias têm

Leia mais

Análise de Dados Categóricos

Análise de Dados Categóricos 1/43 Análise de Dados Categóricos Modelo de Regressão de Poisson Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Departamento de Estatística Universidade Federal de Minas Gerais 2/43 Revisão:

Leia mais

Exemplos Regressão Dados de Contagem

Exemplos Regressão Dados de Contagem Exemplos Regressão Dados de Contagem p. 1/26 Exemplos Regressão Dados de Contagem Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011 Exemplos

Leia mais

Exemplo Regressão Binomial Dados Emparelhados

Exemplo Regressão Binomial Dados Emparelhados Exemplo Regressão Binomial Dados Emparelhados Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2013 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre

Leia mais

MODELO DE DECISÃO PARA ESCOLHA DE PORTFOLIO DE INVESTIMENTOS

MODELO DE DECISÃO PARA ESCOLHA DE PORTFOLIO DE INVESTIMENTOS MODELO DE DECISÃO PARA ESCOLHA DE PORTFOLIO DE INVESTIMENTOS Rodrigo José Pires Ferreira UFPE Cx. Postal 7462, Recife PE, 50.630-970 rodrigo@ufpe.br Adiel Teixeira de Almeida Filho UFPE Cx. Postal 7462,

Leia mais

Análise de Sobrevivência

Análise de Sobrevivência Análise de Sobrevivência Modelagem paramétrica Valeska Andreozzi 1 valeska.andreozzi@fc.ul.pt & Marilia Sá Carvalho 2 cavalho@fiocruz.br 1 Centro de Estatística e Aplicações da Universidade de Lisboa,

Leia mais

Universidade de Brasília Departamento de Estatística. Felipe Gomes Ribeiro

Universidade de Brasília Departamento de Estatística. Felipe Gomes Ribeiro Universidade de Brasília Departamento de Estatística Uso da regressão logísitica na estimação da probabilidade de reincidência de jovens infratoras Felipe Gomes Ribeiro Monograa apresentada para obtenção

Leia mais

Filipe Ribeiro, Universidade de Évora/MPIDR Trifon I. Missov, MPIDR José Gonçalves Dias, Instituto Universitário de Lisboa (ISCTE-IUL) Maria Filomena

Filipe Ribeiro, Universidade de Évora/MPIDR Trifon I. Missov, MPIDR José Gonçalves Dias, Instituto Universitário de Lisboa (ISCTE-IUL) Maria Filomena Filipe Ribeiro, Universidade de Évora/MPIDR Trifon I. Missov, MPIDR José Gonçalves Dias, Instituto Universitário de Lisboa (ISCTE-IUL) Maria Filomena Mendes, Universidade de Évora Introdução 1940 Frequente

Leia mais

A distribuição Weibull Exponencial de Zografos

A distribuição Weibull Exponencial de Zografos Trabalho apresentado no XXXV CNMAC, Natal-RN, 2014. A distribuição Weibull Eponencial de Zografos Patrícia Silva N. Barros, PPGBEA - UFRPE / DCE - UFPB E-mail: patriciajp1408@hotmail.com Kleber Napoleão

Leia mais

Qualidade na empresa. Fundamentos de CEP. Gráfico por variáveis. Capacidade do processo. Gráficos por atributos. Gráficos com.

Qualidade na empresa. Fundamentos de CEP. Gráfico por variáveis. Capacidade do processo. Gráficos por atributos. Gráficos com. Roteiro da apresentação 1 Controle de Qualidade Lupércio França Bessegato 2 3 4 UFMG Especialização em Estatística Setembro/2008 5 6 7 8 Monitoramento da Média Gráfico de Controle de CUSUM e de EMWA Além

Leia mais

7. Resultados. 7 MATLAB é um produto da The MathWorks, Inc.

7. Resultados. 7 MATLAB é um produto da The MathWorks, Inc. 7. Resultados O modelo foi implementado por meio da linguagem computacional utilizada no software Matlab 7 e através da utilização do otimizador GLPK (GNU Linear Programming kit), em uma plataforma de

Leia mais

Esse material foi extraído de Barbetta (2007 cap 13)

Esse material foi extraído de Barbetta (2007 cap 13) Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos

Leia mais

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara 1 TESTES DE HIPÓTESES Notas de aula Prof.: Idemauro Antonio Rodrigues de Lara 2 Conteúdo 1. Fundamentos e conceitos básicos; 2. Função poder; 3. Testes mais poderosos e Lema de Neyman-Pearson; 4. Teste

Leia mais

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA UFPE - Universidade Federal de Pernambuco Departamento de Estatística Disciplina: ET-406 Estatística Econômica Professor: Waldemar A. de Santa Cruz Oliveira Júnior INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Podemos

Leia mais

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33 Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto

Leia mais

O passo inicial de qualquer análise estatística consiste em uma descrição dos dados através de análise descritiva (tabelas, medidas e gráficos).

O passo inicial de qualquer análise estatística consiste em uma descrição dos dados através de análise descritiva (tabelas, medidas e gráficos). TÉCNICAS NÃO-PARAMÉTRICAS O passo inicial de qualquer análise estatística consiste em uma descrição dos dados através de análise descritiva (tabelas, medidas e gráficos). Como a presença de censura invalida

Leia mais

Aumentando a Eciência de Métodos Monte Carlo: Redução de Variâncias por Condicionamento

Aumentando a Eciência de Métodos Monte Carlo: Redução de Variâncias por Condicionamento Aumentando a Eciência de Métodos Monte Carlo: Redução de Variâncias por Condicionamento Ian Meneghel Danilevicz Walmir dos Reis Miranda Filho Métodos Computacionais Aplicados à Estatística Prof.: Cristiano

Leia mais

Anderson Garneth de Castro 1 Graziela Dutra Rocha Gouvêa 2

Anderson Garneth de Castro 1 Graziela Dutra Rocha Gouvêa 2 Identificação dos fatores que influenciam no tempo até a evasão/ retenção dos alunos do ICEB-UFOP utilizando técnicas paramétricas em Análise de Sobrevivência Anderson Garneth de Castro 1 Graziela Dutra

Leia mais

Distribuição Generalizada de Valores Extremos (GVE): Um estudo aplicado a valores de temperatura mínima da Cidade de Viçosa-MG

Distribuição Generalizada de Valores Extremos (GVE): Um estudo aplicado a valores de temperatura mínima da Cidade de Viçosa-MG Distribuição Generalizada de Valores Extremos (GVE): Um estudo aplicado a valores de temperatura mínima da Cidade de Viçosa-MG Eduardo Campana Barbosa 12 Carlos Henrique Osório Silva 3 Rômulo César Ricardo

Leia mais

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES 18 aula META Fazer com que o aluno seja capaz de realizar os procedimentos existentes para a avaliação da qualidade dos ajustes aos modelos. OBJETIVOS Ao final

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Métodos Estatísticos Avançados em Epidemiologia Modelo de Poisson e Análise de Dados Longitudinais Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/

Leia mais

Analise de sobreviventes em acidentes de carros

Analise de sobreviventes em acidentes de carros Analise de sobreviventes em acidentes de carros Modelos Lineares Generalizados Lais Hoffmam GRR20159455 Simone Matsubara GRR20124663 Willian Meira GRR20159077 Yasmin Fernandes ISO20180365 Curitiba 2018

Leia mais

Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de regressão para dados correlacionados. Cibele Russo Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo 1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística

Leia mais

Uma Análise de Desempenho de Gráficos de Controle Multivariados. Rodrigo Luiz P. Lara 1, José Ivo Ribeiro Júnior 2, Rafael L. R.

Uma Análise de Desempenho de Gráficos de Controle Multivariados. Rodrigo Luiz P. Lara 1, José Ivo Ribeiro Júnior 2, Rafael L. R. ISSN: 2317-0840 Uma Análise de Desempenho de Gráficos de Controle Multivariados Rodrigo Luiz P. Lara 1, José Ivo Ribeiro Júnior 2, Rafael L. R. Oliveira 3 1,2 DET-UFV: Universidade Federal de Viçosa, Viçosa-MG.

Leia mais

Aplicação da análise de regressão na contabilidade do custo de produção do milho

Aplicação da análise de regressão na contabilidade do custo de produção do milho Aplicação da análise de regressão na contabilidade do custo de produção do milho Janser Moura Pereira 1 Quintiliano Siqueira Schroden Nomelini 1 Andréa Clélia da Rocha Moura 2 Nathane Eva dos Santos Peixoto

Leia mais

ESTUDO NUMÉRICO DO DESLOCAMENTO DE FLUIDOS NÃO NEWTONIANOS

ESTUDO NUMÉRICO DO DESLOCAMENTO DE FLUIDOS NÃO NEWTONIANOS ESTUDO NUMÉRICO DO DESLOCAMENTO DE FLUIDOS NÃO NEWTONIANOS Aluno: Thiago Ferrão Moura Cruz Orientadora: Mônica Feijó Naccache e Aline Abdu Introdução Com o objetivo de estudar o comportamento do cimento

Leia mais

Modelos para dados de contagem

Modelos para dados de contagem O modelo de Poisson Sumário 1 Introdução 2 Regressão de Poisson Taxa de Incidência Inclusão de covariáveis Interpretação dos parâmetros 3 Exemplos 4 Superdispersão Dados de Contagem Podemos estar interessados

Leia mais

Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná

Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná Quantis residuais Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná Orientador: Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Resumo Uma etapa importante

Leia mais

3 Modelo Matemático Definições Iniciais. Denote-se, em geral, o desvio-padrão do processo por σ = γσ 0, sendo σ 0 o

3 Modelo Matemático Definições Iniciais. Denote-se, em geral, o desvio-padrão do processo por σ = γσ 0, sendo σ 0 o Modelo Matemático 57 3 Modelo Matemático Este trabalho analisa o efeito da imprecisão na estimativa do desvio-padrão do processo sobre o desempenho do gráfico de S e sobre os índices de capacidade do processo.

Leia mais

CÁLCULO I. 1 Funções. Objetivos da Aula. Aula n o 01: Funções. Denir função e conhecer os seus elementos; Reconhecer o gráco de uma função;

CÁLCULO I. 1 Funções. Objetivos da Aula. Aula n o 01: Funções. Denir função e conhecer os seus elementos; Reconhecer o gráco de uma função; CÁLCULO I Prof. Edilson Neri Júnior Prof. André Almeida Aula n o 01: Funções. Objetivos da Aula Denir função e conhecer os seus elementos; Reconhecer o gráco de uma função; Denir funções compostas e inversas.

Leia mais

ANÁLISE DE DADOS DE SOBREVIVÊNCIA NA PRESENÇA DE RISCOS COMPETITIVOS

ANÁLISE DE DADOS DE SOBREVIVÊNCIA NA PRESENÇA DE RISCOS COMPETITIVOS UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA Eliane Ribeiro Carmes ANÁLISE DE DADOS DE SOBREVIVÊNCIA NA PRESENÇA DE RISCOS COMPETITIVOS Projeto

Leia mais

Internamentos Hospitalares por VIH/SIDA em Portugal 2006: Modelos de Fragilidades na Sobrevivência

Internamentos Hospitalares por VIH/SIDA em Portugal 2006: Modelos de Fragilidades na Sobrevivência 1 XVIII Congresso Mundial de Epidemiologia Internamentos Hospitalares por VIH/SIDA em Portugal 2006: Modelos de Fragilidades na Sobrevivência S. Dias 1,2, R. O. Martins 2, V. Andreozzi 3, J. Torgal 1 sdias@isegi.unl.pt

Leia mais

Um comparativo de desempenho entre gráficos de controle univariados e multivariados

Um comparativo de desempenho entre gráficos de controle univariados e multivariados Um comparativo de desempenho entre gráficos de controle univariados e multivariados Rodrigo Luiz Pereira Lara 3 Vladimir Barbosa Carlos de Souza 3. Introdução O Controle Estatístico do Processo (CEP) é

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Métodos Estatísticos Avançados em Epidemiologia Análise de Sobrevivência - Conceitos Básicos Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia 1/43 Métodos Estatísticos Avançados em Epidemiologia Análise de Sobrevivência - Modelo de Cox Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/

Leia mais

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2. Veremos

Leia mais

Coeficiente de determinação R 2 no modelo de regressão linear normal

Coeficiente de determinação R 2 no modelo de regressão linear normal Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br

Leia mais