Distribuição hipergeométrica confluente Pareto com uma aplicação em Análise de Sobrevivência Jailson de Araujo Rodrigues 3 Ana Paula Coelho Madeira Silva 2 Jaime dos Santos Filho 3 Introdução Nos últimos anos, novas distribuições têm sido propostas para modelagem do tempo de duração de componentes. Isso se justifica em função das distribuições tradicionais não se ajustarem de forma satisfatória ao conjunto de dados em estudo. Nesse contexto, diversos autores apresentaram generalizações das distribuições já existentes. Por exemplo, [] introduziu a distribuição beta Pareto, [0] estudaram a distribuição Weibul exponenciada, [3] introduziu o modelo beta normal, [5] apresentou a distribuição beta Weibull inversa, [6] propôs o modelo beta Weibull, [8] introduziu o modelo beta Gumbel, [9] apresentou a distribuição beta exponencial e [] inseriu o modelo beta Burr XII Neste trabalho, é estudada uma distribuição com cinco parâmetros, denominada distribuição hipergeométrica confluente Pareto. A estimação dos parâmetros utilizando o método da máxima verossimilhança é discutida. A potencialidade do modelo é demonstrada em uma aplicação a dados reais de sobrevivência. 2 Materiais e métodos A base de dados utilizada é bastante conhecida na literatura e refere-se ao tempo de falha do sistema de condicionamento de ar de aeronaves. Mais detalhes sobre esse conjunto de dados podem ser encontrados em [7]. Considere a distribuição hipergeométrica confluente apresentada por [4] com função densidade de probabilidade (fdp), f (x) = xa ( x) b exp( cx) B(a,b) F (a;a + b; c) () DEPEN-IFBA. e-mail: jailsondearaujo@yahoo.com.br 2 CSL - UFSJ. 3 Agradecimento ao IFBA pelo apoio financeiro.
em que > x > 0, a > 0, b > 0, + > c > e F (a;c;x) a função hipergeométrica confluente, F (a;c;x) = (a) i x i (2) i=0 (c) i A partir dos trabalhos apresentados por [3] e [2] pode-se construir uma nova classe de distribuições: se G(x) denota uma função de distribuição de uma variável aleatória em que x I, então, uma nova classe de distribuições generalizadas é dada por, F (x) = a fdp associada a essa distribuição é, G(x) t a ( t) b exp( ct)dt (3) B(a,b) F (a;a + b; c) 0 f (x) = g(x)g(x)a [ G(x)] b exp[ c G(x)], g(x) = dg(x) B(a,b) F (a;a + b; c) dx (4) Se considerarmos a função de distribuição Pareto, ( x ) k G(x) = (5) s em que x s, k > 0 e s > 0. Substituindo (5) em (4), obtém-se uma nova função distribuição hipergeométrica confluente Pareto (HC-Pareto), F (x) = ( x s ) k t a ( t) b exp( ct)dt (6) B(a,b) F (a;a + b; c) 0 em que x s, a > 0, b > 0, + > c >, k > 0 e s > 0. A função densidade de probabilidade (fdp) e a função taxa de falha associadas a distribuição HC-Pareto são dadas por: f (x) = ks bk x (bk+) [ (x/s) k] a exp [ c(x/s) k] exp(c)b(a,b) F (a;a + b; c) (7) e λ(x) = [ ks bk x (bk+) (x/s) k] a exp { c [ (x/s) k]} (x/s) k B(a,b) F (a;a + b; c) t a ( t) b exp( ct)dt 0 A distribuição HC-Pareto representa uma generalização de algumas distribuições muito conhecidas na literatura. Claramente, a distribuição Pareto é um sub-modelo da distribuição HC- Pareto quando a = b = e c = 0. Para c = 0, o modelo reduz-se a distribuição beta Pareto. Se b = e c = 0, tem-se a distribuição Pareto exponenciada. (8) 2
3 Resultados e discussão As estimativas de máxima verossimilhança para o HC-Pareto e os sub-modelos beta Pareto e Pareto são exibidas na Tabela. Tabela : Estimativa de máxima verossimilhança dos parâmetros e AIC. Distribuição a b c k s AIC HC-Pareto 5, 59 2,496 0,243 0,3 0,546 322,304 Beta Pareto 5,09 2,903... 0,347 0,686 323,962 Pareto......... 0,298,000 338,68 Para selecionar a distribuição com melhor ajuste foi utilizado o critério de informação de Akaike, baseado na teoria de decisão o AIC (Akaike Information Criterion) é definido como a quantidade AIC = 2L + 2p em que L representa a magnitude máxima da função suporte e p denota o número de parâmetros da distribuição. De acordo com esse critério, o melhor modelo é aquele que apresenta o menor valor do AIC. Na Tabela pode-se observar que a distribuição HC-Pareto apresentou um ajuste melhor comparado aos outros modelos probabilísticos alternativos, pois seu AIC apresentou menor valor em relação aos demais. Na Figura pode-se comparar as densidades ajustadas com o histograma dos dados observados, o modelo Pareto é o de pior ajuste. Figura : Gráficos de probabilidade para as densidades ajustadas. A qualidade de ajuste dos modelos também pode ser verificada pelos gráficos de probabilidades. Esses gráficos consistem são a representação no plano cartesiano da probabilidade observada versus a probabilidade esperada. Para cada um dos modelos foi plotado F(x (i) ) versus (i 0,375)/(n+0,25), i =,...,n em que F( ) denota a função de distribuição e x (i) representa os valores amostrais em ordem crescente. Na Figura 2 são exibidos os gráficos de probabilidade das distribuições ajustadas, também por esse critério, a distribuição HC-Pareto apresentou melhor ajuste em relação as distribuições beta Pareto e Pareto. 3
4 Conclusões Figura 2: Gráficos de probabilidade para as densidades ajustadas. Utilizando a composição da função de distribuição hipergeométrica confluente com a função de distribuição Pareto, foi intoduzido o modelo hipergeométrico confluente Pareto. Algumas de suas principais propriedades foram deduzidas. A estimação dos parâmetros dessa nova distribuição via método da máxima verossimilhança pode ser facilmente computada utilizando métodos numéricos. A aplicação do modelo a dados reais de sobrevivência apresentou um ganho inferêncial em relação às distribuições beta Pareto e Pareto. Referências [] A. Akinsete, F. Famoye, C. Lee, The beta-pareto distribution, Statistics, 42, No. 6 (2008), 547 563. [2] G.M. Cordeiro, M. Castro, A new family of generalized distributions, J. Stat. Comp. Simulation, 8, No. 7 (20), 883 898. [3] N. Eugene, C. Lee, F. Famoye, Beta-normal distribution and its application, Commun. Stat. - Theory and Methods, 3 (2002), 497 52. [4] M. B. Gordy, Computationally Convenient Distributional Assumptions for Common- Value Auctions, Comp. Econom., 2, No. (998), 6 78. [5] M.S. Khan, The beta inverse Weibull distribution, Int. Trans. Math. Sciences and Comp., 3, No. (200), 3 9. [6] C. Lee, F. Famoye, O. Olumolade, Beta-Weibull distribution, J. Mod. Appl. Stat. Meth., 6, No. (2007), 73 86. [7] A. L. Morais, A class of generalized beta distributions, Pareto power series and Weibull power series, Dissertação para a obtenção do grau de Mestre em Estatística, Universidade Federal de Pernambuco, Recife, 2009. 4
[8] S. Nadarajah, S. Kotz, The beta Gumbel distribution, Math. Prob. Eng., 0 (2004), 323 332. [9] S. Nadarajah, S. Kotz, The beta exponential distribution, Reliab. Eng. and Syst. Safety, 9 (2006), 689 697. [0] M. Pal, M.M. Ali, J. Woo, Exponentiated Weibull distribution, Statistica, 66, No. 2 (2006), 39 47. [] P.F. Paranaíba, E.M.M. Ortega, G.M. Cordeiro, R.R. Pescim, The beta Burr XII distribution with application to lifetime data, Commun. Stat. - Theory and Methods, 55, No. 2 (20), 8 36. [2] M.A.R. de Pascoa, E.M.M. Ortega, G.M. Cordeiro, The Kumaraswamy generalized gamma distribution with application in survival analysis, Commun. Stat. - Theory and Methods, 8, No. 5 (20), 4 433. [3] J. de A. Rodrigues, L. M. Chaves and F. Castellares, Uma nova classe de distribuições generalizadas, Ten. Mat. Apl. Comput., 3, No. 2 (202), 67 78. 5