Predição bootstrap via amostragem Gibbs do montante a- nual de indemnizações



Documentos relacionados
TTT-PLOT E TESTE DE HIPÓTESES BOOTSTRAP PARA O MODELO BI-WEIBULL. Cleber Giugioli Carrasco 1 ; Francisco Louzada-Neto 2 RESUMO

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

Avaliando o que foi Aprendido

Utilizando Monte Carlo e Reamostragem em Estimativas. Mauricio Aguiar, TI Métricas

Cláudio Tadeu Cristino 1. Julho, 2014

3. Características amostrais. Medidas de localização e dispersão

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

6 Construção de Cenários

Introdução. Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra.

Desenvolvimento de Sistema de Software

EVOLUÇÃO DO SEGURO DE SAÚDE EM PORTUGAL

Planeamento da Produção

Universidade Federal de Pernambuco Mestrado em Estatística

Tecido A B

2. Método de Monte Carlo

Introdução à análise de dados discretos

Como proceder à renovação ou à confirmação de dados estimados

Base de Dados para Administrações de Condomínios

ActivALEA. active e actualize a sua literacia

O que é a estatística?

Propagação de distribuições pelo método de Monte Carlo

Ministério das Finanças Instituto de Informática. Departamento de Sistemas de Informação

NCE/11/01396 Relatório preliminar da CAE - Novo ciclo de estudos

METODOLOGIA BAYESIANA PARA A ACTUALIZAÇÃO DO MÓDULO DE DEFORMABILIDADE NUMA ESTRUTURA SUBTERRÂNEA

Sistemas de Alarme Óptimos para Processos de Contagem

A MATEMÁTICA NO ENSINO SUPERIOR POLICIAL 1

5 Análise dos Resultados Seguro de Vida

ActivALEA. active e actualize a sua literacia

Segurança e Higiene no Trabalho

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

Teorema do Limite Central e Intervalo de Confiança

Geração de Números Aleatórios e Simulação

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria Prova de Conhecimentos Específicos

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

Métodos de Monte Carlo

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

Procedimento Específico. Gestão dos Dispositivos de Monitorização e Medição. Validado: Jaime Quendera Data: Responsável da Qualidade

por João Gomes, Director Executivo do Instituto de Planeamento e Desenvolvimento do Turismo e Professor Associado da Universidade Fernando Pessoa

COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA METODOLOGIA DE MONTE CARLO

1. Introdução. 1.1 Introdução

Teorema Central do Limite e Intervalo de Confiança

Tarefa Orientada 14 Subconsultas

UNIVERSIDADE FEDERAL DO PIAUÍ (UFPI) ENG. DE PRODUÇÃO PROBABILIDADE E ESTATÍSTICA 2

ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário. As Normas da família ISO As Normas da família ISO 9000

GESTÃO DE ARQUIVOS E DEPÓSITOS. Regulamento

Norma Interpretativa 2 Uso de Técnicas de Valor Presente para mensurar o Valor de Uso

Transcrição Automática de Música

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Saúde

Um estudo da correlação dos resultados patrimoniais e operacionais das seguradoras Francisco Galiza, Mestre em Economia (FGV)

Simulação Transiente

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

Métodos de Previsão de Sinistros

dissertação. 2 Credibilidade total, em linhas gerais, seria a capacidade de representar o comportamento

2 Independência e dependência das taxas de juro

O método de Monte Carlo: algumas aplicações na Escola Básica

1 Descrição do Trabalho

Cresce o numero de desempregados sem direito ao subsidio de desemprego Pág. 1

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

NCE/10/01121 Relatório preliminar da CAE - Novo ciclo de estudos

Uma Avaliação do Uso de um Modelo Contínuo na Análise de Dados Discretos de Sobrevivência

Explorações de alunos

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores

Probabilidade. Distribuição Binomial

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto.

Perguntas mais frequentes

a) Suponha que na amostra de 20 declarações foram encontrados 15 com dados incorrectos. Construa um

GUIA PARA O PREENCHIMENTO DOS FORMULÁRIOS ENTIDADE GESTORA ERP PORTUGAL

Modelo Cascata ou Clássico

Introdução à genética quantitativa usando os recursos do R


4 Avaliação Econômica

Modelos Logísticos e Hierárquicos

Entendimento do ICP-ANACOM. Originação de chamadas nas redes móveis nacionais

NCE/11/01851 Relatório final da CAE - Novo ciclo de estudos

5 Circuitos Equivalentes

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES. Comentários sobre as provas de estatística e financeira ICMS RJ

COMPARAÇÃO DOS TESTES DE ADERÊNCIA À NORMALIDADE KOLMOGOROV- SMIRNOV, ANDERSON-DARLING, CRAMER VON MISES E SHAPIRO-WILK POR SIMULAÇÃO

PROJECTO DE RELATÓRIO

ISO 9001:2008. A International Organization for Standardization (ISO) publicou em a nova edição da Norma ISO 9000:

DISTRIBUIÇÃO NORMAL 1

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

ANÁLISE DOS SISTEMAS DE MEDIÇÃO MSA SISTEMA DE MEDIÇÃO NÃO REPLICÁVEL

Leia o texto abaixo para resolver as questões sobre população e amostra.

Engenharia de Software

Modelação conceptual de classes

Regressão logística na identificação de factores de risco em acidentes automóveis e fraude de seguros.

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais

Monitor Giovani Roveroto

DISTRIBUIÇÕES DE PROBABILIDADE

Projeto de Armazéns e Modelos de Armazenamento

Nota prévia. Convenções

'LVWULEXLomR(VWDWtVWLFDGRV9DORUHV([WUHPRVGH5DGLDomR6RODU *OREDOGR(VWDGRGR56

Histogramas. 12 de Fevereiro de 2015

CIRCUITOS E SISTEMAS ELECTRÓNICOS

Como aleatorizar? (Nome professor) (Universidade) Abdul Latif Jameel Poverty Action Lab.

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA

Transcrição:

Actas do XIV Congresso Anual da SPE 1 Predição bootstrap via amostragem Gibbs do montante a- nual de indemnizações Susana Rosado-Ganhão Faculdade de Arquitectura da UTL, Departamento de Tecnologias da Arquitectura/Centro de Estatística e Aplicações da UL Maria Antónia Amaral Turkman Faculdade de Ciências da UL, Departamento de Estatística e Investigação Operacional/ Centro de Estatística e Aplicações da UL Resumo: Este artigo surge na sequência de trabalhos anteriores sobre a aplicação da metodologia bayesiana para a predição do montante anual futuro do total de indemnizações pagas em seguros do ramo automóvel, tendo como informação passada as indemnizações agregadas nos anos 2000 a 2004 por tipo de indemnização. A predição é feita na forma de intervalos de predição, usando modelos bayesianos hierárquicos via amostragem Gibbs. A distribuição preditiva usada é obtida através do método bootstrap por aplicação da técnica "bagging" (Fushiki[3]). A título comparativo, aplicámos também uma metodologia "plug-in" usando para o efeito estimativas a posteriori dos parâmetros envolvidos. Palavras chave: intervalo de predição, modelo bayesiano hierárquico, amostragem Gibbs. Abstract: This work follows the application of the Bayesian methodology for the prediction of the total future amount of indemnities for a certain year payed in automobile insurances, having as past information the aggregated indemnities in the years 2000 to 2004. The prediction is made through prediction intervals, using Bayesian hierarchical models with Gibbs sampling. The predictive distribution is obtained using bootstrap methods and applying bagging to the statistical prediction problem (Fushiki[3]). For comparison purposes, we also use a "plug-in" methodology where the parameters involved are substituted by their posterior estimates. Keywords: prediction interval, hierarchical Bayesian model, Gibbs sampling. 1 Introdução O problema que temos em vista é o de predizer, na forma de intervalos de predição, o montante futuro do total de indemnizações pagas pela Companhia de Seguros Tranquilidade, no ramo automóvel. Este problema já foi alvo de um estudo anterior (Rosado-Ganhão e Amaral Turkman[4]) tendo-se então usado uma metodologia bayesiana hierárquica para a obtenção dos intervalos de predição. Contudo, os resultados obtidos não foram

2 S.R.Ganhão e M.A.Turkman/Predição do total de indemnizações totalmente satisfatórios em algumas das situações. Uma das razões possíveis apontadas foi o facto de os dados respeitantes aos anos mais recentes não se encontrarem actualizados à data das análises feitas. O objectivo do presente trabalho é o de averiguar em que medida é que, com o auxílio da metodologia bootstrap, se consegue ultrapassar os problemas anteriormente detectados com os intervalos de predição obtidos, já que essa metodologia confere uma maior variabilidade ao "observado"(davison e Hinkley[2]). Os dados que nos foram disponibilizados referem-se às indemnizações individuais por tipo de indemnização nos anos 2000 a 2004. Para os seguros referentes ao ramo automóvel, as indemnizações geradas por um determinado sinistro podem ser de quatro tipos: Tipo 0 - Indemnização por Danos Materiais; Tipo 1 - Indemnização por Danos Corporais; Tipo 2 - Indemnização Directa ao Segurado (IDS - acordo entre seguradoras em que uma companhia gere o sinistro do seu segurado, apesar da responsabilidade do sinistro ser de uma outra seguradora); Tipo 3 - Indemnização por Danos Próprios. Por indemnizações individuais entende-se os montantes pagos pela companhia de seguros em consequência de um sinistro. Assim, cada indemnização individual representa univocamente um sinistro. Os dados referentes aos anos 2000 a 2003 produziram resultados que foram validados com dados de 2004. Posteriormente aplicou-se o modelo proposto neste trabalho com os dados de 2000 a 2004 para fazer predições para o ano 2005. A predição é feita com recurso à distribuição preditiva bootstrap, depois de definido o modelo e estudada a sua adequabilidade aos dados, feito em Rosado- Ganhão e Amaral Turkman[4]. Esta distribuição é construída por aplicação da técnica "bagging" no problema da predição estatística (Fushiki[3]). Esta técnica consiste em obter uma predição estável através da média de várias predições baseadas em dados bootstrap. 2 Modelo Proposto Anualmente, e para cada tipo de indemnização, vamos assumir que temos um vector aleatório Y = (Y 1,,Y N ) constituído pelas indemnizações individuais, sendo N o número aleatório de sinistros, tal como foi feito em Rosado-Ganhão e Amaral Turkman[4]. Seja X = (X 1,,X n ) o vector das indemnizações agregadas semanais onde X i (i = 1,..., n) representa a soma de cada uma das n = 52 sequências das indemnizações individuais formadas a partir de (Y 1,..., Y nk ). Voltemos a definir o número médio de indemnizações semanais por k = [ N n ]1. 1 A representação [x] significa que se considera a parte inteira do número x.

Actas do XIV Congresso Anual da SPE 3 Assim, cada X i corresponde à soma de k valores de Y, de forma a termos as indemnizações agregadas semanais, X i, definidas pela soma de k indemnizações individuais Y j. O objectivo é, então, o de inferir sobre o montante futuro do total de indemnizações, 52 M T = X i = Y j (1) i=1 onde M é a variável aleatória que representa o número futuro anual de indemnizações (sinistros). Neste caso o ano futuro em estudo será o de 2005. Em termos do modelo proposto em Rosado-Ganhão e Amaral Turkman[4], uma análise preliminar dos dados das indemnizações agregadas sugeriu que um modelo adequado é um modelo de mistura de duas populações normais. Este modelo foi consonante com o facto de que, em geral, o valor das indemnizações ou se encontra dentro de determinados limites expectáveis, ou então pertence a um grupo de valores elevados que fogem desses limites. Tal como em Rosado-Ganhão e Amaral Turkman[4], assumimos que, para cada ano e para um determinado tipo de indemnização, cada observação de indemnizações agregadas, X i, é retirada de um grupo G i, que pode tomar os valores 1 ou 2. Novamente, supomos que existe um número desconhecido de observações no grupo 1 com probabilidade p e no grupo 2 com probabilidade (1 p). O modelo será (cf. Rosado-Ganhão e Amaral Turkman[4]), j=1 X i G i, λ Gi, σ 2, N Normal(µ Gi, σ 2 X ) G i p Categorical(p) µ Gi = [ N n ]λ G i λ 2 = λ 1 + ξ, ξ > 0 (2) σ 2 X = [ N n ]σ2 N µ, σ 2 N Normal(µ, σ2 N ) π(µ, p, λ 1, ξ, σ 2, σ 2 N ) = π(µ)π(p)π(λ 1)π(ξ)π(σ 2 )π(σ 2 N ), tendo-se assumido distribuições a priori não informativas para os parâmetros µ, p, λ 1, ξ, σ 2 e σn 2. Uma vez que queremos predizer o montante anual futuro do total de indemnizações T, definido em (1), voltamos a assumir que este tem uma distribuição amostral Normal de valor médio µ f e variância σf 2 onde µ f = (pλ 1 + (1 p)λ 2 ) M, σ 2 f = M σ2, (3) e onde M tem distribuição idêntica a N, ou seja, M µ, σ 2 N Normal(µ, σ2 N ).

4 S.R.Ganhão e M.A.Turkman/Predição do total de indemnizações 3 Metodologia Para os dados descritos na secção 1. vamos, então, usar o modelo bayesiano hierárquico de mistura de duas populações Normais definido em Rosado-Ganhão e Amaral Turkman[4] e recordado em (2), para predizer o total de indemnizações, T, definido por (1). Esta predição é feita via amostragem Gibbs para simular valores da distribuição preditiva bootstrap de T. Fushiki[3] define função preditiva bootstrap do seguinte modo: Definição A distribuição preditiva bootstrap é dada por p boot(x n+1 ;x) = f(x E p n+1 ; θ ) = f(x n+1 ; θ (x )) p(x )dx (4) onde x = (x 1,..., x n ) é o vector das observações, x = (x 1,..., x n) uma amostra bootstrap (que se obtem por reamostragem de x usando o método de amostragem aleatória simples com reposição), x n+1 uma observação futura, condicionalmente independente de x, mas cuja distribuição f(x n+1 ; θ) partilha com a distribuição de x do mesmo parâmetro θ, θ uma estimativa do parâmetro da distribuição baseada na amostra bootstrap x e p uma estimativa empírica da distribuição de X. Prova-se que p boot (x n+1;x) = 1 B B f(x n+1 ; θ (x (i) ) (5) converge para p boot (x n+1;x) (Fushiki[3]), sendo x (i) a amostra bootstrap para a réplica i. Assim, (5) é uma estimativa Monte Carlo da distribuição preditiva bootstrap dada por (4) e, como tal, ilustra uma aplicação da técnica bagging que consiste em obter uma predição estável através da média de várias predições baseadas em dados bootstrap. Esta distribuição preditiva bootstrap baseia-se numa metodologia "plugin" para obter a distribuição preditiva. Esta definição pode então ser generalizada para o caso em que se usa outro tipo de metodologia para construir a distribuição preditiva (Rosado-Ganhão e Amaral Turkman[5]) do seguinte modo p boot (x n+1 x) = p(x n+1 x ) p(x )dx (6) sendo a estimativa da distribuição preditiva bootstrap obtida através de i=1 p boot (x n+1 x) = 1 B B i=1 p(x n+1 x (i)). (7)

Actas do XIV Congresso Anual da SPE 5 Em particular, quando p(x n+1 x ) é a distribuição preditiva bayesiana, baseada em x, isto é p(x n+1 x ) = f(x n+1 θ)π(θ x ) dθ, obtemos a distribuição preditiva bootstrap bayesiana. Quando o cálculo desta distribuição preditiva é obtido com recurso a métodos de simulação, nomeadamente MCMC (Métodos de Monte Carlo via Cadeias de Markov), designamos essa estimativa por EMCBoot. O algoritmo para obter a estimativa EMCBoot da função preditiva bootstrap, p boot (t x), para a função que queremos predizer, T, é dado por: 1. Para i=1 a B gerar dados bootstrap, i.e, aplicar o método de amostragem aleatória simples com reposição ao vector das observações obtendo-se x (i) = (x (i)1,..., x (i)n ); simular valores do parâmetro θ, θ j (i), a partir da distribuição a posteriori de θ relativa a x (i) e com recurso ao método de amostragem Gibbs. 2. Calcular a distribuição preditiva bootstrap p boot (t x) = 1 B B i=1 p(t x (i)). (8) onde p(t x (i) ) 1 m m j=1 f(t θj (i)) é uma estimativa de Monte Carlo da distribuição preditiva bayesiana relativamente aos dados x (i), m corresponde ao número de valores simulados da distribuição a posteriori do parâmetro θ, f(t θ) é a densidade de probabilidade amostral para T. Neste trabalho vamos obter a estimativa da distribuição preditiva bootstrap bayesiana usando metodologia "plug-in" definida em (5) onde θ (x (i)) é substituído por uma estimativa a posteriori do parâmetro θ, seja θ (i), média dos valores simulados, θ j (i) ; procedimento EMCBoot. Tanto a metodologia "plug-in" como o procedimento EMCBoot foram codificados e implementados no package R 2 usando uma biblioteca específica deste package, designada R2WinBugs, que permite integrar o código implementado no WinBugs (que simula valores da distribuição a posteriori do parâmetro θ) no programa principal, o qual fornece uma estimativa da distribuição preditiva bootstrap de T. 2 R Package, versão 2.0.1, disponível em http://www.r-project.org/

6 S.R.Ganhão e M.A.Turkman/Predição do total de indemnizações 4 Resultados Depois de estudada em Rosado-Ganhão e Amaral Turkman[4] a adequabilidade do modelo proposto 3 considerámos as seguintes situações para aplicação da metodologia descrita: 1. A situação em que o futuro corresponde ao ano 2004. Neste caso os vectores das indemnizações agregadas para os anos 2000 a 2003 são X j = (X 1j,..., X nj ) com j = 1,..., 4, sendo conhecidos os valores do montante anual futuro do total de indemnizações, T. Com esta situação podemos avaliar se o valor de T registado se encontra no intervalo de predição obtido. 2. A situação em que o futuro é referente ao ano 2005. Neste caso os vectores das indemnizações agregadas para os anos 2000 a 2004 são X j = (X 1j,..., X nj ) com j = 1,..., 5, não sendo possível avaliar os resultados uma vez que ainda não disponibilizamos do valor registado de T para 2005. Assim, os valores observados de X j são os vectores das observações e o parâmetro da distribuição amostral de T, o montante futuro do total de indemnizações (definido em (1)), condicional a M, é θ f = (µ f, σf 2 ), definido em (3), sendo M N(µ, σn 2 ), considerada observação omissa e imputada via simulação. Para cada tipo de indemnizações considerado neste estudo repetiu-se B = 100 vezes o passo 1 do procedimento EMCBoot e para a simulação dos valores do vector parâmetro θ do modelo (θ = (µ, p, λ 1, ξ, σ 2, σn 2 )), fizeram-se 30000 iterações, com um período de aquecimento de 25000 iterações. Para obter uma estimativa da distribuição preditiva bootstrap, quer usando (5), quer usando (8), considerou-se uma grelha de valores para t e para f(t θ) usou-se a expressão da função densidade de probabilidade da normal com parâmetros (µ f, σf 2 ) dados em (3). 4.1 Resultados para o ano 2004 A Tabela 1, obtida em Rosado-Ganhão e Amaral Turkman[4], apresenta os intervalos de predição de 95% para T no caso em que não se aplica uma metodologia bootstrap. Comparando os resultados da Tabela 1 com os resultados da Tabela 2 referentes ao método EMCBoot verificamos que a metodologia bootstrap permitiu reduzir a amplitude dos intervalos de predição particularmente para as indemnizações de Tipo 0 e Tipo 3; as estimativas para os valores médios das distribui- 3 Este estudo foi realizado com recurso a uma técnica que consiste em simular dados replicados da função preditiva a posteriori e comparar estes valores com os dados observados através de alguma medida de relacionamento entre o modelo e os dados. Se o modelo for adequado o vector de réplicas deve ter um comportamento semelhante ao vector de dados em termos dessa medida.

Actas do XIV Congresso Anual da SPE 7 Tabela 1: Resumo dos resultados obtidos considerando informação dos anos 2000 a 2003 sem usar uma metodologia bootstrap. Valor registado Valor médio da dist. Intervalo de Anos 2000-2003 de T (2004) preditiva de T predição para T Tipo 0 25280.88 29960 [18620, 41500] Tipo 1 16085.39 23050 [19190, 27650] Tipo 2 12574.35 13050 [12770, 13340] Tipo 3 17897.54 26840 [16150, 38230] ções preditivas não se alteraram substancialmente. Continua a observar-se uma sobrestimação dos custos de indemnização. Ainda, comparando os resultados da Tabela 2 no que diz respeito às duas metodologias constata-se, tal como seria de esperar, que os intervalos de predição obtidos pela metodologia "plug-in" apresentam amplitudes menores. Sabe-se, no entanto, que esta redução da amplitude é obtida à custa de uma menor probabilidade de cobertura dos intervalos, em geral bastante inferior à confiança do intervalo de predição (Butler[1]). Tabela 2: Resultados obtidos por simulação da distribuição preditiva bootstrap de T usando informação dos anos 2000 a 2003, seguindo o procedimento EMCBoot e a metodologia "plug-in". Valor registado Valor médio da dist. Intervalo de Anos 2000-2003 de T (2004) preditiva de T predição para T EMCBoot plug-in EMCBoot plug-in Tipo 0 25280.88 30330 30680 [26930, 36930] [27010, 34520] Tipo 1 16085.39 22780 22900 [19130, 27240] [19920, 25810] Tipo 2 12574.35 13094 13088.5 [12817.5, 13336.5] [12892, 13284] Tipo 3 17897.54 25780 25980 [20930, 29530] [21850, 29130] 4.2 Resultados para o ano 2005 Comparando os resultados da Tabela 3 (obtidos em Rosado-Ganhão e Amaral Turkman[4]) e os da Tabela 4, no que diz respeito à metodologia EMCBoot, constatamos novamente que há uma redução na amplitude dos intervalos de predição no que diz respeito às indemnizações de Tipo 0, 1 e 2, não havendo alterações significativas no que diz respeito aos valores médios da distribuição preditiva. Novamente, como era de esperar, a metodologia "plug-in" produz intervalos de predição com menor amplitude embora as diferenças observadas não sejam tão díspares como anteriormente.

8 S.R.Ganhão e M.A.Turkman/Predição do total de indemnizações Tabela 3: Resumo dos resultados obtidos considerando informação dos anos 2000 a 2004 sem usar uma metodologia bootstrap. Valor médio da dist. Intervalo de Anos 2000-2004 preditiva de T predição para T Tipo 0 29690 [18440, 41380] Tipo 1 22650 [19080, 26530] Tipo 2 13030 [12770, 13290] Tipo 3 24210 [21040, 27340] Tabela 4: Resultados obtidos por simulação da distribuição preditiva bootstrap de T usando informação dos anos 2000 a 2004, seguindo o procedimento EMCBoot e a metodologia "plug-in". Valor médio da dist. Intervalo de Anos 2000-2004 preditiva de T predição para T EMCBoot plug-in EMCBoot plug-in Tipo 0 30888 31130 [26810, 37530] [26850, 35680] Tipo 1 22330 22360 [18760, 26320] [19610, 25110] Tipo 2 13056.5 13054.5 [12809, 13290] [12871.5, 13233] Tipo 3 24000 24130 [20250, 28880] [20740, 27020] 5 Conclusões A metodologia bootstrap, aplicada ao problema da predição do montante futuro do total de indemnizações, permitiu uma redução da amplitude dos intervalos de predição, particularmente para as indemnizações de Tipo 0 e Tipo 3 que apresentam uma maior variabilidade, já que correspondem a danos materiais e danos próprios, respectivamente. Esta metodologia não permitiu, no entanto, reduzir o problema do enviesamento (neste caso causador de sobrestimação) e como consequência os intervalos de predição deixaram de conter o valor registado do total de indemnizações do ano 2004. Deve referir-se que os dados utilizados continuam a não estar actualizados. No entanto, a Companhia de Seguros Tranquilidade já se disponibilizou para nos fornecer os dados de 2004 actualizados e uma previsão de 2005 (que aguardamos ter a qualquer momento) para poder refazer os cálculos e tirar conclusões mais apropriadas.

Actas do XIV Congresso Anual da SPE 9 Agradecimentos À Companhia de Seguros Tranquilidade pela disponibilidade em fornecer o conjunto de dados que tornou possível este estudo. Referências [1] Butler, R.W. (1989). Approximate predictive pivots and densities. Biometrika, vol. 76(3), p. 489-501. [2] Davison, A.C. e Hinkley, D.V. (1997). Bootstrap methods and their application. Cambridge: University Press. [3] Fushiki, T, Komaki, F. e Aihara, K. (2005). Nonparametric bootstrap prediction. Bernoulli, vol. 11(2), p. 293-307. [4] Rosado-Ganhão, S. e Amaral Turkman, M.A. (2006). Predição bayesiana do montante anual futuro do total de indemnizações. In Canto e Castro, L. et al (Eds.), Ciência Estatística. Edições SPE, p.637-648. [5] Rosado-Ganhão, S. e Amaral Turkman, M.A. (2004). Um estudo comparativo de diferentes métodos de predição. In Rodrigues, P.M.M. et al (Eds.), Estatística com Acaso e Necessidade. Edições SPE, p.259-269.