Aplicação do processo de KDD em uma gestora de planos de saúde



Documentos relacionados
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

A Grande Importância da Mineração de Dados nas Organizações

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. DCC-IME-USP

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Data, Text and Web Mining

DATA WAREHOUSE. Introdução

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Prof. Msc. Paulo Muniz de Ávila

ADM041 / EPR806 Sistemas de Informação

SISTEMA GERENCIADOR DE BANCO DE DADOS

Orientação a Objetos

Planejamento Estratégico de TI. Prof.: Fernando Ascani

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

KDD UMA VISAL GERAL DO PROCESSO

Introdução a Banco de Dados

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Saúde da mulher em idade fértil e de crianças com até 5 anos de idade dados da PNDS 2006

Banco de Dados I. Quantidade de informação gerada em um dia. Aula milhões de clientes ativos; Mais de 42 terabytes de dados; Salários na área

KDD E MINERAÇÃO DE DADOS:

Aprendizagem de Máquina

AULA 04 - TABELA DE TEMPORALIDADE

Oficina. Praça das Três Caixas d Água Porto Velho - RO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

Sistemas de Informação

Persistência e Banco de Dados em Jogos Digitais

ISO/IEC 12207: Gerência de Configuração

MODELAGEM DE DADOS. Unidade II Arquiteturas do SGBD

Módulo 4: Gerenciamento de Dados

AVALIAÇÃO DE INTERFACES UTILIZANDO O MÉTODO DE AVALIAÇÃO HEURÍSTICA E SUA IMPORTÂNCIA PARA AUDITORIA DE SISTEMAS DE INFORMAÇÕES

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Perfil das mulheres brasileiras em idade fértil e seu acesso à serviços de saúde Dados da PNDS 2006

4 Segmentação Algoritmo proposto

Projeto Você pede, eu registro.

1 Introdução 1.1. Contextualização

Disciplina: Unidade III: Prof.: Período:

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO

INF 2125 PROJETO DE SISTEMAS DE SOFTWARE Prof. Carlos J. P. de Lucena

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Sistema web de Monitoramento para Banco de. Acadêmico: Giovani Tercílio Moser Orientador: Cláudio Ratke 2013/2

A IMPORTÂNCIA DA GESTÃO DE CUSTOS NA ELABORAÇÃO DO PREÇO DE VENDA

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

NOKIA. Em destaque LEE FEINBERG

Gestão de Relacionamento com o Cliente CRM

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

AGILE ROLAP - UMA METODOLOGIA ÁGIL PARA IMPLEMENTAÇÃO DE AMBIENTES DE NEGÓCIOS BASEADO EM SERVIDORES OLAP.

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Variação dos Custos Médicos Hospitalares VCMH/IESS Data-base - junho de 2010

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Disciplina: Tecnologias de Banco de Dados para SI s

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

O propósito deste trabalho foi o de apresentar os programas de. catalogação cooperativa, centralizada e catalogação-na-publicação, os quais,

MUDANÇAS NA ISO 9001: A VERSÃO 2015

Processos Técnicos - Aulas 4 e 5


Introdução à Banco de Dados. Definição

Tecnologia para garantir qualidade e eficiência

(Capitais e Interior) (Demais Localidades) (Capitais e Interior) Golden Fone (SAC)

Conceitos de Banco de Dados

Ambiente Weka Waikato Environment for Knowledge Analysis

Sistema de Autorização Unimed

Núvem Pública, Privada ou Híbrida, qual adotar?

UML 2. Guia Prático. Gilleanes T.A. Guedes. Novatec. Obra revisada e ampliada a partir do título Guia de Consulta Rápida UML 2

05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados

TERMO DE REFERÊNCIA Nº 4031 PARA CONTRATAÇÃO DE PESSOA FÍSICA PROCESSO DE SELEÇÃO - EDITAL Nº

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

LINGUAGEM DE BANCO DE DADOS

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Introdução a Gestão de Custos nas pequenas empresas Prof. MSc Hugo Vieira L. Souza

Manual do usuário. v1.0

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES. Trabalho de Graduação

como ferramenta de análise de informações no mercado de saúde: o caso da Unimed-BH Ana Paula Franco Viegas Pereira

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

Desigualdades em saúde - Mortalidade infantil. Palavras-chave: mortalidade infantil; qualidade de vida; desigualdade.

Primeira Pesquisa TecnoAtiva de Segurança da Informação da Bahia e Sergipe 2006

Gestão da Qualidade em Projetos

PRIAD: GESTÃO DE RELACIONAMENTO COM CLIENTES

Manual Operacional SIGA

5 Análise dos resultados

DICAS SOBRE VERIFICAÇÃO. POSITIVA x NEGATIVA

4 Implementação e Resultados Experimentais

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Fundamentos em Informática (Sistemas de Numeração e Representação de Dados)

GARANTIA DA QUALIDADE DE SOFTWARE

Transcrição:

Aplicação do processo de KDD em uma gestora de planos de saúde Lucas Carvalho de Paula Graduado em Sistemas de Informação pela Libertas Faculdades Integradas Ely Fernando do Prado Mestrando em Sistemas de Informação e professor da Libertas Faculdades Integradas RESUMO O data mining, faz parte de um processo muito maior que é o KDD (Knowledge Discovery in Databases), o qual pode ser usado para diversas finalidades, entre uma das principais é a clusterização ou agrupamento. Foi aplicada essa técnica para separação dos usuários de uma gestora de plano de saúde, de acordo com a utilização de serviços de cada um em um determinado período. Após esse processo os clusters (grupos) descobertos foram analisados e extraídos deles o conhecimento. O qual foi usado para elaboração de medidas de medicina preventiva para economia de gastos da gestora e conservação da saúde dos usuários. Palavras chave: Data mining, KDD, WEKA, planos de saúde, K-means, Oracle, clusterização, reconhecimento de padrões, 1 INTRODUÇÃO As gestoras de planos de saúde estão sempre buscando maneiras eficazes de prevenção de gastos. Isso pode ser feito de várias maneiras, por exemplo: cortes no orçamento, eliminar serviços da cobertura do usuário, medidas de medicina preventiva, entre outras. Sendo que aplicar medidas de medicina preventiva tem o melhor custo benefício, tanto do lado econômico quanto humanitário (ROSE, 2010). Em uma pesquisa realizada pelo Instituto de Estudos de Saúde Suplementar (IESS), foi usado nessa pesquisa a Variação dos Custos Médico-hospitalares (VCMH), que engloba todos os gastos de um paciente gera. E este índice foi comparado com o Índice Nacional de Preços ao Consumidor Amplo (IPCA) que mede a inflação acumulada em um período de 12 meses, o resultado está apresentado no gráfico 1, conforme CECHIN; MARTINS & LEITE (2009). É possível perceber que o VCMH sofreu reajustes maiores que o IPCA, conclui-se que o valor médio do VCMH está muito defasado em relação a inflação. 100

Gráfico 1 - Gráfico comparaivo IPCA X VCMH Fonte: http://www.iess.org.br/html/td00252009vcmh.pdf 2 REFERENCIAL TEÓRICO 2.1 Dados, banco de dados e SGBD Segundo Carneiro (2004, p. 4): (dados)... são fatos fornecidos que descrevem uma característica de um objeto ou evento de mundo real. Um dado é qualquer característica que descreva um fato ou objeto, uma informação surge quando um dado é inserido num determinado contexto. O banco de dados substitui o antigo sistema de armazenamento de informações: as fichas, fichários e arquivos. Um banco de dados é: Um conjunto de dados relacionados entre si armazenados segundo uma determinada lógica de forma para que possam ser recuperados quando necessário. Carneiro (2004, p. 4). Com o passar do tempo foi desenvolvido o Sistema Gerenciador de banco de dados (SGBD) que auxiliam na gerência e manutenção dos dados. 101

2.2 Oracle O Oracle é um SGBD que foi desenvolvido no final da década de 70 pela Oracle Corporation. O Oracle foi um dos primeiros bancos de dados relacionais do mercado, antes disso havia os modelos hierárquico e em rede, nesses modelos o armazenamento dos dados era pensado de acordo com o armazenamento físico. De acordo com o manual PL/SQL User s Guide and Reference (2005, p. 19), a linguagem PL/SQL é utilizada para consulta no Oracle, que possui forte ligação a linguagem SQL. 2.3 KDD Descoberta de conhecimento em base de dados Uma das melhores definições para esse processo foi feita por Fayyad (1996): Knowledge Discovery in Databases é um processo não trivial de identificar padrões válidos, originais, potencialmente úteis e compreensíveis em determinados bancos de dados. Alguns estudos usam a nomenclatura KDD e data mining como sinônimos, mas o data mining é uma etapa do processo de KDD. O KDD pode ser divido em etapas, podendo ser três ou cinco dependendo do autor. Este trabalho adotou a divisão em cinco etapas que segundo Fayyad (1996) são: Seleção, Pré-processamento, Formatação, Mineração de Dados (Data Mining) e Interpretação/avaliação. Cada parte do KDD tem suas características próprias, descritas a seguir: Seleção: Define os dados que serão utilizados no processo e é nesta etapa que os dados são separados de acordo com a necessidade e objetivo do projeto. Pré-processamento: Depois de selecionados os dados é preciso corrigir possíveis erros utilizando algumas técnicas, conforme Figueira (1998) são: padronização, remoção de duplicidade, eliminação de ruídos, preenchimento ou exclusão de ausentes. Formatação: Nesta etapa os dados são convertidos ou migrados para o formato que a ferramenta escolhida utilize. Mineração de dados (data mining):o processamento de todos os dados selecionados ocorre nessa fase do processo, as técnicas (algoritmos) são aplicadas a eles de acordo com o objetivo desejado. Alguns exemplos de técnicas usadas para data mining, segundo Goldschmit & Passos(2005, cap. 4): descoberta de associações, descoberta de sequências, classificação, sumarização, clusterização, previsão de séries temporais, entre outras. 102

Interpretação/avaliação: Esta avaliação deve ser feita pelos envolvidos na extração dos dados e especialistas no resultado a que se quer chegar. Exemplos de aplicação do KDD: segue abaixo alguns casos de sucesso na aplicação do data mining, conforme Loss & Rabelo (2004, p. 7-8): A rede americana Wall-Mart, pioneira no uso de Data Mining, descobriu ao explorar seus números que 60% das mães que compram boneca Barbie, levam também uma barra de chocolate. O SERPRO no Brasil, implantando o seu Data Warehouse e Data Mining, já consegue hoje cruzar e analisar informações em cinco minutos, o que antes demandavam quinze dias de trabalho. E o clássico exemplo de uma grande rede varejista americana (Wall-Mart) que descobriu, através de seu Data Mining,que as vendas de fraldas estavam intimamente ligadas às vendas de cerveja. Explicação, os pais que saiam à noite para comprar fraldas, compravam cerveja também. 2.4 WEKA O Waikato Environment for Knowledge Analysis (WEKA) começou a ser escrito em 1993, usando a linguagem de programação Java, na Universidade de Waikato, Nova Zelândia. O Weka é uma coleção de algoritmos de aprendizado de máquina para tarefas de mineração de dados. O Weka utiliza o padrão Attribute Relation File Format (ARFF) e tem a licença GNU General Public License. Fonte: http://www.cs.waikato.ac.nz/ml/weka/ 3 - METODOLOGIA Para o desenvolvimento e aplicação deste trabalho foram usadas três ferramentas (aplicativos) diferentes: SGBD Oracle, PL/SQL Developer e WEKA para o data mining; Seleção: Juntamente com esse select, foi feita a etapa de pré-processamento dos dados, os casos de duplicidade, ruídos, omissão de dados e falta padronização dos dados, foram tratados. Os campos selecionados foram: idade, sexo, nome do serviço e a quantidade realizada deste serviço no período de um ano. 103

Processamento: Foi realizado juntamente com a seleção dos dados, não havendo a necessidade da segunda etapa, para um tratamento mais detalhado de campos com dados incorretos ou inválidos e a padronização das informações. Transformação: O formato do arquivo de saída do select é csv. No próprio WEKA existe a funcionalidade para conversão de arquivos csv para arff. Data mining: A técnica de clusterização atende às necessidades do trabalho, pois o problema de pesquisa necessita de vários grupos como resposta e não há uma quantidade definida nem um padrão para cada grupo. O algoritmo usado para a clusterização foi o K- means, que segundo Berry e Linoff (2004, p. 354) e Goldschmit & Passos (2005), é um dos mais usados para essa técnica. No WEKA está disponível o algoritmo SimpleKmeans, baseado no K-means. Interpretação: O primeiro resultado está apresentado no gráfico 2. A cor dos pontos significa o tipo do sexo de cada instância (vermelho F, azul M ), o eixo x é a idade, partindo de 0 até 101 anos, e o eixo y a quantidade de vezes que um determinado usuário realizou um determinado procedimento no período de um ano. Foram feitos dois grupos os quais serão analisados no próximo capítulo. Gráfico 2 - Resultados pré-selecionados 104

4 ANÁLISE DE RESULTADOS Como mostrado no capítulo anterior nos gráfico 2, foram descobertos dois agrupamentos. Foi feita a análise juntamente com o departamento de marketing da gestora e chegou-se às seguintes conclusões, com base nesse primeiro resultado: No primeiro cluster estão usuários de 0 a 10 anos de idade e destacam-se os procedimentos de caráter diagnóstico (laboratoriais e radiológicos), porque nessa faixa etária são crianças que, por terem a imunidade mais baixa em relação aos adultos apresentam doenças que necessitam deste tipo de exames. No segundo cluster estão os usuários de 23 a 60 anos, a faixa etária em que se apresenta o período fértil das mulheres está neste grupo que abrange a faixa dos 15 aos 49 anos de idade. Os exames mais realizados dos 23 aos 38 anos estão diretamente relacionados à gravidez. Na faixa dos 38 aos 60 aparecem em maior número os exames hormonais, pois a mulher está no período da menopausa. No segundo resultado foi utilizado o algoritmo SimpleKmeans, e encontrados vinte clusters distintos. Após a avaliação verificou-se apenas sete clusters apresentavam alguma informação útil, apresentados no gráfico 3. Segue abaixo uma breve descrição de cada cluster: Cluster um (amarelo): apresentam mulheres de 25 a 32 anos, principais procedimentos realizados: exames de laboratórios relacionados à gravidez e às doenças sexuais e procedimento de parto via vaginal; Cluster dois (rosa): formado por mulheres de 33 a 38 anos de idade, os procedimentos mais comuns neste cluster são: exames laboratoriais relacionados à gravidez e às doenças sexuais, procedimentos de parto e ultrassons diversos; Cluster três (azul): formado por mulheres de 39 a 44 anos, com utilização dos procedimentos: mamografia, exames hormonais, procedimentos de parto, punção mamária, alguns casos de exérese de lesões na pele; 105

Gráfico 3 Resultados úteis com o algoritmo SimpleKmeans Cluster quatro (roxo): formado por homens na faixa etária dos 41 aos 50 anos, onde os procedimentos mais comuns são: exames de próstata, exames de urina e exames cardíacos; Cluster cinco (vermelho): também formado por homens, da idade de 51 a 60 anos, os procedimentos mais comuns neste cluster são: uma frequência maior dos exames de próstata do que apresenta o cluster quatro, cirurgias de próstata, exames laboratoriais, cirurgias e exames nas articulações.; Cluster seis (turquesa): cluster formado por mulheres na faixa dos 66 a 72 anos de idade, com os procedimentos mais comuns sendo exames: oftalmológicos, auditivos, hormonais, e aparecem também exames mais complexos (ressonâncias magnéticas, cintilografias e tomografias); Cluster sete (verde): formado por homens da idade de 74 a 95 anos, que realizam com frequência os procedimentos: cirurgia de remoção de próstata, exérese na pele, cirurgias ortopédicas, exames oftalmológicos, exames auditivos, e tratamentos para esses dois últimos, e com uma frequência muito grande aparecem fisioterapias de todos os tipos; 106

5 CONSIDERAÇÕES FINAIS Após a análise de cada cluster feitas no capítulo 4 deste trabalho foram enviadas as seguintes sugestões de medidas preventivas para a gestora: Realizar um maior número de palestras e cursos focados em gestantes e futuras gestantes, evitando várias consultas e exames que podem ser resolvidos nestes eventos; Realizar cursos preparatórios para os pais, principalmente quando for o primeiro filho, evitando realizar consultas muito frequentes; Fazer eventos que envolva a terceira idade, pessoas acima de 60 anos, estimulando-as a praticas de exercícios e buscar uma vida mais saudável, pois melhorando a qualidade de vida evita-se gastos com tratamentos como: fisioterapias e até mesmo cirurgias; Incentivar o exame anual de próstata nos homens a partir dos 45 anos, através de cartilhas ou palestras mostrando que quanto mais cedo é detectado o câncer maior a chance de tratamento e menos invasivo é o procedimento; Incentivar a realização da mamografia nas mulheres a partir 40 ou 50 anos, dependendo se há fatores de riscos, como casos confirmados de câncer de mama na família; Com este estudo foi comprovado que é possível através da aplicação do processo de KDD, reconhecer e classificar os usuários pertencentes a uma gestora de planos de saúde de acordo com a utilização dos mesmos. E de acordo com esse grupos tomar as decisões de quais medidas preventivas deve ser tomadas para evitar gastos futuros e zelar pela saúde dos usuários. REFERÊNCIAS A HISTÓRIA DO ORACLE: Inovação, Liderança e Resultados. Disponível em: <http://www.oracle.com/br/corporate/press/story-346137-ptb.html>. Acessado em 07 de março de 2012. ATKINSON, M.; BANCILHON, F.; DITTRICH, K.; MAIER, D.; ZDONIK, S.; The Object-Oriented Database System Manifesto. 1989. Disponível em: < cs.cmu.edu/afs/cs.cmu.edu/user/clamen/oodbms/manifesto/htmanifesto/manifesto.html>. Acessado em: 19 de março 2012. ATTRIBUTE-RELATION FILE FORMAT (ARFF). Disponível em: <http://www.cs.waikato.ac.nz/ml/weka/arff.html>. Acessado em: 27 de abril de 2012. BERRY, Michael J. A.; LINOFF, Gordon, S.. Data Mining Techniques: For Marketing, Sales and Customer Relationship Management. 2nd ed.. Indianapolis: Wiley Publishing, Inc., 2004. 643p. 107

BOUCKAERT, Remco R. et al. WEKA: Manual for Version 3-7-5. 2011. Disponível em: <http://ufpr.dl.sourceforge.net/project/weka/documentation/3.7.x/wekamanual-3-7-5.pdf>. Acessado em: 25 de abril de 2012. CARNEIRO, José Luís. Introdução a banco de dados. 2004. Salvador: s.n., 2004. 65p. CECHIN, José; MARTINS, Carina Burri; LEITE, Francine. VCMH Variação dos Custos Médico- Hospitalares, 2009. Disponível em: <http://www.iess.org.br/html/td00252009vcmh.pdf>. Acessado em: 25 de Janeiro de 2012. CHIARA, Ramon; Aplicação de Técnicas de Data Mining em Logs de Servidores Web. Universidade de São Paulo São Carlos, 2003. 176 p. COSTA, Rogério Luís de Carvalho. SQL: Guia Prático, 2nd ed. Rio de Janeiro: Brasport, 2006. 232 p. Disponível em: <http://books.google.com.br/books?id=3lxv-q6- S3MC&pg=PA16&lpg=PA16&dq=A+LMD+trata+dos+comandos+ligados+%C3%A0+manipula%C3%A7%C3 %A3o+de+dados,+definindo+os+comandos+para+a+sele%C3%A7%C3%A3o,+inclus%C3%A3o,+altera%C3% A7%C3%A3o+e+exclus%C3%A3o+de+dados+de+tabelas.+J%C3%A1+a+LDD+re%C3%BAne+os+comandos +para+a&source=bl&ots=iuvy6l8oxm&sig=eljmrnq2mxe_joifiiixdomvmy0&hl=pt- BR&sa=X&ei=_JrfT_nMLofm9ASs44nHCQ&ved=0CEsQ6AEwAA#v=onepage&q&f=true>. Acessado em: 18 de junho de 2012. ELMARI, Rames; NAVATHE, Shamkant B.. Fundamentals of Database Systems. 4th ed.. Boston: Pearson Addison Wesley, 2003. 1030 p. FANDERUFF, Damaris. Dominando o Oracle 9i: Modelagem e Desenvolvimento. São Paulo: Editora Pearson Education do Brasil, 2003. 372p. FAYYAD, Usama M.; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. The KDD Process for extracting Useful Knowledge from Volumes of Data. Comunications of the ACM, v. 39, p. 27-34, nov. de 1996. FIGUEIRA, Rafael. Mineração de dados e bancos de dados orientados a objetos. 1998. 96f, Dissertação (Mestrado em Ciência da Computação) Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2004. GENERAL PUBLIC LICENSE. Disponível em: <http://www.gnu.org/licenses/gpl.html>. Acessado em: 26 de abril de 2012. GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel. Data Mining: um guia prático. Rio de Janeiro: Elsevier, 2005. 261 p. GOMES, Romeu et al. A prevenção do câncer de próstata: uma revisão da literatura. Ciência & Saúde Coletiva, v. 3, p. 235-246, 2008. Disponível em: <http://www.scielo.br/pdf/csc/v13n1/26.pdf>. Acessado em 24 de junho de 2012. GONÇALVES, Lóren Pinto Ferreira, Avaliação de ferramentas de mineração de dados como fonte de dados relevantes para a tomada de decisão: aplicação na rede unidão de supermercados, São Leopoldo - RS. 2001. 92f. Dissertação (Mestrado em Administração) Universidade Federal do Rio Grande do Sul, Porto Alegre, 2001. HADDAD, Nagib; SILVA, Maria Barbosa. Mortalidade feminina em idade reprodutiva no Estado de São Paulo, Brasil, 1991-1995: causas básicas de óbito e mortalidade materna. Revista de Saúde Pública, v. 34, nº 1, p. 64-70, fev. 2000. Disponível em: <http://www.scielosp.org/pdf/rsp/v34n1/1383.pdf>. Acessado em: 24 de junho de 2012. HAYES, Frank; The Story So Far. 2002. Disponível em: <http://www.computerworld.com/s/article/70102/the_story_so_far?taxonomyid=009> Acessado em: 16 de março de 2012. 108

LOSS, Leandro; RABELO, Ricardo José. Sistemas de Data Mining. Florianópolis: Universidade Federal de Santa Catarina, 2004. 12 p. MARCHI, Ailton Augustinho; GURGEL, Maria Salete Costa; FONSECHI-CARVASAN, Gislaine Aparecida. Rastreamento mamográfico do câncer de mama em serviços de saúde públicos e privados. Revista Brasileira de Ginecologia e Obstetrícia, v. 28, p. 214-219, 2006. Disponível em: <http://www.scielo.br/pdf/rbgo/v28n4/a02v28n4.pdf>. Acessado em: 25 de junho de 2012. MUNIZ, Eliane. Introdução a banco de dados. S. l.:s.n. 200-?. ON TARGGET TREINAMENTO E CONSULTORIA. Introdução ao Oracle 8i: Volume I. S.l.: s.n., 2000. p. 15-16. Disponível em: <http://pt.scribd.com/doc/29296145/introducao-ao-oracle-8i>. Acessado em: 13 de março de 2012. PL/SQL USER s GUIDE AND REFERENCE. Oracle, 2005. Disponível em: <http://docs.oracle.com/cd/b19306_01/appdev.102/b14261.pdf> Acessado em 07 de março de 2012. RAMAKRISHNAN, Raghu, GEHRKE, Johannes. Database Management Systems. 3 ed.. New York: McGraw- Hill, 2003. 1065 p. REZENDE, Ricardo. Conceitos Fundamentais de Banco de Dados Parte 2.Disponível em: <http://www.sqlmagazine.com.br/colunistas/ricardorezende/03_conceitosbd_p2.asp>. Acessado em: 07 de março 2012. ROSE, Geoffrey. Estratégias de medicina preventiva. Porto Alegre: Artmed, 2010. 192 p. SQL REFERENCE. Oracle, 2005. Disponível em: <http://docs.oracle.com/cd/b19306_01/server.102/b14200.pdf>. Acessado em 07 de março de 2012. TAKAI, Osvaldo Koaro; ITALIANO, Isabel Cristina; FERREIRA, João Eduardo. Introdução a banco de dados. São Paulo: DCC-IME-USP, 2005. 124p. Capítulo 8. WEKA 3: Data Mining Software in Java. Disponível em: <http://www.cs.waikato.ac.nz/ml/weka/index.html>. Acessado em: 26 de abril de 2012. WITTEN, Ian H.; FRANK, Eibe; HALL, Mark A.. Data Mining: Pratical Machine Learning Tool and Techniques. 3rd ed. Burlington: Morgan Kaufmann Publishes, 2011. 629 p. 109