REDES BAYESIANAS. karila@outlook.com

REDES BAYESIANAS Karila Palma Silva Programa de Pós-Graduação em Engenharia de Automação e Sistemas (PPGEAS) Universidade Federal de Santa Catarina (UFSC) Florianópolis SC Brasil karila@outlook.com Abstract This paper describes the Bayesian Networks, which is a good strategy for dealing with problems dealing uncertainties, being able to automatically generate predictions or decisions even in the situation of lack of information. Keywords Bayesian network, Artificial Intelligence, probability, uncertainty. Resumo Este artigo descreve as Redes Bayesianas, que representa uma boa estratégia para lidar com problemas que tratam incertezas, sendo capazes de gerar automaticamente predições ou decisões mesmo na situação de inexistência de informação. Palavras-chave Rede Bayesiana, Inteligência Artificial, probabilidade, incerteza. 1 Introdução Uma grande área de estudos em Inteligência Artificial é o desenvolvimento de sistemas que agem racionalmente. Dentro deste contexto, duas abordagens principais podem ser utilizadas: raciocínio lógico e raciocínio probabilístico (Marques and Dutra, 2002). O raciocínio lógico pondera sobre o conhecimento prévio a respeito do problema e, extraí suas conclusões. Entretanto, esta abordagem pode não ser útil em situações onde não se conhece previamente todo o escopo do problema, para estes casos, o raciocínio probabilístico surge como uma boa opção (Marques and Dutra, 2002). Um sistema que possa atuar em situações de incerteza deve ser capaz de atribuir níveis de confiabilidade para todas as sentenças em sua base de conhecimento, além de, estabelecer relações entre as sentenças. Redes bayesianas oferecem uma abordagem para o raciocínio probabilístico envolvendo teoria de grafos, para o estabelecimento das relações entre sentenças e, teoria de probabilidades, para a atribuição de níveis de confiabilidade (Marques and Dutra, 2002). Dentre as possíveis abordagens para o raciocínio probabilístico, será tratado neste artigo a Rede Bayesiana, que são modelos que procuram representar a realidade, podendo inferir a probabilidade de um ou mais eventos, dada a observação de alguma evidência, possibitando predições ou decisões mesmo em situação de inexistência de informação (Calil, 2009). 2 Motivação As Redes Bayesianas permitem analisar grandes quantidades de dados, possibilitando extrair conhecimentos úteis em tomada de decisões, controlar ou prever o comportamento de um sistema, diagnosticar as causas de um fenômeno. Com isso, dentre os motivos para a utilização de Rede Bayesiana podemos destacar a possibilidade de expressar as assertivas de independência de forma visual e de fácil percepção, possibilidade de representação e armazenamento de uma distribuição conjunta de forma econômica, explorando a esparcidade do relacionamento entre as variáveis, além de tornar o processo de inferência eficiente computacionalmente (Luna, 2004), (da Silva e M. Ladeira, 2002). 3 Estado da arte O termo Redes Bayesianas derivou da utilização da fórmula matemática para o cálculo de probabilidades estabelecidas pelo reverendo Thomas Bayes em 1763 (Orlandeli, 2005). Portanto, para a compreensão das redes bayesianas, primeiramente será introduzido conceitos básicos da teoria de probabilidade e o Teorema de Bayes. 3.1 Teoria da Probabilidade A teoria da probabilidade permite medir as incertezas anteriormente aos acontecimentos de eventos atribuindo um valor no intervalo [0, 1] que representa a probabilidade de ocorrência de um determinado evento, ou seja, trata de incertezas aleatórias (Tibiriçá, 2005). Quando existe alguma evidência com relação às proposições que fazem parte do domínio, não são mais aplicáveis as probabilidades a priori, sendo então usadas as probabilidades a posteriori ou probabilidades condicionais. A probabilidade a posteriori representa a probabilidade de um evento ocorrer dado que outro evento já ocorreu (Arruda, 2004). Os sistemas desenvolvidos utilizando o método probabilístico baseiam-se no Teorema de

Bayes. 3.2 Teorema de Bayes O teorema de Bayes é um método quantitativo para a revisão de probabilidades conhecidas (probabilidades a priori), com base em nova informação amostral, sendo fundamental para se analisar um conjunto de informações disponíveis e se chegar a uma conclusão objetiva, expressa numericamente, sendo útil para o cálculo de probabilidade, especificamente a probabilidade condicional (Tibiriçá, 2005). O seu método consiste em particionar em diversos subconjuntos o espaço amostral, cujas probabilidades sejam conhecidas e, em seguida, aplicar a Fórmula 1 (Plentz, 2003): P (A i /B) = P (B/A i) P (A i ) P (B/Aj ) P (A j ) (1) Onde: A i : é o evento cujo a probabilidade se quer calcular dado que o evento B tenha ocorrido; A j : representa genericamente uma das fatias da partição do espaço amostral (A i é uma dessas fatias ); Esse método permite que se ajuste uma probabilidade a priori de um dado evento em vista de novas evidências envolvendo um outro evento que apresenta relação de dependência. Também possibilita representar numericamente o grau de certeza sobre um evento, e manipulação de acordo com as regras da teoria de probabilidade (Plentz, 2003). Na teoria da probabilidade, dados dois eventos A e B, é possível condicionar A a ocorrência de B. Essa probabilidade condicional é dada por (Plentz, 2003): P (A B) = P (A B), sep (B) > 0 (2) P (B) P (A B) pode ser interpretada como a atualização da crença em A dado que a evidencia B tornou-se disponível. O teorema de Bayes descrito pode facilmente ser reescrito de forma a obter a probabilidade posterior de uma hipótese A, após a observação de alguma evidencia A, dado a probabilidade a priori em A e a verossimilhança da observação B estar em A (Plentz, 2003): P (A B) = (P (B A)P (A)) ; sep (B) > 0 (3) P (B) Esta fórmula tem imensa importância prática num domínio como o de diagnóstico. 4 Rede Bayesiana Segundo (Russell and Norvig, 2004), Rede Bayesiana 1 é um grafo orientado em que cada nó (variáveis de interesse) é identificado como informações de probabilidade quantitativa, sendo um modelo de representação do conhecimento, que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana. Sua especificação consiste em: 1. Conjunto de variáveis aleatórias constitui os nós da rede. As variáveis podem ser discretas ou contínuas. 2. Conjunto de vínculo orientados ou setas conecta pares de nós. Se houver uma seta do nó X até o nó Y, X será denominado pai de Y. 3. Cada nó X i tem uma distribuição de probabilidade condicional P(X i Pais(X i )) que quantifica o efeito dos pais sobre o nó. 4. O grafo não tem nenhum ciclo orientado (é um grafo acíclico direcionado (Direct Acyclic Graphic - DAG)). A topologia da rede especifica os relacionamentos de independência condicional que são válidos no domínio. O significado intuitivo de uma seta em uma rede construída corretamente em geral é que X tem influência direta sobre Y, com isso, facilita para um especialista em domínios descobrir quais são as influências diretas existêntes no domínio. Definido a topologia da rede bayesiana, só é preciso especificar uma distribuição de probabilidade condicional para cada variável, dados seus pais (Russell and Norvig, 2004). A estrutura de uma Rede Bayesiana é composta por duas partes complementares, uma qualitativa e outra quantitativa. A qualitativa corresponde a estrutura gráfica da rede, composta pelas variáveis de entrada (evidência), variável de saída (hipótese) e os arcos (relação de dependência entre elas). (Tibiriçá, 2005). E a quantitativa à base de conhecimento da rede, é composta pelo conjunto de probabilidades condicionais, associado aos arcos existentes no modelo gráfico da parte qualitativa e as probabilidades estimadas a priori das hipóteses. As incertezas tratadas pelas Redes Bayesianas são expressas em probabilidades, que devem ser estabelecidas pelo especialista, representando seu conhecimento (Tibiriçá, 2005), (Arruda, 2004). Assim, a topologia da rede representa: Modelo probabilístico completo de um domínio, com a descrição das informações qualitativas (relações de dependências), e quantitativas (distribuições de probabilidades); 1 também conhecidas como rede casal, rede de crença e gráficos de dependência probabilística, mapa de conhecimente.

Estrutura de controle para a inferência. Em cada topologia de rede existem restrições sobre o tipo de conhecimento que é possível expressar. 4.1 Tipos de Conexões em uma Rede Causal Quando é deparado com raciocino de incerteza é importante saber se devido a criação e eliminação de relacionamentos de dependências, a informação sobre algum evento influencia a crença em outros. Com isso, será abordado as formas de propagação de evidência entre variáveis em um DAG: serial, divergente e convergente (LADEIRA et al., 1999). Na conexão serial, conforme mostrado na Figura 1, uma evidência em A influencia a crença em B que influencia a crença em C. E uma evidência em C se propaga para A. Nesses casos não há propagação de influência se B está instanciado porque o canal entre A e C fica bloqueado, tornandoos condicionalmente independentes. Com isso, I(A,B,C) é válido e A e C são ditos d-separados, dado B (LADEIRA et al., 1999). Figura 1: Serial. Na conexão divergente, conforme mostrado na Figura 2, uma evidência em um ascendente de A influencia a crença sobre os filhos de A, exceto se A é instanciado. Desta forma, uma evidência em A bloqueia o canal de comunicação com os seus filhos, tornando-os condicionalmente independentes. Com isso, B, C,.., E são d-separados, dado A (LADEIRA et al., 1999). Figura 2: Divergente. Na conexão convergente, conforme mostrado na Figura 3, evidência em A ou em um dos seus descendentes influencia a crença nos pais de A, tornando-os condicionalmente dependentes. Se nada é conhecido sobre A, exceto o que pode ser inferido a partir do conhecimento de seus pais B, C,.., E então eles são independentes (d-separados) pois evidência em um deles não influencia a crença sobre os outros. Portanto evidência só pode ser transmitida em uma conexão convergente se nem a variável na conexão ou qualquer dos seus descendentes recebeu alguma evidência (LADEIRA et al., 1999). Figura 3: Convergente. 4.2 Semântica das Redes Bayesianas Para compreender a semântica das Redes Bayesianas temos: a rede como uma representação da distribuição de probabilidade conjunta, uma forma útil na compreensão de como construir redes, e outra forma é visualizá-la como uma codificação de uma coleção de declarações de independência condicional, que é útil no projeto de procedimento (Russell and Norvig, 2004). Na representação da distribuição conjunta total, uma Rede Bayesiana fornece descrição completa do domínio. Toda a entrada pode ser calculada a partir das informações armazenadas na rede. Uma entrada genárica na distribuição conjunta é a probabilidade de uma conjunção de atribuições específicas a cada variável, como P (X 1 = x 1... X n = x n ). Assim, o valor dessa entrada é dado pela equação (Russell and Norvig, 2004): P (x 1,..., x n ) = n P (x i pais(x i )) (4) i=1 Sendo P (x i pais(x i )) a probabilidade de ocorrência de x i condicionada ás variáveis pais. Portanto, é possível calcular a distribuição de probabilidade conjunta a partir de probabilidades condicionais locais (Matsumoto and dos Santos, 2008). Com isso, cada entrada da distribuição conjunta é representada pelo produto dos elementos apropriados das tabelas de probabilidade condicional (TPCs), na Rede Bayesiana. Na relação de independência condicional, é fornecido uma semântica numérica em termos de representação da distribuição conjunta total, e utilizando desta para derivar um método com a finalidade de construir Redes Bayesianas, verificou-se que um nó é condicionalmente independênte de seus predecessores, dados seus pais. É possível também começar de uma semântica (topológica) que especifique os relacionamentos de independência condicional codificados por grafo, com isso, possibilita derivar a semântica numérica (Russell and Norvig, 2004). A semântica é dada por uma das especificações, que são equivalentes: Um nó é condicionalmente independente de seus não-descendentes, dados seus pais, conforme mostrado na Figura 4. Ou um nó é condicionalmente independente de todos os outros nós na rede, dados seus pais, conforme mostrado na Figura 5 (Russell and Norvig, 2004).

nós correspondente ao fato de Maria estar ouvindo música alta ou João confundir o alarme com o telefone. Esses fatores são resumidos na incerteza associada aos vínculos Alarme para JoãoLigar e MariaLigar. Figura 4: X é condicionalmente independente de seus não-descendentes dados seus pais. 4.3.1 Método para construção de uma rede Bayesiana Com base na equação 4 é construído a Rede Bayesiana, a qual será reescrita para: P (x 1,..., x n ) = P (x n 1 x n 1,..., x 1 )P (x n 1...x 1 ) Esse processo é repetido, reduzindo cada conjunção de probabilidade em uma probabilidade condicional e uma conjunção menor, a qual comparada com 4, verifica que a especificação de uma tabela de conjunção de probabilidade é equivalente com a declaração geral (Russell and Norvig, 2004), (Marques and Dutra, 2002): P (X i X i 1 ) = P (X i pais(x i ))parapais(x i ) (5) Figura 5: X é condicionalmente independente de todos os outros nós na rede, dados seus pais. 4.3 Exemplo Para exemplificar uma Rede Bayesiana típica, considere o exemplo extraído de (Russell and Norvig, 2004), onde, tem-se um alarme contra roubo em casa. Este alarme é bastante confiável na detecção de roubo, entretanto, ele também pode disparar caso ocorra um terremoto. Considerando a existência de dois vizinhos, João e Maria, os quais prometeram comunicar caso o alarme dispare. João sempre liga quando ouve o alarme, entretanto, algumas vezes confunde o alarme com o telefone e também liga nestes casos. Maria, por outro lado, gosta de ouvir música alta e às vezes não escuta o alarme. Este domínio pode ser representado como apresenta a figura 6. x i 1,..., X 1 Com isso, verifica-se que uma rede Bayesiana é a representação correta de um domínio se e somente se, cada nó é condicionalmente independente de seus predecessores, dado seu pai. Para se construir uma rede cuja estrutura represente devidamente o domínio do problema, é necessário que para todo nó da rede esta propriedade seja atendida. Portanto, é possível, por exemplo, determinar que a seguinte igualdade é verdadeira: P(MariaLig JoaoLig,Alarme,Terremoto,Roubo) = P(MariaLig Alarme); Assim, um procedimento geral para construção de redes Bayesianas (Marques and Dutra, 2002): 1. Escolha um conjunto de variáveis X i que descrevam o domínio; 2. Escolha uma ordem para as variáveis; 3. Enquanto existir variáveis: Escolha uma variável X i e adicione um nó na rede; Determine os nós pais(x i ) dentre os nós que já estejam na rede e que satisfaçam a equação 5; Defina a tabela de probabilidades condicionais para Xi. Figura 6: Rede Bayesiana Simples. Observa-se que em caso de roubos ou terremotos afetam diretamente a probabilidade do alarme soar, no entanto, o fato de João e Maria ligares só depende do alarme. E também a rede não tem Após definir a topologia, é necessário definir a tabela de probabilidades condicionais para cada nó, onde cada linha na tabela contém a probabilidade condicional para cada caso condicional dos nós pais. Sendo que, um caso condicional é uma possível combinação dos valores para os nós pais.

A segunda tebela abaixo exemplifica a TPC para a variável aleatória Alarme. Letra Significador R Roubo T Terremoto A Alarme J JoãoLiga M MariaLiga V Verdadeiro F Falso P(A L,T) Roubo Terremoto V F V V 0.95 0.050 V F 0.94 0.060 F V 0.29 0.71 F F 0.001 0.999 A Figura 7, ilustra uma Rede Bayesiana, mostrando a topologia e as tabelas de probabilidade condicional. entanto, quando se trata de apenas uma variável, a inferência é trivial, porém no caso geral, o problema é NP-hard. Os tipos de inferência em Redes Bayesianas são (Lima, 2012): Inferência Diagnostica (de efeitos para causas): Dado que João liga, qual a probabilidade de roubo? Exemplo: P (R J). Inferência Casual (de causas para efeitos): Dado roubo, qual é a probabilidade de João ligar? Exemplo: P (J R). Inferência Intercasual (entre causas de um evento em comum): Dado terremoto e alarme, qual a probabilidade de roubo? Exemplo: P (R A T ). Inferência Mista (algumas causas e alguns efeitos conhecidos): Dado que João liga e não existe terremoto, qual é a probabilidade de alarme? Exemplo: P (A J T ). A Figura 8 ilustra a representação gráfica dos tipos de inferência. Figura 7: Rede Bayseiana. 4.3.2 Representando a distribuição de conjunção de probabilidades A partir das informações disponíveis em uma rede Bayesiana, podem ser calculadas as entradas da tabela de conjunção de probabilidades, a qual representa a descrição completa de um domínio (Marques and Dutra, 2002). Como exemplo, considere que se deseja calcular a probabilidade do alarme ter soado, mas não tenha ocorrido nenhum roubo e nem um terremoto aconteceu, e ambos, João e Maria ligaram. Assim, temos (Marques and Dutra, 2002): P (J M A R T ) = P (J A)P (M A)P (A R T )P ( R) P ( T ) = 0.9 0.7 0.001 0.999 0.998 = 0.00062 4.4 Inferência A rede Bayesiana contém toda a informação necessária para inferir as probabilidades dos valores de uma ou mais variáveis na rede, à partir das probabilidades dos valores das outras variáveis, no Figura 8: Tipos de Inferência. 4.5 Aprendizagem Bayesiana As Redes Bayesianas foram desenvolvidas supondo-se uma dependência de especialistas humanos para a definição do DAG, mas elas podem ser construídas tanto a partir do conhecimento de especialistas humanos quanto a partir de bases de dados, com a utilização de algoritmos de aprendizagem Bayesiana (Matsuura, 2003). O aprendizado pode ocorrer com supervisão onde a aquisição dos conceitos e do conhecimento estruturado é orientada por um supervisor ou uma função de supervisão que classifica os resultados

apresentados em certos ou errados; e o aprendizado sem supervisão que ocorre sem esse tipo de orientação (Matsuura, 2003). Com isso, um método de aprendizagem Bayesiana será supervisionado se existir uma função de avaliação do desempenho da rede, no caso de classificadores Bayesianos, isso ocorre na forma da variável a ser classificada. É um aprendizado por exemplos, onde cada tupla é um exemplo de classificação e a função de avaliação normalmente medirá a capacidade da Rede Bayesiana classificar corretamente as variáveis, dada a evidência dos atributos. Caso não haja essa função de avaliação de desempenho, ou seja, caso a Rede Bayesiana não tenha o objetivo de classificar uma variável, o método será não supervisionado (Matsuura, 2003). Os algoritmos de aprendizagem Bayesiana não-supervisionados podem ser divididos em duas categorias, uma que utiliza métodos de busca heurística, para construir possíveis Redes Bayesianas e então avaliá-la usando um método de pontuação, que estima a adequação da rede em análise com relação ao conjunto de dados fornecidos, e não com relação à correta classificação de uma variável, como no caso de aprendizagem supervisionada. O processo de construção de possíveis Redes Bayesianas continua até que a pontuação das novas redes não seja significantemente melhor que as das anteriores ou até que um critério de parada seja atingido. E outra categoria que constrói Redes Bayesianas pela análise de relações de dependência entre os nós, as possíveis relações de dependência entre os vários nós são avaliadas pelo uso de testes de independência condicional e são criados os arcos para as dependências mais relevantes (Matsuura, 2003). Geralmente a primeira categoria citada apresenta resultados mais rápidos, mas devido à sua natureza heurística pode não encontrar a melhor solução. Enquanto que a segunda categoria cita converge para a melhor solução, mas apenas em situações onde as distribuições de probabilidade satisfazem certas hipóteses (Matsuura, 2003). 4.6 Vantagens Dentre as vantagens que as Redes Bayesianas apresentam podemos citar (Akizuki and e Cristina Vieira de Melo, 2006): Inclusão da incerteza no modelo de estimativas além de relações de causa e efeito; Possibilidade de combinar diversos tipos de informações; Informações que antes ficavam ocultas, são deixadas explícitas (hipóteses), adicionando visibilidade ao processo de decisão; Representação em gráficos intuitivos, explicita e de fácil compreensão do modelo, mesmo para usuários pouco familiarizados com a teoria Bayesiana; Habilidade de fazer previsões mesmo com dados incompletos; Não é necessário nenhum cálculo complexo, dado que existem ferramentas que fazem isso (aprendizagem de probabilidades, aprendizagem da estrutura da Rede Bayesiana, possibilidade de integrar variáveis contínuas, variáveis de utilidade e de decisão). 4.7 Desvanatagens As Redes Bayesianas apresentam algumas desvantagens/limitações, das quais podemos citar (Oliveira, 2011): Não incorporam malhas de realimentação (feedback loops); Representarem de maneira sucinta dinâmicas temporais e espaciais; Em caso de uma definição ruim dos estados podem mascarar a análise de um determinado cenário ou condição de entrada. 5 Aplicações Redes Bayesianas têm sido utilizadas em diversos tipos de aplicações e em diferentes áreas, como: saúde (diagnóstico, localização de genes), indústria (controle de autômatos ou de robôs), computação e redes (agentes inteligentes), marketing (mineração de dados, gestão da relação com os clientes), finanças (análise financeira), gestão (tomada de decisões, gestão de conhecimento e risco). A seguir serão apresendados alguns projetos. Application of Bayesian Networks to Assist the Expansion of the Digital Inclusion Of Elderly People: auxiliar uma iniciativa de inclusão digital de idosos (Sales et al., 2010). A Aplicação do Modelo de Redes Bayesianas para o Gerenciamento de Risco de Ruptura em Cadeias de Suprimento: auxiliar o gerenciamento de atributos como disponibilidade e eficiência de custos nos processos de gestão de estoques na rede (Silva et al., 2008). Aprendizagem Estrutural de Redes Bayesianas Utilizando Métrica MDL Modificada: explorar o aprendizado da estrutura da rede Bayesiana utilizando-se um algoritmo de busca (Pifer and Guedes, 2007). AutoClass, NASAs Ames Research Center, 1998 - Sistema de exploração e aquisição de conhecimento espacial.

Pathfinder, Heckerman 1990. Stanford - Sistema para diagnósticos de problemas nas glândulas linfáticas. 6 Ferramentas Dentre as ferramentas existentes para criação e manipulação de Redes Bayesianas podemos citar: JavaBayes; Bayesia; GeNIe & SMILE; Hugin Expert; Netica; UnBBayes (Windows 2000, Millenium e XP); BNet. 7 Conclusões Conclui-se que as Redes Bayesianas representam uma técnica poderosa em um domínio de incerteza, além de proporcionam uma forma de visualização global dos dados do problema que facilita o entendimento do sistema. Referências Akizuki, D. and e Cristina Vieira de Melo (2006). Medidas de riscos de software usando redes bayesianas, Technical report. Arruda, A. A. C. d. (2004). Desenvolvimento do banco de desafios para o clube virtual de ciências. Calil, L. F. P. (2009). Metodologia para Gerenciamento de Risco: Foco na Segurança e na Continuidade, PhD thesis, Universidade Federal de Santa Catarina. Programa de Pósgraduação em Engenharia de Mecânica. da Silva e M. Ladeira, W. T. (2002). MineraÃ ão de dados em redes bayesianas, Vol. 2, p. 235 286. LADEIRA, M., VICARI, R. M. and COELHO, H. (1999). Redes bayesianas multiagentes, Congreso da Sociedade Brasileira de Computação, XIX. Lima, E. S. d. (2012). Redes bayesianas. Luna, J. E. O. (2004). Algoritmos em para aprendizagem de redes bayesianas a partir de dados incompletos, Universidade Federal de Mato Grosso do Sul. Marques, R. L. and Dutra, I. (2002). Redes bayesianas: o que são, para que servem, algoritmos e exemplos de aplicações, Coppe Sistemas Universidade Federal do Rio de Janeiro, Rio de Janeiro, Brasil. Matsumoto, S. and dos Santos, L. L. (2008). Framework para redes bayesianas multientidades e ontologias probabilãsticas. Matsuura, J. P. (2003). Discretização para Aprendizagem Bayesiana: Aplicação no Auxílio à Validação de Dados em Proteção ao Vôo, PhD thesis, Dissertação de Mestrado, Instituto Tecnológico de Aeronáutica, São José dos Campos. Oliveira, M. A. d. (2011). Desenvolvimento de um modelo de previsão de performance de projetos considerando a influência do estilo de liderança sobre a agilidade ea flexibilidade da organização, PhD thesis, Universidade Federal de Santa Catarina, Programa de Pósgraduação em Engenharia de Produção. Orlandeli, R. (2005). Um modelo markovianobayesiano de inteligência artificial para avaliação dinâmica do aprendizado: aplicação à logística, PhD thesis, Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-graduação em Engenharia de Produção. Pifer, A. and Guedes, L. (2007). Aprendizagem estrutural de redes bayesianas utilizando métrica mdl modificada, AC Pifer e LA Guedes, IEEE Latin America Transactions 5(8). Plentz, R. D. (2003). Redes bayesianas para análise de comportamento aplicadas a telefonia celular, Master s thesis, Universidade Federal de Santa Catarina, Programa de Pósgraduação em Ciência da Computação. Russell, S. J. and Norvig, P. (2004). InteligÃa ncia artificial, Elsevier. Sales, M. B. d., Schwaab, A. A. d. S. and Nassar, S. M. (2010). Application of bayesian networks to assist the expansion of the digital inclusion of elderly people, Latin America Transactions, IEEE (Revista IEEE America Latina) 8(3): 275 279. Silva, A. L. B., Ladeira, M. B. and OLIVEIRA, M. d. (2008). A aplicação do modelo de redes bayesianas para o gerenciamento de risco de ruptura em cadeias de suprimento, XI Simpósio de Administração da Produção, Logística e Operações Internacionais. Local FGV- EAESP, de 27.

Tibiriçá, C. A. G. (2005). Uma abordagem híbrida fuzzy-bayesiana para modelagem de incertezas, Master s thesis, Universidade Federal de Santa Catarina, Programa de Pós-graduação em Ciência da Computação.