REDES BAYESIANAS. karila@outlook.com



Documentos relacionados
INF 1771 Inteligência Artificial

Inteligência Artificial

Eventos independentes

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos

c. Técnica de Estrutura de Controle Teste do Caminho Básico

Aprendizado Bayesiano. Disciplina: Agentes Adaptativos e Cognitivos

Raciocínio Probabilístico. Inteligência Artificial. Redes Bayesianas. Exemplo. Exemplo. Exemplo. Capítulo 14 Russell & Norvig Seções 14.1 a 14.

Processos de gerenciamento de projetos em um projeto

Guia de utilização da notação BPMN

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Engenharia de Software e Gerência de Projetos Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

3 Qualidade de Software

AMOSTRAGEM ESTATÍSTICA EM AUDITORIA PARTE ll

Capítulo 2. Processos de Software Pearson Prentice Hall. Todos os direitos reservados. slide 1

Do neurônio biológico ao neurônio das redes neurais artificiais

TÉCNICAS DE PROGRAMAÇÃO

natureza do projeto e da aplicação métodos e ferramentas a serem usados controles e produtos que precisam ser entregues

A REGULAMENTAÇÃO DA EAD E O REFLEXO NA OFERTA DE CURSOS PARA FORMAÇÃO DE PROFESSORES

Análise e Projeto de Software

2 Engenharia de Software

Gerenciamento de Projetos Modulo VIII Riscos

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade

ENSINO DE QUÍMICA: REALIDADE DOCENTE E A IMPORTANCIA DA EXPERIMENTAÇÃO PARA O PROCESSO DE APRENDIZAGEM

Probabilidade - aula I

AULA 6 Esquemas Elétricos Básicos das Subestações Elétricas

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

3.1 Definições Uma classe é a descrição de um tipo de objeto.

REDES BAYESIANAS. Palavras-chave: Redes bayesianas, Grafo, Estrutura de Dados, Inteligência artificial.

Sumário. 1 Introdução. Demonstrações Contábeis Decifradas. Aprendendo Teoria

Categorias Temas Significados Propostos

ANALISE COMBINATORIA Um pouco de probabilidade

2 Fundamentação Conceitual

ANÁLISE DAS MELHORIAS OCORRIDAS COM A IMPLANTAÇÃO DO SETOR DE GESTÃO DE PESSOAS NA NOVA ONDA EM ARACATI CE

Planejamento - 7. Planejamento do Gerenciamento do Risco Identificação dos riscos. Mauricio Lyra, PMP

ELABORAÇÃO DE PROJETOS

1 Um guia para este livro

Solução de problemas por meio de busca (com Python) Luis Martí DEE/PUC-Rio

4 Metodologia e estratégia de abordagem

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA

Matemática Aplicada às Ciências Sociais

PESQUISA EM INFORMÁTICA -ESTILOS DE PESQUISA EM COMPUTAÇÃO. Prof. Angelo Augusto Frozza, M.Sc.

Prof. Me. Marcos Echevarria

PROBABILIDADE Prof. Adriano Mendonça Souza, Dr.

Introdução a Banco de Dados Aula 03. Prof. Silvestri

3 Estratégia para o enriquecimento de informações

Roteiro SENAC. Análise de Riscos. Análise Quantitativa de Riscos. Análise Quantitativa de Riscos. Análise Quantitativa de Riscos

O QUE FAZER PARA MELHORAR O PROCESSO DE COMPRAS 1

A ESTRUTURA DA GESTÃO DE

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DA PARAÍBA CONSELHO SUPERIOR DE ENSINO, PESQUISA E EXTENSÃO

Os Estilos de Pesquisa na Computação. TCC Profº Carlos José Maria Olguín

Processos de Gerenciamento de Projetos. Planejamento e Controle de Projetos 5 TADS FSR. Processos

Engenharia de Software III

2 Trabalhos relacionados

PREVISÃO DE DEMANDA - O QUE PREVISÃO DE DEMANDA - TIPOS E TÉCNICAS DE PREVISÃO DE DEMANDA - MÉTODOS DE PREVISÃO - EXERCÍCIOS

; CONSOLI, M. A. ; NEVES,

BSC Balance Score Card

A IMPORTÂNCIA DA PARTICIPAÇÃO DOS PAIS NA EDUCAÇÃO DOS FILHOS NO CONTEXTO ESCOLAR

Agentes Inteligentes. Inteligência Artificial. Exemplos. Agentes Inteligentes. Prof. Ms. Luiz Alberto Contato:

Teste de Software: Um Breve Estudo do Importante Processo no Desenvolvimento de Softwares

CAPÍTULO 3. Sistemas com Vários Componentes (Multicomponentes) em Modelos Markovianos de Decisão

A presente seção apresenta e especifica as hipótese que se buscou testar com o experimento. A seção 5 vai detalhar o desenho do experimento.

TÍTULO: COMPARAÇÃO ENTRE OS MÉTODOS DE BUSCA EM ESPAÇOS DE ESTADOS E O ALGORITMO DE DIJKSTRA

6. Pronunciamento Técnico CPC 23 Políticas Contábeis, Mudança de Estimativa e Retificação de Erro

O Uso da Inteligência Competitiva e Seus Sete Subprocessos nas Empresas Familiares

CURSO DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

Conhecimento Incerto Redes de Crença

SISTEMA DE AVALIAÇÃO E APOIO À QUALIDADE DO ENSINO A DISTÂNCIA

Norma Interpretativa 2 Uso de Técnicas de Valor Presente para mensurar o Valor de Uso

Aula 4 Estatística Conceitos básicos

4. Metodologia. Capítulo 4 - Metodologia

Conflito de Interesses e Imparcialidade dos Auditores dos Organismos Certificadores

UNEMAT SISTEMA DE INFORMAÇÃO (SI) Professora: Priscila Pelegrini

Resolução da lista de exercícios de casos de uso

EGC Gestão Estratégica da Tecnologia da Informação

MARKETING DE RELACIONAMENTO COM OS FORNECEDORES 1

AS CONTRIBUIÇÕES DAS VÍDEO AULAS NA FORMAÇÃO DO EDUCANDO.

Recomendada. A coleção apresenta eficiência e adequação. Ciências adequados a cada faixa etária, além de

Jornal Oficial da União Europeia L 141/5

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

LISTA DE VERIFICAÇAO DO SISTEMA DE GESTAO DA QUALIDADE

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

PLANEJAMENTO OPERACIONAL - MARKETING E PRODUÇÃO MÓDULO 16 AS QUATRO FASES DO PCP

1. Introdução. Avaliação de Usabilidade Página 1

Fundamentos de Teste de Software

ANÁLISE DOS RESULTADOS DOS PROGRAMAS DE APOIO ÀS PMEs NO BRASIL Resumo Executivo PARA BAIXAR A AVALIAÇÃO COMPLETA:

TRANSMISSÃO DE DADOS Prof. Ricardo Rodrigues Barcelar

Plano de aula. 5. Metodologia: Aula expositiva dialógica orientada pela interação: alunos professor conhecimento.

2 METODOLOGIA DA PESQUISA

Módulo 9 A Avaliação de Desempenho faz parte do subsistema de aplicação de recursos humanos.

Modelagem Matemática Aplicada ao Ensino de Cálculo 1

CÓDIGO CRÉDITOS PERÍODO PRÉ-REQUISITO TURMA ANO INTRODUÇÃO

CURSO. Master in Business Economics 1. vire aqui

Aula 2 Revisão 1. Ciclo de Vida. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW

Gerenciamento de Projeto: Planejando os Riscos. Prof. Msc Ricardo Britto DIE-UFPI

TÉCNICAS DE ORIENTAÇÃO DOS MILITARES USADAS NO BRASIL

Preparação do Trabalho de Pesquisa

Transcrição:

REDES BAYESIANAS Karila Palma Silva Programa de Pós-Graduação em Engenharia de Automação e Sistemas (PPGEAS) Universidade Federal de Santa Catarina (UFSC) Florianópolis SC Brasil karila@outlook.com Abstract This paper describes the Bayesian Networks, which is a good strategy for dealing with problems dealing uncertainties, being able to automatically generate predictions or decisions even in the situation of lack of information. Keywords Bayesian network, Artificial Intelligence, probability, uncertainty. Resumo Este artigo descreve as Redes Bayesianas, que representa uma boa estratégia para lidar com problemas que tratam incertezas, sendo capazes de gerar automaticamente predições ou decisões mesmo na situação de inexistência de informação. Palavras-chave Rede Bayesiana, Inteligência Artificial, probabilidade, incerteza. 1 Introdução Uma grande área de estudos em Inteligência Artificial é o desenvolvimento de sistemas que agem racionalmente. Dentro deste contexto, duas abordagens principais podem ser utilizadas: raciocínio lógico e raciocínio probabilístico (Marques and Dutra, 2002). O raciocínio lógico pondera sobre o conhecimento prévio a respeito do problema e, extraí suas conclusões. Entretanto, esta abordagem pode não ser útil em situações onde não se conhece previamente todo o escopo do problema, para estes casos, o raciocínio probabilístico surge como uma boa opção (Marques and Dutra, 2002). Um sistema que possa atuar em situações de incerteza deve ser capaz de atribuir níveis de confiabilidade para todas as sentenças em sua base de conhecimento, além de, estabelecer relações entre as sentenças. Redes bayesianas oferecem uma abordagem para o raciocínio probabilístico envolvendo teoria de grafos, para o estabelecimento das relações entre sentenças e, teoria de probabilidades, para a atribuição de níveis de confiabilidade (Marques and Dutra, 2002). Dentre as possíveis abordagens para o raciocínio probabilístico, será tratado neste artigo a Rede Bayesiana, que são modelos que procuram representar a realidade, podendo inferir a probabilidade de um ou mais eventos, dada a observação de alguma evidência, possibitando predições ou decisões mesmo em situação de inexistência de informação (Calil, 2009). 2 Motivação As Redes Bayesianas permitem analisar grandes quantidades de dados, possibilitando extrair conhecimentos úteis em tomada de decisões, controlar ou prever o comportamento de um sistema, diagnosticar as causas de um fenômeno. Com isso, dentre os motivos para a utilização de Rede Bayesiana podemos destacar a possibilidade de expressar as assertivas de independência de forma visual e de fácil percepção, possibilidade de representação e armazenamento de uma distribuição conjunta de forma econômica, explorando a esparcidade do relacionamento entre as variáveis, além de tornar o processo de inferência eficiente computacionalmente (Luna, 2004), (da Silva e M. Ladeira, 2002). 3 Estado da arte O termo Redes Bayesianas derivou da utilização da fórmula matemática para o cálculo de probabilidades estabelecidas pelo reverendo Thomas Bayes em 1763 (Orlandeli, 2005). Portanto, para a compreensão das redes bayesianas, primeiramente será introduzido conceitos básicos da teoria de probabilidade e o Teorema de Bayes. 3.1 Teoria da Probabilidade A teoria da probabilidade permite medir as incertezas anteriormente aos acontecimentos de eventos atribuindo um valor no intervalo [0, 1] que representa a probabilidade de ocorrência de um determinado evento, ou seja, trata de incertezas aleatórias (Tibiriçá, 2005). Quando existe alguma evidência com relação às proposições que fazem parte do domínio, não são mais aplicáveis as probabilidades a priori, sendo então usadas as probabilidades a posteriori ou probabilidades condicionais. A probabilidade a posteriori representa a probabilidade de um evento ocorrer dado que outro evento já ocorreu (Arruda, 2004). Os sistemas desenvolvidos utilizando o método probabilístico baseiam-se no Teorema de

Bayes. 3.2 Teorema de Bayes O teorema de Bayes é um método quantitativo para a revisão de probabilidades conhecidas (probabilidades a priori), com base em nova informação amostral, sendo fundamental para se analisar um conjunto de informações disponíveis e se chegar a uma conclusão objetiva, expressa numericamente, sendo útil para o cálculo de probabilidade, especificamente a probabilidade condicional (Tibiriçá, 2005). O seu método consiste em particionar em diversos subconjuntos o espaço amostral, cujas probabilidades sejam conhecidas e, em seguida, aplicar a Fórmula 1 (Plentz, 2003): P (A i /B) = P (B/A i) P (A i ) P (B/Aj ) P (A j ) (1) Onde: A i : é o evento cujo a probabilidade se quer calcular dado que o evento B tenha ocorrido; A j : representa genericamente uma das fatias da partição do espaço amostral (A i é uma dessas fatias ); Esse método permite que se ajuste uma probabilidade a priori de um dado evento em vista de novas evidências envolvendo um outro evento que apresenta relação de dependência. Também possibilita representar numericamente o grau de certeza sobre um evento, e manipulação de acordo com as regras da teoria de probabilidade (Plentz, 2003). Na teoria da probabilidade, dados dois eventos A e B, é possível condicionar A a ocorrência de B. Essa probabilidade condicional é dada por (Plentz, 2003): P (A B) = P (A B), sep (B) > 0 (2) P (B) P (A B) pode ser interpretada como a atualização da crença em A dado que a evidencia B tornou-se disponível. O teorema de Bayes descrito pode facilmente ser reescrito de forma a obter a probabilidade posterior de uma hipótese A, após a observação de alguma evidencia A, dado a probabilidade a priori em A e a verossimilhança da observação B estar em A (Plentz, 2003): P (A B) = (P (B A)P (A)) ; sep (B) > 0 (3) P (B) Esta fórmula tem imensa importância prática num domínio como o de diagnóstico. 4 Rede Bayesiana Segundo (Russell and Norvig, 2004), Rede Bayesiana 1 é um grafo orientado em que cada nó (variáveis de interesse) é identificado como informações de probabilidade quantitativa, sendo um modelo de representação do conhecimento, que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana. Sua especificação consiste em: 1. Conjunto de variáveis aleatórias constitui os nós da rede. As variáveis podem ser discretas ou contínuas. 2. Conjunto de vínculo orientados ou setas conecta pares de nós. Se houver uma seta do nó X até o nó Y, X será denominado pai de Y. 3. Cada nó X i tem uma distribuição de probabilidade condicional P(X i Pais(X i )) que quantifica o efeito dos pais sobre o nó. 4. O grafo não tem nenhum ciclo orientado (é um grafo acíclico direcionado (Direct Acyclic Graphic - DAG)). A topologia da rede especifica os relacionamentos de independência condicional que são válidos no domínio. O significado intuitivo de uma seta em uma rede construída corretamente em geral é que X tem influência direta sobre Y, com isso, facilita para um especialista em domínios descobrir quais são as influências diretas existêntes no domínio. Definido a topologia da rede bayesiana, só é preciso especificar uma distribuição de probabilidade condicional para cada variável, dados seus pais (Russell and Norvig, 2004). A estrutura de uma Rede Bayesiana é composta por duas partes complementares, uma qualitativa e outra quantitativa. A qualitativa corresponde a estrutura gráfica da rede, composta pelas variáveis de entrada (evidência), variável de saída (hipótese) e os arcos (relação de dependência entre elas). (Tibiriçá, 2005). E a quantitativa à base de conhecimento da rede, é composta pelo conjunto de probabilidades condicionais, associado aos arcos existentes no modelo gráfico da parte qualitativa e as probabilidades estimadas a priori das hipóteses. As incertezas tratadas pelas Redes Bayesianas são expressas em probabilidades, que devem ser estabelecidas pelo especialista, representando seu conhecimento (Tibiriçá, 2005), (Arruda, 2004). Assim, a topologia da rede representa: Modelo probabilístico completo de um domínio, com a descrição das informações qualitativas (relações de dependências), e quantitativas (distribuições de probabilidades); 1 também conhecidas como rede casal, rede de crença e gráficos de dependência probabilística, mapa de conhecimente.

Estrutura de controle para a inferência. Em cada topologia de rede existem restrições sobre o tipo de conhecimento que é possível expressar. 4.1 Tipos de Conexões em uma Rede Causal Quando é deparado com raciocino de incerteza é importante saber se devido a criação e eliminação de relacionamentos de dependências, a informação sobre algum evento influencia a crença em outros. Com isso, será abordado as formas de propagação de evidência entre variáveis em um DAG: serial, divergente e convergente (LADEIRA et al., 1999). Na conexão serial, conforme mostrado na Figura 1, uma evidência em A influencia a crença em B que influencia a crença em C. E uma evidência em C se propaga para A. Nesses casos não há propagação de influência se B está instanciado porque o canal entre A e C fica bloqueado, tornandoos condicionalmente independentes. Com isso, I(A,B,C) é válido e A e C são ditos d-separados, dado B (LADEIRA et al., 1999). Figura 1: Serial. Na conexão divergente, conforme mostrado na Figura 2, uma evidência em um ascendente de A influencia a crença sobre os filhos de A, exceto se A é instanciado. Desta forma, uma evidência em A bloqueia o canal de comunicação com os seus filhos, tornando-os condicionalmente independentes. Com isso, B, C,.., E são d-separados, dado A (LADEIRA et al., 1999). Figura 2: Divergente. Na conexão convergente, conforme mostrado na Figura 3, evidência em A ou em um dos seus descendentes influencia a crença nos pais de A, tornando-os condicionalmente dependentes. Se nada é conhecido sobre A, exceto o que pode ser inferido a partir do conhecimento de seus pais B, C,.., E então eles são independentes (d-separados) pois evidência em um deles não influencia a crença sobre os outros. Portanto evidência só pode ser transmitida em uma conexão convergente se nem a variável na conexão ou qualquer dos seus descendentes recebeu alguma evidência (LADEIRA et al., 1999). Figura 3: Convergente. 4.2 Semântica das Redes Bayesianas Para compreender a semântica das Redes Bayesianas temos: a rede como uma representação da distribuição de probabilidade conjunta, uma forma útil na compreensão de como construir redes, e outra forma é visualizá-la como uma codificação de uma coleção de declarações de independência condicional, que é útil no projeto de procedimento (Russell and Norvig, 2004). Na representação da distribuição conjunta total, uma Rede Bayesiana fornece descrição completa do domínio. Toda a entrada pode ser calculada a partir das informações armazenadas na rede. Uma entrada genárica na distribuição conjunta é a probabilidade de uma conjunção de atribuições específicas a cada variável, como P (X 1 = x 1... X n = x n ). Assim, o valor dessa entrada é dado pela equação (Russell and Norvig, 2004): P (x 1,..., x n ) = n P (x i pais(x i )) (4) i=1 Sendo P (x i pais(x i )) a probabilidade de ocorrência de x i condicionada ás variáveis pais. Portanto, é possível calcular a distribuição de probabilidade conjunta a partir de probabilidades condicionais locais (Matsumoto and dos Santos, 2008). Com isso, cada entrada da distribuição conjunta é representada pelo produto dos elementos apropriados das tabelas de probabilidade condicional (TPCs), na Rede Bayesiana. Na relação de independência condicional, é fornecido uma semântica numérica em termos de representação da distribuição conjunta total, e utilizando desta para derivar um método com a finalidade de construir Redes Bayesianas, verificou-se que um nó é condicionalmente independênte de seus predecessores, dados seus pais. É possível também começar de uma semântica (topológica) que especifique os relacionamentos de independência condicional codificados por grafo, com isso, possibilita derivar a semântica numérica (Russell and Norvig, 2004). A semântica é dada por uma das especificações, que são equivalentes: Um nó é condicionalmente independente de seus não-descendentes, dados seus pais, conforme mostrado na Figura 4. Ou um nó é condicionalmente independente de todos os outros nós na rede, dados seus pais, conforme mostrado na Figura 5 (Russell and Norvig, 2004).

nós correspondente ao fato de Maria estar ouvindo música alta ou João confundir o alarme com o telefone. Esses fatores são resumidos na incerteza associada aos vínculos Alarme para JoãoLigar e MariaLigar. Figura 4: X é condicionalmente independente de seus não-descendentes dados seus pais. 4.3.1 Método para construção de uma rede Bayesiana Com base na equação 4 é construído a Rede Bayesiana, a qual será reescrita para: P (x 1,..., x n ) = P (x n 1 x n 1,..., x 1 )P (x n 1...x 1 ) Esse processo é repetido, reduzindo cada conjunção de probabilidade em uma probabilidade condicional e uma conjunção menor, a qual comparada com 4, verifica que a especificação de uma tabela de conjunção de probabilidade é equivalente com a declaração geral (Russell and Norvig, 2004), (Marques and Dutra, 2002): P (X i X i 1 ) = P (X i pais(x i ))parapais(x i ) (5) Figura 5: X é condicionalmente independente de todos os outros nós na rede, dados seus pais. 4.3 Exemplo Para exemplificar uma Rede Bayesiana típica, considere o exemplo extraído de (Russell and Norvig, 2004), onde, tem-se um alarme contra roubo em casa. Este alarme é bastante confiável na detecção de roubo, entretanto, ele também pode disparar caso ocorra um terremoto. Considerando a existência de dois vizinhos, João e Maria, os quais prometeram comunicar caso o alarme dispare. João sempre liga quando ouve o alarme, entretanto, algumas vezes confunde o alarme com o telefone e também liga nestes casos. Maria, por outro lado, gosta de ouvir música alta e às vezes não escuta o alarme. Este domínio pode ser representado como apresenta a figura 6. x i 1,..., X 1 Com isso, verifica-se que uma rede Bayesiana é a representação correta de um domínio se e somente se, cada nó é condicionalmente independente de seus predecessores, dado seu pai. Para se construir uma rede cuja estrutura represente devidamente o domínio do problema, é necessário que para todo nó da rede esta propriedade seja atendida. Portanto, é possível, por exemplo, determinar que a seguinte igualdade é verdadeira: P(MariaLig JoaoLig,Alarme,Terremoto,Roubo) = P(MariaLig Alarme); Assim, um procedimento geral para construção de redes Bayesianas (Marques and Dutra, 2002): 1. Escolha um conjunto de variáveis X i que descrevam o domínio; 2. Escolha uma ordem para as variáveis; 3. Enquanto existir variáveis: Escolha uma variável X i e adicione um nó na rede; Determine os nós pais(x i ) dentre os nós que já estejam na rede e que satisfaçam a equação 5; Defina a tabela de probabilidades condicionais para Xi. Figura 6: Rede Bayesiana Simples. Observa-se que em caso de roubos ou terremotos afetam diretamente a probabilidade do alarme soar, no entanto, o fato de João e Maria ligares só depende do alarme. E também a rede não tem Após definir a topologia, é necessário definir a tabela de probabilidades condicionais para cada nó, onde cada linha na tabela contém a probabilidade condicional para cada caso condicional dos nós pais. Sendo que, um caso condicional é uma possível combinação dos valores para os nós pais.

A segunda tebela abaixo exemplifica a TPC para a variável aleatória Alarme. Letra Significador R Roubo T Terremoto A Alarme J JoãoLiga M MariaLiga V Verdadeiro F Falso P(A L,T) Roubo Terremoto V F V V 0.95 0.050 V F 0.94 0.060 F V 0.29 0.71 F F 0.001 0.999 A Figura 7, ilustra uma Rede Bayesiana, mostrando a topologia e as tabelas de probabilidade condicional. entanto, quando se trata de apenas uma variável, a inferência é trivial, porém no caso geral, o problema é NP-hard. Os tipos de inferência em Redes Bayesianas são (Lima, 2012): Inferência Diagnostica (de efeitos para causas): Dado que João liga, qual a probabilidade de roubo? Exemplo: P (R J). Inferência Casual (de causas para efeitos): Dado roubo, qual é a probabilidade de João ligar? Exemplo: P (J R). Inferência Intercasual (entre causas de um evento em comum): Dado terremoto e alarme, qual a probabilidade de roubo? Exemplo: P (R A T ). Inferência Mista (algumas causas e alguns efeitos conhecidos): Dado que João liga e não existe terremoto, qual é a probabilidade de alarme? Exemplo: P (A J T ). A Figura 8 ilustra a representação gráfica dos tipos de inferência. Figura 7: Rede Bayseiana. 4.3.2 Representando a distribuição de conjunção de probabilidades A partir das informações disponíveis em uma rede Bayesiana, podem ser calculadas as entradas da tabela de conjunção de probabilidades, a qual representa a descrição completa de um domínio (Marques and Dutra, 2002). Como exemplo, considere que se deseja calcular a probabilidade do alarme ter soado, mas não tenha ocorrido nenhum roubo e nem um terremoto aconteceu, e ambos, João e Maria ligaram. Assim, temos (Marques and Dutra, 2002): P (J M A R T ) = P (J A)P (M A)P (A R T )P ( R) P ( T ) = 0.9 0.7 0.001 0.999 0.998 = 0.00062 4.4 Inferência A rede Bayesiana contém toda a informação necessária para inferir as probabilidades dos valores de uma ou mais variáveis na rede, à partir das probabilidades dos valores das outras variáveis, no Figura 8: Tipos de Inferência. 4.5 Aprendizagem Bayesiana As Redes Bayesianas foram desenvolvidas supondo-se uma dependência de especialistas humanos para a definição do DAG, mas elas podem ser construídas tanto a partir do conhecimento de especialistas humanos quanto a partir de bases de dados, com a utilização de algoritmos de aprendizagem Bayesiana (Matsuura, 2003). O aprendizado pode ocorrer com supervisão onde a aquisição dos conceitos e do conhecimento estruturado é orientada por um supervisor ou uma função de supervisão que classifica os resultados

apresentados em certos ou errados; e o aprendizado sem supervisão que ocorre sem esse tipo de orientação (Matsuura, 2003). Com isso, um método de aprendizagem Bayesiana será supervisionado se existir uma função de avaliação do desempenho da rede, no caso de classificadores Bayesianos, isso ocorre na forma da variável a ser classificada. É um aprendizado por exemplos, onde cada tupla é um exemplo de classificação e a função de avaliação normalmente medirá a capacidade da Rede Bayesiana classificar corretamente as variáveis, dada a evidência dos atributos. Caso não haja essa função de avaliação de desempenho, ou seja, caso a Rede Bayesiana não tenha o objetivo de classificar uma variável, o método será não supervisionado (Matsuura, 2003). Os algoritmos de aprendizagem Bayesiana não-supervisionados podem ser divididos em duas categorias, uma que utiliza métodos de busca heurística, para construir possíveis Redes Bayesianas e então avaliá-la usando um método de pontuação, que estima a adequação da rede em análise com relação ao conjunto de dados fornecidos, e não com relação à correta classificação de uma variável, como no caso de aprendizagem supervisionada. O processo de construção de possíveis Redes Bayesianas continua até que a pontuação das novas redes não seja significantemente melhor que as das anteriores ou até que um critério de parada seja atingido. E outra categoria que constrói Redes Bayesianas pela análise de relações de dependência entre os nós, as possíveis relações de dependência entre os vários nós são avaliadas pelo uso de testes de independência condicional e são criados os arcos para as dependências mais relevantes (Matsuura, 2003). Geralmente a primeira categoria citada apresenta resultados mais rápidos, mas devido à sua natureza heurística pode não encontrar a melhor solução. Enquanto que a segunda categoria cita converge para a melhor solução, mas apenas em situações onde as distribuições de probabilidade satisfazem certas hipóteses (Matsuura, 2003). 4.6 Vantagens Dentre as vantagens que as Redes Bayesianas apresentam podemos citar (Akizuki and e Cristina Vieira de Melo, 2006): Inclusão da incerteza no modelo de estimativas além de relações de causa e efeito; Possibilidade de combinar diversos tipos de informações; Informações que antes ficavam ocultas, são deixadas explícitas (hipóteses), adicionando visibilidade ao processo de decisão; Representação em gráficos intuitivos, explicita e de fácil compreensão do modelo, mesmo para usuários pouco familiarizados com a teoria Bayesiana; Habilidade de fazer previsões mesmo com dados incompletos; Não é necessário nenhum cálculo complexo, dado que existem ferramentas que fazem isso (aprendizagem de probabilidades, aprendizagem da estrutura da Rede Bayesiana, possibilidade de integrar variáveis contínuas, variáveis de utilidade e de decisão). 4.7 Desvanatagens As Redes Bayesianas apresentam algumas desvantagens/limitações, das quais podemos citar (Oliveira, 2011): Não incorporam malhas de realimentação (feedback loops); Representarem de maneira sucinta dinâmicas temporais e espaciais; Em caso de uma definição ruim dos estados podem mascarar a análise de um determinado cenário ou condição de entrada. 5 Aplicações Redes Bayesianas têm sido utilizadas em diversos tipos de aplicações e em diferentes áreas, como: saúde (diagnóstico, localização de genes), indústria (controle de autômatos ou de robôs), computação e redes (agentes inteligentes), marketing (mineração de dados, gestão da relação com os clientes), finanças (análise financeira), gestão (tomada de decisões, gestão de conhecimento e risco). A seguir serão apresendados alguns projetos. Application of Bayesian Networks to Assist the Expansion of the Digital Inclusion Of Elderly People: auxiliar uma iniciativa de inclusão digital de idosos (Sales et al., 2010). A Aplicação do Modelo de Redes Bayesianas para o Gerenciamento de Risco de Ruptura em Cadeias de Suprimento: auxiliar o gerenciamento de atributos como disponibilidade e eficiência de custos nos processos de gestão de estoques na rede (Silva et al., 2008). Aprendizagem Estrutural de Redes Bayesianas Utilizando Métrica MDL Modificada: explorar o aprendizado da estrutura da rede Bayesiana utilizando-se um algoritmo de busca (Pifer and Guedes, 2007). AutoClass, NASAs Ames Research Center, 1998 - Sistema de exploração e aquisição de conhecimento espacial.

Pathfinder, Heckerman 1990. Stanford - Sistema para diagnósticos de problemas nas glândulas linfáticas. 6 Ferramentas Dentre as ferramentas existentes para criação e manipulação de Redes Bayesianas podemos citar: JavaBayes; Bayesia; GeNIe & SMILE; Hugin Expert; Netica; UnBBayes (Windows 2000, Millenium e XP); BNet. 7 Conclusões Conclui-se que as Redes Bayesianas representam uma técnica poderosa em um domínio de incerteza, além de proporcionam uma forma de visualização global dos dados do problema que facilita o entendimento do sistema. Referências Akizuki, D. and e Cristina Vieira de Melo (2006). Medidas de riscos de software usando redes bayesianas, Technical report. Arruda, A. A. C. d. (2004). Desenvolvimento do banco de desafios para o clube virtual de ciências. Calil, L. F. P. (2009). Metodologia para Gerenciamento de Risco: Foco na Segurança e na Continuidade, PhD thesis, Universidade Federal de Santa Catarina. Programa de Pósgraduação em Engenharia de Mecânica. da Silva e M. Ladeira, W. T. (2002). Mineraà ão de dados em redes bayesianas, Vol. 2, p. 235 286. LADEIRA, M., VICARI, R. M. and COELHO, H. (1999). Redes bayesianas multiagentes, Congreso da Sociedade Brasileira de Computação, XIX. Lima, E. S. d. (2012). Redes bayesianas. Luna, J. E. O. (2004). Algoritmos em para aprendizagem de redes bayesianas a partir de dados incompletos, Universidade Federal de Mato Grosso do Sul. Marques, R. L. and Dutra, I. (2002). Redes bayesianas: o que são, para que servem, algoritmos e exemplos de aplicações, Coppe Sistemas Universidade Federal do Rio de Janeiro, Rio de Janeiro, Brasil. Matsumoto, S. and dos Santos, L. L. (2008). Framework para redes bayesianas multientidades e ontologias probabilãsticas. Matsuura, J. P. (2003). Discretização para Aprendizagem Bayesiana: Aplicação no Auxílio à Validação de Dados em Proteção ao Vôo, PhD thesis, Dissertação de Mestrado, Instituto Tecnológico de Aeronáutica, São José dos Campos. Oliveira, M. A. d. (2011). Desenvolvimento de um modelo de previsão de performance de projetos considerando a influência do estilo de liderança sobre a agilidade ea flexibilidade da organização, PhD thesis, Universidade Federal de Santa Catarina, Programa de Pósgraduação em Engenharia de Produção. Orlandeli, R. (2005). Um modelo markovianobayesiano de inteligência artificial para avaliação dinâmica do aprendizado: aplicação à logística, PhD thesis, Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-graduação em Engenharia de Produção. Pifer, A. and Guedes, L. (2007). Aprendizagem estrutural de redes bayesianas utilizando métrica mdl modificada, AC Pifer e LA Guedes, IEEE Latin America Transactions 5(8). Plentz, R. D. (2003). Redes bayesianas para análise de comportamento aplicadas a telefonia celular, Master s thesis, Universidade Federal de Santa Catarina, Programa de Pósgraduação em Ciência da Computação. Russell, S. J. and Norvig, P. (2004). InteligÃa ncia artificial, Elsevier. Sales, M. B. d., Schwaab, A. A. d. S. and Nassar, S. M. (2010). Application of bayesian networks to assist the expansion of the digital inclusion of elderly people, Latin America Transactions, IEEE (Revista IEEE America Latina) 8(3): 275 279. Silva, A. L. B., Ladeira, M. B. and OLIVEIRA, M. d. (2008). A aplicação do modelo de redes bayesianas para o gerenciamento de risco de ruptura em cadeias de suprimento, XI Simpósio de Administração da Produção, Logística e Operações Internacionais. Local FGV- EAESP, de 27.

Tibiriçá, C. A. G. (2005). Uma abordagem híbrida fuzzy-bayesiana para modelagem de incertezas, Master s thesis, Universidade Federal de Santa Catarina, Programa de Pós-graduação em Ciência da Computação.