REDES BAYESIANAS. Palavras-chave: Redes bayesianas, Grafo, Estrutura de Dados, Inteligência artificial.



Documentos relacionados
Raciocínio Probabilístico. Inteligência Artificial. Redes Bayesianas. Exemplo. Exemplo. Exemplo. Capítulo 14 Russell & Norvig Seções 14.1 a 14.

Artificial Intelligence,

6 Construção de Cenários

Este material traz a teoria necessária à resolução das questões propostas.

Cálculo das Probabilidades e Estatística I

Raciocínio Lógico - Parte II

Espaço Amostral ( ): conjunto de todos os

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes

INF 1771 Inteligência Artificial

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade

Estatística e Probabilidade. Aula 4 Cap 03. Probabilidade

Eventos independentes

Fundamentos da Matemática

Conceitos Iniciais Parte 1

Calculando probabilidades

Arquitetura de Rede de Computadores

Você sabe a regra de três?

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

Teste de Gravidez. Série Matemática na Escola

RESOLUÇÃO DAS QUESTÕES DE RACIOCÍNIO LÓGICO-MATEMÁTICO

BCC202 - Estrutura de Dados I

(a 1 + a 100 ) + (a 2 + a 99 ) + (a 3 + a 98 ) (a 50 + a 51 ).

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

Lógica Indutiva. Aula 4. Prof. André Martins

Preparando sua empresa para o forecasting:

Aula 05 Raciocínio Lógico p/ INSS - Técnico do Seguro Social - Com Videoaulas

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br

PROBABILIDADE Prof. Adriano Mendonça Souza, Dr.

RESOLUÇÃO DAS QUESTÕES DE RACIOCÍNIO LÓGICO-MATEMÁTICO

C Curso destinado à preparação para Concursos Públicos e Aprimoramento Profissional via INTERNET RACIOCÍNIO LÓGICO AULA 7

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti

PRÓ-MATATEMÁTICA NA FORMAÇÃO DE PROFESSORES

Sistema Inteligente Não-Linear de Apoio à Aprendizagem 1 Rangel RIGO, Ana Paula Laboissière AMBRÓSIO

Cooperativa de Leite. Série Matemática na Escola

Lógica e Raciocínio. Decisão sob Risco Probabilidade. Universidade da Madeira.

Capítulo 4 - Roteamento e Roteadores

SISTEMA CLÁSSICO DE REDUÇÃO

Introdução à Matemática Financeira

5 Equacionando os problemas

CURSO ON-LINE PROFESSOR GUILHERME NEVES

Exercícios resolvidos sobre Definição de Probabilidade

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

Gabarito da Prova de Oficinas dos Velhos Ano 2008

Computadores XXI: Busca e execução Final

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

Dois eventos são disjuntos ou mutuamente exclusivos quando não tem elementos em comum. Isto é, A B = Φ

TÍTULO: Plano de Aula UMA FATIA DE PIZZA OU UMA BANDA DE INTERNET? Ensino Fundamental/ Anos Iniciais. 5º ano. Matemática

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade

O Guia para Blogueiros de Gabriel dos Reis

Aprendizagem da Análise Combinatória nas séries iniciais do Ensino Fundamental

VESTIBULAR: Uma escolha profissional que interliga a família e a escola

Eduardo J. A. e SILVA 2 Camilla P. BRASILEIRO 3 Claudomilson F. BRAGA 4 Universidade Federal de Goiás, Goiânia, GO

Aula 11 Esperança e variância de variáveis aleatórias discretas

16. A relatividade especial e a experiência / O espaço quadridimensional de Minkowski / 68

Princípio da Casa dos Pombos I

Linguagem algorítmica: Portugol

Análise e Complexidade de Algoritmos

MODELO PROBABILISTICO PARA O SORTEIO DA MEGA SENA

Universidade do Algarve

Sistema para Visualização dos Resultados de Pesquisas de Clima Organizacional. PERSPECTIVA Consultores Associados Ltda.

Na Figura a seguir apresento um exemplo de uma "mini-tabela" de roteamento:

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Aula 4 Estatística Conceitos básicos

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Mercados de Publicidade

RESOLUÇÃO DAS QUESTÕES DE RACIOCÍNIO LÓGICO-MATEMÁTICO

Um Estudo Sobre a Chance de Repetição de Sorteios na Mega-Sena

Dicas para a 6 a Lista de Álgebra 1 (Conteúdo: Homomorfismos de Grupos e Teorema do Isomorfismo para grupos) Professor: Igor Lima.

BRINCANDO COM GRÁFICOS E MEDINDO A SORTE

Exercícios Teóricos Resolvidos

UM TEOREMA QUE PODE SER USADO NA

LOTOFACIL MAIS FÁCIL

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

Unidade VI. Validação e Verificação de Software Teste de Software. Conteúdo. Técnicas de Teste. Estratégias de Teste

Prof. Me. Marcos Echevarria

2. Representação Numérica

Inteligência Computacional Aplicada a Engenharia de Software

Disponibilizo a íntegra das 8 questões elaboradas para o Simulado, no qual foram aproveitadas 4 questões, com as respectivas resoluções comentadas.

O conceito de probabilidade

Contagem I. Figura 1: Abrindo uma Porta.

Unidade 11 - Probabilidade. Probabilidade Empírica Probabilidade Teórica

INF 1771 Inteligência Artificial

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

RESOLUÇÃO DAS QUESTÕES DE RACIOCÍNIO LÓGICO-MATEMÁTICO

A equação do 2º grau

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Conhecimento Incerto Redes de Crença

COMO DETERMINAR O PREÇO DE UMA

Revisão de combinatória

Regra do Evento Raro p/ Inferência Estatística:

Implementação e avaliação

3º Ano do Ensino Médio. Aula nº 02. Assunto: JUROS E PORCENTAGENS

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto.

PLANIFICAÇÃO OPERACIONAL DA PESQUISA

AULA 5 QUANTIFICADORES, PREDICADOS E VALIDADE

ESTRUTURA CONDICIONAL

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

Pisa 2012: O que os dados dizem sobre o Brasil

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente:

Transcrição:

REDES BAYESIANAS Gabriel Rigo da Cruz Jacobsen gabrielrigoj@gmail.com Prof. Leonardo Sommariva, Estrutura de Dados RESUMO: Uma rede bayesiana é uma forma de representar o conhecimento de um domínio onde não se tem certeza de todas as variáveis presentes. Através da probabilidade podemos responder, com níveis de certeza, a questões formuladas com base em evidências de uma situação. Palavras-chave: Redes bayesianas, Grafo, Estrutura de Dados, Inteligência artificial. 1 INTRODUÇÃO Desde o nosso nascimento somos submetidos a situações probabilísticas. Por exemplo, ao atravessar a rua, estamos rodeados de parâmetros que definem se atravessaremos a rua com segurança ou não, como a distância de um carro até você, a velocidade dos carros, a intensidade do tráfego e muitos outros. Com base nisso, decidimos qual o melhor momento e/ou qual o melhor lugar para realizar a travessia. Aparentemente, encaramos isso de maneira simples, mas simular essa tomada de decisão não é uma tarefa simples, e para isso, podemos utilizar redes bayesianas, que trabalham a partir do raciocínio probabilístico, e estabelecem um conjunto de dependências entre variáveis, que podem ser discretas ou contínuas. 2 DESENVOLVIMENTO Quando nos deparamos com problemas onde não há conhecimento total de todos os elementos apresentados, estamos trabalhando sob incerteza. Com isso, se faz necessário utilizar de um percentual para definirmos qual será a melhor solução, dadas certas evidências. Algoritmos para diagnóstico utilizam desse método de resolução para prever qual será o resultado mais provável para determinado problema. Para isso é usado um importante campo da Matemática: a Probabilidade. A probabilidade muitas vezes é descrita na maioria das fontes de pesquisa como sendo um estudo de fenômenos aleatórios. Em um domínio composto por um agente inteligente, este agente deverá, através da probabilidade, determinar, por exemplo, qual a melhor ação a ser tomada baseada em evidências adquiridas ao longo da execução do sistema. A melhor ação é definida pela alta

probabilidade dela acontecer juntamente com seu nível de utilidade. A utilidade é uma questão importante na hora da decisão, pois nem sempre um plano onde temos uma probabilidade maior de sucesso, será o melhor. Por exemplo, se quisermos sair de uma cidade para chegar até a cidade B até 19:00, montamos um planejamento de viagem que nos garantirá uma boa chance de chegar ao nosso destino a tempo. O plano X nos diz para saírmos com quarenta minutos de antecedência, sendo que, em média, essa distância é percorrida em vinte minutos. Temos que levar em consideração alguns fatores que determinam o melhor plano, neste caso, o atraso é um fator importante a ser levado em consideração. Vamos supor que temos um plano Y, que nos diz para sair com três horas de antecedência. Certamente, a chance de atraso para o plano Y é bem menor, mas será que é vantajoso adotar o plano Y? Sendo que quando chegarmos no destino, teremos um tempo muito longo de espera. O agente então precisa definir qual dos dois planos será o mais útil para ele, na hora de tomar sua decisão. De acordo com (NORVIG; RUSSEL, 1995): Teoria da decisão = teoria da probabilidade + teoria da utilidade. 2.1 PROBABILIDADE Segundo (MEYER, 2000), um evento é, simplesmente, um conjuto de resultados possíveis, onde o evento será um subconjunto de um espaço amostral. O espaço amostral é constituído por todos os valores que analisaremos em um problema. A probabilidade de determinado evento ocorrer é dada pelo número de elementos contidos no evento A dividido pelo número de elementos do espaço amostral. Quando precisamos calcular a probabilidade de um evento A, tal que o evento B tenha ocorrido, usamos probabilidade condicionada, que, de acordo com (MORGADO et al., 2004) pode ser descrita como:. Isto é, a probabilidade de A acontecer, tal que B, é igual a probabilidade de A e B acontecerem dividido pela probabilidade de B acontecer, sempre que P(B) > 0. Podemos reescrever isso como sendo:. Como, temos que, ou seja,, que é o Teorema de Bayes, formulado por Thomas Bayes, e apresentado após a sua morte, em 1763. As redes bayesianas são representações gráficas deste teorema. Segundo (NORVIG; RUSSEL, 1995), uma distribuição conjunta total especifica a probabilidade de todo evento atômico, sendo assim uma especificação completa da incerteza

sobre um mundo. Um evento atômico é uma atribuição de valores a todas as variáveis presentes em um domínio incerto. Por exemplo, se existisse um mundo onde houvesse apenas uma váriavel booleana A. Os eventos atômicos seriam A = verdadeiro e A = falso. Para um mundo com duas variáveis booleanas A e B, teríamos que A = falso ^ B = falso seria um evento atômico. Tabela 1: Relação dos eventos atômicos de um domínio. DorDeDente DorDeDente Boticão Boticão Boticão Boticão Cárie 0.108 0.012 0.072 0.008 Cárie 0.016 0.064 0.144 0.576 Fonte: (NORVIG; RUSSEL, 1995) Tomando como exemplo de (NORVIG; RUSSEL, 1995), temos um mundo com três variáveis booleanas DorDeDente, Cárie e Boticão. O número de eventos atômicos é dado por 2 neste exemplo, tendo em vista que todas as variáveis são booleanas, onde k representa o número de váriaveis. A distribuição conjunta total é descrita na Figura 1. Se quisermos saber, por exemplo, a probabilidade de Cárie ser verdadeiro, basta somar todos os eventos atômicos em que essa condição aparece: P(Cárie) = 0.108 + 0.012 + 0.072 + 0.008 Esse processo se chama totalização ou marginalização. 2.2 REDES BAYESIANAS Uma rede bayesiana pode ser representada por um grafo acíclico dirigido, onde cada nó terá informações probabilísticas daquele evento, e com arcos representando dependências entre esses eventos.

Figura 1: Rede bayesiana representando uma distribuição de probabilidades. Na Figura 1, podemos analisar a representação de uma rede bayesiana simples, onde, para cada nó, estará atribuída uma probabilidade condicionada, relativa à probabilidade dos nós pais, caso houver. A seta representa que, neste caso, AC tem influência direta em IS, como pode ser visto na tabela de probabilidade condicional. Segundo (NORVIG; RUSSEL, 1995), a combinação da topologia com as distribuições condicionais são suficientes para especificar (de forma implícita) a distribuição conjunta total para todas as variáveis. Nota-se que não há muitos fatores para determinar o estado de insônia, apenas dois. Se melhorassemos essa rede, poderíamos, por exemplo, constar outras causas de insônia afetando diretamente a probabilidade do evento IS. Isso se deve à preguiça e ignorância, de acordo com (NORVIG; RUSSEL, 1995). Uma rede bayesiana representa um resumo das possíveis circunstâncias envolvidas em um domínio, devido à complexidade em descobrir probabilidades de muitas variáveis, ou irrelevância dos fatores. Para especificar nossa rede bayesiana precisamos dos parâmetros necessários para isso, e estes podem ser descobertos através das relações de dependência entre as variáveis,

onde cada variável é dependente do nó pai. Neste caso, temos que a especificação dessa rede é dada por: P AC,CA,IS,RT P AC P CA P IS AC,CA P RT IS Onde P(AC) e P(CA) representam um parâmetro cada. P(IS AC,CA) representa quatro parâmetros, pois precisamos admitir todos os casos possíveis que são: P(IS AC ^ CA), P(IS AC ^ CA), P(IS AC ^ CA) e P(IS AC ^ CA). E P(RT IS) representa dois parâmetros, pois temos o caso em que P(RT IS) e P(RT IS). Sendo assim, precisamos de 8 parâmetros para especificar nossa rede bayesiana. Se usássemos a distribuição conjunta total nativa para esta especificação, precisaríamos de 2 1 parâmetros, pois todas as variáveis são binárias e a soma de uma distribuição de probabilidades é sempre 1, logo a última probabilidade poderia ser descoberta através disto. Para este exemplo temos a diferença de 31 para 8 parâmetros, o que, computacionalmente, não daria muitos problemas, porém se pensarmos em redes com muitas variáveis e com mais de dois estados para cada variável, a diferença é muito grande. Dentre os exemplos de aplicação utilizando redes bayesianas, os mais comuns são para diagnósticos. Em um diagnóstico médico, por exemplo, um paciente informaria os seus sintomas, e com isso, um software pesquisaria em sua base de dados, alimentada com vários dados estatísticos pré-definidos ou adquiridos ao longo de seu uso, e retornaria possíveis doenças relativas aos sintomas apresentados, com certos níveis de chances para cada doença. A maioria dos sistemas de e-mail possuem filtros contra spams, que, na maioria dos casos, utilizam de redes bayesianas para definir qual a probabilidade de uma mensagem recebida ser spam ou não. 3 CONCLUSÃO Nota-se que o uso de redes bayesianas nos proporciona um eficiente método para resolução de problemas. Podemos responder a consultas em redes bayesianas de maneira mais otimizada que em uma distribuição conjunta total, e isso é uma grande vantagem quando estamos lidando com agentes que precisam tomar decisões sensatas. Como é necessário raciocinar sob incerteza, o nível de confiança que uma rede bayesiana oferece, para cada variável, é uma peça-chave para escolher o próximo passo a ser

seguido, e isso que a torna uma ferramenta importante quando estamos lidando com situações em um domínio incerto. 4 REFERÊNCIAS NORVIG, Peter; RUSSEL, Stuart. Inteligência Artificial. Tradução de Vandenberg D. de Souza. 2ª edição. Rio de Janeiro: Editora CAMPUS, 2004. 1021 p. COPPIN, Ben. Inteligência Artificial. Traduçaõ de Jorge Duarte Pires Valério.1ª edição. Rio de Janeiro: LTC, 2010. 636 p. MARQUES, Rogério; DUTRA, Inês. Redes Bayesianas: o que são, pra que servem, algoritmos e exemplos de aplicação. 22 folhas. Dissertação UFRJ. GONÇALVES, André. Redes Bayesianas. 18 folhas. Dissertação UNICAMP. MORGADO, Augusto César; CARVALHO, João Bosco; CARVALHO, Paulo César; FERNANDEZ, Pedro. Análise Combinatória e Probabilidade. 1ª edição. Rio de Janeiro: SBM, 1991. 191 p. MEYER, Paul. Probabilidade: Aplicações à Estatística. Tradução de Ruy de C. B. Lourenço Filho. 2ª edição. Rio de Janeiro: LTC, 1983. 109 p.