EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO

Tamanho: px
Começar a partir da página:

Download "EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO"

Transcrição

1 EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO Gustavo Silva Semaan, Andrei de Alencastro Graça, Carlos Rodrigo Dias Faculdade Metodista Granbery Rua Batista de Oliveira, 1145, Centro, Juiz de Fora - MG {gsemaan, agraca}@si.granbery.edu.br; crdias@granbery.edu.br RESUMO A cada dia cresce o interesse das empresas em buscar formas de alcançar vantagem competitiva em um mercado globalizado. Neste contexto, as técnicas de mineração de dados se propõem a ajudar através da extração de conhecimento a partir de bases de dados disponíveis nas empresas. Esse trabalho propõe um algoritmo genético para a extração de regras de associação a partir de uma base de dados de transações. No algoritmo genético proposto é utilizada uma função de aptidão que permite identificar se há uma dependência positiva entre os itens do antecedente e do conseqüente de uma regra de associação. A execução do algoritmo proposto sobre uma base de dados real forneceu resultados em que foram geradas regras interessantes contendo itens com dependência positiva, mesmo com valor reduzido para o seu suporte. Apesar das regras obtidas serem interessantes, o valor reduzido do suporte iria impedi-las de serem geradas no modelo suporte-confiança tradicional. PALAVRAS CHAVE. Mineração de Dados, Regras de Associação, Algoritmos Genéticos ABSTRACT The interest of companies in finding forms to reach competitive advantage in a global market grows daily. In this context, the techniques of data mining are considered to help the extraction of knowledge from available databases in the organizations. This work considers a genetic algorithm for the achievement of association rules from a database of transactions. In the considered genetic algorithm the fitness function is used to identify if it has a positive dependence among items of the antecedent part and the consequence part of an association rule. The execution of this algorithm on a real database supplied results in which interesting rules had been generated containing items with positive dependence, even with reduced value for its support. Although these rules showed to be interesting, the reduced value for the support measure would avoid them to be generated in the traditional support-confidence model. KEYWORDS. Data Mining, Association Rules, Genetic Algorithms. [ 1312 ]

2 1. INTRODUÇÃO A realidade atual das empresas está inserida no contexto da globalização. Desta forma, torna-se importante que cada empresa busque estratégias para conseguir alcançar alguma vantagem competitiva. Conforme Porter (1989), vantagem competitiva é o valor que uma empresa consegue criar para seus clientes. O valor é o montante que os compradores estão dispostos a pagar por aquilo que a empresa lhes fornece. Para que a vantagem competitiva seja efetiva, ela precisa ser difícil de imitar, única, sustentável, superior à competição e aplicável em múltiplas situações. Carvalho (2005) afirma que, até à década passada, o marketing em empresas privadas era focado na compreensão das preferências e necessidades dos clientes e, consequentemente, no esforço de vender produtos e serviços que correspondessem às expectativas dos clientes. Contudo, como resultado da globalização, da maior oferta de fornecedores e do uso crescente de tecnologias de informação e comunicação, os clientes ficaram menos sensíveis às variáveis como preferência e necessidade, o que induz a empresa a ampliar o foco do marketing para alcançar seus objetivos. Para aumentar a vantagem competitiva de uma empresa em um ambiente de constantes mudanças, os seus gestores devem tomar as decisões corretas nos momentos certos, utilizando as informações disponíveis. Desta forma, o sucesso poderá ser alcançado a partir das decisões tomadas, desde que seja realizada uma exploração eficaz do relacionamento existente entre os elementos que compõem a realidade de atuação da empresa (Graça et al., 2005). Este relacionamento pode ser obtido através da organização e processamento de grandes bases de dados, atualmente disponíveis nas empresas devido aos constantes avanços na área da Tecnologia da Informação, gerando, assim, conhecimento a partir destes dados. Segundo Fayyad et al. (1996) o processo de descoberta de conhecimento em bases de dados, KDD (Knowledge Discovery in Databases) trata-se de um processo não trivial, formado por várias etapas, de forma interativa e iterativa, para identificação de padrões válidos, novos, potencialmente úteis e compreensíveis, em grandes conjuntos de dados. Dentre as etapas do KDD, a etapa de mineração de dados consiste em aplicar algoritmos para análise e descoberta de padrões ou modelos nos dados. Esta etapa pode corresponder a diferentes tarefas, aplicadas conforme o tipo de problema a ser tratado. Conforme Viana (2004), descobrir padrões e tendências escondidas em grandes massas de dados não é um processo trivial. O objetivo nesse trabalho é tratar o processo de descoberta de conhecimento em bases de dados sobre uma base de dados padronizada utilizada por empresas varejistas, o sistema SINTEGRA, através da proposta de um algoritmo genético (AG) para a extração de regras de associação sobre esta base de dados. O AG proposto considera a dependência entre os diferentes itens presentes na base de dados submetida ao processo, com o objetivo de obter as regras de associação mais interessantes. Esse trabalho está organizado da seguinte forma: a Seção 2 apresenta a tarefa de extração de regras de associação da etapa de mineração de dados; a Seção 3 apresenta o sistema SINTEGRA, utilizado para controle de operações com mercadorias e serviços em empresas varejistas; a Seção 4 apresenta o algoritmo genético proposto para a extração de regras de associação; a Seção 5 apresenta os resultados obtidos com a aplicação do algoritmo proposto sobre uma massa de dados de uma empresa varejista; e a Seção 6 apresenta as considerações finais do trabalho. 2. EXTRAÇÃO DE REGRAS DE ASSOCIAÇÃO Conforme Agrawal et al. (1993), a tarefa clássica de busca por regras de associação tem como objetivo obter relacionamentos interessantes entre itens em bases de dados de transações. [ 1313 ]

3 Seja I = {i 1, i 2,... i m } um conjunto de itens distintos e D uma base de dados formada por um conjunto de transações, onde cada transação T é composta por um conjunto de itens (itemset), tal que T I. Uma regra de associação é uma expressão na forma A B, onde A I, B I, A ø, B ø e A B = ø. A é chamado de antecedente da regra e B é o conseqüente da regra. As regras de associação são formadas por um conjunto de itens no antecedente da regra e um conjunto de itens no conseqüente da regra. Segundo Goldschmidt e Passos (2005), uma regra de associação indica que o conjunto de itens do antecedente das regras tem propensão a ocorrer juntamente com o conjunto de itens do conseqüente. O exemplo clássico utilizado para demonstrar a tarefa de extração de regras de associação é o problema da cesta de compras (market basket analysis), onde cada compra realizada por um cliente em determinado momento representa uma transação com um conjunto de itens, os produtos comprados. A Tabela 2.1 exemplifica a formação e interpretação das regras de associação para o problema da cesta de compras. Tabela 2.1: interpretação das regras de associação Regra extraída na mineração Interpretação {salsicha} {tomate, pão} As compras que possuem salsicha tendem a possuir os itens tomate e pão. {cerveja} {amendoim} As compras que possuem cerveja tendem a possuir amendoim. Gonçalves (2005) afirma que são utilizadas medidas de interesse para as regras de associação com o objetivo identificar as regras realmente relevantes e úteis. As medidas de interesse podem ser objetivas e subjetivas. As medidas de interesse objetivas empregam índices estatísticos para avaliar a força de cada regra, como o fator de suporte, a confiança e o lift, enquanto as medidas subjetivas consideram a opinião de um analista de negócio para determinar a força de cada regra. Nesse trabalho são utilizadas apenas as medidas de interesse objetivas FATOR DE SUPORTE O fator de suporte, ou simplesmente suporte, de um conjunto de itens Z, Sup(Z), representa o percentual de transações da base de dados que contêm os itens do conjunto Z. Assim, o suporte de uma regra de associação A B é dado pela Equação 2.1. Sup( A B) = Sup( A B) 2.1 A Tabela 2.2 apresenta um conjunto exemplo de dados de transações, onde cada linha é uma transação de compra formada pelo conjunto de itens comprados na transação. Tabela 2.2: exemplo de conjunto de dados de transações. Compra Lista de Itens 1 Arroz, biscoito, limão, feijão 2 Arroz, pão, salame 3 Café, pão 4 Limão, pão 5 Arroz, café, feijão, pão 6 Café, kiwi, pão [ 1314 ]

4 Para o cálculo do suporte da regra {arroz} {feijão}, Sup(arroz feijão), verificase qual é o percentual de transações que possuem a união dos itens da regra, neste caso os itens arroz e feijão. De acordo com a Tabela 2.2, estes itens estão contidos em duas das seis transações da base de dados possuindo, assim, suporte com o valor aproximado de 0,33 (33%) CONFIANÇA DE UMA REGRA A confiança da regra A B, Conf(A B), é um valor que indica, dentre as transações que contêm os itens de A, o percentual de transações que também contêm os itens de B. A confiança é calculada conforme Equação 2.2. Sup( A B) Conf ( A B) = 2.2 Sup( A) Para o cálculo da confiança da regra {arroz} {feijão}, Conf(arroz feijão), verifica-se qual é o percentual, das transações dentre as que contêm arroz, que possuem também feijão. Conforme ilustra a Tabela 2.2, o item arroz está contido em três transações e, dentre elas, o feijão se encontra em duas. Assim, 2/3 das transações que possuem arroz possuem também feijão. A confiança desta regra é de 2/3, ou aproximadamente 0,66 (66%) O MODELO SUPORTE-CONFIANÇA O modelo suporte-confiança, proposto por Agrawal et al. (1993), é o modelo típico para mineração de regras de associação em bases de dados. Este modelo consiste em encontrar todas as regras que possuam fatores de suporte e confiança maiores ou iguais, respectivamente, a um valor mínimo para o suporte (SupMin) e um valor mínimo para confiança (ConfMin) das regras. Estes valores para o SupMin e ConfMin são definidos antes da execução do algoritmo de mineração de dados. O algoritmo mais conhecido que utiliza este modelo é o APRIORI, proposto por Agrawal e Srikant (1994). Considerando o modelo suporte-confiança, o processo de mineração de dados é dividido em duas etapas. Inicialmente são determinados todos os conjuntos de itens que satisfaçam o SupMin e, em seguida, a partir destes conjuntos, geram-se as regras de associação que atendam a ConfMin. Ao aplicar este modelo aos dados da Tabela 2.2, é possível obter várias regras de associação, algumas das quais estão indicadas na Tabela 2.3. Entretanto, considerando SupMin=0,3 (30%) e ConfMin=0,65 (65%), as regras válidas obtidas serão apenas as regras {arroz} {feijão}, {feijão} {arroz}, {arroz} {pão} e {café} {pão}. Tabela 2.3: exemplos de regras de associação baseadas na tabela 2.2 Regra (A B) Sup(A) Sup(B) Sup(A B) Conf(A B) {arroz} {feijão} 50% 33% 33% 67% {feijão} {arroz} 33% 50% 33% 100% {arroz} {pão} 50% 83% 33% 67% {café} {pão} 50% 83% 50% 100% {biscoito} {feijão} 17% 33% 17% 100% {salame} {pão} 17% 83% 17% 100% [ 1315 ]

5 2.4. LIFT A medida de interesse Lift, proposta por Brin et al. (1997), também conhecida como Interest, é utilizada para avaliar as dependências entre o conjunto de itens do antecedente e o conjunto de itens do conseqüente de uma regra de associação. Assim, valor do Lift de uma regra de associação A B, obtida a partir de uma base de dados de transações, indica o quanto mais freqüente torna-se B quando ocorre em conjunto com A. O Lift de uma regra de associação A B é dado pela Equação 2.3. Sup( A B) Conf ( A B) Lift( A B) = = 2.3 Sup( A) Sup( B) Sup( B) A Tabela 2.4 apresenta as medidas de suporte, confiança e Lift das regras geradas na aplicação do modelo suporte-confiança, utilizando SupMin=0,3 (30%) e ConfMin=0,65 (65%), sobre a base de dados da Tabela 2.2. Tabela 2.4: lista de regras geradas com a medida Lift para base de dados da Tabela 2.2 Regra (A B) Sup(A) Sup(B) Sup(A B) Conf(A B) Lift(A B) {arroz} {feijão} 50% 33% 33% 67% 2,03 {feijão} {arroz} 33% 50% 33% 100% 2,00 {arroz} {pão} 50% 83% 33% 67% 0,80 {café} {pão} 50% 83% 50% 100% 1,20 {biscoito} {feijão} 17% 33% 17% 100% 3,03 {salame} {pão} 17% 83% 17% 100% 1,20 Gonçalves (2005) afirma que o Lift pode variar entre 0 e e as faixas de valores indicam que: Lift(A B) = 1: independência entre os conjuntos de itens A e B. Lift(A B) < 1: os conjuntos de itens A e B possuem dependência negativa. Lift(A B) > 1: os conjuntos de itens A e B possuem dependência positiva. Um aspecto importante do modelo suporte-confiança é que este pode ignorar regras interessantes, que possuem dependência positiva, caso não atendam ao suporte mínimo e/ou confiança mínima exigidos. Utilizando o exemplo da Tabela 2.2, os itemsets de tamanho 1, ou seja, com apenas um item, {biscoito}, {kiwi} e {salame}, não satisfazem ao SupMin igual a 30%. Assim, estes itemsets não participarão da lista de itemsets freqüentes de tamanho 1 e, consequentemente, não farão parte dos itemsets de tamanho n, tal que n > 1. Os resultados apresentados na Tabela 2.4 indicam que: a regra de associação {arroz} {feijão} possui dependência positiva entre o antecedente e o conseqüente, e que o suporte da regra é 2,03 vezes maior que seu suporte esperado; a regra de associação {arroz} {pão}, embora satisfaça o SupMin e ConfMin, apresenta dependência negativa entre o antecedente e o conseqüente, tendo o suporte real da regra 0,80 vezes o valor do suporte esperado. a regra de associação {biscoito} {feijão}, embora possua o itemset {biscoito}, que não satisfaz ao SupMin, ou seja, não atende a primeira etapa do modelo suporte confiança, possui Lift superior a todas as regras geradas com itemsets freqüentes, com suporte real da regra igual a 3,03 vezes o suporte esperado, indicando dependência positiva entre o antecedente e o conseqüente da regra. [ 1316 ]

6 3. SINTEGRA O SINTEGRA, Sistema Integrado de Informações sobre Operações Interestaduais com Mercadorias e Serviços, é formado por um conjunto de procedimentos administrativos aliados a sistemas computacionais de apoio, adotado simultaneamente pelas Administrações Tributárias das diversas Unidades Federativas do Brasil (Sintegra, 2006). A proposta do SINTEGRA, do ponto de vista dos contribuintes, é simplificar e homogeneizar as obrigações de fornecimento de informações relativas às operações de compra, venda e prestação de serviços. Do ponto de vista dos fiscos estaduais, o propósito do sistema é aumentar a agilidade e confiabilidade no tratamento das informações recebidas dos contribuintes e na troca de dados entre as diversas unidades federativas (Sintegra, 2006). Para tornar mais eficaz e seguro o processo de envio e recebimento de documentos com informações dos contribuintes, o SINTEGRA, além de padronizar um formato para os documentos eletrônico, possui um software para validar e criptografar estes documentos e transferir estes documentos aos fiscos estaduais: o Validador SINTEGRA e o Programa de Transferência Eletrônica de Documentos, respectivamente. O documento eletrônico submetido pelo contribuinte ao fisco estadual é um arquivo texto plano no formato SINTEGRA, onde cada linha do arquivo é iniciada com um código referente ao tipo de registro e contém um formato específico. Torna-se necessário, então, obter do arquivo no formato SINTEGRA informações sobre quais itens pertencem as quais transações. As linhas iniciadas com código 60I referem-se aos dados que contêm os itens do documento fiscal, referentes a transações efetuadas pelo cliente. Isto indica que cada linha representa um produto ou serviço de uma transação, e várias linhas podem pertencer a uma mesma transação, dependendo da quantidade de itens de cada transação. A Tabela 3.1 apresenta a formatação utilizada nas linhas referentes ao código 60I. Tabela 3.1: tabela com o formato 60I do arquivo no padrão SINTEGRA. Nº Denominação do campo Conteúdo Tam. Inicio Fim 1 Tipo Subtipo I Data de emissão Data de emissão do documento fiscal Número de série de fabricação Número de série de fabricação do equipamento Modelo do documento fiscal Código do modelo do documento fiscal Nº de ordem do documento fiscal Número do Contador de Ordem de Operação Número do item Número de Ordem do item no Documento Fiscal Código da mercadoria/produto ou Serviço Código do produto ou serviço do informante Quantidade Quantidade da mercadoria / produto Valor Unitário da mercadoria/produto Valor Unitário da mercadoria/produto Base de Cálculo do ICMS Base de Cálculo do ICMS do Item SituaçãoTributária/alíquota/prod. ou Serviço Identificador da Situação Tributária / ICMS Valor do ICMS Montante do imposto Brancos Brancos Conforme apresenta a Tabela 3.1, os campos 6 e 8 representam, respectivamente o identificador da a transação e o identificador do item pertencente à transação. Sendo assim, estes serão os campos utilizados na mineração das regras de associação. Os demais campos não foram considerados nesse trabalho. 4. ALGORITMO GENÉTICO PROPOSTO Os algoritmos genéticos (AG) foram propostos por Holland (1975) e são modelos computacionais de busca e otimização de soluções em problemas de elevada complexidade computacional. Estes modelos são inspirados em princípios da teoria da evolução Charles Darwin [ 1317 ]

7 e nos princípios de herança genética de Gregor Mendel, com características de busca de múltiplos pontos e busca paralela. Segundo Pacheco (1999), os princípios da natureza nos quais os AG se inspiram são simples. Baseado na teoria de Darwin o principio da seleção privilegia os indivíduos mais aptos e com maior longevidade, que possuem maior probabilidade de reprodução. Assim, indivíduos com mais descendentes têm mais chances de perpetuarem seus códigos genéticos nas próximas gerações. Estes códigos genéticos identificam cada indivíduo, e sua representação computacional é denominada cromossoma, ou simplesmente indivíduo. Pacheco (1999) afirma que os princípios mencionados são utilizados na construção de algoritmos computacionais para busca de soluções de problemas através de evolução de populações formadas por cromossomas artificiais, que representam soluções para o problema tratado. A Figura 4.1 mostra uma representação das iterações de um algoritmo genético. Figura 4.1: fluxograma de um algoritmo genético (Goldschmidt e Passos, 2005) REPRESENTAÇÃO DOS INDIVÍDUOS Segundo Goldschmidt e Passos (2005), a menor unidade de um AG é denominada gene. Uma série de genes constitui um cromossoma, que representa uma possível solução para o problema e qualquer forma de representação de um problema deve suportar todas as soluções do espaço de busca a ser investigado. Um cromossoma é também chamado de indivíduo em um AG. No AG proposto, o gene representa um item da transação, ou seja, um produto ou um serviço. Um indivíduo representa uma regra de associação. Figura 4.2: indivíduo representando uma regra de associação. [ 1318 ]

8 A posição do sinal é definida aleatoriamente na geração da população inicial e não altera nas gerações seguintes, localizando-se em qualquer posição posterior ao primeiro gene e anterior ao último gene. A posição do sinal fica associada a cada indivíduo. Assim, observando apenas o indivíduo representado na Figura 4.2, este pode corresponder às regras {A} {F,P,C}, {A,F} {P,C} ou {A,F,P} {C} AVALIAÇÃO A avaliação de um indivíduo é a ligação entre o AG e o mundo externo e, segundo Pacheco (1999), consiste em utilizar uma função que melhor represente o problema, tendo como objetivo fornecer a aptidão de cada individuo na população corrente e direcionando o processo de busca. Conforme Whitley (1994), a função de aptidão, usada para a avaliação dos indivíduos, deve ser implementada de forma otimizada, para que seja executada de maneira relativamente rápida, considerando que todos os indivíduos de todas as populações devem ser avaliados. No AG proposto, a função de aptidão baseia-se na medida de interesse Lift, medida utilizada para avaliar dependência entre itens. Assim, itemsets não freqüentes segundo o modelo suporte-confiança também irão participar das regras geradas, onde a função de aptidão indicará se os itemsets das regras são independentes, se possuem dependência negativa ou dependência positiva. O objetivo do AG será, então, a maximização da função de aptidão, ou seja, obter as regras de associação que possuam uma maior dependência entre os itens do antecedente e do conseqüente da regra SELEÇÃO DOS INDIVÍDUOS Segundo Goldschmidt E Passos (2005), durante a etapa de seleção, o AG privilegia os indivíduos com melhores valores para a função de aptidão, indicando os que devem permanecer e se multiplicar para a próxima população. No algoritmo genético proposto, as regras de associação com melhor aptidão (melhor valor para a função Lift) tendem a ser selecionadas e gerar novas regras nas gerações seguintes. A estratégia utilizada para seleção no algoritmo genético proposto foi a seleção por torneio, onde, para a seleção de cada indivíduo que fará parte da próxima geração (iteração) do AG, um certo número de regras de associações são escolhidas de forma aleatória. A regra de associação selecionada será aquela com maior valor para a função de aptidão dentre as escolhidas de forma aleatória. Vale ressaltar que pode ocorrer a repetição de regras de associação selecionadas para a próxima geração do AG OPERADORES GENÉTICOS DIAS (2004) afirma que após a seleção e reprodução dos indivíduos, o algoritmo genético cria novas soluções às quais serão aplicados os operadores genéticos. Os operadores genéticos tradicionais utilizados em AG são o crossover, ou cruzamento, e a mutação. Segundo Goldberg (1989), o crossover é a principal força direcionadora das soluções em um algoritmo genético, realizando a troca de partes dos genes de pares de indivíduos com o objetivo de tentar obter indivíduos melhores a partir dos indivíduos previamente selecionados. A execução da operação de crossover está condicionada a uma taxa de aplicação definida como parâmetro na execução do AG. O tipo de operador crossover utilizado no algoritmo genético proposto é o crossover de um ponto. Neste tipo de crossover, a partir de um ponto de corte aleatório, há a troca de genes entre duas soluções, conforme ilustra a Figura 4.3. [ 1319 ]

9 Figura 4.3: operador crossover de um ponto. As regras de associação possuem uma característica que deve ser levada em consideração para que não seja geradas soluções inválidas pelo AG: um gene do indivíduo, ou seja, um item da regra, deve ser único na regra de associação, não podendo existir ao mesmo tempo no antecedente e no conseqüente da regra. Assim, a localização do sinal não altera a implementação do crossover do AG proposto. Conforme DIAS (2004), os parâmetros e operadores genéticos afetam significamente tanto o desempenho do algoritmo genético quanto a qualidade dos resultados obtidos e devem ser definidos conforme o tipo de problema tratado. 5. RESULTADOS OBTIDOS O AG proposto neste trabalho foi executado em uma base de dados de uma empresa varejista com informações sobre vendas realizadas em um período de um mês. A base de dados submetida à mineração de dados possui 4416 transações, 1426 produtos distintos com uma média de 5,05 produtos por transação. Conforme apresentado na Seção 4, o AG proposto utiliza como função de aptidão a medida de interesse Lift, que indica a dependência entre o antecedente e o conseqüente de uma regra de associação. Considerando que uma regra de associação é formada por dois conjuntos não vazios de itens, as transações da base de dados utilizada que contém apenas um item deverão ser descartadas, reduzindo o total de transações para 3176 e aumentando a média de itens por transação para 6,81. Os parâmetros utilizados para extração de regras de associações com dois e três itens foram: população com 50 soluções, taxa de aplicação do crossover igual a 0,8 (80%), taxa de aplicação da mutação igual a 0,05 (5%) e seleção por torneio com 2 soluções. Para exemplificar os resultados obtidos com a execução do AG proposto, a Tabela 5.1 apresenta algumas regras de associações obtidas, com dois e três itens. Tabela 5.1: algumas regras de associação obtidas pelo AG proposto. Regra de associação Lift Suporte Confiança {865} {814} 8,022 1,353% 56,578% {205} {284} 4,183 0,850% 27,000% {980} {41, 1061} 8,368 0,315% 6,060% É importante observar que o AG implementado trabalha apenas com os identificadores dos itens das transações, que são representados no domínio dos números inteiros. Com base na Tabela 5.1, pode-se observar, por exemplo, que a regra {865} {814}, possui suporte de 1,353% e dependência positiva entre seu antecedente e conseqüente, indicando que a ocorrência conjunta dos itens {865} e {814} é 8,022 vezes maior que o esperado. As Figuras 5.1 e 5.2 apresentam a evolução das soluções ao longo de duas execuções do AG, considerando a obtenção de regras com dois e três itens, respectivamente. São apresentados o valor médio da função de aptidão considerando todos os indivíduos de cada geração e o melhor indivíduo obtido até a geração corrente. Estas figuras mostram que, ao longo das gerações, os [ 1320 ]

10 valores médios da função de aptidão das soluções sofreram incremento, indicando a evolução da população. Evolução das soluções com 2 itens Aptidão Melhor solução Valor médio das soluções Geração Figura 5.1: evolução das soluções com 2 itens. Evolução das soluções com 3 itens Aptidão Melhor solução Valor médio das soluções Geração Figura 5.2: evolução das soluções com 3 itens. 6. CONSIDERAÇÕES FINAIS O objetivo principal desse trabalho foi propor um AG para extração de regras de associação em uma base de dados de transações. Para os testes computacionais foi executado o AG sobre uma base de dados padronizada, utilizada por empresas varejistas. Para que fossem obtidas regras de associação interessantes, foi utilizada como função de aptidão do AG a medida de interesse Lift, tendo em vista que esta medida identifica a dependência entre o antecedente e conseqüente de cada regra de associação. Os resultados obtidos com a execução do AG proposto comprovam que, utilizando o modelo suporte-confiança para extrair regras de associação, alguns itemsets interessantes, que possuem dependência positiva com outros itemsets podem ser ignorados por não atenderem ao SupMin ou ConfMin especificados. Os testes computacionais apresentaram as evoluções de populações com dois e três itens a partir de uma base de dados real de transações de uma empresa [ 1321 ]

11 varejista. Cada regra extraída a partir do AG pode possuir um valor para o fator de suporte considerado baixo, mas possuir uma considerável dependência positiva entre o seu antecedente e o seu conseqüente. Neste caso, apesar da regra ser interessante, ela seria poderia ser ignorada caso fosse utilizado o modelo suporte-confiança. Ochi et al. (2005) afirma que os AG têm sido muito utilizados para solucionar problemas considerados intratáveis em diversas áreas, embora, AG clássicos podem não tratar alguns problemas de forma tão eficiente quanto outros. Assim, a contribuição desse trabalho é utilizar a técnica de algoritmos genéticos aplicada ao problema de extração de regras de associação em bases de dados, usando como função de aptidão a medida de interesse Lift. Como proposta para trabalhos futuros pode-se considerar a pesquisa de novas técnicas para aperfeiçoar o AG apresentado, como a inclusão de busca local e a hibridização do AG, utilizando outras técnicas como path relinking e procedimentos de diversificação da população. 7. REFERÊNCIAS Agrawal, R., Imielinski, T. e Srikant, R., Mining Association Rules between Sets of Items in Large Databases, Proceedings of the ACM SIGMOD International Conference on Management of Data, Washington, USA, Agrawal, R. e Srikant, R., Fast algorithms for mining association rules in large databases., Proceedings of the 20th International Conference on Very Large Data Bases (VLDB), Santiago, Chile, Brin, S., Motwani, R., Ullman, J. D. e Tsurm S., Dynamic itemset counting and implication rules for market basket data, Proceedings of the ACM SIGMOD International Conference on Management of Data, Arizona, USA, Carvalho, P. M. F. M., O marketing relacional e o estudo do caso chip 7, Universidade Portucalense Infante D. Henrique, Dias, C. R., Algoritmos Evolutivos para o Problema de Clusterização de Grafos Orientados: Desenvolvimento e Análise Experimental, Dissertação de Mestrado, Universidade Federal Fluminense, Niterói, Fayyad,U. M., Piatetsky Shapiro, G. e Smyth, P., Knowledge Discovery and Data Mining: Towards a Unifying Framework, Proceeding of the Second International Conference on Knowledge Discovery and Data Mining, Portland, Oregon, Goldschmidt, R. e Passos, E., Data Mining Um Guia Prático, Campus, Rio de Janeiro, Goldberg, D. E., Genetic Algorithms in search, optimization and machine learning, Addison-Wesley, Gonçalves, E. C., Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas, INFOCOMP Journal of Computer Science, Graça, A. A.; Semaan, G. S.; Dias, C. R., Data Mining e a descoberta de associações em dados, SQL Magazine, Ed. 26, Holland, J. H., Adaptation in Natural and Artificial Systems, University of Michigan Press, Ochi, L. S., Santos, H. G., Merschmann, L., Melhorando o desempenho de algoritmos evolutivos por meio de Mineração de Dados: Uma aplicação na área de Petróleo, MathSciNet da American Mathematical Society, Pacheco, M. A., Algoritmos Genéticos: Princípios e Aplicações, Anais do INTERCON99: V Congreso Internacional de Ingeniería Electrónica, Elétrica Y Sistemas, Lima, Peru, Porter, M., Vantagem competitiva, Editora Campus, Sintegra Sistema, Viana, R., Mineração de Dados: Introdução e Aplicações, SQL Magazine, Ed. 10, Whitley, D., A Genetic Algorithm Tutorial. Statistics and Computing, vol. 4, pp. 5-85, [ 1322 ]

UMA HEURÍSTICA BASEADA EM GRASP PARA A EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS

UMA HEURÍSTICA BASEADA EM GRASP PARA A EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS UMA HEURÍSTICA BASEADA EM GRASP PARA A EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS 1. INTRODUÇÃO Fagner Silva Pinho Centro Universitário Plínio Leite (UNIPLI) fagnersp.ti@gmail.com José André de Moura Brito

Leia mais

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Análise de associação Principais tópicos Análise de associação Itens frequentes Conjunto de itens frequentes de associação Avaliação de regras de associação Docente:

Leia mais

Descoberta de Associações em Dados

Descoberta de Associações em Dados Descoberta de Associações em Dados Gustavo Silva Semaan, Andrei de Alencastro Graça, Carlos Rodrigo Dias Faculdade Metodista Granbery Rua Batista de Oliveira, 1145, Centro, Juiz de Fora - MG {gsemaan,agraca}@si.granbery.edu.br;

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Descoberta de Conhecimento em Bases de Dados Mineração de Dados Descobertas de regras de associação Descoberta de Conhecimento em Bases de Dados DCBD (Descoberta de Conhecimento

Leia mais

Inteligência Artificial. Algoritmos Genéticos. Aula I Introdução

Inteligência Artificial. Algoritmos Genéticos. Aula I Introdução Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação Inteligência Artificial Algoritmos Genéticos Aula I Introdução Roteiro Introdução Computação Evolutiva Algoritmos

Leia mais

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) JONAS RAFAEL ONOFRE Orientador(es) MARINA TERESA PIRES VIEIRA

Leia mais

Algoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante:

Algoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante: Algoritmos Genéticos Prof. Luis Otavio Alvares INE/UFSC Características de alguns problemas Tamanho do espaço de busca- Ex. caixeiro viajante: 10 cidades: 181.000 soluções 20 cidades: 10.000.000.000.000

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Mineração de Dados (Regras de associação)

Mineração de Dados (Regras de associação) Aplicações Mineração de Dados (Regras de associação) Perfis de clientes ( Market basket analysis ) Merchandizing Detecção de fraudes em seguros de saúde Organização de produtos em vitrines de lojas M.

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

Mineração de padrões frequentes

Mineração de padrões frequentes Mineração de padrões frequentes Fabrício J. Barth fabricio.barth@gmail.com Setembro de 2016 Objetivos Os objetivos desta aula são: Apresentar e discutir métodos para identificar associações úteis em grandes

Leia mais

Associações & Freqüentes

Associações & Freqüentes Associações & Análises de Itens Freqüentes Eduardo R. Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Transações Itens freqüentes Regras

Leia mais

Técnicas de Inteligência Artificial

Técnicas de Inteligência Artificial Universidade do Sul de Santa Catarina Ciência da Computação Técnicas de Inteligência Artificial Aula 9 Algoritmos Genéticos Max Pereira Algoritmos Genéticos Algoritmos Genéticos São técnicas de busca e

Leia mais

ALGORITMO GENÉTICO COMO REPRESENTAÇÃO DAS MUTAÇÕES NA BIOLOGIA

ALGORITMO GENÉTICO COMO REPRESENTAÇÃO DAS MUTAÇÕES NA BIOLOGIA Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. ALGORITMO GENÉTICO COMO REPRESENTAÇÃO DAS MUTAÇÕES NA BIOLOGIA Igor Acassio Melo

Leia mais

Inteligência Artificial

Inteligência Artificial UFRGS 2 Inteligência Artificial Técnicas de Mineração de Dados Árvores de Decisão Regras de Associação Árvores de Decisão As árvores de decisão (AD) são ferramentas poderosas para classificação cuja maior

Leia mais

Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas

Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas EDUARDO CORRÊA GONÇALVES UFF - Universidade Federal Fluminense IC - Instituto de Computação Rua Passo da Pátria, 156 - Bloco E -

Leia mais

Andrei de Alencastro Graça. Mineração de Dados em Cestas de Compras

Andrei de Alencastro Graça. Mineração de Dados em Cestas de Compras Andrei de Alencastro Graça Mineração de Dados em Cestas de Compras Monografia de Final de Curso 26/10/2011 Monografia apresentada ao Departamento de Engenharia Elétrica da PUC/Rio como parte dos requisitos

Leia mais

GT-JeDi - Curso de Desenv. de Jogos IA para Jogos. Gustavo Pessin 2007

GT-JeDi - Curso de Desenv. de Jogos IA para Jogos. Gustavo Pessin 2007 GT-JeDi - Curso de Desenv. de Jogos IA para Jogos Gustavo Pessin 2007 Cronograma Base conceitual Exemplo: Achando o máximo de uma função... Como criar uma pequena aplicação: Exercício-Exemplo [Animal selvagem...]

Leia mais

ALGORITMOS GENÉTICOS. Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR

ALGORITMOS GENÉTICOS. Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR ALGORITMOS GENÉTICOS Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR Fev/2018 Introdução Algoritmos Genéticos são algoritmos heurísticos de busca, que utilizam regras

Leia mais

Algoritmo Genético. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto

Algoritmo Genético. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto Algoritmo Genético Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Introdução 2. Conceitos Básicos 3. Aplicações 4. Algoritmo 5. Exemplo Introdução São técnicas de busca

Leia mais

3 Algoritmos Genéticos

3 Algoritmos Genéticos Técnicas de Inteligência Computacional 33 3 Algoritmos Genéticos Este capítulo resume os principais conceitos sobre o algoritmo evolucionário empregado nesta dissertação. É apresentada uma breve explicação

Leia mais

B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A

B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A Mineração de Dados Espaciais B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A Roteiro 2 Introdução Mineração de Dados Estado da Arte Artigo apresentado Conclusão

Leia mais

partir da navegação de usuários em sites Web

partir da navegação de usuários em sites Web Criação de regras de associação a partir da navegação de usuários em sites Web Fabrício J. Barth Faculdades BandTec e VAGAS Tecnologia Junho de 2013 Processo de mineração de padrões na Web Pré processamento

Leia mais

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO Prof. Msc. Saulo Popov Zambiasi (saulopz@gmail.com) Informação - ICPG - Criciuma - SC 1 Características Gerais, operadores, algoritmo.

Leia mais

Algoritmos genéticos Abordagem unificada de algoritmos evolutivos simples

Algoritmos genéticos Abordagem unificada de algoritmos evolutivos simples Introdução Inspiração biológica Histórico da computação evolutiva Algoritmo evolutivo simples Programação evolutiva Estratégias evolutivas Algoritmos genéticos Abordagem unificada de algoritmos evolutivos

Leia mais

Universidade Federal Fluminense (UFF) Rua Passo da Pátria, 156, bloco E, sala Niterói, RJ

Universidade Federal Fluminense (UFF) Rua Passo da Pátria, 156, bloco E, sala Niterói, RJ Mineração de Regras de Associação Híbridas Eduardo Corrêa Gonçalves 1, Alexandre Plastino 2 1 ADDLabs - Laboratório de Documentação Ativa e Design Inteligente Universidade Federal Fluminense (UFF) Rua

Leia mais

Algoritmos Genéticos. Estéfane G. M. de Lacerda DCA/UFRN Outubro/2008

Algoritmos Genéticos. Estéfane G. M. de Lacerda DCA/UFRN Outubro/2008 Estéfane G. M. de Lacerda DCA/UFRN Outubro/2008 Introdução São técnicas de busca e otimização. É a metáfora da teoria da evolução das espécies iniciada pelo Fisiologista e Naturalista inglês Charles Darwin.

Leia mais

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução 19 Congresso de Iniciação Científica IMPLEMENTAÇÃO DE GUIAS E ALGORITMOS PARA REGRAS DE ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es)

Leia mais

Técnicas de Inteligência Artificial

Técnicas de Inteligência Artificial Universidade do Sul de Santa Catarina Ciência da Computação Técnicas de Inteligência Artificial Aula 9 Algoritmos Genéticos Max Pereira Algoritmos Genéticos São técnicas de busca e otimização. Uma metáfora

Leia mais

Max Pereira. Inteligência Artificial

Max Pereira. Inteligência Artificial Max Pereira Inteligência Artificial Algoritmos Genéticos Algoritmos Genéticos São técnicas de busca e otimização. Uma metáfora da teoria da evolução das espécies iniciada pelo Naturalista inglês Charles

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Extracção de Conhecimento

Extracção de Conhecimento Programa Doutoral em Engenharia Informática Mestrado Integrado em Engenharia Informática LIACC/FEUP Universidade do Porto www.fe.up.pt/ ec rcamacho@fe.up.pt Outubro 2007 Algoritmos Genéticos alguns destes

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB Acadêmico: Leonardo José Correia Orientador: Prof. Ricardo Alencar Azambuja Blumenau, Julho/2004 1 Roteiro Introdução Objetivo

Leia mais

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares Mineração de Dados Técnicas de Associação Exemplo: vendas casadas Sei que quem compra A também compra B. Apresentação adaptada do material do livro: Introduction to Data Mining Tan, Steinbach e Kumar PRODUTO

Leia mais

3 Algoritmos Genéticos

3 Algoritmos Genéticos Algoritmos Genéticos Algoritmos Genéticos (AGs) constituem um mecanismo de busca adaptativa que se baseia no princípio Darwiniano de seleção natural e reprodução genética [101]. AGs são tipicamente empregados

Leia mais

Algoritmos Genéticos

Algoritmos Genéticos Algoritmos Genéticos Introdução Um Algoritmo Genético (AG), conceitualmente, segue passos inspirados no processo biológico de evolução natural segundo a teoria de Darwin Algoritmos Genéticos seguem a idéia

Leia mais

Algoritmo Genético aplicado ao Sistema de Análise de Concessão de Crédito (SACC) Rosini Antonio Monteiro Bezerra Professor Marco Aurélio

Algoritmo Genético aplicado ao Sistema de Análise de Concessão de Crédito (SACC) Rosini Antonio Monteiro Bezerra Professor Marco Aurélio Algoritmo Genético aplicado ao Sistema de Análise de Concessão de Crédito (SACC) Rosini Antonio Monteiro Bezerra Professor Marco Aurélio ICA, DEE, PUC-RIO CEP: 22453-900 ramb@ele.puc-rio.br ica@ele.puc-rio.br

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba

Tópicos Especiais em Informática Fatec Indaiatuba Prof. Dilermando Piva Jr. ((Compilação de diversas fontes na Internet)) Principal motivação para o estudo da computação evolutiva Otimização de processos complexo e que possuem um grande número de variáveis

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

1. Computação Evolutiva

1. Computação Evolutiva Computação Bioinspirada - 5955010-1 1. Computação Evolutiva Prof. Renato Tinós Programa de Pós-Graduação Em Computação Aplicada Depto. de Computação e Matemática (FFCLRP/USP) 2 Computação Bioinspirada

Leia mais

Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística

Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística José Edson Rodrigues Guedes Gondim 1 Joab de Oliveira Lima 2 1 Introdução

Leia mais

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO AULA 06 Algoritmos Genéticos Sumário Introdução Inteligência Artificial (IA) Algoritmos Genéticos Aplicações de

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 6 Algoritmos Genéticos M.e Guylerme Velasco Roteiro Introdução Otimização Algoritmos Genéticos Representação Seleção Operadores Geneticos Aplicação Caixeiro Viajante Introdução

Leia mais

Algoritmos Genéticos

Algoritmos Genéticos Algoritmos Genéticos Roteiro Introdução Algoritmos Genéticos Otimização Representação Seleção Operadores Genéticos Aplicação Caixeiro Viajante Introdução Algoritmos Genéticos (AGs), são métodos de otimização

Leia mais

ESTUDO DOS PARAMETROS DE UM ALGORITMO GENÉTICO PARA POSTERIOR USO NA SOLUÇÃO DE PROBLEMAS DO TIPO JOB-SHOP

ESTUDO DOS PARAMETROS DE UM ALGORITMO GENÉTICO PARA POSTERIOR USO NA SOLUÇÃO DE PROBLEMAS DO TIPO JOB-SHOP ESTUDO DOS PARAMETROS DE UM ALGORITMO GENÉTICO PARA POSTERIOR USO NA SOLUÇÃO DE PROBLEMAS DO TIPO JOB-SHOP Gilson Rogério Batista, Gideon Villar Leandro Universidade Regional do Noroeste do Estado do Rio

Leia mais

CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA.

CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA. CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA. Emerson Carlos Pedrino * e-mail: ecpedrin@sel.eesc.sc.usp.br Valentin Obac Roda ** e-mail: valentin@sel.eesc.sc.usp.br

Leia mais

MiRABIT: Um Novo Algoritmo para Mineração de Regras de Associação

MiRABIT: Um Novo Algoritmo para Mineração de Regras de Associação MiRABIT: Um Novo Algoritmo para Mineração de Regras de Associação Sandro da Silva Camargo Universidade da Região da Campanha (URCAMP) 96.400-101 Bagé RS Brasil scamargo@urcamp.tche.br Paulo Martins Engel

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid 1 Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid Luciana Conceição Dias Campos Resumo Este trabalho consiste da aplicação de um algoritmo genético ao método

Leia mais

Algoritmos Genéticos e Evolucionários

Algoritmos Genéticos e Evolucionários Algoritmos Genéticos e Evolucionários Djalma M. Falcão COPPE/UFRJ PEE e NACAD falcao@nacad.ufrj.br http://www.nacad.ufrj.br/~falcao/ http://www.nacad.ufrj.br/~falcao/ag/ag.htm Resumo do Curso Introdução

Leia mais

4 Modelos Propostos para Otimização de Planejamentos com Restrições de Precedência 4.1 Representação com Algoritmos Genéticos

4 Modelos Propostos para Otimização de Planejamentos com Restrições de Precedência 4.1 Representação com Algoritmos Genéticos 46 4 Modelos Propostos para Otimização de Planejamentos com Restrições de Precedência 4.1 Representação com Algoritmos Genéticos Para definir a representação de um modelo para problemas de planejamento

Leia mais

Minerando regras de associação

Minerando regras de associação Minerando regras de associação Proposto por Rakesh Agrawal em 1993. É o modelo de mineração de dados mais estudado pela comunidade de banco de dados. Utiliza dados categóricos. Não há bons algoritmos para

Leia mais

Introdução aos Algoritmos Genéticos

Introdução aos Algoritmos Genéticos Introdução aos Algoritmos Genéticos Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana 2 Algoritmos Genéticos: Introdução Introduzidos

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva Computação Evolutiva Algoritmos Genéticos A computação evolutiva (CE) é uma área da ciência da computação que abrange modelos computacionais inspirados na Teoria da Evolução das Espécies, essencialmente

Leia mais

Sarajane M. Peres e Clodoaldo A. M. Lima. 19 de novembro de 2015

Sarajane M. Peres e Clodoaldo A. M. Lima. 19 de novembro de 2015 Sarajane M. Peres e Clodoaldo A. M. Lima 19 de novembro de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 Sarajane M. Peres e Clodoaldo A. M. Lima Regras

Leia mais

REGRAS NEGATIVAS DE ASSOCIAÇÃO EM MINERAÇÃO DE DADOS

REGRAS NEGATIVAS DE ASSOCIAÇÃO EM MINERAÇÃO DE DADOS REGRAS NEGATIVAS DE ASSOCIAÇÃO EM MINERAÇÃO DE DADOS *1 Carlos Rodrigo Dias *2 Paulo Alceu d Almeida Rezende Resumo. A mineração de dados vem despertando um crescente interesse em todas as áreas e comunidades,

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 5) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Otimização. Unidade 6: Algoritmo Genético. Jaime Arturo Ramírez. 7. Teoria do processo evolutivo num GA. 8. Aspectos avançados

Otimização. Unidade 6: Algoritmo Genético. Jaime Arturo Ramírez. 7. Teoria do processo evolutivo num GA. 8. Aspectos avançados Otimização Jaime Arturo Ramírez Conteúdo 1. Introdução 2. Analogia de mecanismos de seleção natural com sistemas artificiais 3. Algoritmo genético modelo 4. Um GA simples 5. Representação, genes e cromossomos

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

Breve Avaliação de Parâmetros básicos de Algoritmos Genéticos

Breve Avaliação de Parâmetros básicos de Algoritmos Genéticos https://eventos.utfpr.edu.br//sicite/sicite17/index Breve Avaliação de Parâmetros básicos de Algoritmos Genéticos RESUMO Stéfanie Caroline Pereira Dekker stefanie.c.dekker@gmail.com Universidade Tecnológica

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Prof. Kléber de Oliveira Andrade pdjkleber@gmail.com Algoritmos Genéticos Conteúdo Introdução O Algoritmo Genético Binário Noções de Otimização O Algoritmo Genético com Parâmetros

Leia mais

Oi, Ficou curioso? Então conheça nosso universo.

Oi, Ficou curioso? Então conheça nosso universo. Oi, Somos do curso de Sistemas de Informação da Universidade Franciscana, e esse ebook é um produto exclusivo criado pra você. Nele, você pode ter um gostinho de como é uma das primeiras aulas do seu futuro

Leia mais

Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais

Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Universidade Federal de Ouro Preto Instituto de Ciências Exatas e Biológicas Departamento de Computação Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Cecília Henriques Devêza ceciliadeveza@gmail.com

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP

Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP 1 Principais Tópicos Introdução Evolução Natural Algoritmos Genéticos Aplicações Conclusão 2 Introdução http://www.formula-um.com/ Como

Leia mais

Clusterização de Clientes Johnson utilizando Algoritmos Genéticos

Clusterização de Clientes Johnson utilizando Algoritmos Genéticos Technical Notes in Computational Intelligence, ICA, PUC-Rio 1 Clusterização de Clientes Johnson utilizando Algoritmos Genéticos Marco Aurélio C. Pacheco 1, André Capella 1,2, Ronaldo R. Goldschmidt 1,3

Leia mais

Computação Evolutiva. Computação Evolutiva. Principais Tópicos. Evolução natural. Introdução. Evolução natural

Computação Evolutiva. Computação Evolutiva. Principais Tópicos. Evolução natural. Introdução. Evolução natural Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP Principais Tópicos Introdução Evolução Natural Algoritmos Genéticos Aplicações Conclusão 1 2 Introdução Evolução natural http://www.formula-um.com/

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

RECONHECIMENTO AUTOMÁTICO DE PADRÕES MUSICAIS UTILIZANDO OPERADORES MORFOLÓGICOS E PROGRAMAÇÃO GENÉTICA.

RECONHECIMENTO AUTOMÁTICO DE PADRÕES MUSICAIS UTILIZANDO OPERADORES MORFOLÓGICOS E PROGRAMAÇÃO GENÉTICA. RECONHECIMENTO AUTOMÁTICO DE PADRÕES MUSICAIS UTILIZANDO OPERADORES MORFOLÓGICOS E PROGRAMAÇÃO GENÉTICA. Emerson Carlos Pedrino e-mail: ecpedrin@sel.eesc.sc.usp.br Valentin Obac Roda e-mail: valentin@sel.eesc.sc.usp.br

Leia mais

APLICAÇÃO DE ALGORITMOS BIO-INSPIRADOS EM CONTROLE ÓTIMO

APLICAÇÃO DE ALGORITMOS BIO-INSPIRADOS EM CONTROLE ÓTIMO APLICAÇÃO DE ALGORITMOS BIO-INSPIRADOS EM CONTROLE ÓTIMO Profa. Mariana Cavalca Baseado em: Material didático do Prof. Dr. Carlos Henrique V. Moraes da UNIFEI Curso de verão da Profa. Gisele L. Pappa Material

Leia mais

Como Funciona o Sintegra? FEF12

Como Funciona o Sintegra? FEF12 Como Funciona o Sintegra? FEF12 Caminho: Fiscal> Arquivo> Sintegra> Sintegra Referência: FEF12 Como Funciona: O SINTEGRA consiste num conjunto de procedimentos administrativos e de sistemas computacionais

Leia mais

Regras de Associação. José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP

Regras de Associação. José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP Regras de Associação A compra de um produto quando um outro produto é comprado representa uma Regra de Associação Regras de Associação são frequentemente utilizadas para apoiar campanhas de marketing e

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 14 Regras de Associação Max Pereira Regras de Associação Motivação O que é geralmente comprado junto com o produto x? Que pares de produtos são comprados juntos?

Leia mais

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Mateus Luiz Gamba 1, Giana da Silva Bernardino 2 1 Universidade Federal

Leia mais

Universidade Federal do Paraná

Universidade Federal do Paraná Universidade Federal do Paraná Mineração de Dados e Aprendizado de Máquinas. Aurora Trinidad Ramírez Pozo Roteiro Overview a Descoberta de Conhecimento em Bases de Dados Descoberta de Conhecimento em Bancos

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Análise de Associação. Mineração de Regras de Associação

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Análise de Associação. Mineração de Regras de Associação SCC0173 Mineração de Dados Biológicos Mineração de Regras de Associação Prof. Ricardo J. G. B. Campello Créditos Parte deste material consiste de adaptações e extensões dos originais: gentilmente cedidos

Leia mais

Inteligência Computacional Aplicada. O que é Inteligência Computacional? Áreas de Aplicação Algoritmos Genéticos

Inteligência Computacional Aplicada. O que é Inteligência Computacional? Áreas de Aplicação Algoritmos Genéticos Inteligência Computacional Aplicada Resumo O que é Inteligência Computacional? Áreas de Aplicação Algoritmos Genéticos O que é Inteligência Computacional? Técnicas e sistemas computacionais que imitam

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ ALGORITMOS GENÉTICOS. Metaheurísticas de Buscas

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ ALGORITMOS GENÉTICOS. Metaheurísticas de Buscas PR UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ ALGORITMOS GENÉTICOS Metaheurísticas de Buscas ALGORITMOS GENÉTICOS (AG) Popularizados por John Holland podem ser considerados os primeiros modelos algorítmicos

Leia mais

Planejamento Hidrotérmico Utilizando Algoritmos Genéticos

Planejamento Hidrotérmico Utilizando Algoritmos Genéticos 1 Planejamento Hidrotérmico Utilizando Algoritmos Genéticos Thayse Cristina Trajano da Silva Pontifícia Universidade Católica Puc-Rio Engenharia Elétrica Rio de Janeiro RJ Brasil Resumo O planejamento

Leia mais

Sistema de mineração de dados para descoberta de padrões em dados médicos

Sistema de mineração de dados para descoberta de padrões em dados médicos Sistema de mineração de dados para descoberta de padrões em dados médicos Matheus Felipe MIRANDA¹; Marcos Roberto RIBEIRO² ¹ Estudante do curso de Tecnologia em Análise e Desenvolvimento de Sistemas e

Leia mais

INTRODUÇÃO À INTELIGÊNCIA COMPUTACIONAL. Aula 06 Prof. Vitor Hugo Ferreira

INTRODUÇÃO À INTELIGÊNCIA COMPUTACIONAL. Aula 06 Prof. Vitor Hugo Ferreira Universidade Federal Fluminense Escola de Engenharia Departamento de Engenharia Elétrica INTRODUÇÃO À INTELIGÊNCIA COMPUTACIONAL Aula 06 Prof. Vitor Hugo Ferreira Representação por cromossomos Codificação

Leia mais

ESTUDO DO EFEITO DOS PARÂMETROS GENÉTICOS DE UM ALGORITMO GENÉTICO NA SOLUÇÃO OTIMIZADA E NO TEMPO DE CONVERGÊNCIA EM UMA FUNÇÃO DE DUAS VARIÁVEIS

ESTUDO DO EFEITO DOS PARÂMETROS GENÉTICOS DE UM ALGORITMO GENÉTICO NA SOLUÇÃO OTIMIZADA E NO TEMPO DE CONVERGÊNCIA EM UMA FUNÇÃO DE DUAS VARIÁVEIS ESTUDO DO EFEITO DOS PARÂMETROS GENÉTICOS DE UM ALGORITMO GENÉTICO NA SOLUÇÃO OTIMIZADA E NO TEMPO DE CONVERGÊNCIA EM UMA FUNÇÃO DE DUAS VARIÁVEIS Marcelo Henrique dos Santos Universidade de Uberaba, Engenharia

Leia mais

3 Otimização Evolucionária de Problemas com Restrição

3 Otimização Evolucionária de Problemas com Restrição 3 Otimização Evolucionária de Problemas com Restrição 3.1. Introdução Este capítulo resume os principais conceitos sobre os algoritmos evolucionários empregados nesta dissertação. Primeiramente, se fornece

Leia mais

Otimização com Algoritmos Evolutivos

Otimização com Algoritmos Evolutivos Otimização com Algoritmos Evolutivos Francisco Pereira (xico@dei.uc.pt) ELBCE 2016 (Setembro 2016) Resumo Problem Optimization Method Solution } Algoritmos Evolutivos } Propriedades e funcionamento } Exemplos

Leia mais

UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS

UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS Uma visão geral dos GAs Um algoritmo genético é uma classe de algoritmo de busca. O algoritmo procura uma solução dentro de um espaço para um problema de otimização.

Leia mais

COMPOSIÇÃO DE UMA CARTEIRA DE AÇÕES COM RISCO MÍNIMO E RETORNO ESPECIFICADO: UM ESTUDO UTILIZANDO ALGORITMO GENÉTICO E A FUNÇÃO SOLVER

COMPOSIÇÃO DE UMA CARTEIRA DE AÇÕES COM RISCO MÍNIMO E RETORNO ESPECIFICADO: UM ESTUDO UTILIZANDO ALGORITMO GENÉTICO E A FUNÇÃO SOLVER UNIVERSIDADE DE SÃO PAULO ESCOLA DE ARTES, CIÊNCIAS E HUMANIDADES SISTEMAS DE INFORMAÇÃO COMPOSIÇÃO DE UMA CARTEIRA DE AÇÕES COM RISCO MÍNIMO E RETORNO ESPECIFICADO: UM ESTUDO UTILIZANDO ALGORITMO GENÉTICO

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com Coleta de dados em vários

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

Elaboração de Grades Horárias Utilizando Algoritmos Genéticos

Elaboração de Grades Horárias Utilizando Algoritmos Genéticos Elaboração de Grades Horárias Utilizando Algoritmos Genéticos Lucas Bucior, Fabio Asturian Zanin, Marcos A. Lucas Departamento de Engenharias e Ciência da Computação Universidade Regional Integrada do

Leia mais

Aplicação da Metaheurística Algoritmos Genéticos na solução do problema das n Rainhas

Aplicação da Metaheurística Algoritmos Genéticos na solução do problema das n Rainhas Aplicação da Metaheurística Algoritmos Genéticos na solução do problema das n Rainhas Resumo Gardiego Luiz da Silva 1 Henrique Faria de Oliveira 2 Faculdade

Leia mais

Método de Hardy-Cross Capitulo 13- Algoritmo genético engenheiro Plínio Tomaz 24 dezembro de Algoritmo genético 13-1

Método de Hardy-Cross Capitulo 13- Algoritmo genético engenheiro Plínio Tomaz 24 dezembro de Algoritmo genético 13-1 1 Algoritmo genético 13-1 2 Capítulo 13-Algoritmo genético 13.1 Introdução As tecnologias recentes para dimensionamento de redes de água são: Algoritmo genético Programação Dinâmica Decision Support System

Leia mais

Assim, no algoritmo BIOCLIM, qualquer ponto do espaço pode ser classificado como:

Assim, no algoritmo BIOCLIM, qualquer ponto do espaço pode ser classificado como: ANEXO A ALGORITMOS BIOCLIM E GARP A.1 Algoritmo BIOCLIM O algoritmo BIOCLIM implementa o conceito de envelope bioclimático (Nix, 1986). O algoritmo calcula a média e o desvio-padrão para cada variável

Leia mais

Algoritmo CLIQUE (Clustering In QUEst)

Algoritmo CLIQUE (Clustering In QUEst) Algoritmo CLIQUE (Clustering In QUEst) Marcelo Camacho de Souza Nº USP: 3199616 Roteiro Algoritmo CLIQUE Exemplo Prático Complexidade Computacional Vantagens e Desvantagens Autores (IBM Almaden Research

Leia mais