EVERTON TAVARES STELLA MARA CARVALHO SILVA DATA MINING BASEADO NO SISTEMA IMUNOLOGICO ARTIFICIAL

Tamanho: px
Começar a partir da página:

Download "EVERTON TAVARES STELLA MARA CARVALHO SILVA DATA MINING BASEADO NO SISTEMA IMUNOLOGICO ARTIFICIAL"

Transcrição

1 EVERTON TAVARES STELLA MARA CARVALHO SILVA DATA MINING BASEADO NO SISTEMA IMUNOLOGICO ARTIFICIAL CURITIBA 2002

2 EVERTON TAVARES STELLA MARA CARVALHO SILVA DATA MINING BASEADO NO SISTEMA IMUNOLOGICO ARTIFICIAL MQnog~fia apre$entada. como re<luisilo pan:ial b oorlclu~o 00 Curso de Tecnokloia em Proceuamento de Oados d., Unilo'l!irsidade luiu!i do Parana Orjentooora: ProP. Dr-. Deboolh Ribeiro Carvalho CURITIBA 2002

3 EVERTON TAVARES STELLA MARA CARVALHO SILVA DATA MINING BASEADO NO SISTEMA IMUNOLOGICO ARTIFICIAL Monografia aprovada como requisi10 parcial a conclusao do CurSD de Tecnologia em Processamento de Dados da Universidade Tuiuti do Parana, pete comissao fannada pelos professares: Orientadora: ProF'. Dr'. Deborah Ribeiro Carvalho Universidade Tuiuti do Parana, UTP Prof. Or. Eduardo Raul Hruschka Universidade Tuiuti do Parana, UTP Prof. Dr. Leandro dos Santos Coelho Universidade Tuiuti do Parana, UTP ProfD. Elaini Simoni Angeletti Universidade Tuiuti do Parana, UTP Curitiba, 29 de novembro de 2002

4 AGRADECIMENTOS A nossa orientadora ProP'. Dr-. Deborah Ribeiro Carvalho, par sua competencia e por ter acreditado em nosso potencial. A minha esposa, meu am or, per seu apoio e pacillncia. A Deus, aos meus pais. e especialmente a urn amigo que me ajudou em hora5 dificeis, Sergio Martenetz, e seu filho Marcelo Martenetz, meu companheiro, meu am or.

5 "Tudo tem Jell t~i1wo 8 afi! Gsrtas rrniij;'e~t1j Je. trn'tis ~.s ti Oliginnil enlrnm em vog.l au SOlJm de modtl.,\11/11ii sabedorm rom umit Vflllt4!gem: ~ e/c!mtt." BJliiu,."r Grl3cijn

6 SUMARIO LlSTA DE FIGURAS.. vii LlSTA DE TABELAS.... viii LlSTA DE ABREVIATURAS ix RESUMO x 1. INTRODUc;:Ao 1 2. KDD - KNOWLEDGE DISCOVERY FROM DATABASES ETA PAS DO KDD - KNOWLEDGE DISCOVERY FROM DATABASES SELEc;:AO DE DADOS LlMPEZA OU PRE-PROCESSAMENTO TRANSFORMAc;:AO OU ENRIQUECIMENTO DOS DADOS DATA MINING INTERPRETAc;:AO E AVALlAc;:AO CONSOLlDAc;:AO DO CONHECIMENTO DESCOBERTO 8 3. TAREFAS DE DATA MINING CLUSTERING DESCOBERTAS DE REGRAS DE ASSOCIAc;:Ao CLASSIFICAc;:Ao DE DADOS TECNICAS DE CLASSIFICAc;:Ao ARVORES DE DECISAO ALGORITMOS GENETICOS SISTEMA IMUNOL6GICO E SISTEMA IMUNOL6GICO ARTIFICIAL METODOLOGIA DE DESENVOLVIMENTO DO PROTOTIPO DEFINIc;:Ao DA MODELAGEM DO SIA 27

7 4.1.1 ALGORITMO IMUNOL6GICO PARA DESCOBERTA DE REGRAS PARA PEQUENOS DISJUNTOS REPRESENTA<;;Ao DO ANTICORPO FUN<;;AO DE AVALlA<;;AO SELE<;;AO CLONAL DEFINI<;;AO DA BASE DE DADOS ORIGINAL DEFINI<;;Ao DA BASE DE TREINAMENTO DEFINI<;;AO DA BASE DE TESTES ARQUIVO NAMES DEFINI<;;AO DAS ESTATisTICAS DA BASE DE DADOS PSEUDOC6DIGO REALlZA9AO DOS EXPERIMENTOS EXPERIMENTO COM A BASE HOUSE-VOTES EXPERIMENTO COM A BASE HEPATITIS EXPERIMENTO COM A BASE CRX ANALISE DOS RESULTADOS CONCLUSAO 48 REFERENCIAS 49 vi

8 LlSTA DE FIGURAS o PROCESSO KDD E SUAS ETAPAS.4 EXEMPLOS DE CLUSTERING 11 TIPOS DE CRUZAMENTO 19 ESTRUTURA DO ANTICORPO (ANTECEDENTE DA REGRA) 30 REGRA CRIADA ATRAVES DA BASE DE TREINAMENTO 43

9 LlSTA DE TABELAS DISTRIBUI<;:AO DOS ATRIBUTOS METAS DA BASE HOUSE-VOTES.. 40 DISTRIBUI<;:Ao DOS ATRIBUTOS METAS BASE HEPATITIS.41 DISTRIBUI<;:Ao DOS ATRIBUTOS METAS BASE CRX..42 ANALISE DOS RESULTADOS DO SIA COMPARADO AO C ANALISE DOS RESULTADOS DO SIA COMPARADO AO C4.5/AI.47 viii

10 USTA DE ABREVIATURAS AG ALGORITMO GENETICO AGs ALGORITMOS GENETICOS AI ALGORITMO IMUNOL6GICO AIS ARTIFICIAL IMMUNE SYSTEMS SIA SISTEMA IMUNOL6GICO ARTIFICIAL ;,

11 RESUMO o foco deste trabalho esta centrado na tarefa de classifica9ao, cnde deseja-se atribuir a urn exemplo (re9i5tro) urna dasse, dentre urn conjunto de classes predefinidas, com base nos valores de atributos daquele exemplo. No contexto da tarera de classifica~o, 0 conhecimento descoberto pode ser expresso atraves de urn oonjunto de regras "se..<condiyao>.. entao..<atyao>..". Este tipo de representa~o tern a vantagem de ser intuitivamente compreensivel para 0 usuario. Existem varios algoritmos que pod em construir classificadores a partir do conhecimento implicito em urna base de dadas, entre eles, algoritmos de arvare de decisao, algoritmos geneticos, algoritmos imunol6gicos, etc. 0 sistema imunologico biol6gico pode ser a base para a constru9bo de algoritmos que cumpram a tarefa de classificayao em Data Mining. Apesar de seu alto grau de complexidade trata-se de uma "inspiray:.io" de grande interesse pela comunidade cientifica da area de computayao.o objetivo principal deste trabalho e propor urn novo algoritmo que construa urn classificador a partir da implementac;ao computacional de alguns dos principais conceitos do Sistema Imunol6gico. Os resultados obtidos a partir dos experimentos realizados no escopo deste projeto poderao ser comparados com os resultados obtidos pelo C4.S e 0 C4.5/AI, apresentado no artigo Urn Algoritrno Imunol6gico para descobrir regras para pequenos disjuntos em Data Mining, da ProF'. Dr-. Deborah Ribeiro Carvalho e Prof. Dr. Alex Alves Freitas.

12 1. INTRODUC;;AO A atual "era da informac;:8o" e caracterizada pelo aumento no volume de clados que esta.o sendo gerados e armazenados (CARVALHO; FREITAS, 2001). Esta expansao deve-se a falares de baixo custo no arrnazenarnento de dados e as novas tecnologias desenvolvidas, com maior capacidade de armazenamento e maior velocidade na recuperayao clestes dados. Com a facilidade no armazenamenlo des dados e 0 crescimento expressivo destes dados armazenados, t~111 crescido a necessidade de ferramentas que possibilitem a extrac;ao de conhecimento destas bases de informa~6es. Devido a esla realidade, existe a necessidade de desenvolvimento de novas metodos e algoritmos para a descoberta e extrayao de conhecimento implicito nestas bases de dados, tarnando-os explicitos e objetivando 0 auxflio na tomada de decisao. As empresas. cada vez mais, necessitam de uma correta interpretac;ao das informa es para auxilia-ias nos processos decis6rios e, conseqoentemente, no crescimento do neg6cio principal da empresa (GURECK. 2001). Segundo FAYYAD. cilado por GURECK (2001). 0 processo de descoberta de conhecimento em base de dados constitui um conjunto de eta pas Que 'lao desde: (i) a identificaqao de qual base sera utilizada, (ii) a sele~o dos atributos envolvidos, (iii} a transforrnoceo e 0 prc-processamento, (iv) a minera~a.o de dados (Data Mining), (v) a antllise do conhecimento extraido, e (vi) a disponibilizac;ao do conhecimento. A etapa que "realmente extrai 0 conhecimento e a etapa de Data Mining {mineraya.o de dado.s}.

13 Este Segundo FAYYAD et ai., citado por CARVALHO (2002b), algumas das larefas usuais de Data Mining sao a descoberta de regras de associa~o, a cjassificayao e 0 agrupamento (clustering). o foeo des!e trabalho e a tarefa de ciassifica<;ao, cnde deseja se atribuir a urn exemplo (registro) urna dasse, dentre urn conjunto de classes pre-definidas, com base nos valores de atributos daquele exemplo. Cabe ressaltar que e5sa tarefa tern verias aplicac;6es em diversas areas. Em urna aplicac;:lo financeira, por exemplo, urn banco poderia classificar seus clientes em duas classes, ~credito ruim" au ~credito born", Em urna aplicayao na area da medicina, um medico poderia classificar alguns de seus pacientes em duas classes: "tern" au Knao tern" urna certa doen<;a. Assim, varias problemas importantes do mundo real podem ser tralados como tarefas de classificac;.ao. Essa tarefa e discutida de forma mais detalhada na sec;;ao3.3. No contexto da larefa de dassificac;;ao, 0 conhecimento descoberto pode ser expresso atraves de urn conjunlo de regras ~se..<condic;ao>.. enlao..<a~o>..m. tipo de representa<;ao tern a vantagem de ser intuitivamente compreensivel para 0 usuario. Existem varios algoritmos que podem construir classificadores a partir do conhecimento implicito em urna base de dados, entre eles, algoritmos de arvore de decisao, algoritmos geneticos, algoritmos imunol6gicos, etc. Este trabalho tern como objetivo principal propor urn novo algoritmo que construa urn dassificador a partir da implementac;;ao computacional de alguns dos princlpais conceitos do Sistema Imunol6gico Artificial. A proposta deste trabalho de gradua~o constitui urn desdobramento de urna das pesquisas desenvolvidas pela Universidade Tuiuti do Parana, que tem

14 como pesquisadora responsavel a Prof". Or-. Deborah Ribeiro Carvalho. Esta pesquisa aponta algumas dire~s de pesquisas futuras, sendo uma delas desenvolvida no presente trabalho. Os resultados obtidos a partir dos experirnentos realizados no escopo deste projeto poder:lo ser cornparados nao apenas com as resultados obtidos pela pesquisa, bem como com os resultados obtidas a partir de um outro projeto de graduac;ao que foi desenvolvido em para lela a este, que se bas.eia em algoritrnos geneticos.

15 2. KDD - KNOWLEDGE DISCOVERY FROM DATABASES ADRIAANS, citado par GURECK (2001), conceitua KOD como um conjunto de atividades contlnuas que compartilham a conhecimento descoberto a partir de bases de dad as. Segundo FAYYAD, citado par GURECK (2001), 0 conjunto e composto de seis etapas: selee;ao dos dadas, limpeza ou pre-processamento, transformayao, Data Mining, interpreta~o e avalia~o dos relat6rios e consolidaytio do conhecimento e.tescoberto (Figura 1). FIGURA 1-0 PROCESSO KDQ E Sl)AS ETAPAS (FAYYAD, c:i1ih:lopar GURECK, 2t101) 2.1 ETAPAS DO KDD - KNOWLEDGE DISCOVERY FROM DATABASES ele<;1lo de Dados Urna vez definido 0 dominic sabre a qual se pretende executar a processo de descoberta, 0 proximo passo e seiecionar e coletar 0 conjunto de dados ou as variiweis necessarias. A maiaria das ernpresas passui a base de dedas, porb:m nem sempre lodos as dados necessarios estao dispon[veis nestas bases.

16 ConseqOentemente, neste contexto e exigido um trabalho de compatibilizac;.ao, ou seja, os dados que sao necessarios, os que ja esta.o disponiveis, e a possibilidade de obten9ao dos dados que nao estao disponiveis (CARVALHO, 1999). Quando se dispoe de uma quantidade de dados, onde todos os exemplos sao importantes, tenta-se substituir 0 ruido ou perturba90es - dados estranhos e/ou incansistentes - par valares consistentes ao dominio em questao au ate mesmo gerar dad os manual mente. Para 0 casa em que a quanti dade de dados e grande, tenta~se eliminar as dadas que contem ruido. Em ambos os casas, fazem-se necessarias a utilizayao de tecnicas estatisticas para detectar os campos com ruido e, de acordo com a conveni~ncia, substitui-ios ou desconsidera-ios (GURECK, 2001) Limpeza ou Pre-Processamenta Oepois de coletar os dados, 0 pas so seguinte e tratar os rufdos e estabelecer as estrategias para resolver 0 problema da aus~ncia dos dados. As causas que levam a situayao de aus~ncia de dados sao a nao disponibilidade do dado ou a inexistencia do mesmo. Uma situac;ao de nao disponibilidade ocorre quando nao ha divulga<;ao do dado, como, par exemplo, os dados da renda de uma pessoa fisica em fun<;ao da obrigatoriedade do sigilo (CARVALHO, 1999). A inexist~ncia dos dados pode ocorrer, per exemplo, quando sao necessaries dades sobre determinados produtos de empresas que, no momenta de organizayao e gerayao da base original, ainda n~o haviam sido criados. Os dad os devem ser relevantes para as necessidades do LJ5uario, limpos, consistentes e livres de excessivas nulidades (CRUZ, 2000).

17 Quando existe limitac;tio computacional relacianada ao temanho da base de dados, e recomendado selecionar algumas amostras aleatoriamente, a fim de se obter uma ideja do que pode ser esperado. Quase todas as bases de dados ern grandes empresas sao ~poluidas~, e quando comeyam a ser olhadas atraves da perspectiva de Data Mining. jdejas quanta a consist~ncia dos dados mudam (CRUZ, 2000), em rela9ao a05 conceitos cu.lssicos de banco de dados Transformavao au Enriquecimento dos Dados Ap6s 0 dado do banco de dados ter sido pre-processado (filtrada), deve-se fazer uma analise sobre a necessidade de dados adicionais, que eventual mente podem enriquecer a base (MARATH; MAYER, 2001). Segundo ADRIAANS, citado por GURECK (2001). em diversos paises, 0 acesso a outras bases de dados adicionais esm disponivel em bases de dados comerciais e pode prover informa\1ao de uma grande variedade de assuntos, incluindo dados demogrilficos, tipos de seguros que as pessoas possuem, entre outros. 0 estudo de uma situa~o ande companhias trocam dados para coordenar suas operayoes de marketing tem side urn segmento em desenvolvimento. A privacidade e urn aspecto importante neste contexto. A jurisprud~ncja, nesta area, esta se desenvolvendo rapidamente, e na maiaria dos paises onde nao e permitida a venda de dados individuais sem a permissao do individuo, e perrnitida a venda de informac;oes de grupos de pessaas, mesma nao sendo alga desejflvel do ponto de vista eticq, segundo ADRIAANS, citado por GURECK (2001).

18 Exemplificando~se atraves de suposic;c5es,as conversoes de dados podem ser realizadas na entrada de um illgoritmo de Data Mining que receba as idades dos clientes de ullla empresa. Entretanto, se a base de dados de estudo possui somente as datas de nascimento dos clientes, faz~se necessaria a realizagao de uma transformayao sobre esses dados, adequando~os a entrada do algoritmo, efetuando urn calculo da idade a partir da data de nascimento (GURECK, 2001) Data Mining Data Mining consiste em um conjunto de conceitos e metodos com 0 objelivo de encontrar uma descric;ao, preferencialmente compreensfvel, de padrc>ese regularidades em um determinado conjunto de dados (CARVALHO, 2002b). Nesta etapa do processo se define a escolha do algoritmo ou dos algoritmos de Data Mining, de acordo corn IJm ou mars metodo(s} adequado(s) ao tratamento dos dados do problema que se esta resolvendo. Relativamente as etapas anteriores mencionadas de a 2.1.3, 0 tempo utilizado por esta etapa ~ substancialmente menor. Data Mining e uma das fases. do processo de descoberta de conhecimento, para a qual tern side descritos varios metod os. Dentre as metod os, destacam~se: tecnicas estatisticas, visualizayao. raciocinio baseado em casas, anores de decis~o, descoberta de regras de associac:;ao, redes neurais e algoritmos geneticos (CARVALHO, 1999). Nesta etapa. as algoritmos de Data Mining, se bem projetados, tl!m a capacidade de e)(trair 0 conhecimento, mesmo sem ter conhecimento total ou

19 parcial da queslao. Esta capacidade faz com que Data Mining agregue valor aos sislemas de apoio a decism (GURECK, 2001) Inlerprela<;ao e Avalia\'llo Nesta etapa deve-se saber se 0 conhecimento gerado e util, relevante e valida, pais se nao for, sera necessaria repelir todo au parte do processo de KDD. Esla descricaa pade sugerir que exista uma trajet6ria linear do processo KDD. No entanla, isla geralmente n~a se verifica, uma vez que em cada elapa pode ser identificada a necessidade de retorno para qualqljer uma das eta pas anteriores. Por exemplo, se na etapa de transformayao au mesmo de Data Mining, e identificado que as dados na.o estao tolalmente consislentes, au se for verificada a necessidade de um dado que nao havia sido previsto anteriarmente, e isso pode levar ao retorno para a fase de consistllncia. limpeza au mesmo de sele\'llo dos dados (GURECK, 2001). Lembrar que esla larefa e desempenhada pelo especialista da area de contlecirnento em questao Consolida~o do Conhecimento Descoberto Nesta elapa de conhecimento, as resllltados dos algoritmos de Data Mining devell1 ser analisados, interpretados e bem avaliados. Se estes resultados nao forem satisfat6rios, deve-se retornar as fases anteriores para efetuar uma melhor sele<;a,o, enriquecimento e limpeza dos dados. Este novo resultado deve gerar informac;ao util e desconhecida, qlle auxilie nos processes decis6rios de uma empresa (GURECK, 2001).

20 A realiza~o das atividades n:io deve ser seqliencial, pais em cada etapa devem ser avaliados os resultados, e caso seja necessaria, deve-se retarnar a qualquer uma das eta pas anteriore-s, para recupera~o de dados nao previstos, para uma nova consist~ncia au limpeza dos dados (GURECK, 2001). Segundo FAYYAD et ai., citado por CARVALHO (2002b), as varias tarefas desenvolvidas em Data Mining t~rn como objetiva essencial a predi~a e/au a descric;aa de dadas e/ou sistemas. A predi<;aa llsa atributas para preyer as valares futuros de uma au mais variaveis {a1ributas) de interesse. A descrivaa contempla a que foi descoberto nas dados sob a ponto de vista da interpretac;aa humana. As eta pas do processo KDD nao sao 0 foeo deste trabalho. visto que ja possuimos as dad os a serem utilizados. Estes dados sao oriundos do UCI Repository, disponiveis em: <http://i,wiw.ics.ugi.edu/-mlearn/mlrepository.html>. A unica etilpa abordada neste trabalho e a do Data Mining, onde utiliza-sa Ulna de suas tarefas, a tarefa de classificaytio.

21 3. TAREFAS DE DATA MINING Para trabalhar com Data Mining e preciso conhecer suas tarefes, a utilizac;ao de cada uma del as e selecionar a que mel her ira se adequar ao objetivo em queslao (MARA TH; MAYER. 2001). Segundo ADRIAANS, FAYYAD el.1. e FU, cilado por CARVALHO (2002b), o objetivq da descri~o, bem como 0 da previsao, sao atendidos atraves de algumas das tarefas principais de Data Mining: classificac;ao, clustering, descoberta de regras de associac;ao, etc. o foco deste Irabalho e a tarefa de classificac;ao. Esla tarefa e detalhada na subsec;:ao CLUSTERING A tarefa de clustering oonsiste na identificactao de um conjunto finita de grupos ou dusters, baseada nos atributos de objelos nad previamente dassiftcados. Urn cluster e basicamente um conjunto de objetos agrupados em fun~o de sua similaridade ou proximidade. as OOjetos sao agrupados de tal forma que as similaridades intradusters (dentro de um mesmo cluster) sao maximizadas e as similaridades interclusters (entre clusters diferentes) sao rninirnizadas. A Figura 2 mostra urn exemplo do resultado de uma tarefa de dusten ng, onde quatro clusters foram identificados (CARVALHO, 2002b). Urna vez definidos os clusters, os objetos sao identificados com seu cluster correspondente, e as caracteristicas comuns dos objetos no cluster podem ser surnarizadas para formar a descri~o do grupo, que podera subseqoentemente ser definido como uma classe. Por exemplo, urn conjunto de pacientes pede ser

22 11 agrupado em varias grupos (clus-te,~), bas.e.ado nas similaridades dos seus sintomas, e as sintoll1as comuns aos padentes de cada cluster podem ser usados para descrever a qual chisler urn novo paciente pertencer~. Assim, urn dado paciente seria atribuido ad cluster cujos pacientes tt.!!m sintomas 0 mais similar posslvel com as sintornas daquele dado paciente. Oessa forma, a tarefa de clustering, cujo resultado e a identifica~o de novas dasses, pode ser realizada como preprocessamento it realizac;ao da tarefa de classificayao, segundo KUBAT et ai., citada por CARVALHO (2002b). A, FIGURA 2- EXEMPLO DE CLUSTERING (CARVAlHO. A, 2OO2b) 3.2 DESCOBERTAS DE REGRAS DE ASSOCIAi;l\O Para exemplificar as regras de associa~o, imagine um consumidor que vai ad supermercado e compra varias produ1os. Uma compra indica as prefer~ncias de um ctiente, porem dillersas compras possuem diversas outras informa95es relevantes. Os consumidores nao sao as mesmos, e sendo assim, cada consumidor compra produtos diferentes e em momentos diferentes. As regras de associa~o usam as informayoes sobre 0 que os consumidores compraram para lentar mostrar quem sao 0 porque oles com pram (BERRY; LIN OFF, 1997, p. 124).

23 12 Neste sentido, cada registro de urna venda no supermercado corresponde a urna transa<;ao efetuacta pelo consumidor, cnde cada item tern valor verdadeiro ou falso, dependendo se 0 consumidor comprou (au na.o) aquele produto naquela transa9ao. Esse tipo de dado e freqoentemente coletado atraves da tecnologia de c6digo de barras (GURECK, 2001). o algoritmo para descoberla de regras de associb930 idenlifica afinidades entre itens de urn subconjunto de dados. Essas afinidades sao expressas na forma de regras, por exemplo: 72% de lodes as registros que contem as itens A, Bee tambem contem 0 e E. A porcentagem de ocorr~ncia (72 neste exemplo), representa 0 fator de confian98 da regra, e costuma ser usado para eliminar tend~ncias fracas, mantendo apenas as regras mais fortes. Trata-se de urn algoritmo voltado a analise de mercado, com a objetivo de encontrar tendencias dentro de urn grande numero de registros. Essas tend~ncjas pod em ajudar a entender e explorar pad roes de compra naturais, e no exemplo citado de cornpras em urn superrnercado, podem ser usadas para modificar prateleiras ou propagandas, e induzir atividades promocionais especificas (FIGUEIRA, 1998). 3.3 CLASSIFICAI;AO DE DADOS A classificayao e a tarefa de Data Mining estudada ao longo do tempo. Essa larefa consiste em classificar um item de dado (exemplo ou registro) como pertencente a uma determinada cia sse dentre varias classes previamenie definidas. 0 principal objetivo e descobrir algum tipo de relayao entre os atributos e as classes, conforme FREITAS, citado por CARVALHO (2002b). Um importante conceito dessa tarefa e a divisao dos dados em bases de treinamento e de teste.

24 13 Inicialmente, um conjunto de dados de treinamento e disponibilizado e analisado, e um rl1odelo de classificayao e construido baseado nestes dados. Entao 0 modele construido e utilizado para classificar QUtros dados, denominados dadas de teste, as quais sao independentes dos dados de treinamento. Cabe ressaltar que 0 modelo construido a partir dos dado5 de treinamento e considerado um born mode 1o, do ponto de vista de precisao preditiva, se 0 modele classificar corretamente uma alta porcentagelll dos exemplos (registros) dos dodos de teste. Em Qutres palavras, a modele deve representar conhecimento que passa ser generalizado para dados de teste e que nao tenham side utilizados durante 0 treinamento (CARVALHO, 2002b). A fim de contribuir para a compreensibilidade do conhecimento descoberto, esse conhecimento e geralmente representado na forma de regras ~se..<condir;:oes:::... entao..<cia sse>..-", cuja interpretayao e: "se as valores dos atnbutos satisfazem as condir;:oes da regra entao a exemplo petience a classe preyista pel. regra" (CARVALHO, 2002b). Existem varios criterios para avaliar a qualidade das regras descobetias na tarefa de classifica92lo. Os dais criterias mais usadas sao precisao preditiva e a compreensibilidade do conhecimento descoberto (CARVALHO, 2002b). A precis2lo preditiva e normalmente medida como 0 numero de exemplos de teste classificados corretamente, dividido pela numero total de exemplos de teste (CARVALHO, 2002b). Segundo HAND, citado por CARVALHO (2002b), cabe ressaltar que M fannas rnais sofisticadas de se medir a precisao preditiva, mas a forma simples descrita anterionnente e, em sua essencia, a forma mais usada na pratica.

25 14 A compreensibilidade, geralmente, e medida em funyao do numero de regras e do numero de condic;:oes por regra. Quanta maiores estes numeros, menos cornpreensivel e a conjunto de regras ern questao (CARVALHO. 2002b). Essa forma de representay80 de conhecimento e adotada neste trabalho, em virtude de ser intuitivamente compreensl\lel para 0 usuario. o algoritrno proposto cum pre a larefa de classificac;:ao, e par issq e utilizado neste trabalho. 3.4 TECNICAS DE CLASSIFICAI;)\O Denlre as hknicas posslveis que tratam da questao de classifica<;ao estao: as arvores de decisao, algoritmos geneticos e sistemas imunol6gicos. Neste trabalho, utiliza-se 0 sistema imunol6gico artificial, conforme exposto na introdu9ao Arvores de Decisao As arvores de decis;'!.io sao meios de representar os resultados de Data Mining na forma de arvores. Dado urn grupo de dados com numerosas colunas e Hnhas, uma ferramenta de arvore de decisao pede ao usuario para escolher uma das colunas como objeto de saida (atributo meta), e entao mostra 0 (mica e mais importante tat~r correlacionado com aquele objeto de saida como primeiro ramo (no) da arvore de decisao. Os outros fatores sao 5ubseqOentemente classificados como nos docs) no{s) anterior(es). Desta maneira 0 usuario pode entender 0 porqu~ do fator escolhido, e vai permitir que 0 usuario explore a arvore de acordo

26 15 com a sua vontade, do mesmo modo como ele podera. encontrar grupos alv05. Os usuarios podem tambem selecionar as dados fundamentais em qualquer n6 da arvore, movendo-os para uma planilha au outra ferrall1enta para posterior analise (MARATH; MAYER, 2001). Conforme QUINLAN (1993), uma "rvore de decisao e uma representac;ao simples de um ciassificador uthizada par diversos sistemas de aprendizado de n1aquina, como par exempto, 0 C4.5. Urna arvore de decisao e induzida a partir de urn conjunto de exemplos de treinamento onde as classes sao previamente conhecidas. A estrutura da arvore e organizada da seguinle forma (CARVALHO, 2002b): cada 110interna (nao-folha) e rotulado com 0 nome de urn dos atributos previsores; os ramos (au arestas) saindo de urn n6 interno sao rotulados com valores do atributo naquele n6: cada folha e rotulada com uma cia sse, a qual e a classe prevista para exemplos que perten<;am aquele n6 folha. o processo de classificac;ao de um exemplo ocorre fazendo aquele exemplo percorrer a arvore, a partir do n6 raiz, proeurando avaliar os arcos que unem as nos, de acordo com as eondic;oes que estes rnesrnos areas representam. Ao atingir urn no folha, a classe que rotula aquele n6 folha e atribufda aquele exemplo (CARVALHO, 2002b).

27 Algoritmos Geneticos Na natureza, 0 processo de sele<;ao natural controla a evoluyao de seres vivos. Os organismos mais adaptados ao seu ambiente tendem a viver tempo suficiente para S8 reproduzirem, enquanto organismos menes adaptados sao mais propensos a morrer antes de sua reprodul;lio (CARVALHO, 2002b). Segundo FALKENAUER, citado por CARVALHO (2002b), os algoritmos geneticos (AGs) sao algoritmos de busca baseados no mecanismo da selec;ao natural e na genetiea. Os AGs se baseiam na sobreviv~ncia da melhor soluc;ao candidata para urn determinado problema. As solu<;6es candidatas sao normalmente representadas par individuos. A cada nova gerayao urn novo conjunto de individuos e criado usanda segmentos (partes) dos melhores individuos da gera<;ao anterior, conforme avaliado por uma funyao de fitness (funo;ao de avaliao;aolfuno;ao objetivo). Um AG difere dos algoritmos de buscas tradicionais principalmente nos seguintes aspectos (GOLDBERG, 1989): AGs realizam uma busca usando uma popula(fao de solu(fao, e nao uma unica solugao; AGs usam operadores probabilisticos e nao operadores deterministioos; e AGs usam diretamente a informa~o de uma funcao objetivo, e nao dependem de derivadas ou conhecimento auxiliar sobre 0 problema. A primeira e a segunda caracteristica mencionadas contribuem para a robustez dos AGs, ajudando-os a escaparem de pontos de olimo locais, a tim de alcanc;arem pontos de otimos globais. A lerceira caracteristica contribui para a

28 17 generalidade de AGs que pod em ser aplicados em urn largo espectro de problemas de otimizayao, busca e aprendizagem de maquina (CARVALHO, 2002b). Os principais mecanismos de urn AG convencional sao faceis de entender, pais envolvem apenas trocas parciais entre individuos e pequenas altera90es de elementos dos individuos (CARVALHO. 2002b). Conforme BERSON. citado por CARVALHO (2002b). algumas caracteristicas usuais em sistemas que utilizam algoritmos geneticos sao as seguintes: (i) Definir 0 problema a ser resolvido - codificar uma solu~o candidata em urn individuo artificial, e especificar urna func;ao de avaliac;ao (fltne ): (ii) Inicializar a populacyao - lipicamente atribuindo valores aleatorios aos individuos da popula<;ao inicial; (iii) Permitir a selec;ao dos mais aptos e extin<;ao dos mends aptos; (iv) Permitir que uma nova gerac;.ao seja formada aplicando os procedimentos (ou operadores) de selec;ao, cruzamento e mutayao das solu es (individuos) da gera~o anterior; (v) Parar quando algum(ns) do(s) criterio(s) mencionados a seguir forem atingidos: - A soluc;ao e suficientemenle apropriada para problema em questao; - 0 sistema atingiu um numero de gerar;5es pre-determinado; - 0 sistema nao consegue rnais evoluir (estagna'1ao);

29 18 - Quando a valor media da funyao de avaliac;ao esta proximo ao ll1elhor valor da funya.o de avaliac;:ao de urn individuo da populilr;ao; - Sen:io, retornar ad item (iii}. Um algoritmo genetico simples e cor1stituido de dais operadores geneticos basicas: cruzamenta e muta~o (GOLDBERG, 1989). A seguir. serao descritas algumas versoes desles operadores Cruzamento {crossover) Segundo BACK, citado por CARVALHO (2002b). a opera~o de cruzamento permite a troca do material genetico disponfvei na populay:io entre seus indivfduos. Urn cruze menlo (crossover) simples pode ser feito em dais passds. Primeiro sao escolhidos aleatoriarnente dais individuqs, cham ados individuos pais" au antecessores, para cruzarem. Segundo, uma posiyao p e selecionada como urn numero aleatorio entre 1 e 11-1, onde 11 e 0 nllmera de genes (ou caracteristicas) que comp6em um individua (nos operadores de cruzamento descritos nesta sllbse<;ao, assume-se que ambos as individuos tt m 0 mesmo numero de genes). Dois novos individuos, denominados indivfduos "filhos~, sao gerados pels troca de todos os val ores entre a posi~o p+1 e n inclusive, PAWLOWSKI (1995) e BOOKER (2000). Est. metoda e denominado cruzamento em ponto simples au cruzamento em um ponto (ver Figura 3.(a}) (CARVALHO,2002b). Outro tipa de cruzamento, segundo SYSWERDA, citado par CARVALHO (2002b), e 0 cruzamento uniforme, onde todos as genes tem a mesma

30 19 probabilidade de serem trocados, independentemente de suas posic;6es no genoma (ver Figura 3.(1))) (CARVALHO, 2002b). Em geral existe uma ta)(a de cruzamento que centrola a frequ~ncia com que as cruzamentos ocorrerem (CARVALHO. 2002b) Mutao;:;o Conforme BACK, citado par CARVALHO (2002b), a operador genetico de nlutac;ao introduz novo material genetico de forma aleat6ria na populayao. Em AGs existem varios modos de implementar 0 operador mutat;ao. Per exemplo, se o individllo consiste de genes binarios, a mutar;ao consiste em inverter 0 valor de um bit (CARVALHO, 2002b). A muta~o pede introduzir material genetico que nao esta presente em nenhum individuo da populayao: ad contrario do cruzamento, que apenas treca material existente entre dais individuos. Assim, a l11utac;ao contribui para aumentar a diversidade gen_tica da populao;:;o (CARVALHO, 2002b). Em geral. e)(iste uma taxa de muta9ao que controla a freqoencia corn que as mutaq6es ocorrerem. Normalmente. a taxa de muta~ e bern menor que a taxa de cruremento (CARVALHO, 2oo2b). ltbj mfi\[][1 Llta1~~ FIGURA 3 TlPOS DE CRUZAME~nO(CARVALHO. lclj2b}

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 04 Algoritmos Genéticos Introdução Algoritmos genéticos são bons para abordar espaços de buscas muito grandes e navegálos

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados Algoritmos Genéticos em Mineração de Dados Descoberta de Conhecimento Descoberta do Conhecimento em Bancos de Dados Processo interativo e iterativo para identificar padrões válidos, novos, potencialmente

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

Complemento IV Introdução aos Algoritmos Genéticos

Complemento IV Introdução aos Algoritmos Genéticos Complemento IV Introdução aos Algoritmos Genéticos Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações e

Leia mais

ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS. Deborah Ribeiro Carvalho

ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS. Deborah Ribeiro Carvalho ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS Deborah Ribeiro Carvalho Orientador: Nelson Francisco Favilla Ebecken Co-Orientador: Alex Alves

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B

Leia mais

Algoritmos Genéticos

Algoritmos Genéticos UNIVERSIDADE PRESBITERIANA MACKENZIE Laboratório de Computação Natural LCoN I ESCOLA DE COMPUTAÇÃO NATURAL Algoritmos Genéticos Rafael Xavier e Willyan Abilhoa Outubro/2012 www.computacaonatural.com.br

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

3 Market Basket Analysis - MBA

3 Market Basket Analysis - MBA 2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO Renan de Oliveira Yamaguti Faculdade de Engenharia de Computação / CEATEC renan.yamaguti@terra.com.br

Leia mais

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação

Leia mais

UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS

UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS Alisson S. C. Alencar, Ajalmar R. da Rocha Neto Departamento de Computação, Instituto Federal do Ceará (IFCE). Programa

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Inteligência Computacional [2COP229]

Inteligência Computacional [2COP229] Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/24) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Componentes clássicos da

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Introdução às Redes Neurais Artificiais Treinamento via Algoritmos Genéticos Prof. João Marcos Meirelles da Silva http://www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

Pós-Graduação em Engenharia Elétrica Inteligência Artificial Pós-Graduação em Engenharia Elétrica Inteligência Artificial João Marques Salomão Rodrigo Varejão Andreão Inteligência Artificial Definição (Fonte: AAAI ): "the scientific understanding of the mechanisms

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Implementação do Algoritmo de Seleção Negativa para Detecção de Spams

Implementação do Algoritmo de Seleção Negativa para Detecção de Spams Implementação do Algoritmo de Seleção Negativa para Detecção de Spams Luane Gomes Cunha 1, Fernando Luiz de Oliveira 1 1 Curso de Sistemas de Informação Centro Universitário Luterano do Brasil (CEULP/ULBRA)

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Problemas Multi-modais e Distribuições Espaciais em Algoritmos Genéticos.

Problemas Multi-modais e Distribuições Espaciais em Algoritmos Genéticos. Problemas Multi-modais e Distribuições Espaciais em Algoritmos Genéticos. Thiago da Mota Souza Coordenação de Pós-Graduação e Pesquisa de Engenharia Centro de Tecnologia Universidade Federal do Rio de

Leia mais

Revisão Inteligência Artificial ENADE. Prof a Fabiana Lorenzi Outubro/2011

Revisão Inteligência Artificial ENADE. Prof a Fabiana Lorenzi Outubro/2011 Revisão Inteligência Artificial ENADE Prof a Fabiana Lorenzi Outubro/2011 Representação conhecimento É uma forma sistemática de estruturar e codificar o que se sabe sobre uma determinada aplicação (Rezende,

Leia mais

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!!

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!! Miguel Rocha Dep. Informática - Universidade do Minho BIOINFORMÁTICA: passado, presente e futuro!! Bragança, 11 de Maio de 2006 Porquê a Bioinformática?! Novas tecnologias experimentais da Biologia Molecular

Leia mais

MBA em Gestão de Empreendimentos Turísticos

MBA em Gestão de Empreendimentos Turísticos Prof. Martius V. Rodriguez y Rodriguez, DSc martius@kmpress.com.br MBA em Gestão de Empreendimentos Turísticos Gestão do Conhecimento e Tecnologia da Informação Gestão do Conhecimento evolução conceitual.

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3.1 - Conceitos Básicos Entendemos como algoritmo um conjunto predeterminado e bem definido de regras

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Engenharia de Software 2012/3 Aula 4 Engenharia de Requisitos

Engenharia de Software 2012/3 Aula 4 Engenharia de Requisitos Engenharia de Software Engenharia de Software 2012/3 Aula 4 Engenharia de Requisitos Thiago P. da Silva thiagosilva.inf@gmail.com Agenda Engenharia de Requisitos Níveis de Descrição dos Requisitos Tipos

Leia mais

Hierarquia de modelos e Aprendizagem de Máquina

Hierarquia de modelos e Aprendizagem de Máquina Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia

Leia mais

Estratégias de Pesquisa

Estratégias de Pesquisa Estratégias de Pesquisa Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Survey Design e Criação Estudo de Caso Pesquisa Ação Experimento

Leia mais

Web Data mining com R: aprendizagem de máquina

Web Data mining com R: aprendizagem de máquina Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de

Leia mais

- Computação Evolutiva -

- Computação Evolutiva - - Computação Evolutiva - Prof. Dr. Cícero Garrozi DEINFO - UFRPE PPGIA@UFRPE cicerog@gmail.com Site da disciplina: http://cicerog.blogspot.com Sumário Situando a Computação Evolucionária Metáfora principal

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa - PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa - PUCPR Muitos dados são coletados e armazenados Web data, e-commerce Compras em departamentos/ supermercados Bancos / Transações com cartão de crédito Computadores se tornaram baratos e mais potentes Pressão

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha WCGE II Workshop de Computação Aplicada em Governo Eletrônico Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Taxonomia da aprendizagem

Taxonomia da aprendizagem Taxonomia da aprendizagem Taxonomia de Bloom Desde 1948, um grupo de educadores assumiu a tarefa de classificar metas e objetivos educacionais. Eles propuseram-se a desenvolver um sistema de classificação

Leia mais

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA Daniel Mandelli Martins Faculdade de Engenharia de Computação CEATEC danielmartins@puc-campinas.edu.br Juan Manuel Adán Coello

Leia mais

Algoritmos Genéticos (GA s)

Algoritmos Genéticos (GA s) Algoritmos Genéticos (GA s) 1 Algoritmos Genéticos (GA s) Dado um processo ou método de codificar soluções de um problema na forma de cromossomas e dada uma função de desempenho que nos dá um valor de

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

Resultados da Lei de Informática - Uma avaliação. Parte 1 - Impactos no Segmento Industrial Sistemas e Periféricos

Resultados da Lei de Informática - Uma avaliação. Parte 1 - Impactos no Segmento Industrial Sistemas e Periféricos Resultados da Lei de Informática - Uma avaliação Parte 1 - Impactos no Segmento Industrial Sistemas e Periféricos Dell Computadores do Brasil Ltda Ministério da Ciência e Tecnologia Resultados da Lei de

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de Técnicas e Aplicações na Área Bancária São Paulo 2011 FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de

Leia mais

Gestão de TI. Aula 9 - Prof. Bruno Moreno 27/06/2011

Gestão de TI. Aula 9 - Prof. Bruno Moreno 27/06/2011 Gestão de TI Aula 9 - Prof. Bruno Moreno 27/06/2011 Aula passada... CRM BI - Introdução Sistemas Interorganizacionais 17:08 2 Aula de hoje... Gestão do Conhecimento 17:08 3 85% dos ativos de conhecimento

Leia mais

Identificando necessidades e estabelecendo requisitos

Identificando necessidades e estabelecendo requisitos Identificando necessidades e estabelecendo requisitos Resumo A importância de requisitos Diferentes tipos de requisitos Coleta de dados para requisitos Descrição de tarefas: Cenários Casos de uso Casos

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro Tiago Mendes Dantas t.mendesdantas@gmail.com Departamento de Engenharia Elétrica,

Leia mais

Projeto e Análise de Algoritmos Projeto de Algoritmos Heurísticas e Algoritmos Aproximados

Projeto e Análise de Algoritmos Projeto de Algoritmos Heurísticas e Algoritmos Aproximados Projeto e Análise de Algoritmos Projeto de Algoritmos Heurísticas e Algoritmos Aproximados Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Universidade Federal de Alfenas Departamento de Ciências

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Ferramenta de Pré e Pós-processamento para Data Mining

Ferramenta de Pré e Pós-processamento para Data Mining Ferramenta de Pré e Pós-processamento para Data Mining Deborah Ribeiro Carvalho (UTP / IPARDES) deborah@utp.br deborah@ipardes.gov.br Marcos Bueno (UTP / IPARDES) bueno@onda.com.br marcos.bueno@acad.utp.br

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

Computação BioInspirada

Computação BioInspirada Computação BioInspirada Os Engenheiros da Natureza Fabrício Olivetti de França The reasonable man adapts himself to the world; the unreasonable one persists in trying to adapt the world to himself. Therefore

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

MINERAÇÃO DE DADOS PARA MODELAGEM DE DEPENDÊNCIA USANDO ALGORITMOS GENÉTICOS

MINERAÇÃO DE DADOS PARA MODELAGEM DE DEPENDÊNCIA USANDO ALGORITMOS GENÉTICOS UNIVERSIDADE FEDERAL DE SANTA CATARINA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Aruanda Simões Gonçalves MINERAÇÃO DE DADOS PARA MODELAGEM DE DEPENDÊNCIA USANDO ALGORITMOS GENÉTICOS Dissertação

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI)

ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI) ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI) APARECIDA DE GOIÂNIA 2014 LISTA DE TABELAS Tabela 1 Áreas de processo por

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

ALGUNS CONCEITOS. Rede de Computadores

ALGUNS CONCEITOS. Rede de Computadores ALGUNS CONCEITOS Rede de Computadores Prof. Airton Ribeiro de Sousa E-mail: airton.ribeiros@gmail.com 1 OBJETIVO 1. Compartilhar recursos computacionais disponíveis sem considerar a localização física

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais