DESCOBERTA DO CONHECIMENTO ESTRATÉGICO COM O USO DE FERRAMENTAS DE DATA MINING

Tamanho: px
Começar a partir da página:

Download "DESCOBERTA DO CONHECIMENTO ESTRATÉGICO COM O USO DE FERRAMENTAS DE DATA MINING"

Transcrição

1 FACULDADE CATÓLICA DE ADMINISTRAÇÃO E ECONOMIA CENTRO DE DESENVOLVIMENTO EMPRESARIAL ESPECIALIZAÇÃO EM GESTÃO DA TECNOLOGIA DA INFORMAÇÃO PROJETO DE CURSO DESCOBERTA DO CONHECIMENTO ESTRATÉGICO COM O USO DE FERRAMENTAS DE DATA MINING CURITIBA MARÇO 2002

2 AFRANIO LAMY SPOLADOR JUNIOR LUCILENE PAULA CABRAL DESCOBERTA DO CONHECIMENTO ESTRATÉGICO COM O USO DE FERRAMENTAS DE DATA MINING Trabalho de pós-graduação apresentado à disciplina Projeto de Curso, do Curso de Especialização em Gestão da Tecnologia da Informação da FAE Business School. Prof. Edson Emílio Scalabrin CURITIBA MARÇO 2002

3 SUMÁRIO LISTA DE TABELAS... IV LISTAS DE FIGURAS... IV LISTA DE SIGLAS... V 1 INTRODUÇÃO CONSIDERAÇÕES INICIAIS DESCRIÇÃO DO TEMA/PROBLEMA IMPORTÂNCIA E JUSTIFICATIVA DO PROBLEMA De Interesse da Organização De Interesse dos Autores deste Projeto OBJETIVOS Objetivo Geral Objetivos Específicos FUNDAMENTOS TEÓRICOS CONSIDERAÇÕES INICIAIS O PROCESSO DATA MINING A TECNOLOGIA DA ÁRVORE Retenção de Dados Destilação em Padrões Semelhança Lógica Regras Algoritmos genéticos Regra indutiva ou aprendizagem de máquina Árvores de decisão Construção do algoritmo de árvore de decisão Poda em árvores de decisão Tabulação Cruzada Agentes Redes de confiança Aproximações Equacionais Redes neurais...26 II

4 3 DESENVOLVIMENTO DO TRABALHO COLETA, TRATAMENTO E ANÁLISE DOS DADOS COLETADOS Coleta Tratamento dos Dados (Data Mining) Análise dos Dados PROPOSTA DE UM MODELO PARA RESOLUÇÃO DOS PROBLEMAS LEVANTADOS APLICAÇÃO DO MODELO PROPOSTO AVALIAÇÃO DOS RESULTADOS OBTIDOS CONCLUSÃO, CONSIDERAÇÕES e RECOMENDAÇÕES BIBLIOGRAFIA...42 III

5 LISTA DE TABELAS TABELA EXEMPLO DE REGRA CONDICIONAL...11 TABELA EXEMPLO PARA CONSTRUÇÃO DE UMA ÁRVORE DE DECISÃO...18 TABELA EXEMPLO DE TABULAÇÃO CRUZADA PRODUÇÃO DE PRODUTOS POR REGIÃO...22 TABELA ATRIBUTOS DEFINIDOS APÓS A SELEÇÃO E LIMPEZA DE DADOS...30 TABELA ATRIBUTOS SELECIONADOS PARA A FASE DE TRATAMENTO DOS DADOS...32 TABELA EXEMPLO DO CONJUNTO DE DADOS ORIGINAL...33 TABELA EXEMPLO DO SUBCONJUNTO DE DADOS DE TREINAMENTO...33 TABELA EXEMPLO DO SUBCONJUNTO DE DADOS DE TESTE...33 TABELA ARQUIVOS UTILIZADOS PELO C TABELA CASOS REAIS PARA APLICAÇÃO DO MODELO PROPOSTO...38 LISTAS DE FIGURAS FIGURA REPRESENTAÇÃO GRÁFICA DA TECNOLOGIA DA ÁRVORE...7 FIGURA REPRESENTAÇÃO GRÁFICA DO MÉTODO NEAREST NEIGHBOR 8 FIGURA MUTAÇÃO DE PADRÕES DOS AGS...12 FIGURA EXEMPLO DE GENERALIZAÇÃO...15 FIGURA EXEMPLO DE GENERALIZAÇÃO COM EXEMPLOS INCORRETOS...15 FIGURA EXEMPLO DE ESPECIALIZAÇÃO...15 FIGURA SUBDIVISÃO DO CONJUNTO DA AD...19 FIGURA EXEMPLO DE ÁRVORE DE DECISÃO...19 FIGURA DEMOSTRAÇÃO GRÁFICA DE AGENTES...23 FIGURA REPRESENTAÇÃO GRÁFICA DE UMA REDE DE CONFIANÇA...24 FIGURA REPRESENTAÇÃO GRÁFICA DE UMA APROXIMAÇÃO EQUACIONAL...25 IV

6 FIGURA ESTRUTURA DE UMA REDE NEURAL...26 FIGURA DESCRIÇÃO DO PROCESSO KDD...28 FIGURA ÁRVORE DE DECISÃO QUE CARACTERISA AS RESCISÕES DO CIEE/PR...35 FIGURA MODELO DO CLASSIFICADOR PROPOSTO...36 FIGURA ENTRADA DE DADOS PARA O CENÁRIO A...38 FIGURA RESULTADO DA CONSULTA PARA O CENÁRIO A...39 FIGURA ENTRADA DE DADOS PARA O CENÁRIO B...39 FIGURA RESULTADO DA CONSULTA PARA O CENÁRIO B...39 LISTA DE SIGLAS AD - ÁRVORE DE DECISÃO AM - APRENDIZAGEM DE MÁQUINA CIEE/PR - CENTRO DE INTEGRAÇÃO EMPRESA - ESCOLA, NO PARANÁ DM - DATA MINING OLAP - ON-LINE ANALYTICAL PROCESSING SINAPE - SISTEMA INTELIGENTE DE APOIO AO ESTÁGIO UCE - UNIDADE CONCEDENTE DE ESTÁGIO V

7 1 1 INTRODUÇÃO 1.1 CONSIDERAÇÕES INICIAIS Na última década, as organizações tiveram um explosivo crescimento em suas capacidades de gerar e coletar dados. Avanços científicos que auxiliam a coleta de dados como a introdução de código de barras, a alta disponibilidade de tecnologia e o aumento na capacidade de armazenamento influenciaram para que grandes bases de dados fossem criadas (FAYYAD, 1996, p. 2). Esse aumento da quantidade de dados nas organizações faz com que um grande número de informações, muitas vezes valiosas, tornem-se ocultas ou não perceptíveis por intermédio de métodos convencionais de consultas, provocando a perda do conhecimento organizacional. Este capítulo visa contextualizar o problema, a justificativa e os objetivos deste trabalho que busca a Descoberta do Conhecimento Estratégico com o uso de ferramentas de Data Mining. 1.2 DESCRIÇÃO DO TEMA/PROBLEMA Este trabalho destina-se ao Centro de Integração Empresa-Escola, no Paraná - CIEE/PR, empresa privada de utilidade pública sem fins lucrativos. Sua atividade principal visa a colocação de estudantes de ensino médio e superior no mercado de trabalho por intermédio do estágio. Segundo Basílio 1 : (...) vencer a grande quantidade de rescisões ocorridas antes do término do estágio é um dos maiores desafios que a instituição enfrenta. Precisamos de uma ferramenta que nos ajude e encontrar o motivo da rotatividade (...). Com o intuito de auxiliar o CIEE/PR em suas dificuldades é que o problema a ser tratado no contexto deste trabalho é: Como caracterizar as causas das rescisões antecipadas de estagiários em empresas conveniadas ao CIEE/PR por intermédio de ferramentas de Data Mining? 1 Prof. Basílio é o coordenador do processo de estágio do CIEE/PR, em Curitiba.

8 2 1.3 IMPORTÂNCIA E JUSTIFICATIVA DO PROBLEMA De Interesse da Organização O CIEE/PR, apesar de ser uma instituição sem fins lucrativos, necessita de recursos para poder sustentar sua estrutura física e de pessoal. Sua receita provém de contribuições feitas pelas Unidades Concedentes de Estágio - UCEs 2 e correspondem a um percentual 3 do valor da bolsa auxílio que os estudantes recebem. Para que a instituição tenha condições de continuar suas atividades é extremamente necessário atingir o equilíbrio financeiro. Para isso, é preciso manter sempre o maior número possível de estudantes em estágio. Como descrito na seção 1.1, o grande número de rescisões antecipadas é um dos maiores problemas atuais do CIEE/PR. Esse fato gera esforço extra de trabalho e, conseqüentemente, despesas adicionais com pessoal e outros recursos, uma vez que há a necessidade de recolocar um estagiário o mais rápido possível para cada contrato rescindido, correndo o risco de haver o desinteresse da UCE pelos serviços prestados pela instituição. De acordo com Basílio, muitos estudos já foram feitos na tentativa de resolver o problema, entretanto, até o presente momento, a única solução é trabalhar na tentativa de repor a vaga, o que apenas ameniza o problema. A informação que o departamento de informática da instituição possui é de que o número mensal de rescisões antecipadas corresponde a 10% do total de estudantes em estágio 4. Fernando Santos Dubiella, funcionário do CIEE/PR, salienta que empresas e estudantes ficam descontes com a rescisão automática. Segundo ele: Acredito que se conseguíssemos adequar melhor o perfil da empresa com a o estudante o número de rescisões seria bem menor e teríamos tanto a empresa quanto os estudantes satisfeitos. 2 Empresas conveniadas ao CIEE/PR que ofertam vagas para estagiários. 3 O valor da Contribuição é de 10% sobre o valor da Bolsa Auxílio ou um mínimo de R$ 25,00. 4 No mês de janeiro de 2002 havia, aproximadamente, estudantes realizando estágio pelo CIEE/PR no Estado do Paraná, sendo que 52% deste total só em Curitiba. Fonte: Departamento de Informática do CIEE/PR.

9 3 Portanto, saber como caracterizar as causas das rescisões antecipadas de estagiários em empresas conveniadas ao CIEE/PR é fundamental para a redução de custos e para a satisfação de UCEs e estudantes De Interesse dos Autores deste Projeto A descoberta do conhecimento não é uma área nova na computação. Surgiu da Inteligência Artificial e preocupa-se não somente em descobrir conhecimento, mas sim, em descobrir formas de armazená-lo (MANNILA, 1994, p.85) A importância do conhecimento nas organizações tem se manifestado nos mais diversos meios de comunicação, tais como livros, revistas, palestras e seminários que tratam de gestão. Os temas são os mais variados possíveis: inteligência competitiva, engenharia do conhecimento, capital intelectual, gestão do conhecimento. Muitos desses títulos convergem para a importância de criar, utilizar, medir e reter o conhecimento humano. Em um artigo na revista Decidir da edição de janeiro de 1999, Pedro Serafim Filho escreve: Administrar o conhecimento na organização é um processo complexo que não admite receitas prontas (...). Alguns pontos delineiam a prática da Gestão do Conhecimento: a) Criação do conhecimento: transformar conhecimento tácito (referente à experiência, ao poder de inovação, habilidade) em conhecimento explícito (refere-se aos procedimentos, banco de dados); b) Utilização do conhecimento: cultura de pesquisa voltada para o aproveitamento do conhecimento; c) Retenção do conhecimento: assimilar ou preservar o conhecimento; d) Medição do conhecimento: a quantidade de conhecimento de uma organização é a diferença entre o seu valor de mercado e o seu valor patrimonial. Ao longo dos tempos, os pesquisadores da área de Sistemas de Informação, principalmente de banco de dados, passaram a pesquisar novas aplicações para as informações armazenadas nesses bancos de dados. Pensavam que, além das informações tradicionais retiradas das bases, poderiam descobrir informações implícitas, ou seja, não disponíveis de forma clara, que também fossem úteis para as organizações. A partir daí, começaram a surgir os primeiros sistemas de análise e de mineração de dados relacionais, dando início a pesquisas em áreas como Data Mining.

10 4 Este projeto pretende trabalhar especificamente com a utilização da descoberta do conhecimento estratégico por intermédio de ferramentas de Data Mining. Tal escolha justifica-se pelo fato de que a descoberta, preservação e boa utilização do conhecimento podem fazer a diferença da organização no mercado competitivo. O CIEE/PR foi escolhido por ser um excelente estudo de caso, pois possui uma grande base de dados, um problema complexo a ser resolvido e, as pessoas envolvidas neste processo de pesquisa conhecem os atributos da base dados (FAYYAD, 1996, p.26) o que se encaixa perfeitamente para o uso das técnicas do processo de KDD - Knowledge Discovery and Data Mining OBJETIVOS Objetivo Geral Caracterizar as causas das rescisões antecipadas de estagiários em empresas conveniadas ao CIEE/PR por intermédio de ferramentas de Data Mining Objetivos Específicos Os objetivos específicos almejados são: a) estudar métodos de aquisição do conhecimento para o desenvolvimento do estudo de caso; b) selecionar os atributos disponíveis que são relevantes para a aquisição do conhecimento estratégico desejado; c) implantar técnicas de aquisição do conhecimento para identificar padrões de comportamento dos dados; d) disponibilizar o conhecimento descoberto aos tomadores de decisão do CIEE/PR. 5 Descoberta do Conhecimento e Data Mining.

11 5 2 FUNDAMENTOS TEÓRICOS 2.1 CONSIDERAÇÕES INICIAIS Este capítulo será consagrado a descoberta do conhecimento estratégico utilizando técnicas de Data Mining. A descoberta do conhecimento pode ser definida como: Um processo não trivial de identificação válida, recente e potencialmente útil de padrões compreensíveis embutidos nos dados. (...) O Processo KDD é composto pelas fases de seleção de dados, pré-processamento, transformação, Data Mining [sem grifo no original], interpretação e avaliação dos resultados (FAYYAD, 1996). Logo, pode-se observar que Data Mining é um passo dentro do processo de KDD, o qual envolve a aplicação de uma ferramenta de busca para encontrar padrões nos dados analisados, sendo que alguns pesquisadores, considerando que o Data Mining é a parte central do processo de KDD, têm utilizado, de forma distinta, os termos KDD e Data Mining. (FAYYAD, 1996) 2.2 O PROCESSO DATA MINING A fase de Data Mining é um processo interativo de consultas, análise de tarefas, coleção de bases de dados, padrões de busca e apresentação das decisões. DM pode ser entendido como: Um dos processos centrais na extração de conhecimento de base de dados e visa extrair padrões interessantes embutidos em grandes bases de dados. Esses padrões podem ser descobertos por intermédio de regras que descrevem propriedades dos dados, padrões que ocorram com freqüência, classificação de objetos, etc. (MANNILA, 1997). As tecnologias utilizadas atualmente fazem uma coleta simples de dados, todavia as análises estão ficando cada vez mais difíceis. Pelo fato de trabalhar com uma grande quantidade de dados, o processo de Data Mining necessita de algoritmos eficazes, rápidos e eficientes. O grande diferencial do Data Mining está no fato de que as descobertas de padrões se dão por uma lógica de algoritmos que baseia-se em uma rede neural, ou seja, são ferramentas de descobertas matemáticas realizadas sobre os registros corporativos já processados contra descobertas empíricas (SIMOUDIS, 1995). Há três classes de Data Mining: descobrimento, modelagem de prognóstico e análise prévia.

12 6 Descobrimento é o processo de exame em um banco de dados para encontrar padrões escondidos sem uma idéia ou hipótese pré-determinada sobre o que são esses padrões. Em outras palavras, o programa toma a iniciativa de encontrar aquilo que interessa aos padrões, sem que o usuário verifique se isto realmente o interessa. Em uma grande base de dados, há muitos padrões que o usuário pode praticamente nunca imaginar as perguntas certas para as respostas existentes. O grande mérito desta solução está na riqueza dos padrões que podem ser expressos e descobertos sem contar a qualidade da informação, a força e a utilidade técnica da descoberta (MANNILA, 1997). Na modelagem de prognóstico, os padrões descobertos no banco de dados são utilizados para prognosticar o futuro. Isso permite ao usuário submeter valores desconhecidos de campos nos registros, e o sistema irá supor valores desconhecido baseado em padrões previamente descobertos no banco de dados. Enquanto o processo de descobrimento encontra padrões, o processo de prognóstico aplica estes padrões para supor valores nos novos itens de dados. E, por fim, a análise prévia é o processo de aplicação dos padrões extraídos para encontrar anomalias ou elementos de dados raros. Para descobrir os dados raros, primeiramente encontram-se os dados que seguem uma norma ou os habituais, então se detectam aqueles que se desviam dos habituais dentro de um centro limiar. 2.3 A TECNOLOGIA DA ÁRVORE O processo de Data Mining possui duas abordagens primárias: a Retenção e a Destilação de Dados. Cada uma dessas técnicas possui métodos específicos e que podem ser melhor compreendidos utilizando-se da Tecnologia da Árvore (ver Figura 2.1). Essa tecnologia demonstra diversos padrões utilizados pelo processo de Data Mining. Cada folha da árvore mostrada na Figura 2.1 representa um método distinto de implementar um sistema baseado em uma técnica.

13 7 FIGURA REPRESENTAÇÃO GRÁFICA DA TECNOLOGIA DA ÁRVORE FONTE: (MANNILA, 1997) Nos próximos itens desta seção, cada método será explicado separadamente, sendo que as regras de indução e árvores de decisão serão estudadas com maior profundidade. Recomenda-se a utilização da Figura 2.1 para melhor entendimento da segmentação das seções que detalham a Tecnologia da Árvore Retenção de Dados Enquanto na Destilação de Padrões (ver na seção 2.3.2) analisam-se dados, extraem-se padrões e deixam-se os dados para trás, na Retenção, os dados são mantidos para posterior combinação. Quando novos dados são apresentados, eles são combinados com o conjunto de dados anterior.

14 8 Um método bem conhecido de uma aproximação baseada na Retenção de Dados é o método nearest neighbor 6. Nesse método, o conjunto de dados é mantido, geralmente em memória, para a comparação com novos dados. Quando um novo registro está presente, por prognóstico, à distância entre ele e os registros semelhantes no conjunto de dados é encontrado, e os mais parecidos (vizinhos próximos) são identificados. O termo K-nearest neighbor é usado para indicar que o topo K de vizinhos foi selecionado. Na seqüência, uma comparação aproximada é feita para selecionar qual novo produto, por exemplo, é mais apropriado, baseado nos produtos usados pelo topo K de vizinhos (ver Figura 2.2). FIGURA 2.2 REPRESENTAÇÃO GRÁFICA DO MÉTODO NEAREST NEIGHBOR FONTE: (MANNILA, 1997) Um problema nesta tentativa de assemelhação acontece em bancos de dados com grande número de valores não-numéricos (MANNILA, 1997). Visto que à distância entre esses valores não-numéricos não são computados facilmente, algumas medidas de aproximação precisam ser utilizadas, podendo, muitas vezes, não obter o resultado previsto (FAYYAD, 1996). E, se no banco de dados são muitos os valores não numéricos, muitas circunstâncias deverão ser administradas, constituindo uma das maiores dificuldades da retenção de dados. 6 tradução: vizinho próximo

15 Destilação em Padrões As tecnologias utilizadas pela Destilação extraem padrões a partir de uma série de dados e os usam para vários fins. As duas primeiras dificuldades encontradas nos métodos de Destilação estão em descobrir quais os tipos de padrões que podem ser extraídos e como serão representados. Os padrões obtidos necessitam ser expressos dentro de um formalismo e uma linguagem. Há três formas distintas de abordagem: a) sistema lógico; b) sistema equacional e; c) tabulação cruzada. Cada uma dessas abordagens tem raízes históricas que conduzem a origens matemáticas distintas. Pode-se considerar, por exemplo, a distinção entre um sistema equacional e lógico. Num sistema equacional, operadores como soma e multiplicação podem ser utilizados simultaneamente para referir variáveis: Exemplo: (a *X) + b No sistema lógico os operadores chaves são condicionais. Exemplo: SE 6 < X <7 ENTÃO 1 < Y < 2 No sistema lógico pode-se distribuir igualmente dados numéricos e nãonuméricos, enquanto que o sistema equacional exige que todos os dados sejam numéricos. Já o sistema de classificação cruzada (ou tabulação cruzada) trabalha somente com dados não-numéricos. Importa ressaltar que o sistema equacional estima distâncias a partir de ocorrências, enquanto que o sistema de classificação cruzada se focaliza em coocorrências. No estudo do Data Mining é necessário fazer a distinção entre a análise direcionada e a forma livre de percorrer o banco de dados. Na análise direcionada, também chamada de aprendizado supervisionado é o equivalente a ter um professor que ensina o sistema.

16 10 Um exemplo de análise direcionada é a indicação de uma premissa como correta ou não. Neste caso, o dado terá uma coluna específica que será utilizada na tentativa de descobrir algo coerente ou, ao menos, fazer predições. No aprendizado sem supervisão, o sistema não possui nada para ensiná-lo, sendo que o mesmo deverá encontrar os clusters 7 que lhe interessam dentro do conjunto de dados. A procura não supervisionada pode ser utilizada na segmentação de dados e agrupamento. Um exemplo é encontrar classes de padrões em séries simultâneas Semelhança Lógica A Lógica forma a base da maioria das linguagens escritas e é essencialmente trabalhada pelo lado esquerdo do cérebro (FAYYAD, 1996). Padrões expressos em linguagens lógicas são distinguidos por duas principais características, sendo que os primeiros são legíveis e compreensíveis, enquanto que os outros são excelentes na representação sinuosa de agrupamentos de dados. O operador central numa linguagem lógica é normalmente uma variação do comando SE / ENTÃO. Um exemplo típico é: SE está chovendo, ENTÃO está nublado. Entretanto, deve-se notar que enquanto a forma lógica mais comum é a lógica condicional, muitas vezes utilizam-se outras formas lógicas, como uma associação lógica com a regra QUANDO / TAMBÉM. Exemplo: QUANDO lava-se o cabelo, TAMBÉM utiliza-se xampu. Ainda que essas lógicas sejam melhor conhecidas, outras formas de lógica também são utilizadas em análise dos dados objetos. Sistemas de lógica condicional podem ser separados em dois grupos distintos (MANILLA, 1997): Regras de Indução e Algorítmos Genéticos e Árvores de Decisão. 7 tradução: grupos

17 Regras Os relacionamentos lógicos são normalmente representados como regras. Simples regras podem expressar relações condicionais ou de associação. Uma regra condicional é um comando na forma: SE Condição ENTÃO Hipótese Exemplo: TABELA 2.1 EXEMPLO DE REGRA CONDICIONAL Nome Profissão Idade João Médico 31 Maria Atleta 25 Ricardo Atleta 29 Francisco Dentista 32 José Médico 29 Tiago Atleta 19 No exemplo, conclui-se que: SE Profissão = Atleta ENTÃO Idade < 30 Neste caso comparam-se os valores contidos nos campos de uma determinada tabela, isto é, tem-se uma representação de atributos e valores, sendo que Profissão é o atributo e Atleta é o valor. Regras também podem atuar bem em dados multi-dimensionais ou OLAP 8 porque podem trabalhar com faixas de dados numéricos e seus formatos lógicos, permitindo que seus padrões possam ser mesclados ao longo de múltiplas dimensões. A capacidade do ser humano pode ser limitada para definir regras dentro sistemas complexos, sejam eles a identificação de uma impressão digital ou a procura de padrões dentro de um banco de dados (FAYYAD, 1996). Em função dessa limitação é que o auxílio da tecnologia torna-se fundamental. A seguir, duas abordagens para a geração de regras serão estudadas: regra indutiva, também conhecida como Aprendizagem de Máquina AD e algoritmos genéticos.

18 Algoritmos genéticos Algoritmos genéticos - AG - também geram regras de conjuntos de dados, mas não seguem a indução (item ) como protocolo de regras de exploração orientada. Ao contrário, esses algoritmos utilizam-se da mutação para realizar as trocas nos padrões até que uma forma apropriada de modelo apareça via aprendizagem seletiva, como mostrado na Figura 2.3. FIGURA 2.3 MUTAÇÃO DE PADRÕES DOS AGs FONTE: (MANNILA, 1997) A operação genética cruzada é muito semelhante a pratica da ação de biólogos quando cruzam plantas e animais. Nesse exemplo, a troca de material genético por cromossomos é baseado no mesmo método (FAYYAD, 1996). No caso das regras, o material trocado é uma parte do modelo que a regra descreve. O que difere AG do Método Indutivo (a ser visto) é que em AG o foco principal é a combinação de modelos das regras que tinham sido descobertas, enquanto que na indução de regra o foco principal da atividade pelo o conjunto de dados (MANNILA, 1997) Regra indutiva ou aprendizagem de máquina Um sistema baseado no método Indutivo ou Aprendizagem de Máquina AM é formado por um conjunto de elementos básicos. Diante de todos esses elementos 8 OLAP On-line Analitcal Process: Processo Analítico de Suporte On-line

19 13 encontra-se a base de dados, a qual é formada por um conjunto de exemplos de treinamento, ou observações, E = {e 1,...e n }. Demais elementos são um ou mais algoritmos de AM, que, se aplicados sobre E, são capazes de gerar uma base de conhecimento BC formada por inúmeros conceitos (ENEMBRECK, 1999). Considerando um sistema que possui base de dados E = {e 1,...e n } de observações, onde cada e i, apresenta o seguinte formato: e i = < a 1,..., a m > O conjunto {a 1,...,a m-1 } é formado pelos atributos previsores e a m é o atributo meta ou objetivo. Sempre que houver a existência de um atributo meta a m, pode-se concluir que a estratégia mais adequada é a utilização do aprendizado supervisionado, ou seja, para cada observação presente em E, um supervisor defini a classe correspondente (atributo meta). Quando não se dispõe de um supervisor, ou professor, define-se a estratégia de aprendizado a ser empregada como aprendizado não supervisionado. Dando seqüência na descrição do formato dos exemplos que formam E, podese dizer que o = m 1 e A = {a 1,..., a o } é o conjunto de atributos previsores. Cada atributo a j está associado a um domínio d j que representa o conjunto de valores possíveis para o atributo a j. Portanto, pode-se dizer que há um conjunto D = {d 1,..., d m } que define todos os domínios de E. O conjunto d m representa as hipóteses mutuamente exclusivas que podem estar associadas a um exemplo de E. E, com base nas definições anteriores, pode-se definir o espaço de tuplas T de E como: m T E = i = di 1 onde E T E. Portanto, o algoritmo de AM pode, ao percorrer o espaço de tuplas T, utilizar determinadas operações sobre os conceitos gerados e escolher, segundo algum critério predefinido, quais são os melhores conceitos ou descrições. Entretanto, observa-se que nem sempre o espaço T precisa ser percorrido inteiramente para

20 14 que as descrições sejam descobertas, pois dificilmente E = T, assumindo a não existência de duplicidade em E. Exemplo: E i a 1 a 2 a 3 a 4 a D d 1 d 2 d 3 d 4 d 5 {1,2,3,4,5,6} {7,8,9} {3,5} {1,2,3} {1,2,4} E = 6 T = 6 x 3 x 2 x 3 x 3 = 324 A = { a 1, a 2, a 3, a 4, a 5 } E = { e 1,..., e 6 } T = { d 1 x d 2 x d 3 x d 4 x d 5 } Em geral, um algoritmo de aprendizado inicia com uma descrição inicial. A partir daí, novas descrições são geradas aplicando-se determinadas operações. Duas operações básicas podem ser realizadas (ENEMBRECK, 1999): generalização e/ou especialização. Uma operação de generalização sobre uma descrição D produz uma descrição D que cobre mais exemplos que D. As Figuras 2.4 e 2.5 demonstram o exemplo de duas operações de generalização em relação a um conjunto de dados. Observa-se que nem sempre a generalização cobre mais exemplos corretamente.

21 15 FIGURA 2.4 EXEMPLO DE GENERALIZAÇÃO D D Generalização FONTE: (ENEMBRECK, 1999) FIGURA EXEMPLO DE GENERALIZAÇÃO COM EXEMPLOS INCORRETOS D Generalização D FONTE: (ENEMBRECK, 1999) Pode-se observar que a Figura 2.4 e 2.5 há uma diferença nas operações de generalização. Enquanto que na Figura 2.4, a descrição gerada é melhor que a original, na Figura 2.5 é possível observar a presença de exemplos negativos, ou seja, exemplos que não pertencem à hipótese associada à descrição, classificados como positivos. A especialização, como mostrado na Figura 2.6, ao contrário da generalização, busca produzir uma descrição D a partir de D que cobre menos elementos que a original. FIGURA EXEMPLO DE ESPECIALIZAÇÃO D Especialização D FONTE: (ENEMBRECK, 1999) Segundo Enembreck (ENEMBRECK, 1999), a operação de generalização visa aumentar o intervalo de valores para possíveis testes, enquanto que especialização busca diminuir o intervalo de valores possíveis para esses testes.

22 Como já visto no item , é possível deduzir que a representação ideal para uma descrição é a representação: SE Condição ENTÃO Hipótese Para que a Condição seja formada são realizados testes sobre os valores dos atributos. Para isso, informações adicionais sobre os respectivos domínios são necessárias. Enembreck salienta que os domínios dos atributos podem ser caracterizados como pertencentes aos seguintes tipos: Nominal ou categórico: os valores possíveis são formados por símbolos ou rótulos independentes, ou seja, estão ordenados; Linear: os elementos do domínio estão totalmente ordenados. Os valores pode ser numéricos ({1,...,10}) ou simbólicos ({pequeno, médio, grande}). Atributos lineares podem, ainda, ser discretos (número limitado de valores) ou contínuos (número infinito de valores possíveis); Parcialmente Ordenado: existe uma ordem parcial entre os elementos, o que torna possível a criação de uma hierarquia onde há um valor que representa todo o domínio (pai de todos) e valores filhos que representam subhierarquias (ENEMBRECK, 1999). 16 Utiliza-se como critério de avaliação das operações básicas de generalização formas básicas de avaliação estatísticas citadas por ENEMBRECK (ENEMBRECK, 1999) e FAYADD (FAYYAD, 1996). Neste projeto será utilizada a notação citada por ENEMBRECK: R:C: é uma regra que associa exemplos à Classe C; E: é à base de dados; PPositivos: é o subconjunto de E de exemplos cobertos por R e que possuem a classe C; Positivos: é o subconjunto de E de exemplos cobertos por R. Em geral, as medidas mais comuns para a avaliação de uma regra R:C são as seguintes: a) confidência: mede a precisão de uma regra. Uma regra R:C possui confidência de 100% se todos os exemplos cobertos são Ppositivos. Podese calcular a confidência de R da seguinte forma: PPositivos Conf R : C = x100 Positivos b) suporte: mede a importância de uma regra em relação à base de dados. Geralmente, uma regra representa um subconjunto da base de dados. Uma

23 regra pode ser mais significante em relação a outras se ela representa grande parte da base de dados e pode ser medida da seguinte forma: Sup R : C = PPositivos E c) desvio: é o custo total de erros de classificação. Assumindo que o custo de classificar de forma equivocada o exemplo e como pertencente à classe C é 1, e o custo de classificar erradamente o exemplo e como pertencente à classe C 1 é β, o cálculo do desvio é dado pela seguinte equação: 17 desv B: C Positivo e xppositivo e xpositivo e xppositivo e ( E R: C ( ) (1 + β ) R: C ( ) R: C ( ) + β R: = E C ( e)) onde Positivo R:C (E) é 1 se e Positivos e 0 caso o contrário Árvores de decisão Árvores de Decisão AD expressam uma forma simples de lógica condicional. Um sistema de AD, simplesmente, divide uma tabela em tabelas menores pela seleção de subconjuntos baseados em valores de um atributo dado. Baseado no modo como a árvore é dividida, obtém-se um algoritmo diferente de AD, tais como C4.5 (QUINLAN, 1993), por exemplo. Em casos que o número de observações e a quantidade de atributos é elevada, a construção da AD pode ser fundamental, uma vez que o processo manual para descoberta de padrões em conjuntos grandes pode ser muito difícil ou inviável. Nos próximos itens que compreendem esta seção o processo para aquisição do conhecimento baseado em AD será descrito como citado por Enemberk (ENEMBERK, 1999) Construção do algoritmo de árvore de decisão Para construir um algoritmo de AD considera-se um conjunto E = {e 1,...,e n } de exemplos de treinamento e um conjunto C = {c 1,...,c m } de classes mutuamente exclusivas que podem ser associadas a um exemplo e i E, tem-se o algoritmo básico de AD:

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem:

As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem: 1 As notas de aula que se seguem são uma compilação dos textos relacionados na bibliografia e não têm a intenção de substituir o livro-texto, nem qualquer outra bibliografia. Introdução O Cálculo Numérico

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

O PROJETO DE PESQUISA. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza

O PROJETO DE PESQUISA. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza O PROJETO DE PESQUISA Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza ROTEIRO Escolher um tema de pesquisa Por onde começar? Ler para aprender Estrutura do Projeto de Pesquisa A Definição

Leia mais

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO Santa Maria, 10 de Outubro de 2013. Revisão aula anterior Documento de Requisitos Estrutura Padrões Template Descoberta

Leia mais

Revisão de Estatística Básica:

Revisão de Estatística Básica: Revisão de Estatística Básica: Estatística: Um número é denominado uma estatística (singular). Ex.: As vendas de uma empresa no mês constituem uma estatística. Estatísticas: Uma coleção de números ou fatos

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA CURSO DE ESPECIALIZAÇÃO EM ANÁLISE DE AMBIENTE ELETROMAGNÉTICO CEAAE /2008 DISCIPLINA EE-09: Inteligência

Leia mais

Objetivos. Engenharia de Software. O Estudo de Viabilidade. Fase do Estudo de Viabilidade. Idéias chave. O que Estudar? O que concluir?

Objetivos. Engenharia de Software. O Estudo de Viabilidade. Fase do Estudo de Viabilidade. Idéias chave. O que Estudar? O que concluir? Engenharia de Software O Estudo de Viabilidade Objetivos O que é um estudo de viabilidade? O que estudar e concluir? Benefícios e custos Análise de Custo/Benefício Alternativas de comparação 1 2 Idéias

Leia mais

Faculdades Pitágoras de Uberlândia. Matemática Básica 1

Faculdades Pitágoras de Uberlândia. Matemática Básica 1 Faculdades Pitágoras de Uberlândia Sistemas de Informação Disciplina: Matemática Básica 1 Prof. Walteno Martins Parreira Júnior www.waltenomartins.com.br waltenomartins@yahoo.com 2010 Professor Walteno

Leia mais

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea 2 O objetivo geral desse curso de Cálculo será o de estudar dois conceitos básicos: a Derivada e a Integral. No decorrer do curso esses dois conceitos, embora motivados de formas distintas, serão por mais

Leia mais

UNG CIC Tópicos Especiais de TI. Aula 13

UNG CIC Tópicos Especiais de TI. Aula 13 Aula 13 1. Data Warehouse Armazém de Dados (Continuação) 1 Erros na implantação de um Data Warehouse Segundo o Data Warehousing Institute existem dez erros mais comuns na implantação de um Data Warehouse

Leia mais

Revisão Inteligência Artificial ENADE. Prof a Fabiana Lorenzi Outubro/2011

Revisão Inteligência Artificial ENADE. Prof a Fabiana Lorenzi Outubro/2011 Revisão Inteligência Artificial ENADE Prof a Fabiana Lorenzi Outubro/2011 Representação conhecimento É uma forma sistemática de estruturar e codificar o que se sabe sobre uma determinada aplicação (Rezende,

Leia mais

Processos Gerenciais

Processos Gerenciais UNIVERSIDADE PAULISTA CURSO SUPERIOR DE TECNOLOGIA Projeto Integrado Multidisciplinar III e IV Processos Gerenciais Manual de orientações - PIM Curso Superior de Tecnologia em Processos Gerenciais. 1.

Leia mais

15 Computador, projeto e manufatura

15 Computador, projeto e manufatura A U A UL LA Computador, projeto e manufatura Um problema Depois de pronto o desenho de uma peça ou objeto, de que maneira ele é utilizado na fabricação? Parte da resposta está na Aula 2, que aborda as

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

MLP (Multi Layer Perceptron)

MLP (Multi Layer Perceptron) MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -

Leia mais

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências Probabilidade Introdução Tabelas Estatísticas População, Amostra e Variáveis Gráficos e Distribuição de Freqüências Renata Souza Conceitos Antigos de Estatística stica a) Simples contagem aritmética Ex.:

Leia mais

Complemento IV Introdução aos Algoritmos Genéticos

Complemento IV Introdução aos Algoritmos Genéticos Complemento IV Introdução aos Algoritmos Genéticos Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações e

Leia mais

Módulo 07 Gestão de Conhecimento

Módulo 07 Gestão de Conhecimento Módulo 07 Gestão de Conhecimento Por ser uma disciplina considerada nova dentro do campo da administração, a gestão de conhecimento ainda hoje tem várias definições e percepções, como mostro a seguir:

Leia mais

Cálculo numérico. ln 1 = 0. Representação numérica. Exemplo. Exemplos. Professor Walter Cunha. ln 1. I s

Cálculo numérico. ln 1 = 0. Representação numérica. Exemplo. Exemplos. Professor Walter Cunha. ln 1. I s Representação numérica Cálculo numérico Professor Walter Cunha Um conjunto de ferramentas ou métodos usados para se obter a solução de problemas matemáticos de forma aproximada. Esses métodos se aplicam

Leia mais

computador-cálculo numérico perfeita. As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem:

computador-cálculo numérico perfeita. As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem: 1 UNIVERSIDADE FEDERAL DE VIÇOSA Departamento de Matemática - CCE Cálculo Numérico - MAT 271 Prof.: Valéria Mattos da Rosa As notas de aula que se seguem são uma compilação dos textos relacionados na bibliografia

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Matemática - UEL - 2010 - Compilada em 18 de Março de 2010. Prof. Ulysses Sodré Matemática Essencial: http://www.mat.uel.

Matemática - UEL - 2010 - Compilada em 18 de Março de 2010. Prof. Ulysses Sodré Matemática Essencial: http://www.mat.uel. Matemática Essencial Equações do Primeiro grau Matemática - UEL - 2010 - Compilada em 18 de Março de 2010. Prof. Ulysses Sodré Matemática Essencial: http://www.mat.uel.br/matessencial/ Resumo: Notas de

Leia mais

5 Análise dos resultados

5 Análise dos resultados 5 Análise dos resultados Neste capitulo será feita a análise dos resultados coletados pelos questionários que foram apresentados no Capítulo 4. Isso ocorrerá através de análises global e específica. A

Leia mais

Unidade III FINANÇAS EM PROJETO DE TI. Prof. Fernando Rodrigues

Unidade III FINANÇAS EM PROJETO DE TI. Prof. Fernando Rodrigues Unidade III FINANÇAS EM PROJETO DE TI Prof. Fernando Rodrigues Quando se trabalha com projetos, é necessária a utilização de técnicas e ferramentas que nos auxiliem a estudálos, entendê-los e controlá-los.

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

4 Arquitetura básica de um analisador de elementos de redes

4 Arquitetura básica de um analisador de elementos de redes 4 Arquitetura básica de um analisador de elementos de redes Neste capítulo é apresentado o desenvolvimento de um dispositivo analisador de redes e de elementos de redes, utilizando tecnologia FPGA. Conforme

Leia mais

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA Muitas organizações terceirizam o transporte das chamadas em seus call-centers, dependendo inteiramente

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Universidade Federal de Santa Catarina CAPÍTULO 6 GRÁFICOS NO EXCEL.

Universidade Federal de Santa Catarina CAPÍTULO 6 GRÁFICOS NO EXCEL. CAPÍTULO 6 GRÁFICOS NO EXCEL. Um gráfico no Excel é uma representação gráfica dos números de sua planilha - números transformados em imagens. O Excel examina um grupo de células que tenham sido selecionadas.

Leia mais

1 Revisão: Construção de fórmulas

1 Revisão: Construção de fórmulas 1 Revisão: Construção de fórmulas Vinicius A. de Souza va.vinicius@gmail.com São José dos Campos, 2011. 1 Sumário Tópicos em Microsoft Excel 2007 Introdução...3 Como efetuar uma operação...3 Construindo

Leia mais

ENGENHARIA DE SOFTWARE I

ENGENHARIA DE SOFTWARE I ENGENHARIA DE SOFTWARE I Prof. Cássio Huggentobler de Costa [cassio.costa@ulbra.br] Twitter: www.twitter.com/cassiocosta_ Agenda da Aula (002) Metodologias de Desenvolvimento de Softwares Métodos Ágeis

Leia mais

Fundamentos em Informática (Sistemas de Numeração e Representação de Dados)

Fundamentos em Informática (Sistemas de Numeração e Representação de Dados) 1 UNIVERSIDADE DO CONTESTADO / UnC CAMPUS CONCÓRDIA/SC CURSO DE SISTEMAS DE INFORMAÇÃO Fundamentos em Informática (Sistemas de Numeração e Representação de Dados) (Apostila da disciplina elaborada pelo

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Universidade Tecnológica Federal do Paraná Gerencia de Ensino e Pesquisa Coordenação de Informática Estágio supervisionado curricular.

Universidade Tecnológica Federal do Paraná Gerencia de Ensino e Pesquisa Coordenação de Informática Estágio supervisionado curricular. Universidade Tecnológica Federal do Paraná Gerencia de Ensino e Pesquisa Coordenação de Informática Estágio supervisionado curricular Relatório Final João Pedro Cavasin Estagiário André Luis Schwerz Orientador

Leia mais

Do neurônio biológico ao neurônio das redes neurais artificiais

Do neurônio biológico ao neurônio das redes neurais artificiais Do neurônio biológico ao neurônio das redes neurais artificiais O objetivo desta aula é procurar justificar o modelo de neurônio usado pelas redes neurais artificiais em termos das propriedades essenciais

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

UNIVERSIDADE PAULISTA

UNIVERSIDADE PAULISTA UNIVERSIDADE PAULISTA CURSO SUPERIOR DE TECNOLOGIA Projeto Integrado Multidisciplinar III e IV Marketing Manual de orientações - PIM Curso Superior de Tecnologia em Marketing. 1. Introdução Os Projetos

Leia mais

A pesquisa de campo foi realizada com questões para os núcleos administrativo, pessoal e acadêmico e procura explorar duas situações distintas:

A pesquisa de campo foi realizada com questões para os núcleos administrativo, pessoal e acadêmico e procura explorar duas situações distintas: 4 Pesquisa de campo Neste capitulo será apresentado o resultado dos questionários da pesquisa de campo que serviu para o estudo de caso. A coleta de dados será dividida em: Núcleo administrativo Núcleo

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Tutorial 5 Questionários

Tutorial 5 Questionários Tutorial 5 Questionários A atividade Questionário no Moodle pode ter várias aplicações, tais como: atividades de autoavaliação, lista de exercícios para verificação de aprendizagem, teste rápido ou ainda

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Anexo III Funcionamento detalhado do Sistema Montador de Autoria

Anexo III Funcionamento detalhado do Sistema Montador de Autoria 1 Sumário Anexo III Funcionamento detalhado do Sistema Montador de Autoria Anexo III Funcionamento detalhado do Sistema Montador de Autoria... 1 1 Sumário... 1 2 Lista de Figuras... 5 3 A Janela principal...

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1 CURSO ON-LINE PROFESSOR GUILHERME NEVES 1 Olá pessoal! Resolverei neste ponto a prova de Matemática e Estatística para Técnico Administrativo para o BNDES 2008 organizado pela CESGRANRIO. Sem mais delongas,

Leia mais

Balanceamento de Carga

Balanceamento de Carga 40 4. Balanceamento de Carga Pode-se entender por balanceamento de carga uma política a ser adotada para minimizar tanto a ociosidade de utilização de alguns equipamentos quanto a super utilização de outros,

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

UNIVERSIDADE PAULISTA

UNIVERSIDADE PAULISTA UNIVERSIDADE PAULISTA CURSO SUPERIOR DE TECNOLOGIA Projeto Integrado Multidisciplinar III e IV Recursos Humanos Manual de orientações - PIM Curso Superior de Tecnologia em Gestão de Recursos Humanos 1.

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

Pós-Graduação em Gerenciamento de Projetos práticas do PMI Pós-Graduação em Gerenciamento de Projetos práticas do PMI Planejamento do Gerenciamento das Comunicações (10) e das Partes Interessadas (13) PLANEJAMENTO 2 PLANEJAMENTO Sem 1 Sem 2 Sem 3 Sem 4 Sem 5 ABRIL

Leia mais

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante Cálculo Numérico Aula : Computação numérica. Tipos de Erros. Aritmética de ponto flutuante Computação Numérica - O que é Cálculo Numérico? Cálculo numérico é uma metodologia para resolver problemas matemáticos

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) AULA 07 MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) JAMES A. O BRIEN MÓDULO 01 Páginas 286 à 294 1 AULA 07 SISTEMAS DE APOIO ÀS DECISÕES 2 Sistemas de Apoio à Decisão (SAD)

Leia mais

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU Prof. Dr. Sergio Pilling (IPD/ Física e Astronomia) I Representação dos números, aritmética de ponto flutuante e erros em máquinas

Leia mais

Instalações Máquinas Equipamentos Pessoal de produção

Instalações Máquinas Equipamentos Pessoal de produção Fascículo 6 Arranjo físico e fluxo O arranjo físico (em inglês layout) de uma operação produtiva preocupa-se com o posicionamento dos recursos de transformação. Isto é, definir onde colocar: Instalações

Leia mais

MODELAGEM E SIMULAÇÃO

MODELAGEM E SIMULAÇÃO MODELAGEM E SIMULAÇÃO Professor: Dr. Edwin B. Mitacc Meza edwin@engenharia-puro.com.br www.engenharia-puro.com.br/edwin Como Funciona a Simulação Introdução Assim como qualquer programa de computador,

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Cruzeiro SP 2008 FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Projeto de trabalho de formatura como requisito

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Construção da Consulta. Para a construção da consulta, siga os passos abaixo:

Construção da Consulta. Para a construção da consulta, siga os passos abaixo: Com a finalidade de esclarecer e auxiliar o usuário sobre a utilização do produto PaepOnline, a Fundação Seade elaborou um manual explicativo sobre a forma de construção das tabelas e sua navegabilidade.

Leia mais

I. A empresa de pesquisa de executivos deve lhe fornecer uma avaliação precisa e cândida das suas capacidades para realizar sua pesquisa.

I. A empresa de pesquisa de executivos deve lhe fornecer uma avaliação precisa e cândida das suas capacidades para realizar sua pesquisa. DIREITO DOS CLIENTES O que esperar de sua empresa de Executive Search Uma pesquisa de executivos envolve um processo complexo que requer um investimento substancial do seu tempo e recursos. Quando você

Leia mais

Projeto de Arquitetura

Projeto de Arquitetura Projeto de Arquitetura Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 11 Slide 1 Objetivos Apresentar projeto de arquitetura e discutir sua importância Explicar as decisões de projeto

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES 3.1 - IDENTIFICADORES Os objetos que usamos no nosso algoritmo são uma representação simbólica de um valor de dado. Assim, quando executamos a seguinte instrução:

Leia mais

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Introdução Objetivos da Gestão dos Custos Processos da Gerência de Custos Planejamento dos recursos Estimativa dos

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Pesquisa Operacional Programação em Redes

Pesquisa Operacional Programação em Redes Pesquisa Operacional Programação em Redes Profa. Alessandra Martins Coelho outubro/2013 Modelagem em redes: Facilitar a visualização e a compreensão das características do sistema Problema de programação

Leia mais

Análise matemática para avaliação de desempenho em ambientes Peer-to-Peer

Análise matemática para avaliação de desempenho em ambientes Peer-to-Peer Análise matemática para avaliação de desempenho em ambientes Peer-to-Peer Érico Santos Rocha 1, Janaina Lemos 1, Daniel Bertoglio 1, Rafael Ávila 1, Luis Paulo Luna de Oliveira 1 1 PIPCA - Programa de

Leia mais

SISTEMAS DE INFORMAÇÃO CONCEITOS

SISTEMAS DE INFORMAÇÃO CONCEITOS SISTEMAS DE INFORMAÇÃO CONCEITOS 1. Sabe-se que o conceito de Sistema de Informação envolve uma série de sistemas informatizados com diferentes características e aplicações, os quais, porém, têm em comum

Leia mais

Objetivos. Apresentar as superfícies regradas e superfícies de revolução. Analisar as propriedades que caracterizam as superfícies regradas e

Objetivos. Apresentar as superfícies regradas e superfícies de revolução. Analisar as propriedades que caracterizam as superfícies regradas e MÓDULO 2 - AULA 13 Aula 13 Superfícies regradas e de revolução Objetivos Apresentar as superfícies regradas e superfícies de revolução. Analisar as propriedades que caracterizam as superfícies regradas

Leia mais

Implementação rápida do modelo Balanced Scorecard (BSC) nas empresas de seguros

Implementação rápida do modelo Balanced Scorecard (BSC) nas empresas de seguros Implementação rápida do modelo Balanced Scorecard (BSC) nas empresas de seguros Uma evolução nos sistemas de controle gerencial e de planejamento estratégico Francisco Galiza Roteiro Básico 1 SUMÁRIO:

Leia mais

Visão Geral dos Sistemas de Informação

Visão Geral dos Sistemas de Informação Visão Geral dos Sistemas de Informação Existem muitos tipos de sistemas de informação no mundo real. Todos eles utilizam recursos de hardware, software, rede e pessoas para transformar os recursos de dados

Leia mais

A probabilidade representa o resultado obtido através do cálculo da intensidade de ocorrência de um determinado evento.

A probabilidade representa o resultado obtido através do cálculo da intensidade de ocorrência de um determinado evento. Probabilidade A probabilidade estuda o risco e a ocorrência de eventos futuros determinando se existe condição de acontecimento ou não. O olhar da probabilidade iniciou-se em jogos de azar (dados, moedas,

Leia mais

EDITAL PROGRAMA DE EMPREENDEDORISMO JOVEM DA UFPE

EDITAL PROGRAMA DE EMPREENDEDORISMO JOVEM DA UFPE EDITAL PROGRAMA DE EMPREENDEDORISMO JOVEM DA UFPE A Universidade Federal de Pernambuco (UFPE) torna pública, através da Diretoria de Inovação e Empreendedorismo (DINE) da Pró-Reitoria para Assuntos de

Leia mais

7.1 Introdução. Monitoramento e Avaliação 427

7.1 Introdução. Monitoramento e Avaliação 427 7.1 Introdução O processo de monitoramento e avaliação constitui um instrumento para assegurar a interação entre o planejamento e a execução, possibilitando a correção de desvios e a retroalimentação permanente

Leia mais

3 Metodologia de Gerenciamento de Riscos

3 Metodologia de Gerenciamento de Riscos 3 Metodologia de Gerenciamento de Riscos Este capítulo tem como objetivo a apresentação das principais ferramentas e metodologias de gerenciamento de riscos em projetos, as etapas do projeto onde o processo

Leia mais