MINERAÇÃO DE DADOS EM REDES COMPLEXAS

Documentos relacionados
Relação de Disciplinas

KDD E MINERAÇÃO DE DADOS:

Prof. Daniela Barreiro Claro

Jennefer Nicholson Secretary General IFLA. Universidade de Évora, Teatro Garcia de Resende e Biblioteca Pública de Évora outubro 2015, Portugal

CENTRO UNIVERSITÁRIO SENAC Diretoria de Pós-graduação e Pesquisa

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

COMPUTAÇÃO UBIQUA E INTERNET DAS COISAS, PROPOSTA DE ELETIVA NA FORMAÇÃO DO TECNÓLOGO EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

CURSOS OFERECIDOS PELO ITA

UNIVERSIDADE DE SÃO PAULO Escola de Artes, Ciências e Humanidades Graduação em Gestão Ambiental Prof. Dra. Sylmara Gonçalves Dias

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

Aula 02: Conceitos Fundamentais

RELATÓRIO FINAL - INDICADORES - DOCENTES ENGENHARIA AMBIENTAL EAD

- atividades complementares: total: 3.630

PROJETO DO CURSO TÉCNICO DE NÍVEL MÉDIO INTEGRADO EM INFORMÁTICA

Engenharia de Software II

GESTÃO DO AGRONEGÓCIO

A Internet das Coisas. Ministro Celso Pansera

Auxiliar em Administração de Redes Redes de Computadores I

01H - Prédio 13 / Sala H - Prédio 13 / Sala 203

Avaliação de desempenho de virtualizadores no envio e recebimento de pacotes em sistemas Linux

SISTEMAS DISTRIBUÍDOS

Público Alvo: Investimento: Disciplinas:

FACULDADE SANTA TEREZINHA - CEST COORDENAÇÃO DO CURSO DE TECNOLOGIA EM GESTÃO AMBIENTAL PLANO DE ENSINO

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

Iniciação Científica no INATEL

VIII Oficinas de Formação A Escola na Sociedade da Informação e do Conhecimento praticar ao Sábado. E-learning. 3 de Março de 2007

Público Alvo: Critérios de admissão para o curso: Investimento:

INCLUSÃO DIGITAL. instrumento de INCLUSÃO SOCIAL

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR

Padronização de Processos: BI e KDD

Investimento Social no Entorno do Cenpes. Edson Cunha - Geólogo (UERJ) Msc. em Sensoriamento Remoto (INPE)

Estudo aponta influência do código de barras e da tecnologia na decisão de compra do consumidor e na estratégia do varejo

Respostas dos alunos sobre o curso

Prof. Msc. Paulo Muniz de Ávila

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

3 Market Basket Analysis - MBA

Sumário. Mineração de Dados aplicada à Gestão de Negócios. 1) Mineração de Dados

Leitura e interpretação de publicações científicas

Sistemática dos seres vivos

Banco de Dados. Modelo Entidade - Relacionamento. João Eduardo Ferreira Osvaldo Kotaro Takai jef@ime.usp.br DCC-IME-USP

A ARTE DA EAD NA BAHIA

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

OTIMIZAÇÃO POR COLÔNIA DE FORMIGAS PARA O ROTEAMENTO EM REDES DE COMPUTADORES.

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

Métricas de Software

PLANO DO CURSO DE ATUALIZAÇÃO NA ATENÇÃO INTERSETORIAL AO USO PREJUDICIAL EM ÁLCOOL E OUTRAS DROGAS - CIAD 2016

Lógica de Programação. Profas. Simone Campos Camargo e Janete Ferreira Biazotto

UFSM-CTISM. Comunicação de Dados Aula-02

Comitê Científico do Enangrad

Plano de Articulação Curricular

UNIVERSIDADE ESTADUAL DO CENTRO-OESTE - UNICENTRO CURSO DE PÓS GRADUAÇÃO EM MÍDIAS NA EDUCAÇÃO JULIANA LEME MOURÃO ORIENTADOR: PAULO GUILHERMETI

UNIVERSIDADE ESTADUAL DE CAMPINAS FACULDADE DE EDUCAÇÃO. Elaborado por Gildenir Carolino Santos Grupo de Pesquisa LANTEC

Plano de Trabalho Docente Ensino Técnico

(RelGradeCurricular) Número de créditos no período: 30 2 CMP4121 INTROD CIENCIA DA COMPUTACAO II MAF4231 CALCULO PARA COMPUTACAO III

Curso de Formação de Oficiais Conhecimentos Específicos ENGENHARIA DE COMPUTAÇÃO CADERNO DE QUESTÕES

CORPO DOCENTE DO CURSO SUPERIOR DE ENGENHARIA DE TELECOMUNICAÇÕES

Agrupamento de Escolas Dr. Bissaya Barreto Castanheira de Pera. Plano. Estudos. Desenvolvimento. Currículo

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags

DIVISÃO DE REGISTROS ACADÊMICOS Registros Acadêmicos da Graduação. Ementas por Currículo 07/02/ :25. Centro de Ciências Exatas e Naturais

Ensino Técnico Integrado ao Médio FORMAÇÃO GERAL. Plano de Trabalho Docente

Fontes de energia. A hidroeletricidade no Brasil

É importante destacar que em 2016 ocorrerão simultaneamente os seguintes eventos:

EXCELÊNCIA EM GESTÃO: DESAFIOS PARA O SÉCULO XXI

UNIVERSIDADE PAULISTA CURSOS

ICI AMPLIA INCLUSÃO DIGITAL E PROMOVE AVANÇOS NA ROTINA DOS ESTUDANTES DA REDE PÚBLICA COM APLICAÇÃO DE WI-FI NAS ESCOLAS

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

ANÁLISE DE LOGS DA WEB POR MEIO DE TÉCNICAS DE DATA MINING

Ensino Técnico Integrado ao Médio FORMAÇÃO GERAL. Ensino Médio

Concepção Pedagógica do curso-piloto Pradime on line 1

Escola Básica do 1º Ciclo com Pré-Escolar da Nazaré. Atividade de Enriquecimento Curricular TIC. Pré-Escolar Nenúfares

I ENCONTRO DE PRÁTICAS PEDAGÓGICAS NOS CURSOS DE LICENCIATURA LICENCIATURA EM PEDAGOGIA: EM BUSCA DA IDENTIDADE PROFISSIONAL DO PEDAGOGO

Paralelização do algoritmo SPRINT usando MyGrid

TECNÓLOGO EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS PROGRAMAÇÃO DE COMPUTADORES I

TITULAÇÕES LEGENDAS: LP (LICENCIATURA PLENA) EII (ESQUEMA II)

CONCEITOS DE CARTOGRAFIA ENG. CARTÓGRAFA ANNA CAROLINA CAVALHEIRO

Smart offices: otimizando o uso de salas com sensores conectados e Machine Learning

EDUCAÇÃO & NEGÓCIOS. Será que estamos preparados para a nova era da instantaneidade?

Cidades Analíticas. das Cidades Inteligentes em Portugal

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Curso de Desenvolvimento de Negócios Sociais e Inclusivos

CONSERVE: SIMULADOR DIDÁTICO SOBRE CONSERVAÇÃO DE ENERGIA ELÉTRICA EM RESIDÊNCIAS

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

ESTUDO DE FERRAMENTAS MATEMÁTICAS SIMPLES EM PHP: APLICAÇÕES EM ENSINO E INSTRUÇÃO EM CIÊNCIA E TECNOLOGIA

FUNDAÇÃO UNIVERSIDADE DE PERNAMBUCO. Relatório Turma/Horário

Deswik.Sched. Sequenciamento por Gráfico de Gantt

ESTUDO, DESENVOLVIMENTO E PRODUÇÃO DE MATERIAIS DIDÁTICOS PARA O ENSINO DE BIOLOGIA. Introdução

MINERAÇÃO DE DADOS RELACIONADOS AO APRENDIZADO DE LÍNGUA PORTUGUESA UM ESTUDO EXPLORATÓRIO

Transcrição:

MINERAÇÃO DE DADOS EM REDES COMPLEXAS Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

POSICIONAMENTO E MOTIVAÇÃO Coleta de dados em vários formatos, por meio de diversos recursos/aplicações em várias áreas: Internet, dispositivos móveis, sensores, sistemas de automação, sistemas de informação,... Redes sociais, AVAs, redes de telecomunicações, operações com cartões de crédito,... Governo, (Bio)Ciências, Finanças, Seguros, Segurança,... IoT (Internet of Things Internet das Coisas) Quanta informação é criada a cada ano?

POSICIONAMENTO E MOTIVAÇÃO Segundo a revista Science (2011): o mundo foi capaz de armazenar 295 exabytes de informação no ano de 2007. 1 exabyte = 1012 megabytes Cerca de 800 megabytes para cada ser humano. Equivalente ao conteúdo textual de mais de 300 livros. Atualmente a NASA possui dados na ordem de bilhões de gigabytes. Estima-se que em 2020, a humanidade disporá de 44 zettabytes de dados. 1 zettabyte = 44 trilhões de gigabytes (44 x 2 70 bytes) Taxa de crescimento de dados mundial em torno de 40% ao ano na próxima década. Fontes: www.sciencemag.org/content/early/2011/02/09/science.1200970.full.pdf http://www.nasa.gov/open/plan/data-gov.html www.emc.com/leadership/digital-universe/index.htm

POSICIONAMENTO E MOTIVAÇÃO Nossa situação atual é a de sobrecarga de informação...

POSICIONAMENTO E MOTIVAÇÃO Grandes Desafios da Pesquisa em Computação no Brasil (SBC, 2014) Gestão da Informação em Grandes Volumes de Dados Multimída Distribuídos Ciência de Dados Astronomia Biologia Defesa Educação Energia Engenharia Esporte Física Saúde Etc... Computação: Gerência de Dados Análise de Dados Temas Relacionados: Workflows Científicos Procedência de Dados Web Semântica Mineração de Dados Etc...

POSICIONAMENTO E MOTIVAÇÃO Tema de Interesse: Análise de Redes Complexas Grande número de elementos fortemente interconectados Compreensão da dinâmica evolutiva dessas redes Mineração de Grafos Heterogeneidade de elementos e de ligações

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

CONCEITOS BÁSICOS ANÁLISE DE DADOS Hierarquia Dado - Informação - Conhecimento: SE Capacidade de Endividamento Mensal > 0.6 ENTÃO Crédito = Sim CONHECIMENTO Capacidade de Endividamento Mensal = 1 Despesa Mensal / Renda Mensal INFORMAÇÃO Renda Mensal, Despesa Mensal 2.345,20; 463,00; 10.048,21; 294,12 DADO

CONCEITOS BÁSICOS ANÁLISE DE DADOS Descoberta de Conhecimento / Análise de Dados KDD: Knowledge Discovery in Databases Interação Especialista de Domínio Especialista em KDD Etapas Operacionais do Processo de KDD Dados Pré-Processamento Mineração de Dados Pós-Processamento Seleção de Dados Limpeza Codificação Criação de Atributos Enriquecimento etc... Iteração Busca por Modelos (de Conhecimento) Modelo de Conhecimento Simplificação de Modelos Conversão de Modelos Visualização de Modelos etc...

CONCEITOS BÁSICOS ANÁLISE DE DADOS Exemplo de aplicação na área de concessão de crédito: Conjunto de dados (Fatos)

CONCEITOS BÁSICOS ANÁLISE DE DADOS Exemplo de aplicação na área de concessão de crédito: Padrão: Se renda > R$ t Então Crédito = SIM (Cto)

CONCEITOS BÁSICOS ANÁLISE DE DADOS Multidisciplinaridade ESTATÍSTICA RECONHECIMENTO DE PADRÕES DATA WAREHOUSING KDD VISUALIZAÇÃO INTELIGÊNCIA ARTIFICIAL BANCO DE DADOS APRENDIZADO DE MÁQUINA

CONCEITOS BÁSICOS TEORIA DE GRAFOS Grafo Definição G(V, E): Estrutura matemática V: conjunto de nós ou vértices E: conjunto de arestas, que conectam os nós C A B D Exemplos sobre conceitos importantes: Vizinhos de C: {B, D} Caminhos entre A e D: A B D A B C D Comprimento de caminho: 2 e 3 Distância entre A e D: 2

CONCEITOS BÁSICOS TEORIA DE GRAFOS Grafo Dirigido Definição G(V, E): Considera a direção dos relacionamentos V: conjunto de nós ou vértices E: conjunto de arestas, que conectam os nós A B Exemplo de aplicação: Twitter C D

CONCEITOS BÁSICOS TEORIA DE GRAFOS Grafos Representação Computacional Matriz de adjacência M nxn onde: M i,j = 1 se existe uma aresta entre os nós i e j M i,j = 0 se não existe uma aresta entre os nós i e j 3 C 1 2 A B 4 D M i,j 1 2 3 4 1 0 1 0 0 2 1 0 1 1 3 0 1 0 1 4 0 1 1 0

CONCEITOS BÁSICOS TEORIA DE GRAFOS Grafos Representação Computacional Lista de adjacência: representação de vértices e seus vértices adjacentes C A B D A B B A C D C B D D B C

CONCEITOS BÁSICOS TEORIA DE GRAFOS Grafos Exemplos de Métricas Topológicas Número de vizinhos comuns cn(i,j) 9 7 5 8 6 4 3 2 1 cn(1,2) = 1 cn(1,3) = 2 cn(1,4) = 1 cn(2,3) = 1 cn(2,4) = 2 cn(4,5) = 1 cn(4,8) = 2 cn(7,9) = 0

CONCEITOS BÁSICOS TEORIA DE GRAFOS Grafos Exemplos de Métricas Topológicas 3 1 5 2 JC(1,2) = 1/5 JC(1,3) = 1/5 JC(1,4) = 2/3 JC(1,5) = 0 JC(2,3) = 2/4 JC(2,4) = 1/4 JC(2,5) = 1/3 JC(3,4) = 1/4 JC(3,5) = 1/3 JC(4,5) = 0 4

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

TAREFAS DE MINERAÇÃO CLÁSSICAS CLASSIFICAÇÃO EXEMPLO DE APLICAÇÃO

TAREFAS DE MINERAÇÃO CLÁSSICAS CLASSIFICAÇÃO PROBLEMA X 1 ƒ (?) X 2 Y 1 X 3... Y 2... Y k X n Conj. de Dados Conj. de Classes

TAREFAS DE MINERAÇÃO CLÁSSICAS CLASSIFICAÇÃO OBJETIVO ^ ƒ ƒ X i Y j

TAREFAS DE MINERAÇÃO CLÁSSICAS CLASSIFICAÇÃO EXEMPLO DE HIPÓTESE (MODELO) ^ ƒ ƒ

TAREFAS DE MINERAÇÃO CLÁSSICAS CLUSTERIZAÇÃO (AGRUPAMENTO) CONCEITO Separação dos registros em n clusters Maximizar/Minimizar similaridade intra/inter cluster X X X X X X X X X X X X X X

TAREFAS DE MINERAÇÃO CLÁSSICAS DESCOBERTA DE REGRAS DE ASSOCIAÇÃO CONCEITO Regra de Associação: X Y, X e Y conjuntos de itens tal que: X Y = Regra frequente: sup(ri)= X e Y / D >= MinSup Regra válida: conf(ri)= X e Y / X >= MinConf Exemplos de Regras de Associação: Café Pão Café Pão Leite Trans Leite Café Cerveja Pão Manteiga Arroz Feijão 1 Não Sim Não Sim Sim Não Não 2 Sim Não Sim Sim Sim Não Não 3 Não Sim Não Sim Sim Não Não 4 Sim Sim Não Sim Sim Não Não 5 Não Não Sim Não Não Não Não 6 Não Não Não Não Sim Não Não 7 Não Não Não Sim Não Não Não 8 Não Não Não Não Não Não Sim 9 Não Não Não Não Não Sim Sim 10 Não Não Não Não Não Sim Não

TAREFAS DE MINERAÇÃO CLÁSSICAS EXEMPLOS DE FERRAMENTAS/RECURSOS SAS Enterprise Miner SPSS PolyAnalist Intelligent Miner Rapid Miner Weka Tanagra Scikit-Learn WizSoft (WizRule)

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

TAREFAS DE MINERAÇÃO REDES COMPLEXAS PREDIÇÃO DE LIGAÇÕES CONCEITO Construir modelos que prevejam a possibilidade de surgir uma associação entre dois vértices não interligados (Wang, 2015). Exemplo de aplicação em redes sociais: Futura amizade? pessoa amizade Instante t Instante t + 1 nova amizade

TAREFAS DE MINERAÇÃO REDES COMPLEXAS PREDIÇÃO DE LIGAÇÕES ABORDAGENS Não Supervisionada (Ordenação por Similaridade) Supervisionada ( Aprendizado de Máquina)

TAREFAS DE MINERAÇÃO REDES COMPLEXAS PREDIÇÃO DE LIGAÇÕES NÃO SUPERVISIONADA 3 1 4 5 2 Pares não conectados Nó1 Nó2 cn(i,j) 1 4 2 2 5 1 3 5 1 4 5 0 NOVOS ORDENAÇÃO Top 2 Nó1 Nó2 cn(i,j) 1 4 2 2 5 1 3 5 1 4 5 0

TAREFAS DE MINERAÇÃO REDES COMPLEXAS PREDIÇÃO DE LIGAÇÕES SUPERVISIONADA Transformação do problema original em um problema de classificação binária. 3 1 4 5 2 Nó1 Nó2 Ligação 1 2 sim 1 3 sim 1 4 não 1 5 sim 2 3 sim 2 4 sim 2 5 não 3 4 sim 3 5 não 4 5 não

TAREFAS DE MINERAÇÃO REDES COMPLEXAS PREDIÇÃO DE LIGAÇÕES SUPERVISIONADA Enriquecimento do conjunto de dados com informações extraídas da rede. 3 1 4 5 2 Nó1 Nó2 cn(i,j) JC(i,j) Ligação 1 2 1 1/3 sim 1 3 1 1/3 sim 1 4 2 2/3 não 1 5 0 0 sim 2 3 2 2/3 sim 2 4 1 1/2 sim 2 5 1 1/3 não 3 4 1 1/2 sim 3 5 1 1/3 não 4 5 0 0 não

TAREFAS DE MINERAÇÃO REDES COMPLEXAS PREDIÇÃO DE LIGAÇÕES SUPERVISIONADA Aplicação de um algoritmo de classificação para aprender o modelo e identificar ligações futuras. 1 5 2 Lig(1, 4, cn(1,4), JC(1,4)) = sim 3 Lig(2, 5, cn(2,5), JC(2,5)) = não 4

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES CONCEITO Identificar grupos de vértices que maximizem o número de arestas dentro do grupo e minimizem o número de arestas entre grupos distintos (Tang e Liu, 2010). Exemplos de aplicação:

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES TIPOS DE COMUNIDADE Disjuntas Sobrepostas

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES EXEMPLOS DE ABORDAGENS Centrada em Vértice Centrada em Grupo Centrada em Rede Centrada em Hierarquia

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES EXEMPLOS DE ABORDAGENS Centrada em Vértice Nós de cada grupo com propriedades semelhantes Exemplo: Formação de cliques Alto custo computacional 7 5 3 9 8 6 4 2 1 Exemplo: 4-clique e 3-clique

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES EXEMPLOS DE ABORDAGENS 1-denso 0,83-denso

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES EXEMPLOS DE ABORDAGENS 7 5 3 9 8 6 4 2 1 Exemplo: 5-quasi-clique e 4-quasi-clique sobrepostas

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES EXEMPLOS DE ABORDAGENS Centrada em Rede Considera a topologia de toda a rede, visando seu particionamento Exemplo: redução de dimensionalidade, preservando a proximidade entre vértices baseada na conectividade da rede. 7 5 3 9 8 6 4 2 1

TAREFAS DE MINERAÇÃO REDES COMPLEXAS DETECÇÃO DE COMUNIDADES EXEMPLOS DE ABORDAGENS Centrada em Hierarquia Cria grupos a partir da estrutura hierárquica dos nós Exemplo: divide o grafo ao remover arestas com maior grau de intermediação (número de caminhos mais curtos que passam pela aresta) 9 7 5 8 6 4 3 2 1 {1,2,3,4,5, 6,7,8,9} remover e(4,5), e(4,6) {1,2, {5,6,7, 3,4,} 8,9} {5,6, 7,8} remover e(7,9) {9} M i,j 1 2 3 4 5 6 7 8 9 1 0 4 1 9 0 0 0 0 0 2 4 0 4 0 0 0 0 0 0 3 1 4 0 9 0 0 0 0 0 4 9 0 9 0 10 10 0 0 0 5 0 0 0 10 0 1 6 3 0 6 0 0 0 10 1 0 6 3 0 7 0 0 0 0 6 6 0 2 8 8 0 0 0 0 3 3 2 0 0 9 0 0 0 0 0 0 8 0 0

TAREFAS DE MINERAÇÃO REDES COMPLEXAS EXEMPLOS DE FERRAMENTAS/RECURSOS Neo4j NetworkX Gephi Scikit-Learn

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

EXEMPLOS DE PROJETOS PREDIÇÃO DE LIGAÇÕES SELEÇÃO DE VARIÁVEIS PREDLIG (Pecli et al., 2015) Abordagem Supervisionada

EXEMPLOS DE PROJETOS PREDIÇÃO DE LIGAÇÕES DADOS TEMPORAIS E CONTEXTUAIS PREDLIG (Muniz, 2016) Abordagem Não Supervisionada

EXEMPLOS DE PROJETOS DETECÇÃO DE COMUNIDADES DADOS CONTEXTUAIS DETCOM (Dias, 2016) Clusterização + Detecção de Comunidades

70% 60% 50% 40% 30% 20% 10% 0% -10% 70% 60% 50% 40% 30% 20% 10% 0% -10% 21% 33% Até 3 salários mínimos 21% 22% 24% 21% 33% Até 3 salários mínimos 22% 24% 21% 47% 45% 49% 57%56% De 4 a 8 salários mínimos 47% 45% 49% 57%56% De 4 a 8 salários mínimos 23% 24% 17% 14% 13% De 9 a 15 salários mínimos 23% 24% 17% 14% 13% De 9 a 15 salários mínimos 6% 6%4%5%5% 1% 0%0% 1%0% De 16 a 25 salários mínimos 2005-2 2006-1 2006-2 2007-1 2007-2 De 26 a 30 salários mínimos 6% 6%4%5%5% 1% 0%0% 1%0% De 16 a 25 salários mínimos 2005-2 2006-1 2006-2 2007-1 2007-2 De 26 a 30 salários mínimos EXEMPLOS DE PROJETOS EDUCAÇÃO: USO DE TECNOLOGIA Coleta de Dados ETC... Discente em Perspectiva Ampliada Transferência de Dados BD Central Central de Análise de Dados Mineração e Visualização de Dados Gestores Docentes Discentes Projeto MEMORE: Um Computador por Aluno (Goldschmidt et al., 2015)

EXEMPLOS DE PROJETOS EDUCAÇÃO: USO DE TECNOLOGIA Exemplos de Regras de Associação Identificadas nas Escolas Piloto de Piraí/RJ Anos: 2013 a 2015 (R 1 ) Atuou em grupo, não utilizou para lazer e desenvolveu atividades escolares ==> Concluiu todas as atividades desenvolvidas Sup. Conf. 34 82 (R 2 ) Atuou em casa ==> Desenvolveu atividades escolares 15 43 (R 3 ) Atuou em casa ==> Desenvolveu atividade de lazer 16 46 (R 4 ) Atuou em grupo ==> Desenvolveu atividades escolares 33 100 (R 5 ) Desenvolveu atividade de Ciências ==> Conseguiu concluir atividade 24 82 (R 6 ) Desenvolveu atividade de Língua Portuguesa ==> Conseguiu concluir atividade 12 84 Projeto MEMORE: Um Computador por Aluno (Goldschmidt et al., 2015)

ROTEIRO 1. POSICIONAMENTO E MOTIVAÇÃO 2. CONCEITOS BÁSICOS 3. TAREFAS DE MINERAÇÃO CLÁSSICAS 4. TAREFAS DE MINERAÇÃO EM REDES COMPLEXAS 5. EXEMPLOS DE PROJETOS 6. CONSIDERAÇÕES FINAIS

CONSIDERAÇÕES FINAIS Recaptulando Redes Complexas Comportamento, propriedades e evolução Análise de dados em Redes Complexas Uso de técnicas de Data Mining Exemplos de tarefas de Data Mining em Redes Complexas Predição de Links e Detecção de Comunidades Pesquisas na área Crescente e diversificado interesse Objetivos da apresentação Expor conceitos básicos e comentar sobre algumas dessas pesquisas

CONSIDERAÇÕES FINAIS Atividades em Ciência de Dados - uma Taxonomia Atividades em Ciência de Dados Desenvolvimento Científico Desenvolvimento Tecnológico Aplicação de Tecnologias

CONSIDERAÇÕES FINAIS Exemplos de Temas de Pesquisa (Análise de Redes Complexas) Aspectos Temporais e Contextuais na Evolução das Redes Propagação da Informação vs. Reputação e Confiança Mineração de Textos Opinion Mining / Sentiment Analysis Combinação de Tarefas Detecção de Comunidades + Predição de Links Redes Heterogêneas Redes Multimodais e/ou Multidimensionais Aplicações em IoT Interações entre as coisas Infraestrutura e Semântica Aplicações em Segurança da Informação Detecção de Botnets e de Social Bots

BIBLIOGRAFIA SUGERIDA Faceli, K., Lorena, A. C., Gama, J., Carvalho, A. C. P. (2011) Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. Rio de Janeiro: LTC. Tan, P., Steinbach, M., Kumar, V. (2009) Introdução ao Data Mining Mineração de Dados. Rio de Janeiro: Editora Ciência Moderna. Witten, I., Frank, E. (2005) Data Mining: Practical Machine Learning Tools and Techniques. San Francisco: Morgan Kaufmann. Goldschmidt, R., Bezerra, E., Passos, E. (2015) Data Mining: Conceitos, Técnicas, Ferramentas, Orientações e Aplicações. Rio de Janeiro: Elsevier.

BIBLIOGRAFIA SUGERIDA Goldschmidt, R. R.; Fernandes, I. (Org.) ; Norris, M. (Org.). MEMORE: Um Ambiente Computacional para Coleta e Mineração de Dados sobre o Uso de Computadores na Educação. 1. ed. Rio de Janeiro: FAETEC, 2015. v. 1. 257p. Pecli, A. et al. Dimensionality Reduction for Supervised Learning in Link Prediction Problems. In: 17th International Conference on Enterprise Information Systems, 2015, Barcelona. Proceedings of the 17th International Conference on Enterprise Information Systems. v. 1. p. 295-301. Dias, M. V. Uma abordagem para Detecção de Comunidades em Redes Complexas Baseada em Informações de Domínio 2016. Dissertação (Mestrado em Engenharia de Defesa) IME.

BIBLIOGRAFIA SUGERIDA Muniz, C. P. Investigando a Utilização de Atributos Temporais no Problema de Predição de Links. 2016. Dissertação (Mestrado em Sistemas e Computação) IME. Wang, P., Xu, B., Wu, Y., & Zhou, X. (2015). Link prediction in social networks: the state-of-the-art. Science China Information Sciences, 58, 1 38. Tang, L.; Liu, H. (2010) Community detection and mining in social media. Synthesis Lectures on Data Mining and Knowledge Discovery. v. 2, n. 1, p. 1 137.

FIM!