Análise de REDES SOCIAIS. uma visão computacional. Ademir Cristiano Gabardo. Novatec



Documentos relacionados
Ricardo Lino Olonca. Novatec

Wilson Moraes Góes. Novatec

Google Android para Tablets

Ademir C. Gabardo. Novatec

Desenvolvendo Websites com PHP

Camila Porto. Novatec

Arquitetura de Rede de Computadores

Gerenciamento. de projetos. Bart Gerardi. Novatec. Como evitar problemas previsíveis para o sucesso do projeto

Pete Goodliffe. Novatec

marketing ágil Utilização de Metodologias Ágeis em Projetos de Marketing Michelle Accardi-Petersen Novatec

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

Editor: Rubens Prates Revisão gramatical: Patrizia Zagni Capa: Victor Bittow Editoração eletrônica: Camila Kuwabata e Carolina Kuwabata

Laboratórios de Tecnologias. Cisco. em Infraestrutura de Redes. Samuel Henrique Bucke Brito. Novatec

Entendendo como funciona o NAT

GASTAR MAIS COM A LOGÍSTICA PODE SIGNIFICAR, TAMBÉM, AUMENTO DE LUCRO

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

Hélio Engholm Jr. Novatec

Excel Avançado. 2ª Edição. Antonio Fernando Cinto Wilson Moraes Góes. Novatec

1. Quem somos nós? A AGI Soluções nasceu em Belo Horizonte (BH), com a simples missão de entregar serviços de TI de forma rápida e com alta qualidade.

Defenda sua base com circuitos simples, Arduino e Raspberry Pi

Preparando sua empresa para o forecasting:

TRANSMISSÃO DE DADOS Prof. Ricardo Rodrigues Barcelar

Segurança em Redes sem Fio

Grafos. Redes Sociais e Econômicas. Prof. André Vignatti

Disciplina: Suprimentos e Logística II Professor: Roberto Cézar Datrino Atividade 3: Transportes e Armazenagem

João Eriberto Mota Filho

#10 PRODUZIR CONTEÚDO SUPER DICAS ATRATIVO DE PARA COMEÇAR A

Ricardo Kléber M. Galvão. Novatec

Trabalho Computacional

como acabar com sua em apenas 140 caracteres Carolina Lima Novatec

Scrum em Ação. Gerenciamento e Desenvolvimento Ágil de Projetos de Software. Andrew Pham Phuong-Van Pham. Novatec

MARKETING DIGITAL NA ERA. Martha Gabriel CONCEITOS, PLATAFORMAS E ESTRATÉGIAS. Novatec

Programa de Pós-Graduação em Comunicação e Cultura Contemporâneas. Grupo de Pesquisa em Interação, Tecnologias Digitais e Sociedade - GITS

Wilson Moraes Góes. Novatec

Técnicas para Programação Inteira e Aplicações em Problemas de Roteamento de Veículos 14

Adail Henrique Spínola Horst Aécio dos Santos Pires André Luis Boni Déo. Novatec

Crie Seu Próprio Site

Análise de Redes Sociais

Mídias sociais como apoio aos negócios B2C

Correlação e Regressão Linear

Como e por onde começar e os melhores formatos de conteúdo para você

A INTERNET COMPLETOU 20 ANOS DE BRASIL EM 2015.

Planejando o aplicativo

Lojas Virtuais com. Magento. André Nobrega Gugliotti. Novatec

Trabalho sobre Social Media Como implementar Social Media na empresa

Paulo Strelczuk. Novatec

Uma Publicação Grupo IPub. Guia. redes sociais para clínica de estética. Guia de redes sociais para clínica de estética

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

E-books. Guia para Facebook Ads. Sebrae

UNIVERSIDADE FEDERAL DE PELOTAS

Novatec Editora Ltda. [2013]. Todos os direitos reservados e protegidos pela Lei de 19/02/1998. É proibida a reprodução desta obra, mesmo

Guia de Métricas. Quais métricas acrescentam para a diretoria da empresa?

David Hows Peter Membrey Eelco Plugge

Segmentação Inteligente: como utilizá-la

Outros Elementos que fazem parte dos ambientes sociais digitais

Como produzir um Curso on line

Edgar Gomes de Abreu

SISTEMAS INTEGRADOS DE GESTÃO PAS 99:2006. Especificação de requisitos comuns de sistemas de gestão como estrutura para a integração

USO DE REDES SOCIAIS EM AMBIENTES CORPORATIVOS.

Internet e Adolescência - Pontos Positivos

Conrado Adolpho. Novatec

REFORMULAÇÃO SITE ARCA BRASIL

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Novatec Editora Ltda. [2014].

Segurança na Internet. Redes Sociais

5 Considerações finais 5.1. Reflexões sobre os resultados

Processos de gerenciamento de projetos em um projeto

As Leis Fundamentais do Projeto de Software

Web Analytics (Google analytics, Web trafic XITI, Coremetrics, etc.); Ferramentas de gestão de listas de s (Mailchimp, constant contact, etc.

Curso: Diagnóstico Comunitário Participativo.

6 Construção de Cenários

Internet Visão Geral. O que é a Internet? Ong Ação Cidadã

Pequenas e Médias Empresas no Canadá. Pequenos Negócios Conceito e Principais instituições de Apoio aos Pequenos Negócios

Análise e Complexidade de Algoritmos

A ERA DIGITAL E AS EMPRESA

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

Laboratórios de Tecnologias. Cisco. em Infraestrutura de Redes. 2a Edição. Samuel Henrique Bucke Brito. Novatec

COMO EXPLORAR OS BENEFÍCIOS DOS INDICADORES DE DESEMPENHO NA GESTÃO DE UM CSC. Lara Pessanha e Vanessa Saavedra

5 Extraindo listas de produtos em sites de comércio eletrônico

Engenharia de Software II: Desenvolvendo o Orçamento do Projeto. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

Roteamento e Comutação

3 Método de Monte Carlo

Ricardo R. Lecheta. Novatec

A Estrutura da Web. Redes Sociais e Econômicas. Prof. André Vignatti

Complemento II Noções Introdutória em Redes Neurais

Teoria dos Grafos. Edson Prestes

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

Aula 20. Roteamento em Redes de Dados. Eytan Modiano MIT

Conceitos Básicos de Rede. Um manual para empresas com até 75 computadores

Mídia Kit. Produzido por Luis Daniel da Silva Rodrigo Almeida Tancy Costa Mavignier. Jornalistas

Empresário. Você curte moda? Gosta de cozinhar? Não existe sorte nos negócios. Há apenas esforço, determinação, e mais esforço.

Jonathan Stark Brian Jepson

Aula Prática Roteador

O que é um Afiliado EaDPLUS? Por que ser Afiliado EaDPLUS? Quais cursos o Afiliado EaDPLUS pode divulgar?

2 Fundamentação Conceitual

Configurando um Grupo Doméstico e Compartilhando arquivos no Windows 7

Transcrição:

Análise de REDES SOCIAIS uma visão computacional Ademir Cristiano Gabardo Novatec

Copyright 2015 da Novatec Editora Ltda. Todos os direitos reservados e protegidos pela Lei 9.610 de 19/02/1998. É proibida a reprodução desta obra, mesmo parcial, por qualquer processo, sem prévia autorização, por escrito, do autor e da Editora. Editor: Rubens Prates Revisão gramatical: Marta Almeida de Sá Editoração eletrônica: Carolina Kuwabata Assistente editorial: Priscila A. Yoshimatsu Capa: Ademir Gabardo e Carolina Kuwabata ISBN: 978-85-7522-417-5 Histórico de impressões: Fevereiro/2015 Primeira edição Novatec Editora Ltda. Rua Luís Antônio dos Santos 110 02460-000 São Paulo, SP Brasil Tel.: +55 11 2959-6529 Email: novatec@novatec.com.br Site: www.novatec.com.br Twitter: twitter.com/novateceditora Facebook: facebook.com/novatec LinkedIn: linkedin.com/in/novatec

capítulo 1 Indo muito além das redes sociais Os fenômenos das redes sociais são incontestáveis em todas as esferas da sociedade, mesmo as empresas mantêm perfis em sites como Facebook, Twitter e Google+. Pessoas se relacionam com amigos, partilham opiniões, discordam ou discutem os mais diversos assuntos. Redes sociais aparecem com a mesma frequência com que desaparecem, algumas agregando milhares, ou mesmo milhões, de usuários; outras sequer decolam. Além do aspecto social, é possível derivar as soluções de análises de redes sociais para uma vasta diversidade de assuntos. Neste capítulo são abordados alguns tópicos relativos à aplicação de redes complexas na resolução de problemas diversos. O objetivo é demonstrar a aplicabilidade dos conceitos apresentados neste livro e estimular a exploração de um tema vasto e rico, que é a análise de redes complexas. 1.1 Representando relações entre empresas por meio de grafos e redes complexas Dado um grafo G(V,E), em que G é o grafo em si, V é um conjunto de vértices e E é um conjunto de arestas, é possível representar empresas e grupos de empresas por meio de grafos ao considerar cada empresa como um vértice (nó) do grafo e suas relações como arestas. Podemos tomar como exemplo as empresas de uma determinada região que façam negócios com um cliente em comum. A figura 1.1 ilustra as conexões de uma pequena rede de empresas fornecedoras e clientes. 27

28 Análise de Redes Sociais Figura 1.1 Pequena rede entre empresas fornecedoras e consumidoras. Imaginemos a empresa T representada no grafo da figura 1.1 e um fabricante de aviões. A empresa T compra diversos componentes das empresas S, Q, U, O, P, M, N, R, V, X e H. Dessas empresas fornecedoras, a empresa H fornece turbinas, e para construí-las, compra peças e materiais das empresas F, G, I, J, L e A. A empresa A, por sua vez, fornece os propulsores para que a empresa H construa as turbinas comprando peças e materiais das empresas B, C, D e E. Não é difícil perceber que, mesmo com um grupo reduzido de empresas, uma descrição textual de seus relacionamentos fica rapidamente confusa, e à medida que mais fornecedores e novas relações entre empresas são criadas, torna-se mais difícil organizar estas relações. Porém basta uma breve inspeção da rede representada na figura 1.1, e os relacionamentos aparecem claramente diante de nossos olhos. Também é possível perceber, ainda que sem nenhum conhecimento acerca das teorias de redes complexas, que todas as empresas exibidas nesse grafo têm algum grau de relacionamento, mesmo que não se conectem diretamente, pois todas compartilham, com algum grau de importância, relações entre si. Embora duas empresas distantes no grafo, como, por exemplo, C e N, possam sequer saber da existência uma da outra, seu comportamento pode influenciar diretamente a outra. Considere que a empresa C forneça alumínio para que a empresa A construa os propulsores. Se a empresa C interromper o fornecimento de matéria-prima, menos propulsores estarão disponíveis no mercado e, consequentemente, menos aviões poderão

Capítulo 1 Indo muito além das redes sociais 29 ser produzidos, influenciando diretamente o número de componentes vendidos por N para T. Esse exemplo é bastante óbvio e simplificado; um cenário real, atual e de mercados globalizados pode englobar centenas e até mesmo milhares de empresas com múltiplos níveis de relacionamentos em comum. Analistas de mercado, bolsas de valores, investidores e empresários dos mais diversos ramos têm se valido cada vez mais de ferramentas de análise de dados, tais como mineração de dados e análise de redes sociais, para compreender o comportamento do mercado. A rede apresentada no exemplo se assemelha ao modelo criado por Barabási e Albert, em que alguns vértices recebem mais conexões, enquanto a maioria dos vértices tem apenas uma ou poucas conexões. 1.2 Representando dados genéticos por meio de redes complexas O DNA vem sendo estudado por geneticistas há bastante tempo e recentes descobertas têm proporcionado grandes avanços na compreensão de como os genes se relacionam e quais genes estão diretamente ligados a doenças e condições biológicas diversas. Existem diversas maneiras de observar como um determinado gene ou um grupo de genes influencia o surgimento ou a manifestação de uma determinada patologia como, por exemplo, câncer ou doença de Alzheimer. Uma dessas formas é medir o nível de expressão que cada gene apresenta para um grupo de amostras (pacientes) e comparar os níveis de expressão desses mesmos genes ou grupos de genes com um grupo de amostras saudáveis ou que não apresentam a doença ou patologia em questão. O nível de expressão de um gene pode ser considerado normal quando está no intervalo regular de seus níveis de expressão, sobre-expresso quando mostra níveis acima do esperado e subexpresso quando os valores lidos estão abaixo de um determinado limiar. Algumas doenças se manifestam quando, em um determinado gene ou grupo de genes, os supressores não se expressam corretamente ou, em outros casos, quando um determinado gene ou grupo de genes está expresso acima dos níveis normais. Isso pode ser observado em doenças como câncer, demência, doenças hereditárias, dentre outras.

30 Análise de Redes Sociais Uma das maneiras mais comuns para representar redes gênicas é verificar o nível de expressão de dois genes distintos e, caso eles apresentem uma forte correlação, ou seja, níveis muito parecidos de expressão, estabelecer que eles estejam conectados. Desse modo, em uma rede de dados de genes, uma das possíveis formas de gerar a rede é representar cada gene como um vértice e a força da correlação entre eles como arestas de um grafo. Essas redes costumam ter milhares de vértices, podendo chegar facilmente a milhares de arestas. A figura 1.2 mostra uma rede complexa formada pelos genes relacionados à doença de Alzheimer e suas conexões. Figura 1.2 Rede complexa composta de genes relacionados à doença de Alzheimer e seus relacionamentos. A rede complexa mostrada na figura 1.2 tem 12.046 vértices e 36.448 arestas. Não é difícil perceber que para redes desta complexidade não é possível fazer inferências visuais sobre as conexões, à exceção de alguns

Capítulo 1 Indo muito além das redes sociais 31 vértices com graus muito maiores que a média da rede. Todas as informações e estatísticas sobre essa rede necessariamente são obtidas por meio de algoritmos e métricas para análise de redes complexas. Talvez neste momento você esteja se perguntando Qual a relação entre empresas que têm clientes em comum e dados de expressão gênica?. A resposta é bem simples. Ambas as redes, assim como diversas outras, compartilham propriedades topológicas semelhantes, como distribuição de graus, proporção entre vértices fortemente conectados, presença de comunidades ou agrupamentos de vértices, entre outros atributos. 1.3 Resolvendo o problema do caixeiro-viajante com grafos O problema do caixeiro-viajante, Travelling Salesman Problem (TSP), também é conhecido como o problema de roteamento de veículos (em inglês, Shortest Path Problem). Ele consiste em encontrar a melhor rota passando por um determinando número de pontos ou cidades considerando o melhor custo-benefício, que pode ser dado em função da distância ou do custo em percorrer um determinado trecho. Este problema varia desde pequenas instâncias com menos de uma dezena de cidades até problemas bastante elaborados englobando milhares de pontos ou cidades. Por muito tempo, ele permaneceu sem uma solução ótima e é considerado um problema computacional de difícil solução. Conforme o número de pontos vai aumentando, o custo computacional vai crescendo exponencialmente até que não seja possível, em tempo finito, calcular todas as rotas possíveis para todos os pontos por meio de uma busca exaustiva. O problema já foi resolvido de diversas maneiras utilizando algoritmos bioinspirados como, por exemplo, o algoritmo que simula o comportamento de formigas. Ao buscar comida e voltar para o formigueiro, as formigas deixam um rastro de feromônio, que serve como trilha para que as próximas formigas encontrem a fonte de alimento. O feromônio vai evaporando com o tempo, de modo que, nas trilhas mais longas, onde as formigas levam mais tempo para percorrer o caminho entre o formigueiro e a fonte de alimentos, acontece maior evaporação. Nas fontes de comida mais próximas, a evaporação é menor.

32 Análise de Redes Sociais Ao mesmo tempo em que mais formigas escolhem as trilhas mais curtas por exalarem mais fortemente o feromônio deixado pelas formigas que já trilharam este caminho, elas reforçam a trilha. Repetindo esse comportamento diversas vezes, inconscientemente as formigas utilizam a inteligência do grupo para minimizar o custo de transporte dos alimentos até o formigueiro. Essa mesma abordagem foi aplicada na resolução do problema do caixeiro-viajante. Contudo tais abordagens heurísticas não garantem que a solução encontrada seja a melhor solução possível para o problema. Assim como no mundo das formigas, uma fonte de alimentos mais próxima pode ser ignorada simplesmente por não ter sido explorada previamente, e assim permanecer. Mesmo sem garantir que a solução encontrada seja a ótima, é provável que seja uma solução muitas vezes melhor que buscar aleatoriamente comida por todos os caminhos possíveis. Outra abordagem para a resolução do problema do caixeiro-viajante é a representação dos pontos na rota por meio de um grafo ponderado não direcionado, em que cada ponto representa um vértice do grafo e as ligações entre os pontos, ou estradas, são representadas por arestas. Algoritmos de caminho mínimo podem ser então empregados para descobrir qual a melhor rota entre dois pontos, repetindo esse cálculo de maneira sucessiva até estabelecer a rota de menor custo. A figura 1.3 ilustra um grafo ponderado, não direcionado, em que o peso das arestas representa a distância ou o custo entre as cidades A e G. Figura 1.3 Grafo ponderado, não direcionado, representando as cidades de A a G.

Capítulo 1 Indo muito além das redes sociais 33 Assumindo que cada vértice do grafo é uma cidade e que a distância ou o custo para ir de uma cidade a outra é representado pelo peso das arestas do grafo, é fácil perceber que, mesmo para uma instância pequena como essa, calcular todas as rotas possíveis para todas as cidades, que corresponderia ao método de busca exaustiva, não é a melhor estratégia. Edsger Dijkstra, em 1956, desenvolveu um algoritmo para calcular o menor caminho entre quaisquer pares de vértices em um grafo. De um modo simplificado, podemos descrever o algoritmo de Dijkstra conforme os seguintes passos: É atribuído custo zero para o vértice-raiz da busca e infinito para os demais. É atribuído um valor qualquer aos vértices precedentes (o precedente de um vértice t é o vértice que precede t no caminho de custo mínimo de s para t). Enquanto houver vértice aberto ou não explorado: Seja k um vértice aberto cuja estimativa seja a menor dentre os vértices abertos. Feche o vértice k. Para todo vértice j aberto sucessor de k faça: Soma da estimativa do vértice k com o custo da aresta que une k a j. Caso a soma seja melhor que a estimativa anterior para o vértice j, substitua-a e anote k como precedente de j. Na abordagem de Dijkstra, não é possível calcular rotas onde existam caminhos negativos. Existem ainda outros algoritmos para calcular o caminho mínimo em grafos, como o algoritmo de Bellman-Ford, que permite calcular caminhos onde existam arestas com valores negativos, e o algoritmo de Floyd-Warshall, que permite calcular o caminho mínimo entre todos os vértices em um grafo dirigido.

34 Análise de Redes Sociais 1.4 Entendendo como ocorrem epidemias A história da humanidade é repleta de epidemias e flagelos, muitos destes tendo dizimado no passado porcentagens significativas de populações de países e continentes como, por exemplo, a trágica peste negra que assolou a Europa no século XVI, dizimando mais de 50 milhões de vidas (um terço da população europeia na época), e a gripe espanhola em 1918. Em tempos recentes, epidemias de variações da gripe denominadas H1N1, H1N2, H3N2 etc., variantes do vírus Influenza A, causaram severa preocupação global. Em 2014, a epidemia de ebola eclodiu novamente na África e, possivelmente, muitas outras que sequer tenham sido noticiadas vêm acompanhando as sociedades modernas. O acesso ao transporte aéreo intercontinental, rotas de trem, navios e autoestradas conectando cidades, países e continentes, de uma forma que jamais foi possível antes, provoca um vaivém sem fim dos mais diversos tipos de viajante. O risco de uma epidemia se alastrar é muito maior do que no tempo em que, para cruzar continentes, dependia-se de caravelas e de um grupo bastante reduzido de intrépidos aventureiros. Citado no livro Linked (2002) de Barabási e Albert, o caso do comissário de bordo chamado Gaëtan Dugas apontado como o paciente zero da epidemia de Aids assustou a todos na década de 1980. O caso de Gaëtan Dugas ficou conhecido porque, das 248 pessoas diagnosticadas com Aids no ano de 1982, pelo menos 40 delas relataram ter tido contato sexual com Dugas ou com alguém que havia praticado sexo com ele. Dugas foi apontado como o centro de uma rede sexual composta de pessoas em diversos pontos, tais como São Francisco, Nova York, Califórnia e Flórida. Em redes complexas, vértices como Dugas são conhecidos como hubs, nós conectados a muitos outros nós. Esses nós têm um grau mais alto que o grau médio da rede. Neste caso específico, o vértice Dugas serviu como agente infectante, dando início a uma epidemia. Da mesma forma que um vírus infecta pessoas por meio do contato físico passando adiante sua carga genética, o mesmo conceito pode ser aplicado a pragas do mundo virtual, quando, por exemplo, uma pessoa com centenas de contatos em seu programa de email decide encaminhar uma figura bonitinha de um cachorrinho carregando um trojan ou worm.

Capítulo 1 Indo muito além das redes sociais 35 Em 8 de maio de 2000, um vírus denominado Love Bug infectou milhares de computadores na Europa causando prejuízos estimados em mais de 10 bilhões de dólares, danificando 45 milhões de computadores na Europa e nos Estados Unidos. Obviamente, a gravidade dos assuntos é bastante díspar e não é possível comparar o valor de vidas humanas a cifras monetárias. Contudo o comportamento percebido em ambas as situações, pelo aspecto de redes complexas, é praticamente o mesmo. Identificar os hubs e interromper o tráfego do agente contaminante nesses pontos é muito mais eficiente que atacar aleatoriamente os novos indivíduos infectados, e é exatamente por isso que, quando existe algum indício de epidemias, os principais pontos de controle são aeroportos, portos e todos os locais com grande circulação de pessoas. É possível aplicar a análise de redes sociais na identificação dos hubs, atacando assim os pontos da rede mais efetivos a fim de interromper epidemias. 1.5 Redes de dados e a internet A internet, rede mundial de computadores, conecta todos os continentes utilizando os mais diversos meios para trafegar dados, como conexões por satélite, cabos intercontinentais, redes sem fio, cabos ópticos, dentre muitos outros. A internet interconecta redes. Desde uma pequena rede privada de um prédio residencial até centenas de computadores em campi de grandes universidades. Analogamente a outras redes complexas, a internet apresenta todos os componentes dos quais falamos até o momento: roteadores e hubs, nós centrais altamente conectados que têm o papel de distribuir as informações pela rede, estruturas análogas a comunidades que compartilham características, distribuição de graus que segue a lei de potência, dentre outras características. A rede formada pela internet está ilustrada na figura 1.4.

36 Análise de Redes Sociais Figura 1.4 Grafo representando as conexões da internet Internet map 1024 transparent por The Opte Project. Fonte: Wikipedia. Os websites, por sua vez, têm conexões hiperlinks que os ligam, formando também redes com estruturas que podem ser representadas por meio de grafos. Reunindo estes exemplos é possível compreender por que esse ramo da ciência vem ganhando adeptos a cada dia. Centenas de cientistas da área da computação, sociologia e matemática vêm somando esforços para construir modelos de redes complexas que representem de maneira fiel os fenômenos percebidos no mundo real. Este livro não tem a pretensão de abordar todas as áreas que utilizam redes complexas e grafos, mas sim de servir como uma base sólida dos princípios e das métricas principais que envolvem esta empolgante ciência.