Centro Federal de Educação Tecnológica Celso Suckow da Fonseca CEFET/RJ Big Data & IoT Eduardo Ogasawara eogasawara@ieee.org h1p://eic.cefet-rj.br/~eogasawara
Data Deluge 2
A Era do Big Data Aumento crescente nos dados produzidos no mundo Em 2011 a es;ma;va era de 1.8ZB 10 21 B Presente nos eixos Indústria Serviços (Google, Facebook, etc) Finanças e-commerce Governo Mobilidade urbana Ciência Levantamentos astronômicos (LST) e-science 3
O fenômeno do Big Data 4
O que é Big Data? Datasets que não podem ser capturados, gerenciados ou processados por um único computador convencional 5
Big Data: Características 6
Big Data: Desafios na Gerência de Dados Coleta e armazenamento de dados Transferência de dados Intrasite Intersites Pré-processamento Limpeza de dados Remoção de redundância Carga (ETL) Declínio do princípio de one size fits all 7
Big Data: Armazenamento e Processamento Sistema de arquivos Tecnologia de Banco de Dados Processamento de fluxos de dados 8
Big Data: Armazenamento de Dados Raw Data or Flat Files Direct A]ached Storage (DAS) Network A]ached Storage (NAS) Storage Area Network (SAN) Aspectos de armazenamento distribuído Consistência Disponibilidade Par;cionamento com redundância 9
Big Data: Armazenamento e Consulta a Dados SGBD Relacional Centralizado Amostragem SGBD Relacional Paralelo Dados homogêneos Dados normalizados Carga de dados Controle de concorrência Sistemas No-SQL Chave-valor Colunas Documento Paralelos / UDF paralelas 10
Uso de UDFs Big Data: Processamento de Fluxos Modelo de processamento paralelo de Message Passage Interface (MPI) e Open Mul9processing (OpenMP) podem não ser suficientes Map Reduce Hadoop Spark PigLa;n 11
Big Data Aspectos Arquiteturais e de Negócios 12
Análise de Dados 13
Tipos de análise de dados Tempo real Off-line Em memória Análise centrada em Inteligência de Negócios Análise Massiva de Dados (Hadoop) 14
Ciência de Dados 15
Ciência de dados: desafio para a ciência, indústria e governo 16
Processo Geral de Extração de Conhecimento Classificação, Padrões Frequentes, Agrupamento 17
Como o meio acadêmico aborda a Ciência de Dados No mundo Criação de fóruns específicos (conferências, revistas) Programas de Pós-graduação Mestrados (23 nos EUA) No Brasil Especializações INCT em Ciência de Dados (LNCC, CEFET/RJ, IME, UFPR,...) Programa de Pós-Graduação em Ciência de Dados (PPGCD) do CEFET/RJ Especializações 18
IoT IoT (Internet das Coisas) Cada objeto passa a ser iden;ficado e conectado a rede Objetos funcionam como sensores Aspectos temporais e espaciais 19
IoT: Aplicações Logís;ca monitoramento de veículos o;mização dinâmica de rotas Cidades inteligentes gerenciamento de recursos hídricos redução de conges;onamento iden;ficação de acidentes vagas para estacionamento de carros aumento de segurança Medicina acompanhamento de pacientes Casas inteligentes uso de recursos e cômodos controle de temperatura reconhecimento de faces e iden;ficação de humor alerta de eventos raros 20
Ligação entre IoT e Big Data Hoje não é o principal cenário de Big Data, mas em 2030... 21
Big Data em IoT: Um novo desafio à nossa porta Fabio Porto, Eduardo Ogasawara, Artur Ziviani Mercado de 4 trilhões de dólares (2020) 25 bilhões de disposi;vos 50 trilhões de GB de dados Fontes de dados de alta frequência de transmissão Coleta e armazenamento desses dados 22
Gerência de Dados Amostragem Big Data em IoT: Desafios Agregação Armazenamento espaço-temporal Processamento de grandes volumes de transações em memória Análise de Dados As abordagens de KDD são centralizadas No cenário de IoT os algoritmos precisam ser paralelizados Redução de dimensionalidade e numerosidade Método de Mineração: Classificação, Agrupamento, Padrões Frequentes 23
Considerações Finais Oportunidade de desenvolver artefatos inteligentes Potencial de produção de patentes Cenário muito rico para as pesquisas em: Banco de Dados Mineração de Dados Aprendizado de máquina Ciência de Dados Pressão crescente pela formação dos Cien;stas de Dados Habilidades diferenciadas 24
Referências [1] J. Gubbi, R. Buyya, S. Marusic, and M. Palaniswami, 2013, Internet of Things (IoT): A Vision, Architectural Elements, and Future Direc;ons, Future Gener. Comput. Syst., v. 29, n. 7 (Sep.), p. 1645 1660. [2] D. Miorandi, S. Sicari, F. De Pellegrini, and I. Chlamtac, 2012, Internet of things: Vision, applica;ons and research challenges, Ad Hoc Networks, v. 10, n. 7 (Sep.), p. 1497 1516. [3] L. Atzori, A. Iera, and G. Morabito, 2010, The Internet of Things: A survey, Computer Networks, v. 54, n. 15 (Oct.), p. 2787 2805. [4] F. Chen, P. Deng, J. Wan, D. Zhang, A.V. Vasilakos, X. Rong, F. Chen, P. Deng, J. Wan, et al., 2015, Data Mining for the Internet of Things: Literature Review and Challenges, Data Mining for the Internet of Things: Literature Review and Challenges, Interna9onal Journal of Distributed Sensor Networks, Interna9onal Journal of Distributed Sensor Networks, v. 2015, 2015 (Aug.), p. e431047. [5] C.-W. Tsai, C.-F. Lai, M.-C. Chiang, and L.T. Yang, 2014, Data Mining for Internet of Things: A Survey, IEEE Communica9ons Surveys Tutorials, v. 16, n. 1 (First.), p. 77 97. [6] C. Perera, C.H. Liu, S. Jayawardena, and M. Chen, 2014, A Survey on Internet of Things From Industrial Market Perspec;ve, IEEE Access, v. 2, p. 1660 1679. [7] M. Chen, S. Mao, and Y. Liu, 2014, Big Data: A Survey, Mobile Networks and Applica9ons, v. 19, n. 2 (Jan.), p. 171 209. [8] R.-I. Ciobanu, V. Cristea, C. Dobre, and F. Pop, 2014, "Big Data Pla}orms for the Internet of Things", In: N. Bessis and C. Dobre, eds., Big Data and Internet of Things: A Roadmap for Smart Environments, Springer Interna;onal Publishing, p. 3 34. 25