CENTRO UNIVERSITÁRIO UNISEB TRABALHO DE CONCLUSÃO DE CURSO BACHARELADO EM CIÊNCIAS DA COMPUTAÇÃO

Tamanho: px
Começar a partir da página:

Download "CENTRO UNIVERSITÁRIO UNISEB TRABALHO DE CONCLUSÃO DE CURSO BACHARELADO EM CIÊNCIAS DA COMPUTAÇÃO"

Transcrição

1 CENTRO UNIVERSITÁRIO UNISEB TRABALHO DE CONCLUSÃO DE CURSO BACHARELADO EM CIÊNCIAS DA COMPUTAÇÃO FERRAMENTA DE MARKETING COM RECOMENDAÇÕES PERSONALIZADAS Leonardo Meloni Washington Jorge de Oliveira Orientador: Prof. MSc. Reginaldo Aparecido Gotardo RIBEIRÃO PRETO 2011

2 LEONARDO MELONI WASHINGTON JORGE DE OLIVEIRA FERRAMENTA DE MARKETING COM RECOMENDAÇÕES PERSONALIZADAS Trabalho de conclusão de curso apresentado ao UniSEB COC de Ribeirão Preto, como parte dos requisitos para obtenção do grau de Bacharel em Ciências da Computação. Orientador: Prof. MSc. Reginaldo Aparecido Gotardo RIBEIRÃO PRETO 2011

3 Ficha Catalográfica M517f Meloni, Leonardo. Oliveira, Washington Jorge. Ferramenta de marketing com recomendações personalizadas. Leonardo Meloni; Washington Jorge Oliveira. - Ribeirão Preto, f.. il. Orientador: Prof. Me. Reginaldo Aparecido Gotardo. Trabalho de conclusão de curso apresentado ao Centro Universitário UNISEB de Ribeirão Preto, como parte dos requisitos para obtenção do Grau de Bacharel em Ciências da Computação sob a orientação do Prof. Me. Reginaldo Aparecido Gotardo. 1. Marketing. 2. Personalização e Recomendação. 3. Mineração de Dados. I. Título. II. Gotardo, Reginaldo Aparecido. CDD

4 TRABALHO DE CONCLUSÃO DE CURSO Aluno: Leonardo Meloni Aluno: Washington Jorge de Oliveira Código: 6186 Código: 5887 Curso: Ciências da Computação Curso: Ciências da Computação Semestre/Ano: 8º/2011 Semestre/Ano: 8º/2011 Tema: Ferramenta de Marketing com Recomendações Personalizadas. Objetivos pretendidos: Pesquisa sobre marketing e como utilizá-lo através da facilidade e abrangência da internet. Desenvolvimento de uma ferramenta que atenda aos requisitos das normas do Marketing. Direcionar os s de acordo com as preferências dos usuários e estabelecer uma experiência melhor nestas comunicações. / / Reginaldo Aparecido Gotardo Professor Orientador / / Leonardo Meloni Aluno / / Washington Jorge de Oliveira Aluno / / Paulo Cesar de Carvalho Dias Coordenador do Curso / / Reginaldo Arthus Diretor Geral

5 Dedicatória Aos meus pais e meus irmãos, pela fé, crédito e apoio - Leonardo Aos meus pais, irmã e namorada, pela fé, crédito e apoio - Washington II

6 Agradecimentos À Deus por proporcionar-nos a dádiva da vida e permitir a conclusão deste trabalho de conclusão de curso, nos dando sabedoria, fé e persistência para não desistir de realizar nossos sonhos. As nossas famílias e amigos, que acreditaram em nós e nos deram forças para poder concluir esta jornada, mesmo estando mais distante de todos em virtude desta etapa acadêmica. Ao nosso orientador, professor MSc. Reginaldo Aparecido Gotardo, que pode nos dar um caminho a seguir, sempre nos apoiando com a sua paciência, dedicação e confiança em nosso trabalho. III

7 Epígrafe Se me acredito capaz de fazer algo, o farei, mesmo que eu não tenha capacidade de começar... Mahatma Ghandi IV

8 Resumo O Marketing é uma ferramenta publicitária que surgiu da oportunidade criada da evolução constante da internet. De acordo com uma pesquisa da ForeSee o maior número de visitantes à sites de e-commerce foram conquistados pela ferramenta de e- mail marketing. À medida que a internet se popularizou e se tornou mais acessível surgiu a necessidade das empresas de investir em um novo meio publicitário que proporcionasse uma forma mais direta e com menor custo, atingindo um maior número de pessoas e obtendo resultados positivos. A ferramenta trata do envio de e- mails para pessoas que permitiram o envio e foram cadastradas em um banco de dados, isto é, a utilização do como ferramenta de marketing direto. Deve ser totalmente confiável, pois ela é muitas vezes responsável pelo relacionamento entre o cliente e a empresa. As técnicas de personalização de conteúdo são aplicadas para descobrir padrões de interesse dos usuários de um sistema e oferecer opções adaptáveis a estes. Isto pode tornar uma ferramenta de marketing direto mais eficaz, pois os usuários terão seus interesses tratados de maneira específica e, assim, haverá menos chances de que este descarte as mensagens enviadas. A recomendação personalizada ocorre por meio da mineração de dados, que é uma área de pesquisa multidisciplinar e tem como objetivo a análise de registros extraídos de um banco de dados, que contém informações sobre os clientes e seus hábitos. Esse banco de dados a principio é alimentado com informações básicas dos clientes, por meio dos disparos de s, os perfis dos clientes vão sendo atualizados na base de dados. Neste trabalho foi estudado e a implementada uma ferramenta que pode gerenciar e realizar este marketing direto personalizado, para isso, foram utilizados algoritmos que implementam as técnicas de associação e recomendação. Com isso, o objetivo final da ferramenta desenvolvida é atingir o público alvo de maneira eficiente. Palavras-Chaves: Marketing, Personalização e Recomendação, Mineração de Dados. V

9 Abstract The Marketing is an advertising tool that arose from the opportunity created by the constant internet evolution. As the internet caught on and became more accessible the necessity from the companies to invest in a different advertising circle that offers an straight and less cost results just appear, reaching a bigger number of people and being successful. This tool talks about how to send out for registered people in a database that is, using the as a tool for direct marketing. It has to be totally trustful, because most of the time it s responsible for the relationship between client and company. The customize content techniques are applied to discover interest patterns from the users of a system and offer them options. This can make a direct marketing tool more effective, due the users will have their interest sort out in a specific manner, this way it will have less change them get rid of the messages. The personalized recommendation occurs through data mining that is a multidisciplinary research area and has the objective to analyze information taken from a database that has information about the clients and their habits. The proposal from this paper is the study and the implementation of a tool that can manager and do this personalized direct marketing, for this, it will be used algorithm that implement association and recommendation techniques. So, the final aim from this paper is to reach the target public in a effective manner. Key words: Marketing, Personalization and recommendation, Data Mining. VI

10 SUMÁRIO 1. INTRODUÇÃO Os benefícios do uso da Internet no marketing direto para uma organização Objetivos Motivação Organização do Trabalho MARKETING Marketing Órgãos Regulamentadores e o Código de Auto-Regulamentação Definição de SPAM Diferenças e vantagens entre Marketing e Mala Direta Marketing de telefonia móvel Meio de aceitação Relevância do conteúdo Considerações SISTEMAS DE RECOMENDAÇÃO E MINERAÇÃO DE DADOS Personalização na Web Sistemas de Recomendação Mineração de Dados Considerações Iniciais Pré-Processamento de Dados Limpeza dos Dados Valores Ausentes Dados Ruidosos Integração dos Dados Redundância dos Dados Detecção e resolução de valores conflitantes VII

11 Integração de esquemas internos Transformação de dados Normalização Redução Medidas de Similaridade Diferenças entre objetos Semelhanças entre objetos Medidas de Semelhança para Dados Binários Classificação O Algoritmo K-Means Análise de Agrupamentos Mineração de Regras de Associação Técnicas para regra de Associação Apriori Formalizando o problema O algoritmo Apriori FERRAMENTA DE MARKETING Detalhes Técnicos Ferramenta de Marketing Ferramenta Personalizada AVALIAÇÃO Utilização da Ferramenta para obtenção dos Dados Estudo de Caso 1 Aplicação do algoritmo de Apriori Estudo de Caso 2 Aplicação do algoritmo de K-means Estudo de Caso 3 Criação e Envio de uma campanha CONCLUSÕES Discussão sobre os Resultados Trabalhos Futuros REFERÊNCIAS BIBLIOGRÁFICAS VIII

12 Lista de Figuras Figura Divisão dos Sistemas computacionais segundo (GOTARDO, 2008) Figura 3. 2 Estrutura dos Sistemas de Recomendação Fonte: BARCELLOS (2007) Figura 3. 3 Recomendação em Websites de e-commerce: indicação de quem comprou Figura 3. 4 Recomendação em Websites de e-commerce: possibilidade de avaliar o produto e deixar uma opinião Figura 3. 5 Fases do KDD Figura 3. 6 Fases do Pré-Processamento Figura 3. 7 Gráfico que representa uma regressão Figura 3. 8 Representação de agregação via cubo Figura 3. 9 Representação da compressão de dados Figura Quatro pontos bidimensionais Figura Ilustração Geométrica da medida de cosseno Figura Matriz de dissimilaridade Figura Funcionamento do algoritmo k-means para k = Figura Ilustração de dados distribuídos em grade Figura Exemplo de construção de itemsets candidatos de tamanho k a partir de itemsets frequentes de tamanho k Figura 4. 1 Cadastro de clientes na ferramenta Figura 4. 2 Processo de envio de mensagens pelo administrador Figura 4. 3 Disponibilidade de cancelamento do recebimento de s Figura 4. 4 Processo de criação de modelos off-line Figura 4. 5 Processo de envio de mensagens pelo administrador com a base atualizada após a mineração de dados Figura Informações obtidas por meio do algoritmo de Apriori Figura 5. 2 Relatório obtido por meio do algoritmo de Apriori Figura 5. 3 Classificação das áreas de interesse similares por meio do Algoritmo de K-means IX

13 Figura 5. 4 Relatório gerado pelo algoritmo de K-means para auxilio na tomada de decisão. 63 Figura 5. 5 Relatório gerado pelo algoritmo de Apriori para auxilio na tomada de decisão Figura 5. 6 Seleção das áreas para realização do disparo da campanha X

14 Lista de Tabelas Tabela 3. 1 Características Únicas da Web segundo LIU (2007) Tabela 3. 2 Coordenadas X e Y Tabela 3.3 Matriz de distância Euclidiana para Tabela Tabela 3.4 Representação numérica dos produtos do supermercado Tabela 3.5 Registros de transações em um banco de dados Tabela 3.6 Suporte de itemsets XI

15 Siglas e Abreviaturas ABEMD Associação Brasileira de Marketing Direto ABRADI Associação Brasileira das Agências Digitais ABRANET Associação Brasileira dos Provedores de Internet ABRAREC Associação Brasileira das Relações Empresa Cliente AGADI Associação Gaúcha das Agências Digitais AMA American Marketing Association APADI Associação Paulista das Agências Digitais ARF Advertising Research Foundation CGI.br Comitê Gestor da Internet no Brasil Codeigniter Framework de desenvolvimentos de aplicações PHP CSS Cascading Style Sheets FECOMÉRCIO-RS Federação do Comércio do Estado do Rio Grande do Sul FECOMÉRCIO-SP Federação do Comércio do Estado de São Paulo FEDERASUL Federação das Associações Comerciais e de Serviços do Rio Grande do Sul IAB Interactive Advertising Bureau IHC Interface Humano-Computador INTERNETSUL Associação Rio Grandense dos Provedores de Acesso, Serviços e Informações da Rede Internet JQuery Biblioteca JavaScript para simplificar o desenvolvimento de páginas HTML KDD - Knowledge Discovery in Databases MMS Multimedia Messaging Service MVC - Model-view-controller PHP Hypertext Preprocessor PRO TESTE Associação Brasileira de Defesa do Consumidor SEPRORGS Sindicato das Empresas de Informática do Rio Grande do Sul XII

16 SGBD Sistema de Gerenciamento de Banco de Dados SMS Short Message Service SMTP Simple Mail Transfer Protocol SPIM Spam via Internet Messenger SPIT Spam over Internet Telephony SQL - Structured Query Language SR Sistema de Recomendação UCE - Unsolicitec Commercial Web World Wide Web XHTML Xtensible Hypertext Markup Language XIII

17 Capítulo 1. Introdução 1 1. Introdução Atualmente, a internet está cada vez mais presente no dia-a-dia das pessoas. Por meio dela, é possível interagir tanto com um vizinho quanto ultrapassar fronteiras e interagir com uma pessoa de outro país ou continente sem ter que sair do conforto de sua casa. Todas essas facilidades disponíveis ao alcance de um clique permitem um meio de comunicação que evidencia um novo meio de exploração de marketing e proporciona um resultado mais efetivo, rápido e de menor custo, isto é, é possível atingir um maior número de pessoas com a velocidade da internet e sem os custos de contratação de mídias sociais. Este capítulo apresenta a descrição do trabalho desenvolvido, abordando na seção 1.1, a importância e relevância da internet em proporcionar resultados positivos para as empresas que invistam nesse meio de comunicação; na seção 1.2 são apresentados os objetivos previstos deste trabalho; na seção 1.3 são citados os fatores que motivam a elaboração e conclusão deste trabalho e na seção 1.4 é apresentada a organização deste trabalho Os benefícios do uso da Internet no marketing direto para uma organização Com a internet é possível atingir um grande número de pessoas de diferentes localidades, sabendo disso as empresas possuem uma nova maneira de investir na divulgação de informações e produtos e atingir seu público-alvo. Além disso, a internet possibilita meios para demonstração de produtos através de catálogos online que podem ser oferecidos, o que aproxima ainda mais o cliente da empresa, sendo assim a internet é considerada uma técnica de atração ao contrário das técnicas tradicionais de marketing que tendem a empurrar o produto para o cliente. A internet também melhora os serviços ao cliente, pois permite que eles naveguem onde e quando quiserem, é também um meio barato, pois possibilita auto-atendimento, e vendas online descartando os vendedores físicos. Sendo essa uma das grandes vantagens, o seu baixo custo.

18 Capítulo 1. Introdução Objetivos Neste trabalho de conclusão de curso são apresentadas várias formas de personalização e recomendação de s de campanhas publicitárias. Estes conceitos estão relacionados a uma personalização Web que seja capaz de atender as necessidades e interesses dos usuários de acordo com seu perfil. O método utilizado para esta recomendação personalizada é a Mineração de Dados, que neste projeto tem a função de obter padrões por meio da análise de perfis dos clientes, sugerindo recomendações que atinjam diretamente o interesse do mesmo. Este trabalho de conclusão apresenta a elaboração de uma ferramenta Web que permite disparos de s personalizados, que são enviados para clientes que possuam um perfil com características que determinam um interesse relevante ao conteúdo da publicidade, além disso, são obtidas informações sobre os s enviados, e por meio destas, utilizadas para atualização de perfil de cada cliente selecionado como destinatário Motivação As pessoas utilizam a Web como uma fonte rápida de obter informações e isto se tornou essencial no dia-a-dia de todos, seja para fins profissionais ou apenas para o lazer. Por isso,as pessoas são alvos de todo tipo de apelo visual e publicitário, muitas vezes indesejáveis, nas páginas web ou . Seguindo essa ideia, a personalização e direcionamento de disparos de s por meio do perfil de cada usuário mostram uma preocupação direta com o cliente, pois evita recebimentos indesejáveis de campanhas publicitárias. Com o auxílio da mineração de dados para a análise de uma grande base de dados utilizando técnicas computacionais para extração e obtenção de padrões desejados, é possível auxiliar na tomada final de decisão. Dentro desse conceito algumas técnicas de classificação tais como mineração de regras de associação e análise de agrupamentos, são abordadas

19 Capítulo 1. Introdução 3 para uma melhor extração de padrões, e assim sempre atingir clientes com um grau de interesse elevado, evitando a insatisfação do mesmo Organização do Trabalho forma: Este trabalho está organizado em 4 capítulos, descritos da seguinte No Capítulo 2, Marketing, é apresentado a definição do tema e os órgãos regulamentadores sobre marketing, além da definição do que é um SPAM e um possível meio de marketing. No Capítulo 3, Sistemas de Recomendação e Mineração de Dados, são descritos conceitos envolvidos na personalização Web que embasam o foco deste trabalho. No Capítulo 4, Ferramenta de Marketing, é descritas as tecnologias envolvidas na elaboração da ferramenta desenvolvida, além da apresentação do seu funcionamento por meio de diagramas.

20 Capítulo 2. Marketing Marketing O marketing é uma evolução do meio tradicional utilizado por meio da mala direta. Com a constante evolução dos meios de comunicações e do seu grande poder de presença no cotidiano das pessoas, o marketing se tornou um candidato natural a assumir esta posição no mercado com maior destaque. Não é uma solução que acabará a princípio com os meios já existentes, mas à medida que a conscientização e a preocupação com o meio ambiente aumentam, evidenciam a busca por novas fontes ecologicamente corretas colocando o marketing neste posto Marketing O Marketing tem sua história marcada por três filosofias, de acordo com os autores LONGENECKER, MOORE e PETTY (1999). A primeira filosofia está voltada para a produção. A segunda filosofia está voltada para as vendas e a terceira filosofia está voltada para o consumidor. Apesar das três filosofias citadas, segundo os autores, o essencial é utilizar-se do marketing pensando no consumidor, haja vista, que a terceira filosofia irá suprir ao mesmo tempo, de forma eficiente, tanto as metas de produção como a de vendas. A palavra Marketing possui várias definições na literatura de acordo com o entendimento de cada autor. Segundo GRACIOSO (1997), uma definição mais ampla para o termo Marketing de acordo com a AMA 1 (American Marketing Association), pode-se afirmar: é a planificação e execução de um conjunto de atividades comerciais, tendo como objetivo final a troca de produtos, ou serviços, entre produtores e consumidores. Em KOTLER e KELLER, (2006), marketing é um processo social por meio dos quais pessoas e grupos de pessoas obtêm aquilo de que necessitam e o que desejam com criação, oferta e livre negociação de produtos e serviços de valor com outros. Outra definição é a entrega de satisfação para o cliente em forma de benefício 1 A American Marketing Association (AMA) é uma associação profissional de indivíduos e organizações que estão liderando a prática, o ensino e o desenvolvimento do marketing no mundo.

21 Capítulo 2. Marketing 5 (KOTLER e ARMSTRONG, 1999). Marketing são atividades sistemáticas de uma organização humana voltada à busca e a realização de trocas para com o seu meio ambiente, visando benefícios específicos (RICHERS,1986). Portanto, apesar de várias definições, o marketing sempre está voltado à necessidade de se comprar produtos ou serviços de interesse do consumidor, aliado aos resultados esperados pela empresa que realiza a negociação. Atualmente, com a evolução constante da tecnologia, novos canais ou mídias de comunicação de marketing são criados, a popularidade da internet aliado ao seu grande poder, seja de custo, agilidade e penetração na vida cotidiana, foi capaz de abrir novos horizontes antes não explorados. A forma de se pensar na prática de marketing foi remodelada, adaptando-se ao novo meio disponibilizado. O Marketing é uma mensagem de correio eletrônico enviada e recebida pela internet com a intenção de divulgar ou ofertar produtos e serviços de determinada empresa, manter o relacionamento com a base disponível de clientes ou ainda, disponibilizar atendimento ao consumidor. As características do Marketing estão fundamentadas no respeito aos destinatários das ações realizadas pelas empresas, desta forma, o uso adequado da internet propiciará que os resultados desejados possam ser alcançados, fortalecendo-se assim a sua marca, sua transparência como empresa idônea, estreitando o relacionamento com o cliente de forma sólida e de confiança mútua. Para realizar o Marketing existe um Código de Auto- Regulamentação 2 no portal da ABEMD que determina as regras a serem seguidas Órgãos Regulamentadores e o Código de Auto-Regulamentação Com a crescente expansão do número de usuários de internet no Brasil, o marketing é uma mídia de destaque e interesse das empresas, cada 2 Guia de boas práticas do portal da ABEMD. Boas maneiras nas ações de marketing. Disponível em: <http://www.abemd.org.br/autoregulamentacao/boasmaneiras.aspx>. Acessado em: 02 fev

22 Capítulo 2. Marketing 6 vez mais, estas vêm trabalhando suas campanhas de marketing utilizando este meio de comunicação, visando os bons resultados inerente a essa prática. Segundo dados do CGI.br 3 (Comitê Gestor de Internet), o Brasil possui cerca de 54 milhões de usuários com acesso a internet e de acordo com o E- bit 4, 20 milhões de pessoas que compraram pela internet ao menos uma vez durante o primeiro semestre de 2010, com previsão de atingir ao número de 23 milhões até o final do segundo semestre conforme o boletim Webshoppers (2010), publicado pela e-bit. Desta forma, com o aumento gradativo a cada ano do número de internautas e E-consumidores 5 em nosso país, assim como o aumento de computadores nas residências somados ao acesso a internet, foi elaborado o Código de Auto-Regulamentação para regulamentar as práticas de envio de E- mail Marketing, tendo em vista a intenção da própria indústria em melhorar o seu uso. Este código que rege o envio de mensagens eletrônicas de marketing aos consumidores e foi criado pela ABEMD (Associação Brasileira de Marketing Direto) em iniciativa conjunta com outras entidades ligadas à prática do marketing direto: ABRADI (Associação Brasileira das Agências Digitais), ABRANET (Associação Brasileira dos Provedores de Internet), ABRAREC (Associação Brasileira das Relações Empresa Cliente), AGADI (Associação Gaúcha das Agências Digitais), APADI (Associação Paulista das Agências Digitais), CGI.br (Comitê Gestor da Internet no Brasil), FECOMÉRCIO-RS (Federação do Comércio do Estado do Rio Grande do Sul), FECOMÉRCIO-SP (Federação do Comércio do Estado de São Paulo), FEDERASUL (Federação das Associações Comerciais e de Serviços do Rio Grande do Sul), IAB (Interactive Advertising Bureau), INTERNETSUL (Associação Rio Grandense dos Provedores 3 CGI.br - O Comitê Gestor da Internet no Brasil (CGI.br) foi criado pela Portaria Interministerial nº 147, de 31 de maio de 1995 e alterada pelo Decreto Presidencial nº 4.829, de 3 de setembro de 2003, para coordenar e integrar todas as iniciativas de serviços Internet no país, promovendo a qualidade técnica, a inovação e a disseminação dos serviços ofertados. 4 E-bit - Presente no mercado brasileiro desde 1999, a e-bit conquistou destaque no desenvolvimento do comércio eletrônico no país tornando-se referência em informações de e-commerce. 5 E-consumidores são pessoas que usam a web para ir além da compra, não são como os consumidores comuns, que simplesmente entram na loja A ou B e compram. Esses novos consumidores querem mais do que entrar em uma loja e comprar, querem se relacionar com a marca e ter a oportunidade de pesquisar, comparar preços, vantagens, serviços. Não se baseiam apenas no preço, mas também em todo o contexto oferecido pela loja, em suas promessas e, principalmente, no cumprimento dessas.

23 Capítulo 2. Marketing 7 de Acesso, Serviços e Informações da Rede Internet), PRO TESTE (Associação Brasileira de Defesa do Consumidor), SEPRORGS (Sindicato das Empresas de Informática do Rio Grande do Sul). De acordo com a CGI.br, o Código de auto-regulamentação para prática de marketing regulamenta segundo o Artigo 1º : O presente Código tem por objeto definir as regras a serem seguidas para a utilização de como ferramenta de marketing, de forma ética, pertinente e responsável, sem prejuízo da concomitante aplicação da legislação vigente aplicável Definição de SPAM SPAM é um termo usado para a prática de enviar mensagem de correio eletrônico a vários destinatários sem o seu consentimento. Estas mensagens quando são exclusivamente comerciais podem ser classificadas como UCE (Unsolicitec Commercial ) comercial não solicitado e, como apresenta em sua grande maioria um caráter publicitário apelativo, tornam-se inconvenientes e incômodos para o receptor. Com o desenvolvimento e a popularização da internet houve um grande impacto na vida e na maneira das pessoas se comunicarem. A internet tornouse um meio de comunicação muito importante e com sua evolução surgiu uma maneira de inovar o negócio, tornando mais fácil e ágil a busca por informações. Entretanto, com todo esse avanço que ajudou a viabilizar a globalização de diversas áreas da economia e do conhecimento, surgiram diversas práticas boas e ruins. Simultaneamente a toda essa revolução na forma como a internet se tornava importante às vidas das pessoas e empresas, um fenômeno surgiu se tornando uns dos principais problemas da comunicação, o envio não solicitado de mensagens em massa. Tal prática ficou conhecida como spamming, os autores das mensagens como spammers e a mensagem enviada como spam. O envio de cartas correntes para obtenção de dinheiro e os panfletos distribuídos nas ruas, assim como ligações telefônicas para ofertar produtos a

24 Capítulo 2. Marketing 8 possíveis consumidores, são considerados os precursores do spam. Porém, agir desta forma demanda certo investimento e trabalhar em grande escala pode inviabilizar sua distribuição. Com a internet e seu grande avanço em disponibilizar um canal de acesso rápido e fácil, exigindo um investimento menor e com abrangência maior em sua distribuição, disseminou-se dessa forma o envio de spam. De acordo com o site Antispam.br define-se como o nascimento oficial do spam na rede mundial, a data de 05 de março de 1994, quando dois advogados, Canter e Siegel, enviaram aos usuários de um grupo de discussão da USENET, uma mensagem sobre a loteria de Green Cards americanos, algo considerável inconcebível, pois se tratava de um assunto totalmente fora do foco do assunto em discussão. Posteriormente, na data de 12 de abril de 1994, por meio do uso de um programa automatizado para envio em massa, a mesma mensagem foi distribuída para vários grupos de discussões dentro da USENET, causando dessa forma uma reação negativa e comprometendo o desempenho da rede devido ao grande volume de mensagens trocadas. Desde então, esta característica ficou conhecida como um efeito colateral que o spam pode causar. A origem do termo spam usado para caracterizar o envio de correio eletrônico indesejado, surgiu logo após, durante as diversas discussões sobre o fato ocorrido, fazendo referência a uma cena do programa de TV do grupo inglês Monty Phyton, onde um grupo de vikings está reunido em uma taverna, recitando por diversas vezes em um texto chato e repetitivo, a palavra spam, referindo-se ao um enlatado de presunto condimentado americano fabricado pela Hormel Foods, o SPAM. Assim, uma reação de incomodo e perturbação foi experimentada pelos usuários da USENET ao receberem por diversas vezes a mesma mensagem. Vários tipos de spam surgiram após a sua criação, sejam eles apenas correntes ou publicidades até crimes praticados por meio de s com códigos maliciosos capazes de lesar o destinatário. Atualmente, o spam pode ser classificado como correntes, boatos, lendas urbanas, propagandas, ameaças, pornografia, códigos maliciosos (vírus,

25 Capítulo 2. Marketing 9 worms e trojans), fraudes, estelionato e golpes, SPIM (spam via Internet Messenger), spam via redes sociais e SPIT (spam over internet telephony) Diferenças e vantagens entre Marketing e Mala Direta Mala direta é um sistema para divulgação de produtos, serviços ou apenas informações, focada em atingir diretamente o consumidor final. Uma mensagem, comunicado ou alerta que é enviado para um grande número de pessoas sob um mesmo modelo, é considerado mala direta. O envio de marketing em comparação à mala direta é superior, pois para o envio de uma mala direta seria necessário dias ou até semanas, devido a impressão do material e a demora dos correios. Já o envio do marketing poderia ser feito em apenas um dia. O baixo custo de uma campanha de marketing também é um diferencial e uma vantagem em comparação a campanha impressa, que exige grande investimento para causar um efeito significativo. Além de receber relatório com informações das ações dos clientes. A aceitação dos usuários também é uma diferença para se destacar, enquanto a mala direta quase nunca possui um retorno positivo, o marketing possui um maior número de aceitação e retorno positivo Marketing de telefonia móvel O marketing de mídias digitais, como a internet e a telefonia móvel, promove um poderoso meio para se chegar aos consumidores, pois permite uma interatividade e personalização do conteúdo e contexto da mensagem. A resposta do consumidor à mensagem recebida está fortemente ligada a sua relevância e a aceitação de recepção da mensagem. Desta forma, quanto maior for a personalização da mensagem ao destinatário e que atenda aos seus interesses, maiores são as chances de se realizar uma transação de sucesso.

26 Capítulo 2. Marketing 10 Hoje em dia viver em um mundo globalizado cuja evolução tecnológica é constante, proporciona a todos a facilidade de acesso a novas tecnologias com mais recursos e vantagens a um preço cada vez menor. Com esta evolução surgiram novos canais ou mídias de comunicação de marketing, assim como o , SMS 6 (Serviço de Mensagens Curtas) e MMS 7 (Serviço de Mensagens Multimídias). Estas mídias digitais são consideradas pelo potencial de melhorar as possibilidades de chegar aos consumidores. Simultaneamente a esse avanço, existe uma desvantagem potencial ao uso dos novos meios digitais. O aumento do número de mídias tem levado a uma dura competição para ganhar a atenção do consumidor. Hoje em dia é afirmado que os consumidores são independentes, individualistas, envolvidos e informados, o que torna ainda mais difícil de conduzir uma comunicação baseada em interrupção. De acordo com um estudo de (FORRESTER, 2001) companhias usando SMS expressaram medo por invasão da privacidade do consumidor (80%) e reação negativa dos consumidores (60%) como uma desvantagem de mídia. Tradicionalmente, as estratégias de comunicação de marketing têm sido baseadas na lógica de interrupção, na qual os consumidores são forçados a prestar atenção. Para resolver isto, tem-se argumentado que os benefícios das empresas em conseguir a permissão dos consumidores possam ser concatenados, tornado mais fácil chegar a eles por meio de mensagens publicitárias. Entretanto, a permissão não é necessariamente uma garantia de que o consumidor irá prestar atenção. Uma questão crucial é descobrir que tipos de obstáculos existem para que se possam usar os meios móveis em seu total potencial. Com o marketing móvel a comunicação de marketing pode ser alcançada com o consumidor em qualquer lugar e a qualquer hora. 6 SMS Serviço de Mensagens Curtas (em inglês: Short Message Service, é um serviço disponível em telefones celulares digitais que permite o envio de mensagens curtas, sendo 255 caracteres em GSM ou 160 caracteres em CDMA). 7 MMS Serviço de Mensagens Multimídias (em inglês: Multimedia Messaging Service) é uma tecnologia que permite aos telefones celulares enviar e receber mensagens multimídias. É uma evolução do SMS, permitindo adicionar recursos audiovisuais, como imagens, sons e gráficos.

27 Capítulo 2. Marketing 11 Diferentes modelos de eficácia de mídia têm sido usados para mensurar o sucesso da comunicação de marketing para chegar aos consumidores. O melhor modelo para comparação da eficiência de campanhas publicitárias é provavelmente o primeiro modelo publicado pela ARF 8. O modelo original contém seis estágios ou níveis de hierarquia dos efeitos da publicidade: veículo de distribuição, veículo de exposição, exposição de publicidade, percepção a publicidade, comunicação da publicidade e vendas. Um modelo atualizado incluiu as novas mídias digitais e criou oito níveis de hierarquia de desempenho; distribuição por veículos, exposição de veículos, exposição de publicidade, publicidade de atenção, publicidade de comunicação, publicidade de persuasão, publicidade de resposta e reposta de vendas. É crucial aos comerciantes conhecer os consumidores que estão abertos e suscetíveis a comunicação de marketing móvel. Considerando o atual estado de conhecimento relativo ao meio móvel, existe uma necessidade de explorar como os consumidores reagem a diferentes mídias. A resposta dos consumidores é modelada como uma função do consumidor baseada na relevância do conteúdo da comunicação de marketing e aceitação/perturbação dos meios de marketing. Uma mídia é considerada efetiva quando estiver baseada em como os consumidores respondem a comunicação de marketing. A resposta do consumidor esta na reflexão do consumidor ao valor percebido na comunicação. Desta forma a comunicação de marketing deveria ter valor para o consumidor e seria avaliada de acordo com as necessidades de informação do consumidor relativos ao contexto e conteúdo. Construído sobre um serviço de modelos de qualidade, dois valores criam dimensões: a dimensão técnica e a dimensão funcional, que se referem ao resultado (o quê) e ao processo (como) respectivamente. Segundo 8 ARF Advertising Research Foundation é uma organização sem fins lucrativos para associação de membros corporativos, com sede em Nova York, e fundada em 1936 pela Associação Nacional dos Anunciantes e Associação Americana de Agências de Publicidade, que supervisiona a pesquisa de mídia e trabalha no sentido de "marketing mais rentáveis por meio de uma investigação mais eficaz e lançou o seu primeiro modelo em 1961.

28 Capítulo 2. Marketing 12 DUCOFFE, ([1995,1996]) que conceitualizou valor da publicidade baseado no conteúdo(o quê) e na forma (como). Ele definiu o valor da publicidade como uma representação global do valor da publicidade para os consumidores. (HARVEY, p.22) Meio de aceitação Os efeitos da mídia e das mensagens de publicidade são de interesse, pois uma nova mídia interativa permite mais contato direto com o consumidor. A resposta e atenção do consumidor a publicidade é influenciada pelas situações (onde e quando), na qual o consumidor recebe a mensagem. Por causa da interatividade e da natureza pessoal de cada indivíduo, o consumidor pode estar em várias situações diferentes quando receber a mensagem. O meio influencia a resposta do consumidor aumentando a aceitação senão houver perturbação ao que ele esteja fazendo no momento. Se o consumidor considerar uma perturbação receber estas mensagens, isto afetará negativamente a aceitação e percepção do contexto da mensagem enviada. Em contrapartida, o meio também pode melhorar a aceitação se estiver retratado de forma apropriada para uma comunicação de publicidade específica. O conceito de intrusão influencia a percepção do consumidor à mensagem enviada e pode ser útil para descrever como sentimentos negativos surgem das publicidades, assim como, a irritação, levar ao comportamento de esquiva, distração, intrusão, invasão e obstrução. A natureza da comunicação de marketing direto pode também ultrapassar a fronteira da discrição e invadir a privacidade do consumidor, como por exemplo, um não autorizado ou um spam são considerados uma invasão de privacidade, pois o dado está sendo manipulado por terceiros, e isso tem se tornado atualmente um sério problema para vários consumidores. Interrupções podem ser intrusivas quando não são esperadas, como por exemplo, consumidores recebem mensagens quando estão em um shopping ou em uma reunião, o horário e o lugar pode influenciar a resposta e

29 Capítulo 2. Marketing 13 consequentemente diminuir a atenção do consumidor para a mensagem de publicidade e pode ser relatado também como um problema Relevância do conteúdo Outro aspecto importante que influencia a resposta do consumidor é o seu interesse sobre determinado assunto e a relevância (o quê) que este assunto tem sobre determinado consumidor. A intrusão das propagandas pode ser moderada por meio da utilidade do conteúdo para o consumidor. Pode ser difícil criar um conteúdo relevante, pois cada consumidor tem um gosto específico, sendo assim necessário tratar cada consumidor de forma única através de diferentes perfis. Em outras palavras, o quê é relevante para um consumidor pode não ser tão relevante para outro. Por exemplo, um consumidor é interessado em golfe enquanto que outro tem interesse por jardinagem e esportes automotivos. Alta relevância pode ter dois caminhos diferentes: Alto compromentimento com umacerta marca ou serviço prestado, pode tornar o consumidor mais receptivo a mensagem encaminhada. Similarmente, alto envolvimento com uma categoria de produto ou atividade pode levar a uma relevância mais alta para o consumidor. Estes caminhos são focados no compromentimento e nas informações relevantes geradas por meio do envolvimento do consumidor Considerações Este capítulo apresentou o tema base a ser abordado no trabalho e as medidas a serem seguidas para que não ocorra práticas indevidas na utilização da internet, esta que seráomeio escolhido para envio de mensagens publicitárias. No próximo capítulo será abordada a personalização na Web e

30 Capítulo 2. Marketing 14 suas vantagens, assim como, as técnicas para se obter tais vantagens. Para isto, é necessário a utilização de um sistema de recomendação personalizado que atenda aos interesses únicos de cada pessoa que faça parte da base de clientes da ferramenta implementada.

31 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Sistemas de Recomendação e Mineração de Dados A personalização na web é um recurso muito útil que permite tomar decisões baseadas no interesse peculiar de cada usuário, com esta abordagem é possível direcionar uma campanha a um cliente ofertando apenas produtos que satisfaçam as necessidades e vontades de cada pessoa. É necessário obter estas informações sobre os clientes de forma controlada e não invasiva. Ao se cadastrar em um site, por exemplo, o cliente pode criar seu perfil, indicando áreas de interesse para que este possa receber s de ofertas, portanto, é necessário o consentimento do cliente para receber tal serviço de mensagens. Mas não somente estas informações prévias do cliente são suficentes para se obter uma abordagem efetiva, é preciso também conhecer os hábitos dos clientes, analisar grupos de clientes que tenham perfis semelhantes. Sendo assim, quanto mais dados relevantes estiverem disponíveis, melhor será a análise para a formulação de uma recomendação ao cliente. Os benefícios da personalização não são somente visto pelos clientes, mas também e principalmente pela empresa que quer saber qual a necessidade do mercado. Oferecer serviços personalizados pode ser um diferencial capaz de possibilitar uma taxa maior de conversão de visitantes em consumidores Personalização na Web Personalizar é tornar algo adaptável a alguém, adequando os serviços oferecido a sua vontade, necessidades e preferências. É apresentar algo de forma diferente a cada pessoa, pois cada uma tem um gosto definido, um perfil formado (GABBER, GIBBONS, MATIAS e MAYER, 1997). Portanto atender aos interesses de um consumidor nem sempre é possível através de uma campanha de interesse voltada a um grupo geral. Para tal, é necessário utilizar uma abordagem adaptativa, onde o conteúdo e as ofertas devem ser feitas de acordo com os interesses e preferências de cada cliente. Desta forma as

32 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 16 empresas são capazes de compreenderem e se relacionar melhor com o seu público alvo. Personalização é um meio pelo qual é possível diminuir o tempo gasto para encontrar e elaborar produtos, proporcionando a uma empresa agilidade e conveniência ao seu processo de aquisição de produtos e/ou serviços prestados. No entanto, a personalização se dá por meio da análise dos hábitos de navegação do usuário com base no seu histórico, agregados a um perfil previamente criado com base em áreas de interesse primário do próprio cliente durante o cadastro. Desta forma, aumenta-se a probabilidade de sucesso nas vendas. De acordo com (KOCH e MOSLEIN, 2003), para utilizar a personalização é necessário que algumas informações sejam obtidas de forma a utilizá-las para fins de divulgação e cálculos estatísticos a fim de descobrir a preferência dos usuários de um modo geral. De maneira geral, a personalização de sistemas ocorre em duas etapas 9 : 1. A interação do usuário no sistema é monitorada. As informações coletadas são utilizadas para manutenção de modelos de usuários. 2. A apresentação dos conteúdos do sistema ao usuário pode ser modificada, sugerindo qual o próximo caminho ou quais opções de caminhos que podem ser seguidos. Rastrear a navegação em um site permite identificar áreas e produtos mais acessados, ao passo que se na utilização de um site o usuário estiver logado, é possível fazer o rastreamento de navegação individual do cliente. O perfil de um cliente pode ser realizado por meio de diversas informações, tais como: produtos adquiridos, áreas favoritas e mais visitadas, perfis sócio demográficos, além da avaliação e comentário de outros usuários comuns sobre determinado produto e/ou serviço. 9 Alguns autores como Kobsa preferem a divisão em três etapas, separando a segunda etapa em: modificação da apresentação de links e modificação na apresentação de conteúdos (KOBSA,KOENEMANN e POHL, 2001)

33 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 17 Esses métodos de análise podem ser destinados ao uso em sites de conteúdo 10, lojas virtuais 11, marketing, newsletters 12 e toda e qualquer comunicação on-line entre empresas e seus clientes, prospects 13, suspects 14 e parceiros (VEDOVELI, 2007). É no ambiente comercial que a personalização é mais utilizada, pois permite um atendimento melhor e diferenciado ao usuário. Neste ponto, a internet tornou-se um ambiente ideal para a personalização, por causa da facilidade do rastreamento e da avaliação dos hábitos. A personalização de sistemas possui também outras nomenclaturas conforme características específicas a respeito das técnicas utilizadas e resultados obtidos. Entretanto, os objetivos restringem-se a oferecer informações para as pessoas que realmente necessitam delas (BELVIN e CROFT, 1992). Outras denominações são Sistemas Hipermídia Adaptativa (SHA) (BRUSILOVSKY, 2001), Sistemas de Recomendação (RESNICK e VARIAN, 1997), ou Sistemas Tutores Inteligentes. Os sistemas adaptativos possuem um mecanismo cuja existência não é visível ao usuário, são encarregados de realizar a adaptação de conteúdo, de links e sugestões automaticamente. Os sistemas adaptáveis são aqueles cujo onível da personalização é controlada pelo próprio usuário. Os sistemas adaptativos e adaptáveis são tipos de sistemas interativos, ou seja, que se moldam de acordo com as respostas dos usuários. Já os sistemas hipermídia tradicionais não são sistemas interativos apesar de proporcionarem 10 Sites de conteúdo são sites focados em um tema ou público específico, tais como: jardinagem, economia, culinária, futebol, artes, e uma infinidade de outros assuntos de interesse. Nesses sites, o internauta encontra conhecimento, fóruns de debates, dicas úteis, além de poder interagir com outras pessoas de interesse semelhante, sempre em torno de um tema central. 11 As lojas virtuais surgiram em meados dos anos 90 e são a face visível de uma verdadeira revolução no comércio. Nas lojas virtuais não há necessidade da presença física nem do comprador, nem do vendedor; lojas virtuais não necessitam do manuseio de papel moeda e, tampouco, necessitam da mercadoria no momento da transação. Nas lojas virtuais, a relação ocorre entre um comprador e um sistema hospedado em um computador localizado em qualquer lugar do planeta. 12 A Newsletter é uma comunicação regular e periódica enviada para clientes e para pessoas que possam ser potenciais novos clientes para a empresa, oferecendo conteúdo sobre assunto específico juntamente com ofertas de produtos e serviços. 13 Prospects vem do inglês e significa ver probabilidades. Muito usado em vendas, significando construir uma carteira de clientes a partir de um levantamento dos possíveis compradores e então criar estratégias para enfim torná-los definitivamente clientes 14 São aquelas empresas ou indivíduos que se encaixam no perfil de futuros clientes, mas, ainda não compram. São considerados como alvo.

34 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 18 uma navegação não linear. Tais definições estão combinadas e representadas na figura 3.1. Figura 3. 1 Divisão dos Sistemas computacionais segundo FONTE: GOTARDO, Customização é outra denominação mais abrangente proposta por KOBSA (1994), que trata da observância do modelo de usuário e também do contexto onde está inserida a informação Sistemas de Recomendação Cotidianamente as pessoas se encontram em situações em que não são raras às vezes em que ficam na dúvida sobre qual produto e/ou serviço devem escolher devido a grande quantidade de alternativas que se encontram a disposição. Tomar esta decisão pode não ser tão trivial quanto parece principalmente se for algo desconhecido da pessoa ou novo no mercado. Assim, uma recomendação vinda de outro cliente que conhece determinado produto/serviço, pode influenciar de maneira positiva na decisão de compra, à

35 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 19 medida que tal produto/serviço já foi testado e aprovado por outros consumidores e pode ser indicado. É importante também considerar o fato de comprar um produto de uma marca específica, pois já é sabido sobre a sua qualidade e destaque no mercado, mas isto implica em não comprar novos produtos de outras marcas que possam ser tão bons quanto e possuir um custo/benefício mais compensador. Uma alternativa para auxiliar nesta decisão é o uso de sistemas de recomendação, pois por meio deste uma indicação de compra será apresentada ao consumidor. Estes sistemas possuem a capacidade de analisar não somente o perfil do usuário, mas também analisar um grupo de clientes similares, os produtos mais vendidos, basearem-se no histórico do cliente ou pela sua localidade geográfica, assim, o sistema de recomendação por meio de alguma técnica de mineração de dados, tais como utilização do algoritmo de K- Means ou o algoritmo de Apriori, é capaz de encontrar um padrão e poder sugerir determinada recomendação, fato que não necessariamente deve ser seguido pelo usuário. A recomendação é uma forma de indicação que tem como finalidade indicar uma escolha de acordo com as necessidades e interesses do cliente, mas não deve ser uma imposição para a pessoa, que é quem de fato irá tomar suas próprias decisões, sendo assim, não existe um único caminho a ser seguido. Um sistema de recomendação requer estudos em outras áreas tal como a Inteligência Artificial, que auxilia na descoberta de padrões feita pela análise de informações, mas também engloba vários estudos voltados a diversas áreas como a Interface Humano-Computador (IHC), destinados à adaptação personalizada do conteúdo a cada usuário. Segundo SCHAFER(2000), a estrutura de um Sistema de Recomendação é constituída de quatro etapas: identificação do usuário, coleta de informações, estratégias de recomendação e visualização das recomendações. A Figura 3.2 ilustra esse processo de acordo com o modelo de Schafer.

36 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 20 Figura 3. 2 Estrutura dos Sistemas de Recomendação FONTE: BARCELLOS, O primeiro sistema de recomendação foi denominado de Tapestry, que é um sistema de com a capacidade de gerenciar documentos eletrônicos recebidos levando em consideração a opinião daqueles que já leram o documento. Assim sendo, foi criada a expressão filtragem colaborativa que representa uma aplicação direta para os sistemas de recomendação. Neste tipo de aplicação, existe o auxílio explícito humano para obtenção de informações, gerando a criação de grupos de interesse, mesmo que seja indiretamente (REATEGUI, CAZELLA e OSÓRIO, 2006). Além disso, diversos websites possibilitam ao cliente fazer a avaliação dos produtos vendidos, desta forma, é possível utilizar-se da capacidade de obter informações sobre as vendas e disponibilizar uma avaliação que possa influenciar novos clientes na hora de comprar um determinado produto. As figuras 3.3 e 3.4 a seguir, ilustram o sistema de vendas do site brasileiro Livraria Saraiva, onde é possível observar esta funcionalidade. Nele, existe a possibilidade de ver as classificações já feitas, bem como, poder deixar a sua própria avaliação.

37 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 21 Os algoritmos de filtragem colaborativa partem do principio de que um usuário ativo possui uma maior probabilidade de se interessar por itens que outros usuários semelhantes preferem ou preferiam. Para isto, é necessário calcular o grau de similaridade entre o usuário ativo (alvo) e os outros usuários, onde tal cálculo é obtido utilizando-se as medidas de Jaccard ou Cosseno para determinar a semelhança dos usuários, desta forma, os itens com maior grau de similaridade são recomendados (GOLDBERG et al., 1992) (RESNICK e VARIAN, 1997). Figura 3. 3 Recomendação em Websites de e-commerce: indicação de quem comprou. FONTE: LIVRARIA SARAIVA.

38 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 22 Figura 3. 4 Recomendação em Websites de e-commerce: possibilidade de avaliar o produto e deixar uma opinião. FONTE: LIVRARIA SARAIVA. Em um site de E-commerce 15, com o auxilio de um sistema de recomendação, este é capaz de adaptar o seu conteúdo de acordo com o consumidor em questão. Portanto, um sistema de recomendação automatiza o processo de personalização na Web, possibilitando uma personalização individual para cada consumidor, sendo assim, o ideal seria, se um site tiver um milhão de clientes, ele deveria ter um milhão de lojas na Web para atender seus clientes de maneira única. Portanto, existem várias técnicas de personalização baseadas em: perfil do usuário com exibição de itens preferenciais, nos itens mais vendidos, nas ofertas casadas de acordo com a análise de quem tem perfil similar e comprou também outro determinado produto, nos produtos que possuem melhores classificações, entre outros. 15 E-commerce ou comércio eletrônico em português brasileiro é um tipo de transação comercial feita especialmente através de um meio digital utilizando-se um equipamento eletrônico, por exemplo, o computador. Conceitua-se como o uso da comunicação eletrônica e digital, aplicada aos negócios, criando, alterando ou redefinindo valores entre organizações ou entre estas e indivíduos.

39 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Mineração de Dados São técnicas que buscam reconhecimentos de padrões dentro de uma grande base de dados, por meio de processos computacionais que extraem conhecimento não trivial e são muito utilizadas para o auxilio de tomada de decisões Considerações Iniciais Atualmente, com o advento da World Wide Web 16 ou simplesmente Web, muitos benefícios foram trazidos para a vida cotidiana de todos. A busca por informações e o seu acesso, que antes só era possível através de pesquisas em livros ou pedindo uma indicação a pessoas amigas ou um especialista. Hoje tais informações encontram-se disponíveis utilizando apenas poucos cliques em uma página Web, sem haver a necessidade de sair do conforto de casa ou escritório. A Web consiste de bilhões de documentos interligados entre si, criado por milhões de pessoas. Sendo assim, a internet se tornou a maior e mais ampla fonte conhecida de informações com fácil acesso e pesquisa ao seu conteúdo (LIU, 2007). É também um importante canal para realização de negócios e comunicação entre pessoas que estejam em qualquer lugar do mundo. Como o compartilhamento de informações acontece numa escala mundial, existe uma preocupação de como disponibilizá-las de forma ordenada e eficiente, não bastando apenas ter informação disponível, e sim, são necessários meios de obtê-las rapidamente e que possuam relevância. Segundo LIU (2007), o rápido crescimento da Web na última década a tornou a maior fonte de dados de acesso público no mundo com características únicas, tornado a mineração de dados e conhecimentos numa tarefa fascinante e desafiadora. 16 World Wide Web é um sistema de documentos hipermídia que são interligados e executados na internet que permite que um usuário de computador tenha acesso a informações armazenadas em outro computador pertencente à outra rede interconectada.

40 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 24 As características únicas mencionadas segundo LIU (2007) são descritas na tabela 3.1, cuja finalidade é demonstrar os desafios e oportunidades da mineração para a descoberta de informações a partir da web e da geração de conhecimentos por meio da análise desses dados. Tabela 3. 1 Características Únicas da Web segundo LIU (2007). Características Únicas da Web 01 A quantidade de dados e informações na Web é enorme e continuam crescendo. É possível encontrar informações sobre quase tudo na Web 02 Existem dados de todos os tipos, tais como: tabelas estruturadas, páginas Web semi-estruturadas, textos desestruturados e arquivos de multimídia (imagens, áudios e vídeos). 03 A informação na Web é heterogênea. Devido às diversas autorias, múltiplas páginas podem apresentar a mesma informação ou informação similar usando palavras totalmente diferentes e/ou formatos. Isso faz com que a integração de informação de várias páginas se torne um problema desafiador. 04 Uma quantidade significativa de informações estão vinculadas. Dentro de um site os hyperlinks representam um mecanismo de organização da informação. Entre sites, os hyperlinks representam uma transmissão implícita de autoria para outras páginas. 05 A informação é ruidosa, ou seja, pode conter informações irrelevantes ou informações cuja fonte não é segura. Estes ruídos surgem de duas fontes: Primeira a página contém muitas partes de informações, por exemplo, (página principal é formada por: hyperlinks de navegação, anúncios, direitos autorais, informação). Pode ser que as várias informações não sejam relevantes a não ser apenas o conteúdo principal. Segundo como não existe controle de qualidade, uma pessoa pode escrever quase tudo sobre o que gosta com informações de baixa qualidade, errôneas ou mesmo enganadora. 06 A Web é voltada à área de serviços. Muitos sites comerciais permitem por meio de seus sites serviços úteis tais como: compra de produtos, pagamento de contas, preenchimento de formulários. 07 A Web é dinâmica, sua informação muda constantemente. 08 A Web é uma sociedade virtual. Ela não contém apenas dados, informações e serviços, mas possibilita também a interação entre pessoas, empresas e sistemas automatizados. Qualquer um pode se comunicar com pessoas do mundo de

41 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 25 maneira fácil e instantânea, bem como expressar sua opinião em fóruns, blogs e sites de avaliação. A mineração de dados é também chamada de Knowledge Discovery in Databases KDD (em português: Descoberta de Conhecimento em Bancos de Dados). Conforme BERRY e LINOFF (1997), mineração de dados é a exploração e análise, da maneira mais automatizada possível, de grandes bases de dados com objetivo de descobrir padrões e regras. O seu objetivo principal é fornecer informações úteis que permitam as empresas montarem de forma mais objetiva as estratégias de marketing, vendas e suporte, melhorando assim os seus negócios. A figura 3.5 ilustra as fases do processo do KDD: seleção dos dados, préprocessamento e limpeza dos dados, transformação dos dados, mineração dos dados e análise dos resultados. Banco de Dados Seleção Pré-Processamento e limpeza Transformação Mineração de Dados Interpretação e Avaliação Conhecimento Dados Selecionados Dados Pré-Processados Dados Transformados Padrões Figura 3. 5 Fases do KDD A mineração de dados é uma área de pesquisa multidisciplinar que envolve tecnologias de aprendizado de máquina, estatísticas, banco de dados, inteligência artificial, recuperação de informação e visualização dos resultados obtidos Pré-Processamento de Dados O pré-processamento na Mineração de dados é uma etapa essencial, pois as bases de dados reais apresentam dados incompletos, ruídos e inconsistências o que afeta negativamente os resultados finais. Esta etapa

42 transações Capítulo 3. Sistemas de Recomendação e Mineração de Dados 26 compreende basicamente a aplicação de várias técnicas para preparação dos dados, organização e tratamento, o que aumenta a qualidade e determina a eficiência dos algoritmos de mineração. O pré-processamento é divido em tarefas como: 1. Limpeza dos dados resolve inconsistências, preenche dados faltantes. 2. Integração e transformação de Dados integração de dados de origens diferentes. 3. Transformação normalização e agregação. 4. Redução redução do volume de dados que não afeta significantemente o resultado final. Limpeza dos dados Integração dos dados Transformação dos dados Redução dos dados atributos atributos Figura 3. 6 Fases do Pré-Processamento Limpeza dos Dados Preencher os valores inexistentes, suavizar ruídos, identificar valores for de série (observações discordantes que podem afetar procedimentos de

43 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 27 análise), resolver redundâncias e dados inconsistentes, identificação e remoção de desvios, isto é, possui como objetivo principal melhorar a qualidade dos dados Valores Ausentes São atributos que possuem valores incompletos ou nenhum valor, podem ocorrer devido ao mau funcionamento do equipamento, falhas e enganos humanos, inconsistência com outros dados gravados, etc. Algumas formas de se corrigir esses erros ausentes são: Preencher com medidas estatísticas utilizando média do atributo, média relativa do atributo em todos os registros que estiverem na mesma situação. Preencher com valores manualmente com base em pesquisas nas fontes originais dos dados. Ignorar o registro. Utilizar o valor de maior probabilidade para preencher os valores ausentes, utilizando a técnica de regressão como árvore de decisão ou formalismo bayesiano, que permite codificar modelos multivariados à partir da exploração das relações de independência entre as variáveis Dados Ruidosos São dados que possuem um erro aleatório ou um valor que contraria a lógica e podem ocorrer devido às falhas nos instrumentos de coleta, problemas de entrada de dados ou de transmissão, limitação de tecnologia, inconsistência nas convenções dos nomes. Algumas formas de se corrigir esses dados ruidosos são: Compartimentalização: ocorre a partir de uma consulta na vizinhança de dados ordenados. Os valores ordenados devem ser armazenados em grupos.

44 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 28 A suavização ocorre dentro de cada grupo, efetuando-se a média, mediana, etc. Pode ocorrer de duas maneiras: o Particionamento por distância: Divide-se os dados em N intervalos de mesmo tamanho. Se A e B são os valores mínimo e máximo do atributo, a largura dos W intervalos será W=(B-A)/N. o Particionamento por frequência: Divide os dados em N intervalos com o mesmo número de amostras. Clusterização: Identifica e remove os outliers. Inspeção humana e computadorizada: Valores suspeitos são identificados pelo computador e avaliados por um ser humano. Regressão: Suavização por meio do ajuste de dados a uma função de regressão, os dados podem ser suavizados por meio do ajustamento em uma função como mostrado na figura 3.7. Figura 3. 7 Gráfico que representa uma regressão FONTE: MERSCHMANN, 2011

45 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Integração dos Dados A integração de dados corresponde a fusão ou combinação de dados de múltiplas fontes em uma única fonte de forma coerente. As fontes podem ser cubos, arquivos de texto ou bases de dados entre outros tipos de armazenamento. Tem como objetivo identificar e resolver conflitos de valores, obtendo assim dados em uma forma mais apropriada para a mineração de dados Redundância dos Dados Um atributo é considerado redundante quando ele pode ser derivado de outro armazenamento (tabela). A redundância geralmente ocorre durante a integração de bases de dados, pode ser detectado por análise de correlação, método que mede o quanto dois atributos são correlatos. Pode-se identificar a redundância por meio da geração de tuplas (registro na base de dados) idênticas geradas em uma mesma entrada de dados Detecção e resolução de valores conflitantes Para relações em bases de dados no mundo real os valores dos atributos podem diferir em diversas fontes de dados podendo haver uma heterogeneidade semântica e isto causa um grande desafio na integração de dados, uma vez que se pode ter várias representações diferentes para um mesmo atributo presente em bases de dados distintas. Para resolver este problema é necessária a busca de uma solução capaz de representar univocamente estes atributos. Uma forma de se obter isso é por meio do uso de funções específicas do próprio SGBD capazes de tratar estes valores conflitantes durante a importação dos dados, verificando quais são estes valores e substituindo por valores uniformes.

46 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Integração de esquemas internos Diferentes entidades do mundo real podem ser semelhantes e cair no problema típico de identificação de entidades caso estejam definidas em vários esquemas com atributos diferentes. Formatos de armazenamento de dados podem afetar também na forma como se recupera e integra dados. A variedade de sistemas operacionais são outros fatores que dificultam o acesso aos inúmeros protocolos para recuperação e integração dos dados Transformação de dados Tem como objetivo transformar e consolidar dados para obter uma forma mais apropriada para aplicação do reconhecimento de padrões Normalização O objetivo da normalização é diminuir os problemas originados do uso de unidades e dispersões distintas entre as variáveis, colocando os valores em uma faixa pré-especificada, por exemplo: valores entre 0 e 1. Normalização min-max: Z-Score: Escalonamento Decimal: Redução Tem como objetivo a redução do conjunto de dados, mantendo a integridade e a distribuição de probabilidade semelhante ao original. O que simplifica a mineração desse novo conjunto de dados, obtendo resultados mais

47 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 31 eficientes do que o conjunto de dados original. Uma das razões para efetuar a redução de dados é a ultrapassagem da capacidade de processamento dos programas de aprendizagem. Estratégias: Agregação via cubo: Operações de agregação são aplicadas aos dados na construção dos cubos de dados como mostra a figura 3.8. Figura 3. 8 Representação de agregação via cubo FONTE: MERSCHMANN, 2011 Redução de dimensão: Bases de dados podem conter muitos atributos, alguns desses podem ser irrelevantes, fracos ou redundantes para a mineração de dados, neste caso são identificados e retirados. Compressão de dados: Dados são transformados para obtenção de uma representação mais simples e reduzida do conjunto de dados original. Figura 3. 9 Representação da compressão de dados FONTE: MERSCHMANN, 2011 Discretização: São alterados os valores de atributos por intervalos ou níveis de conceitos mais elevados.

48 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Medidas de Similaridade Medidas de semelhança e diferenças são importantes artifícios utilizados em várias técnicas de mineração como, por exemplo, em agrupamento, classificação do vizinho mais próximo, etc. À medida que estas semelhanças ou diferenças são calculadas, o conjunto de dados iniciais pode não ser mais útil, uma vez que já se encontra calculado estes novos parâmetros de comparação. Tais diferenças ou semelhanças são referenciadas por meio do termo proximidade, este termo, indica a proximidade entre dois objetos por meio da análise de atributos correspondentes entre ambos. O cálculo da proximidade pode ser feito utilizando-se apenas um atributo simples ou por meio de múltiplos atributos. De acordo com TAN, STEINBACH E KUMAR (2009), a proximidade inclui medidas como correlação e distância Euclidiana, que são utilizadas para se trabalhar com dados densos tais como, séries de tempos ou pontos bidimensionais, bem como, as medidas de semelhança cosseno e Jaccard, úteis para trabalho com dados esparsos tais como, documentos. A semelhança entre dois objetos é uma medida numérica do grau que determina o quanto estes dois objetos se parecem, desta forma, a semelhança será maior quanto mais os dois objetos sejam parecidos. O grau de semelhança geralmente não é negativo e disposto entre a faixa de 0 a 1, onde, o 0 determina nenhuma semelhança e 1 determina semelhança completa. A diferença por sua vez, é uma medida numérica do grau que determina o quanto dois objetos são diferentes, desta forma, quanto mais semelhantes são dois objetos, menor será a diferença entre ambos, e o termo que determina essa diferença é a distância. Para que se possa trabalhar com semelhanças ou diferenças no intervalo [0,1] é necessária uma normalização dos dados. Esta normalização pode ser obtida no caso da semelhança, aplicando a transformada de semelhança dada pela expressão s = (s - min_s) / (mas_x min_s), onde max_s e min_s são os

49 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 33 valores de semelhança máxima e mínima. Para a diferença, o intervalo [0,1] pode ser mapeado utilizando a expressão d = (d - min_d) / (mas_d min_d). Para dados ordinais, como por exemplo, um atributo que determina a qualidade de um produto numa escala (fraca, razoável, satisfatória, boa, ótima), os valores do atributo ordinal são mapeados com números inteiros sucessivos, começando em 0 ou 1, desta forma, os valores normalizados são (fraca=0, razoável=1, satisfatória=2, boa=3, ótima=4). Assim, a distância entre um produto classificado como de qualidade boa e outro de qualidade satisfatória, ou seja, P1(3) e P2(2) respectivamente, a distância entre estes produtos é dada por d(p1,p2) = d(3-2) = d(1). Agora, se for necessário trabalhar com os valores calculados da diferença em um intervalo entre 0 e 1, basta usar a expressão d(p1,p2) / N, onde N representa o números de variáveis presentes na escala, que neste exemplo são as variáveis que determinam a qualidade do produto na escala (fraca, razoável, satisfatória, boa, ótima), desta forma, a distância é dada por d(3-2) / 5 = d(0,2) Diferenças entre objetos Como dito anteriormente, a distância é um meio de determinar a diferença entre as propriedades de um objeto. A distância Euclidiana, d, é dada pela seguinte fórmula descrita abaixo: d(x,y)=, Onde n é o número de dimensões e e, são os atributos (componentes) de índice k de x e y. Um exemplo da aplicação da distância Euclidiana sobre quatro pontos bidimensionais pode ser observado na figura 3.10 e nas tabelas 3.2 e 3.3.

50 Capítulo 3. Sistemas de Recomendação e Mineração de Dados P1 1 P4 P4 0 P Figura Quatro pontos bidimensionais Tabela 3. 2 Coordenadas X e Y ponto Coordenada X Coordenada Y P1 1 2 P2 2 0 P3 3 1 P4 5 1 Tabela 3.3 Matriz de distância Euclidiana para Tabela 3.2 P1 P2 P3 P4 P1 0,0 2,8 3,2 5,1 P2 2,8 0,0 1,4 3,2 P3 3,2 1,4 0,0 2,0 P4 5,1 3,2 2,0 0, Semelhanças entre objetos Uma forma de determinar a semelhança entre objetos é a utilização das medidas de semelhança Jaccard e cosseno. Segundo TAN, STEINBACH E KUMAR (2009), as vezes é possível transformar facilmente uma medida de semelhança

51 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 35 em uma distância métrica, além de que, é possível derivar limites matemáticos sobre a semelhança entre dois objetos, simulando uma diferença triangular. A seguir serão apresentadas medidas de proximidade tais como: medidas de semelhança para dados binários, semelhança de cosseno, coeficiente de Jaccard-Tanimoto Estendido 17 e Correlação Medidas de Semelhança para Dados Binários Coeficiente de semelhança são medidas de semelhança entre objetos que apresentam atributos com valores entre 0 e 1. O valor 0 indica nenhuma semelhança enquanto que o valor 1 indica que estes são idênticos. Supondo que x e y sejam dois objetos que consistam de n atributos binários, a comparação entre estes objetos como, por exemplo, dois vetores binários podem identificar quatro quantidades de frequências: f 00 = o número de atributos onde x é 0 e y é 0 f 01 = o número de atributos onde x é 0 e y é 1 f 10 = o número de atributos onde x é 1 e y é 0 f 11 = o número de atributos onde x é 1 e y é 1 Coeficiente de Correspondência Simples (Simple Matching Coefficient - SMC): é um coeficiente comumente usado e definido como: SMC. O SMC pode ser usado então para contar tanto presenças quanto ausências, desta forma, supondo uma prova cujas questões são do tipo verdadeiro/falso, poderia ser empregado o SMC para descobrir alunos que responderam de forma semelhante à prova. Coeficiente de Jaccard (J): este é um coeficiente utilizado frequentemente com atributos binários assimétricos, suponha que x e y sejam 17 O coeficiente de Jaccard-Tanimoto Estendido é uma variação do coeficiente de Jaccard para ser utilizado em atributos contínuos, diferentemente do original que é indicado para atributos binários.

52 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 36 objetos de dados que representam duas linhas de uma matriz de transação. Se cada atributo binário assimétrico corresponder a um item em uma loja, então um número 1 indica que o item foi comprado e 0 indica que não foi comprado. Sendo o número de produtos não comprados maior que o número de produtos comprados, a medida SMC diria que as transações são semelhantes, por sua vez, o coeficiente de Jaccard é utilizado para tipo de dados binários assimétricos. Este é simbolizado pelo símbolo J e representado pela seguinte equação: J. Exemplo de uso para ilustrar a diferença de semelhança entre as duas medidas apresentadas acima. Seja o dois vetores binários X=(1,0,0,0,0,0,0,0,0,0) e Y=(0,0,0,0,0,0,1,0,0,1) onde: f 01 = 2 o número de atributos onde x é 0 e y é 1 f 10 = 1 o número de atributos onde x é 1 e y é 0 f 00 = 7 o número de atributos onde x é 0 e y é 0 f 11 = 0 o número de atributos onde x é 1 e y é 1 SMC = J = = 0 Semelhança do Cosseno: é uma das medidas mais comuns de semelhança de documentos. Uma vez que documentos são representados como vetores, cada atributo representa a frequência de ocorrência de um item (palavra). Embora cada documento tenha milhares de dezenas de milhares de atributos (termos), cada um é esparso, já que possui poucos atributos diferentes de zero. Desta forma, a normalização para documentos não cria entradas diferentes de zero para uma entrada igual a zero, elas preservam o

53 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 37 esparsamento. Assim, a semelhança não deve depender do número de valores zero compartilhados, uma vez que, quaisquer dois documentos provavelmente não possuem muitas palavras iguais, portanto, se correspondências 0-0 forem encontradas, a maioria dos documentos serão muito semelhantes aos outros. Portanto, para determinar a semelhança entre documentos é necessário ignorar correspondências do tipo 0-0 como a medida de Jaccard, mas ao mesmo tempo devem ser capazes de lidar com vetores não binários (TAN, STEINBACH E KUMAR, 2009). Seja x e y dois vetores de documentos, a representação do cosseno é dada pela equação abaixo: Onde indica o produto dos ponto do vetor = é o comprimentos do vetor x,. Exemplo de calculo de semelhança através do cosseno de dois objetos de dados que poderiam representar vetores de documentos: x y = 3*1 + 2*0 + 0*0 + 5*0 + 0*0 + 0*0 + 0*0 + 2*1 + 0*0 + 0*2 = 5 = = 6,45 = = 2,24 cos(x,y) = 0,31 Desta forma, a semelhança do cosseno é na verdade uma medida do (cosseno) ângulo entre x e y, onde, se o cosseno for igual a 1, o ângulo entre x e y é igual a 0 e x e y são iguais, exceto pela magnitude (comprimento). Caso a semelhança do cosseno seja 0 o ângulo entre x e y é 90 e eles não possuem nenhum termo (palavra) em comum.

54 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 38 x Ө y Figura Ilustração Geométrica da medida de cosseno Outra forma de escrever a equação do cosseno é mostrada a seguir: = x y Onde x = x / e y = y /. Desta forma, a divisão de x e y pelo seu comprimento, o que os normaliza fazendo-os ter o comprimento igual a 1. Assim, a semelhança de cosseno de dois objetos não leva em consideração a magnitude (comprimento). Correlação: é uma medida do relacionamento linear entre atributos dos objetos que possuam variáveis contínuas ou binárias. A correlação de Pearson entre dois objetos é definida pela equação: Onde, é utilizada a seguinte notação estatística: covariância(x,y) = desvio padrão(x) = desvio padrão(y) = é média de x é média de y

55 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 39 A correlação é dita perfeita quando possui os valores 1 ou -1, assim, o valor 1 significa que x e y têm um relacionamento linear positivo perfeito ou para -1 um relacionamento linear negativo perfeito. Para valor de correlação igual a 0, significa que não há relacionamento linear entre os atributos Classificação A classificação é uma tarefa de mineração de dados, cujo objetivo é encontrar modelos de classificação que possam classificar dados em classes distintas, para tal, são analisadas propriedades (atributos) comuns entre objetos em uma base de dados. Este modelo de classificação criado baseia-se num conjunto de dados de amostragem ou treinamento cujas classes já são conhecidas, desta forma, é possível utilizar o modelo para que se possa predizer a classe de objetos que ainda não possuem uma classe definida, levando-se em consideração a análise das propriedades similares com os dados utilizados na criação do modelo. Em algumas situações, pode não ser necessário utilizar o modelo para determinar classes, ao invés disso, pode-se querer predizer alguns valores de dados que estão faltando na base de dados. Esta abordagem é principalmente utilizada quando faltam valores numéricos, se fossem textuais seria necessário um processo de normalização antes, para adequar os dados em um intervalo numérico. Quando isto ocorre, a tarefa de mineração é denominada de predição. Algumas técnicas de classificação amplamente utilizadas para classificação são: redes neurais e árvores de decisões. Grande parte dos métodos empregados nesse processo utiliza técnicas estatísticas e de aprendizado de máquina.

56 Capítulo 3. Sistemas de Recomendação e Mineração de Dados O Algoritmo K-Means Segundo AMO (2003), o algoritmo é baseado em análises e comparações entre os valores numéricos dos dados, assim fornece uma classificação automática sem a necessidade da supervisão humana, considerado então um algoritmo de mineração de dados não supervisionado. O método K-means recebe uma base de dados de objetos (tuplas) e um número k que representa o número de classes que se deseja formar entre as tuplas da base de dados. Essas classes são denominadas clusters, coleção de objetos que são semelhantes uns aos outros de acordo com algum critério de semelhança préfixado e diferenças entre objetos de outros clusters. A base de dados é dada como uma matriz de dissimilaridade entre os objetos. Nesta matriz são definidos i, j e d(i, j) como sendo respectivamente linha, coluna e a distância entre os objetos i e j. A representação por dissimilaridade é baseada na comparação entre todos os objetos envolvidos, isso nos leva a uma matriz D, na qual cada elemento da matriz representa o valor de dissimilaridade entre dois objetos. Figura Matriz de dissimilaridade FONTE: AMO, Dependendo do tipo de dados presentes no banco de dados, existem técnicas para construir a matriz de dissimilaridade, tais como a distância Euclidiana, distância de Manhattan e a distância de Minkowski.

57 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 41 Seja C = {C1, C2, C3..., Ck} uma partição do banco de dados em k clusters e sejam s1,s2,s3,...,sk elementos que representam o centro dos clusters escolhidos em cada um dos mesmos. O erro quadrático da partição é obtido por meio de: Erro(C) = x si 2. O algoritmo de K-means procura construir uma partição P contendo k clusters para a qual o erro quadrático seja mínimo. SegundoAMO (2003) o algoritmo é dividido em 6 passos: 1º Passo: Neste passo são escolhidos k objetos {p1, p2, p3..., pk} da base de dados, geralmente são escolhidos os k primeiros registros da tabela. Esses objetos serão os centros de k clusters, ou seja, os k centróides. Cada cluster C i é formado somente pelo objeto p i. 2º Passo: A distância entre cada ponto e os centróides é calculada, para cada objeto O diferente de cada um dos p i 's. Considera-se a distância entre O e cada um dos p i 's. Considera-se o pi para o qual a distancia é mínima, o objeto então passa a fazer parte do cluster representado por p i. Este processo é o que mais exige processamento de cálculos, pois para N pontos e k centróides o calculo será N x k distâncias. 3º Passo: Os pontos são classificados de acordo com sua distância dos centróides de cada cluster. O centróide que está mais perto deste ponto vai pertencer ao cluster do ponto. 4º Passo: Calcula-se a média dos elementos de cada cluster, isto é, o seu centro de gravidade, este ponto será o novo representado pelo cluster.

58 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 42 5º Passo: O algoritmo volta para o 2º passo, varrendo a base de dados e para cada objeto O a distância é calculada entre este objeto e os novos centros dos clusters. O objeto O será realocado para o cluster C tal que a distância entre O e o centro de C é a menor possível. 6º Passo: O processo fica repetindo iterativamente e o refinamento do cálculo das coordenadas dos centróides, até que nenhuma mudança ocorra, isto é, os clusters se estabilizem. Figura Funcionamento do algoritmo k-means para k = 3 FONTE: AMO, Na primeira iteração os objetos selecionados representam que foram escolhidos aleatoriamente, nas iterações segunda e terceira os centros de gravidade são marcados com o sinal positivo (+). A vantagem do algoritmo é sua eficiência em tratar grandes conjuntos de dados. Sua desvantagem porém, se encontra no fato do usuário ter que fornecer o valor de k clusters e por serem sensíveis à ruídos, já que valores altos podem causar uma grande alteração do cento de gravidade dos clusters, e assim distorcer a distribuição dos dados nos mesmos Análise de Agrupamentos Diferente do método de classificação, na análise de agrupamento não existe classes pré-definidas, a função deste método consiste em identificar classes de objetos, ou seja, tem como objetivo por meio de um aprendizado não supervisionado segmentar um conjunto de dados em subconjuntos homogêneos, por exemplo, pessoas de uma certa região do país efetua mais

59 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 43 compras em uma loja virtual durante a noite enquanto pessoas de outra região compram mais no período da manhã. A formação desses subconjuntos ou grupos é baseada no princípio de que os elementos de um mesmo grupo devem ser semelhantes entre si, sendo assim elementos de grupos diferentes devem possuir elementos distintos entre si. Sua habilidade de identificar estruturas diretamente dos dados sem que exista um conhecimento dos mesmos torna a técnica de agrupamento uma das mais utilizadas. A qualidade do agrupamento está diretamente ligada à uma série de definições estabelecidas pelo usuário como por exemplo: escolha dos atributos, medidas de dissimilaridade, escolha do algoritmo apropriado, número de agrupamento ou clusters. Os métodos de agrupamento podem ser divididos em: 1. Métodos hierárquicos 2. Métodos de particionamento 3. Métodos baseados em Densidade 4. Métodos baseado em Grades Métodos Hierárquicos Os métodos hierárquicos montam uma hierarquia de agrupamentos (dendograma) ou árvore de agrupamentos. Este método é subdivido em dois tipos: aglomerativo e divisivo. Aglomerativo (bottom-up): cada objeto representa um grupo inicialmente, em seguida esses grupos são unidos sucessivamente, uma vez unidos eles permanecem unidos até o final do processo. Este processo é realizado até que todos os grupos formem um único grupo ou até que a condição de finalização seja válida. De acordo com (BOGORNY,2003) o algoritmo hierárquico aglomerativo é executado seguindo os seguintes passos:

60 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Iniciar com n clusters, cada um contendo um objeto. 2. Calcular a dissimilaridade entre os objetos. 3. Procurar o par de clusters com menor dissimilaridade. 4. Recalcular a dissimilaridade do cluster fundido com os demais clusters. 5. Repetir os passo 3 e 4 n-1 vezes. Divisivos (top-down): Neste método ocorre o contrário, todos os objetos começam fazendo parte do mesmo grupo, o mesmo vai sofrendo divisões até que em cada grupo reste apenas um agrupamento grupo ou até que a condição de finalização seja válida. Neste caso o elemento uma vez separado de seu grupo ele jamais volta a fazer parte do mesmo. O método hierárquico possuem históricos, ou seja, é possível saber onde cada elemento estava nos passos anteriores. Devido ao seu alto custo computacional são impraticáveis em grandes bases de dados. Método Particionamento São métodos iterativos que buscam para um determinado número de grupos uma melhor divisão de um determinado número de objetos, ou seja, buscam uma melhor partição dos n objetos em k grupos. A melhor forma de se representar este método é possuir na base de dados um elemento que melhor representa o grupo ao qual ele pertence, esses elementos serão usados como referência para decidir a qual grupo outro elemento irá pertencer. Esse elemento geralmente é representado pelo ponto central do grupo (média dos atributos dos objetos que formam o grupo) ou pelo elemento mais próximo desse ponto central. Comparados ao método hierárquico os agrupamentos deste método possuem uma qualidade maior ou seja possuem elementos mais semelhantes.

61 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 45 Método baseado em Densidade Levando em consideração que os grupos são regiões densas os métodos baseados em densidade podem ser utilizados para eliminar o ruído dos dados e descobrir clusters separados com formatos diferentes os quais são separadas por regiões de baixa densidade, são caracterizados como valores atípicos os objetos que se encontram nessas regiões. Métodos baseado em Grades Dividem o espaço de objetos em um certo número de células, estas por sua vez são divididas em outras e assim, sucessivamente formando uma estrutura de grade. Onde cada célula seria um novo grupo. Figura Ilustração de dados distribuídos em grade A velocidade de processamento é a principal vantagem desse método, que geralmente independe do tamanho da base de dados, dependendo apenas da resolução da grade Mineração de Regras de Associação São regras eficazes na busca por associações ou relações em uma transação entre conjuntos de atributos denominadas itens. Seja X e Y conjuntos de valores, a regra de associação é um padrão da forma X Y, exemplo {açúcar} { pão }. No exemplo: Um cliente que compra produto A

62 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 46 também compra produto B, a regra de associação tem a função de encontrar uma relação entre esses dois produtos e informar o quão confiável é esta relação, isto é, a regra busca caracterizar quanto um conjunto de atributos na base de dados implica na presença de outro conjunto. Toda regra de associação é associada a uma medida objetiva: Fator de confiança: frequência com que Y aparece nas transações que contêm X. Definida por P (X Y), onde P indica a porcentagem, nesse caso, de transações contendo os itens X que também contém os itens Y. Confiança (X Y) = Número de transações que suportam (X U Y) Número de transações que suportam X Fator de suporte: freqüência de ocorrência de um conjunto de itens denominados itemset. Definida por P (X U Y), onde P indica porcentagem e X U Y que a transação contém a união dos dois conjuntos. A regra de associação extrai de uma base de dados consistente todas as regras possíveis com fator de suporte e confiança maiores ou iguais aos passados pelo usuário. Além das medidas objetivas existem também as subjetivas que servem para guiar o processo de mineração de dados, especificando problemas particulares. Para eficiência do processo de mineração de dados, medidas objetivas e subjetivas são essenciais, isto é, pela definição de AMO (2003) uma regra de associação q é dita interessante se confiança(q) α e suporte(q) β, onde α e β são respectivamente, um grau de confiança e grau de suporte especificado pelo usuário. Podem ser utilizadas durante o processo de mineração ou após o término a fim de efetuar uma classificação dos padrões encontrados de acordo com o interesse de um dado usuário, filtrando e eliminando os não interessados.

63 Capítulo 3. Sistemas de Recomendação e Mineração de Dados Técnicas para regra de associação Apriori Suponha como exemplo, um supermercado e a cada compra de um cliente, são registrados em uma base de dados todos os produtos ou itens comprados. Na figura abaixo por questão de simplificação de representação será associado um número a cada produto do supermercado. Tabela 3.4 Representação numérica dos produtos do supermercado Artigo (item) Número que o representa Pão 1 Leite 2 Açuçar 3 Papel Higiênico 4 Manteiga 5 Fralda 6 Cerveja 7 Refrigerante 8 Iogurte 9 Suco 10 Suponha que o itemset considerado frequente será aquele que aparece pelo menos 50% de todas as compras registradas. Se o banco de dados for a figura abaixo, então o itemset {1,3} é o considerado frequente pois aparece em mais de 60% das compras. Tabela 3.5 Registros de transações em um banco de dados TID Itens comprados 101 {1,3,5} 102 {2,1,3,7,5} 103 {4,9,2,1} 104 {5,2,1,3,9} 105 {1,8,6,4,3,5} 106 {9,2,8}

64 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 48 A figura abaixo contabiliza os suportes de diversos itemsets com relação à base de dados das transações da tabela3.4. Tabela 3.6 Suporte de itemsets Itemset Suporte {1,3} 0,6666 {2,3} 0,3333 {1,2,7} 0,16666 {2,9} 0,5 Caso o valor mínimo para um itemset ser considerado frequente seja 50%, os itemsets {1,3}, {2,9} serão considerados Formalizando o problema Pela definição de AMO (2003), seja A = { i1, i2,..., in} um conjunto de itens (produtos de uma loja virtual) e seja B uma tabela com duas colunas, ou seja uma base de dados de transações, possuindo a primeira coluna com o ID (identificador de atributo) e a segunda correspondendo ao conjunto de produtos ou itemsets. Os registros de B são chamados de transações. Um subconjunto não vazio de A é chamado de itemset. Uma transação T suporta um itemset S se S T. Por exemplo, na Tabela 3.5 a primeira transação suporta os itemsets {1}, {3}, {5}, {1,3}, {1,5}, {3,5}, {1,3,5}. O problema da mineração de dados utilizando técnicas de associação é: encontrar todas as regras de associação com relação a uma base de dados B, um nível mínimo de confiança α e um nível mínimo de suporte β.

65 Capítulo 3. Sistemas de Recomendação e Mineração de Dados O algoritmo Apriori Com base na explanação de AMO (2003), é considerado um algoritmo clássico na regra de associação, proposto pela equipe de pesquisa QUEST da IBM em Utilizado para resolver o problema da mineração de dados de itemsets frequentes, fazendo buscas recursivas na base de dados à procura de conjuntos que satisfaçam o valor de suporte e de confiança estabelecidos. Considerando, por exemplo, todos os itemsets frequentes com relação à base de dados B e valor mínimo de suporte β. E para cada itemset frequente L, todas as regras candidatas C (L C), onde C L e é verificado para cada uma das regras candidatas se o valor de confiança excede o grau α. Para efetuar o cálculo de confiança de C (L C) não é preciso varrer novamente a base de dados B. Durante a execução do algoritmo de Apriori já foi calculado o valor de suporte para L e C. Veja: conf(c (L-C)) = = = Para efetuar o cálculo da confiança C (L C) deve-se apenas dividir o suporte de L pelo suporte de C. O algoritmo de Apriori é divido em 3 diferentes fases: 1. Geração dos candidatos 2. Poda dos candidatos 3. Validação As fases 1 e 2 são realizadas na memória principal e não precisam varrer a base de dados B. A memória secundária é apenas utilizada caso o conjunto de itemsets candidatos seja muito grande e exceda o tamanho da memória principal. Apenas na fase 3 onde ocorre o cálculo do suporte dos itemsets candidatos é que é necessário varrer a base de dados B. Nas fases de geração e de poda (1 e 2) é utilizada a propriedade de Apriori ou antimonotonia:

66 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 50 Propriedade de Apriori ou antimonotonia: Segundo CAMILO (2010), sejam V e U dois itemsets tais que V U, se U é frequente então V também é. Dada uma sequência de itemset de tamanho k, um k-itemset será freqüente se todos os seus (k-1)-itemsets também forem frequentes. O algoritmo de associação Apriori possui a execução de forma iterativa: os itemsets frequentes são calculados através do seu anterior, ou seja, 2- itemset é calculado a partir do 1-itemset e assim sucessivamente, não é necessário calcular o suporte de k-itemset, pois basta utilizar a propriedade de Apriori ou antimonotonia e verificar se são frequentes os itemsets anteriores. 1º Fase Geração dos candidatos Nesta fase ocorre a geração dos itemsets candidatos, não necessariamente frequentes, de tamanho k a partir do conjunto Lk 1. O conjunto C k de itemsets candidatos de tamanho k é construído unindo-se pares de itemsets de tamanho k 1 que tenham k 2 registros em comum. Dessa forma pelo menos dois subconjuntos de tamanho k 1 serão frequentes em um itemset de tamanho k. a b c d e x itemset frequente de tamanho 6 a b c d e y itemset frequente de tamanho 6 a b c d e x y itemset frequente de tamanho 7 Figura Exemplo de construção de itemsets candidatos de tamanho k a partir de itemsets frequentes de tamanho k-1. Para a construção do conjunto C k é utilizado a função de Apriori-Gen, requer como argumento o Lk 1 que consiste no conjunto de todos os conjuntos de itemsets frequentes com (k 1)-itemsets e retorna um conjunto de todos os itemsets frequentes com k-itemsets.

67 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 51 Exemplo de utilização da função Apriori-Gen: Considerando a base de dados da Tabela 3.5 e que no passo 2 da iteração é obtido o seguinte conjunto de itemsets frequentes de tamanho 2: L2 = { { 1, 3 }, { 1, 5 }, { 1,4 }, { 2,3 }, { 3,4 }, { 2,4 } } O conjunto C 3 da interação será: C 3 = { { 1, 3,5 }, { 1, 3, 4 }, { 1,4, 5 }, {2, 3, 4 } } 2º Fase Poda dos candidatos Com base na explanação de AMO (2003). Utilizando a propriedade Apriori é possível descartar subconjuntos de itens de tamanho k 1 que não estiverem em Lk 1, pois não possui chance de ser um item frequente. Nessa fase é calculado o conjunto Ck = C k { V existe U V tal que U = k 1 e U Lk 1 }. A notação U significa numero de elementos do itemset U. Exemplo: Considerando o exemplo anterior da função Apriori-Gen, neste caso o C3 = C 3 { { 1, 4, 5 }, { 1,3, 5 } } = { { 1, 3,4 }, { 2, 3, 4 } }. O itemset { 1, 4, 5 } foi podado mas será descartado pois não possui chance de ser um itemset frequente, pois possui o 2-itemset { 4, 5 } que não aparece em L2. 3º Fase Validação: cálculo do valor de suporte Nesta fase são calculados o valor de suporte de cada um dos itemsets do conjunto Ck, isso pode ser feito varrendo uma única vez a base de dados B. Para cada transação verifica-se quais são os candidatos suportados por cada

68 Capítulo 3. Sistemas de Recomendação e Mineração de Dados 52 transação e para esses candidatos é incrementado uma unidade no valor de suporte. Itemsets frequentes de tamanho 1: São computados todos os itemsets de tamanho 1, a base de dados é varrida uma vez para calcular o suporte de cada um destes conjuntos de tamanho 1, descartandose aqueles que não possuem suporte β. O código a seguir é uma uma implementação do algoritmo de Classificação Apriori segundo GARCIA(2007). Algorithm: Apriori. Find frequent itemsets using an iterative level-wise approach based on candidate generation. Input: Database, D, of transactions; minimum support threshold, min_sup. Output: L, frequent itemsets in D. Method: L1 = find_frequent_1-itemsets(d); for (k = 2; Lk-1 Ø; k++) { Ck = apriori_gen(lk-1,min_sup); for each transaction t in D { // Scan D for counts Ct = subset(ck,t); // get the subsets of t that are candidates for each candidate c in Ct c.count++; } Lk = {c in Ck c.count min_sup} } return L = UkLk; procedure apriori_gen(lk-1:frequent(k-1)-itemsets; min_sup: minimum support threshold) for each itemset l1 in Lk-1 for each itemset l2 in Lk-1 if (l1[1]=l2[1])^(l1[2]=l2[2])^ ^(l1[k-2]=l2[k-2])^(l1[k-1]=l2[k-1])then { c=l1 join l2; //join step: generate candidates if has_infrequent_subset(c,lk-1) then delete c; // prune step: remove unfruitful candidate else add c to Ck; } return Ck; procedure has_infrequent_subset(c:candidate k-itemset; Lk-1: frequent (k-1)-itemsets) for each (k-1)-subset s of c if s not in Lk-1 then return TRUE; return FALSE;

69 Capítulo 4. Ferramenta de Marketing Ferramenta de Marketing A ferramenta de Marketing é uma ferramenta Web, que deve ser hospedada em um servidor. Todas as informações e relatórios gerados são armazenados em um sistema de banco de dados. A ferramenta é utilizada para montagem de campanhas, cadastros de produtos, visualização de relatórios e disparo de s Detalhes Técnicos A ferramenta de Marketing utilizada nesse projeto de trabalho e conclusão de curso foi implementada com auxilio do framework Codeigniter 1.7.2,da linguagem de programação PHP 5.2.6, do SGBD Mysql e outras tecnologias como XHTML, CSS 2, JQuery Codeigniter é um framework baseado no modelo arquitetural MVC (model, view e controller) e na linguagem de programação PHP. PHP (Personal Home Page) é uma linguagem de scripts interpretada e OpenSource, utilizada para gerar conteúdos dinâmicos dentro de aplicações Web. Mysql é um sistema gerenciador de banco de dados, utiliza como interface a linguagem SQL (Linguagem de Consulta Estruturada, do inglês Structured Query Language). XHTML é a linguagem HTML (HyperText Markup Language) reformulada para XML (Extensible Markup Language). CSS (Cascading StyleSheets) são folhas de estilo, utilizadas para personalizar e formatar documentos XHTML e HTML. JQuery biblioteca JavaScript, utilizada para definir efeitos, criar elementos, entre outros dentro de uma página Web.

70 Capítulo 4. Ferramenta de Marketing Ferramenta de Marketing A ferramenta de Marketing tem como objetivo o disparo de e- mails com campanhas publicitárias para vários clientes. Para esse trabalho de conclusão de curso, foi desenvolvida uma ferramenta divida em duas áreas: área pública (cliente) e área restrita (administrador). Na área pública a ferramenta permite o cadastro de usuários a partir dos campos: nome, e áreas de interesse (várias opções que permitem a ferramenta armazenar um perfil inicial do usuário). Este processo é ilustrado na Figura 4.1. Figura 4. 1 Cadastro de clientes na ferramenta A área restrita foi desenvolvida para uso do administrador, ou seja, a pessoa que irá gerenciar o disparo dos s. Por ser uma área privada o sistema conta com uma identificação por login e senha para que seja permitido o acesso. Além dos disparos dos s, é possível gerenciar novos administradores, permitindo adicionar, editar e excluir um registro. Inserir, visualizar e excluir clientes cadastrados, gerenciar de forma dinâmica as áreas de interesse que são exibidas para o usuário na hora do cadastro. Permite também configurar o SMTP para envio dos s. Quando o administrador efetua o disparo dos s, a ferramenta realiza esse comando da seguinte forma: verifica no banco de dados onde estão todas as informações do sistema os clientes que estão ativos, ou seja, que desejam receber s, exibe uma listagem de áreas que por meio de algoritmos de mineração de dados mostraram similaridades dando ao

71 Capítulo 4. Ferramenta de Marketing 55 administrador liberdade para análise e escolha dessas áreas antes de realizar realmente o disparo da campanha conforme é visto na Figura 4.2. Figura 4. 2 Processo de envio de mensagens pelo administrador O cliente possui a opção de cancelar seu cadastro para recebimentos de s, dentro do corpo do existe um link com essa opção, quando o cliente clicar nesse link automaticamente o seu status será desativado, isto é, no próximo disparo de s esse cliente não será selecionado. Quando um é aberto, essa informação é inserida no banco, ou seja, o sistema saberá qual cliente, a data e a hora que o foi aberto, dentro do corpo do contém produtos cadastrados que quando clicados, insere no banco o código do cliente e qual o produto foi de interesse do mesmo, de acordo com a Figura 43. Figura 4. 3 Disponibilidade de cancelamento do recebimento de s

72 Capítulo 4. Ferramenta de Marketing Ferramenta Personalizada A ferramenta trabalha com listas de recomendações personalizadas baseadas em perfis formados a partir dos disparos dos s, onde serão armazenados eventos realizados pelos usuários, e regras de associações criadas por meio de semelhanças encontradas entre os perfis dos usuários cadastrados no sistema. A cada nova campanha gerada, os perfis dos usuários são atualizados a partir do momento que o mesmo mostra interesse, abrindo o sobre a campanha enviada. Os algoritmos de mineração de dados são executados off-line, ou seja, são agendados para executar em um horário em que não haja uso da ferramenta e consequentemente atrapalharem o seu uso normal, atualizando as listas de recomendação, com usuários que possuem interesse direto sobre os assuntos enviados, algoritmo de classificação e possíveis novos interesses, gerados pelo algoritmo de regras de associação, conforme Figura 4.4. Figura 4. 4 Processo de criação de modelos off-line À medida que a base de dados é atualizada pela interação dos clientes com os s disparados, são criados os modelos off-line que sugerem listas de recomendações baseadas nos interesses dos perfis de clientes atualizados. A Figura 4.5, ilustra esta geração dos modelos a partir da nova base de dados que foi atualizada.

73 Capítulo 4. Ferramenta de Marketing 57 Figura 4. 5 Processo de envio de mensagens pelo administrador com a base atualizada após a mineração de dados.

74 Capítulo 5. Avaliação Avaliação Este capítulo de avaliação visa descrever as atividades realizadas para demonstrar a proposta apresentada para este trabalho. São descritos 3 estudos de caso realizados baseados na execução da mineração de dados para criação de perfis por associação (técnica do algoritmo Apriori) e por criação de grupos (técnica do algoritmo K-means). Além disso, são apresentados os resultados obtidos por meio das técnicas sugeridas Utilização da Ferramenta para obtenção dos Dados Com a ferramenta implementada vários usuários acessaram o front-end e realizaram o cadastro com nome, e as possíveis áreas de interesse que foram previamente inseridas, com isso, a base de clientes foi preenchida de acordo com o interesse inicial dos usuários. Paralelamente, foram cadastrados produtos de diferentes categorias alimentando a base de produtos da ferramenta a serem utilizados em cada campanha. Com a conclusão dessas etapas, iniciou-se a elaboração das campanhas para o envio dos s, neste trabalho foram criadas 11 (onze) campanhas contendo produtos categorizados em áreas distintas, que ao serem selecionadas pelos usuários atualizavam o perfil do mesmo. Nota-se que por enquanto ainda não foi utilizada nenhuma técnica de mineração de dados, os registros iniciais de cadastro se dão pela inserção dos dados pelo usuário por meio do cadastro no site e pela interação com os s de campanhas recebidas, na qual, caso um cliente tivesse interesse em algum produto de área que ainda não fazia parte do seu perfil, o mesmo seria atualizado com a nova informação. Desta forma, os perfis individuais são criados e atualizados conforme a necessidade. As personalizações e recomendações se dão pela execução dos algoritmos específicos presentes na ferramenta, os quais serão descritos nos estudos de casos.

75 Capítulo 5. Avaliação Estudo de Caso 1 Aplicação do algoritmo de Apriori. O algoritmo de Apriori é utilizado para se obter regras de associação, ou seja, busca por áreas frequentes em uma base de dados que ocorre simultaneamente em diversas transações. Desta forma, o sistema busca encontrar associações entre duas áreas distintas e verifica qual é a significância de associação que ambas possam ter. Na aplicação do algoritmo de Apriori são utilizados dois parâmetros com os valores desejados para este experimento.o primeiro representa o fator de suporte mínimo e tem o valor de 30%, o segundo indica o fator de confiança e tem o valor de 70%. O suporte mínimo é o percentual de vezes em que uma área aparece dentro de um conjunto de transações do banco de dados, neste caso, será considerada a área que tiver uma representação mínima de 30% dentro da base. A confiança representa o percentual de ocorrência de uma regra dentro do conjunto de transações obtido pelo suporte mínimo, neste caso, essa regra deverá ocorrer em no mínimo 70% dos casos. O algoritmo cria uma tabela temporária onde são inseridas as áreas e as frequências sem que as mesmas ocorram dentro das transações, onde essa frequência deve ser superior ou igual ao valor do suporte mínimo. A partir dessa tabela temporária são criadas associações entre as áreas, obtendo como resultado: áreas cadastradas, áreas associadas, frequência total da área cadastrada e frequência total das áreas associadas dentro da associação criada. O resultado obtido pelo algoritmo de Apriori é inserido em de uma tabela na base de dados e é utilizado para exibição das informações conforme pode ser observado na Figura 5.1.

76 Capítulo 5. Avaliação 60 Figura Informações obtidas por meio do algoritmo de Apriori A figura 5.1 demonstra as associações encontradas dentro dos parâmetros de suporte mínimo e de confiança estipulados, ou seja, cada área deve ocorrer no mínimo 30% dentre todas as transações da base de dados e uma regra de associação precisa estar presente em no mínimo 70% das ocorrências neste conjunto de áreas. Analisando estes dados, o sistema exibe outro relatório que demonstra as conclusões obtidas pelo processo de associações geradas, conforme pode ser observado na Figura 5.2. Figura 5. 2 Relatório obtido por meio do algoritmo de Apriori

77 Capítulo 5. Avaliação 61 Para isso, como não se deseja mostrar todas as regras que possam existir e que não sejam relevantes para um estudo mais eficaz, induz-se os valores mínimos para que ocorra o corte de regras desnecessárias. Portanto, quanto maior for o percentual de ocorrência (suporte) de uma área na base dados, assim como, quanto maior for seu percentual de associação (confiança) à outra área distinta, pode-se concluir que existe uma forte relação entre ambas as áreas dentro do cenário estudado Estudo de Caso 2 Aplicação do algoritmo de K-means. O algoritmo de K-Means é considerado um algoritmo não supervisionado, pois não necessita da supervisão humana, o seu objetivo é fornecer uma classificação de informações de acordo com um conjunto de dados informados, para isso ele utiliza de comparações entre valores numéricos desses dados. Para a aplicação desse algoritmo é necessário informar o valor do parâmetro k que vai representar a quantidade de classes (clusters) que serão gerados. As classes são formadas por meio da distância Euclidiana, para isso vai depender da quantidade de atributos da tabela fornecida, após descobrir as distâncias, o algoritmo calcula centróides de cada classe formada. Neste estudo de caso foi utilizado para o parâmetro k o valor 3 e passado uma lista contendo todas as áreas de interesse de cada cliente, com isso foi gerado três clusters de áreas com interesses similares conforme mostrado na Figura 5.3.

78 Capítulo 5. Avaliação 62 Figura 5. 3 Classificação das áreas de interesse similares por meio do Algoritmo de K-Means. De acordo com a Figura 5.3, são demonstrados 3 grupos,este valor k foi escolhido pois a base de dados com as áreas de interesses não é muito grande, o que não justificaria adotar um valor muito alto. Analisando a Figura 5.3, é possível ver que Informática e Eletrodoméstico possui alto grau de similaridade devido ao fato de terem uma distância Euclidiana pequena e por isso são inseridos no mesmo grupo. Desta forma, um cliente que tem interesse na área de Informática possui grande probabilidade de ter interesse na área de eletrodoméstico Estudo de Caso 3 Criação e Envio de uma campanha. Para este estudo de caso foi criada uma campanha da área de informática onde foi possível após a sua criação, uma análise baseada na execução das técnicas de Apriori e K-Means. A execução desses algoritmos irá sugerir áreas que possuem similaridades com o tema proposto na criação da campanha. A análise permite auxiliar o usuário na tomada de decisão para o envio da campanha criada, permitindo que o disparo seja direcionado para os clientes

79 Capítulo 5. Avaliação 63 cuja área de interesse seja o mesmo da campanha e para aqueles com possíveis interesses, que serão determinados pelas técnicas aplicadas. De acordo com a Figura 5.24 pode-se observar que aplicando-se a técnica de k-means são encontradas regras de associações onde são formados grupos específicos: Grupo 1 (Informática e Eletrodoméstico), Grupo 2 (Veículos, Culinária, Futebol e Jogos) e Grupo 3 (Vestuário, Bebidas, Entretenimento e Literatura). Figura 5. 4 Relatório gerado pelo algoritmo de K-Means para auxilio na tomada de decisão. Com a aplicação dessa técnica o resultado obtido foi uma associação entre as áreas informática e eletrodomésticos, conforme destacado em vermelho na Figura 5.4.

80 Capítulo 5. Avaliação 64 Figura 5. 5 Relatório gerado pelo algoritmo de Apriori para auxilio na tomada de decisão. Outra técnica disponível é a de Apriori que é exibida na Figura 5.5 onde são destacadas todas as linhas que possuem associações com a área da campanha criada. As duas técnicas propostas demonstram a capacidade de sugerir novas recomendações baseadas em uma área tema para criação de campanhas, desta forma, busca-se encontrar associações com outras áreas que possuem uma relação dentro da base de dados analisada. Sendo assim, o usuário da ferramenta tem a liberdade de poder escolher ou não os clientes de outras áreas para o envio da campanha, haja vista, que esses outros clientes podem também se interessar pelo conteúdo de tal campanha. O processo de escolha e envio da campanha pode ser observado conforme a Figura 5.6.

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING PREÂMBULO Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing. As disposições aqui descritas são destinadas a todos aqueles envolvidos na cadeia de envio e recebimento

Leia mais

Marketing digital NARCISO SANTAELLA

Marketing digital NARCISO SANTAELLA Marketing digital 1 Introdução As agências de publicidade recorrem ao marketing digital para conquistar o público que hoje tem na web uma das principais fontes de informação. Utilizar todos os recursos

Leia mais

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING. Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing.

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING. Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing. CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING PREÂMBULO Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing. As disposições aqui descritas são destinadas

Leia mais

Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing.

Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing. Código de Autorregulamentação para prática de E-mail Marketing Preâmbulo Este Código foi elaborado para regulamentar as práticas de envio de E-mail Marketing. As disposições aqui descritas são destinadas

Leia mais

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING PREÂMBULO Este Código de Autorregulamentação para a Prática de Email Marketing, doravante designado abreviadamente CAPEM, foi elaborado para

Leia mais

Com sede na Rua Conselheiro João Alfredo, 102B Mooca São Paulo/SP CEP: 03106-060

Com sede na Rua Conselheiro João Alfredo, 102B Mooca São Paulo/SP CEP: 03106-060 Política de Privacidade da Babyou A Política de Privacidade da Babyou foi elaborada para reafirmar nosso compromisso com a privacidade e a segurança das informações que coletamos de nossos clientes e internautas.

Leia mais

Unidade IV MERCADOLOGIA. Profº. Roberto Almeida

Unidade IV MERCADOLOGIA. Profº. Roberto Almeida Unidade IV MERCADOLOGIA Profº. Roberto Almeida Conteúdo Aula 4: Marketing de Relacionamento A Evolução do Marketing E-marketing A Internet como ferramenta As novas regras de Mercado A Nova Era da Economia

Leia mais

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING

CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING CÓDIGO DE AUTORREGULAMENTAÇÃO PARA PRÁTICA DE E-MAIL MARKETING PREÂMBULO Este Código de Autorregulamentação para a Prática de E-Mail Marketing, doravante designado abreviadamente CAPEM, foi elaborado para

Leia mais

POLÍTICA DE PRIVACIDADE

POLÍTICA DE PRIVACIDADE POLÍTICA DE PRIVACIDADE A Política de Privacidade da SOS EMPRESARIAL foi elaborada para reafirmar nosso compromisso com a privacidade e a segurança das informações que coletamos de nossos clientes e usuários.

Leia mais

Comércio eletrônico 05/05/15. Objetivos de estudo. Qual o papel do e- commerce nos negócios e quais as aplicações mais importantes?

Comércio eletrônico 05/05/15. Objetivos de estudo. Qual o papel do e- commerce nos negócios e quais as aplicações mais importantes? Escola Superior de Gestão e Tecnologia Comércio eletrônico Mercados digitais, mercadorias digitais Prof. Marcelo Mar3ns da Silva Objetivos de estudo Qual o papel do e- commerce nos negócios e quais as

Leia mais

Poucas inovações na história da humanidade reúnem tantos benefícios potenciais quanto o Comércio Eletrônico (também conhecido como e-commerce).

Poucas inovações na história da humanidade reúnem tantos benefícios potenciais quanto o Comércio Eletrônico (também conhecido como e-commerce). Poucas inovações na história da humanidade reúnem tantos benefícios potenciais quanto o Comércio Eletrônico (também conhecido como e-commerce). A natureza global da tecnologia, a oportunidade de atingir

Leia mais

ARKETING INTERNET SEO CRIATIVIDADE AGÊNCIA CRIAÇÃO

ARKETING INTERNET SEO CRIATIVIDADE AGÊNCIA CRIAÇÃO DESIGN CRIAÇÃO AGÊNCIA USABILIDA ARKETING INTERNET SEO DIGIT CRIATIVIDADE DESDE 1999 NO MERCADO, A M2BRNET É UMA AGÊNCIA DE MARKETING DIGITAL ESPECIALIZADA EM SOLUÇÕES PERSONALIZADAS. SI ARQ Desde 1999

Leia mais

Introdução ao GetResponse

Introdução ao GetResponse Guia rápido sobre... Introdução ao GetResponse Neste guia... Aprenda a construir sua lista, a criar envolventes e-mails e a converter contatos em clientes em GetResponse, com acesso aos melhores recursos

Leia mais

Jornalismo Interativo

Jornalismo Interativo Jornalismo Interativo Antes da invenção da WWW, a rede era utilizada para divulgação de informações direcionados a públicos muito específicos e funcionavam através da distribuição de e-mails e boletins.

Leia mais

AUTOR(ES): MAITHÊ CORSI DA SILVA, FERNANDO TEIXEIRA CARVALHO, RENAN GUSTAVO MOLINA

AUTOR(ES): MAITHÊ CORSI DA SILVA, FERNANDO TEIXEIRA CARVALHO, RENAN GUSTAVO MOLINA TÍTULO: A IMPORTÂNCIA DO E-COMMERCE NAS PEQUENAS EMPRESAS CATEGORIA: EM ANDAMENTO ÁREA: CIÊNCIAS SOCIAIS APLICADAS SUBÁREA: ADMINISTRAÇÃO INSTITUIÇÃO: FACULDADE DE JAGUARIÚNA AUTOR(ES): MAITHÊ CORSI DA

Leia mais

APRESENTAÇÃO da Empresa

APRESENTAÇÃO da Empresa APRESENTAÇÃO da Empresa EMPRESA ÍNDICE - Sobre a empresa - Política de Qualidade e Código de ética - Comprometidos com a qualidade e satisfação do cliente 04 05 06 SERVIÇOS - Desenvolvimento de Sites -

Leia mais

E-Mail Marketing: Primeiros Passos

E-Mail Marketing: Primeiros Passos E-Mail Marketing: Primeiros Passos E-Mail Marketing: Primeiros Passos Aprenda a utilizar o email marketing para alavancar o seu negócio O Marketing Digital vem ganhando cada vez mais força entre as empresas

Leia mais

15 dicas. para tornar o seu E-mail Marketing bem-sucedido

15 dicas. para tornar o seu E-mail Marketing bem-sucedido 15 dicas para tornar o seu E-mail Marketing bem-sucedido 1 Índice PÁG 04 - Dica 1: Analise o mercado e segmente os consumidores PÁG 05 - Dica 2: Tenha uma lista Opt-In PÁG 05 - Dica 3: Insira um link para

Leia mais

Marcelo Ivanir Peruzzo

Marcelo Ivanir Peruzzo 5 Web Marketing Marcelo Ivanir Peruzzo É comum as pessoas utilizarem o termo marketing nas mais variadas situações, como na política: Ele está fazendo uma jogada de marketing para conquistar o cargo de

Leia mais

O que é comércio eletrônico?

O que é comércio eletrônico? COMÉRCIO ELETRÔNICO O que é comércio eletrônico? O comércio eletrônico ou e-commerce é a compra e venda de mercadorias ou serviços por meio da Internet, onde as chamadas Lojas Virtuais oferecem seus produtos

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

http://cartilha.cert.br/

http://cartilha.cert.br/ http://cartilha.cert.br/ Atualmente, graças à Internet, é possível comprar produtos sem sair de casa ou do trabalho, sem se preocupar com horários e sem enfrentar filas. Eainda receber tudo em casa ou

Leia mais

Comércio eletrônico: mercados digitais, mercadorias digitais. slide 1

Comércio eletrônico: mercados digitais, mercadorias digitais. slide 1 Comércio eletrônico: mercados digitais, mercadorias digitais slide 1 Nexon Games: o comércio eletrônico torna-se social Problema: concorrência com outras empresas de jogos on-line e off-line; aumentar

Leia mais

Principais Estratégias de Web Marketing

Principais Estratégias de Web Marketing Comércio Eletrônico Faculdade de Tecnologia SENAC Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas Unidade Curricular: Comércio Eletrônico Edécio Fernando Iepsen (edecio@terra.com.br)

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

Guia completo para o sucesso de sua loja de veículos: dicas de como ter sucesso e manter uma alta lucratividade neste segmento

Guia completo para o sucesso de sua loja de veículos: dicas de como ter sucesso e manter uma alta lucratividade neste segmento Guia completo para o sucesso de sua loja de veículos: dicas de como ter sucesso e manter uma alta lucratividade neste segmento Introdução Planejamento Divulgando sua loja Como fechar as vendas Nota Fiscal

Leia mais

PUBLICIDADE ONLINE uma visão geral. João Luiz Serpa Seraine Webdesigner 11/05/2007

PUBLICIDADE ONLINE uma visão geral. João Luiz Serpa Seraine Webdesigner 11/05/2007 PUBLICIDADE ONLINE uma visão geral João Luiz Serpa Seraine Webdesigner 11/05/2007 Nova Economia A nova economia está diretamente ligada à velocidade de informações, comunicação, conhecimento, tecnologia.

Leia mais

Sistemas web e comércio eletrônico. Aula 02 Arquiteturas de comércio eletrônico

Sistemas web e comércio eletrônico. Aula 02 Arquiteturas de comércio eletrônico Sistemas web e comércio eletrônico Aula 02 Arquiteturas de comércio eletrônico Tópicos abordados Arquitetura do e-commerce Aspectos importantes do e-commerce Modelos de negócios Identificação do modelo

Leia mais

Benefícios do E-mail marketing e da Benchmark E-mail

Benefícios do E-mail marketing e da Benchmark E-mail 1 1. SOBRE O E-BOOK... 1 2. A BENCHMARK E-MAIL... 5 3. IMPORTÂNCIA DO E-MAIL... 5 4. OS BENEFÍCIOS DO E-MAIL MARKETING... 6 4.1. DIGITAL VS. IMPRESSO... 7 4.1.1. CUSTOS... 7 4.1.2. CONTEÚDO... 7 4.1.3.

Leia mais

POLÍTICA DE PRIVACIDADE DA INTEREP REPRESENTAÇÕES VIAGENS E TURISMO LTDA

POLÍTICA DE PRIVACIDADE DA INTEREP REPRESENTAÇÕES VIAGENS E TURISMO LTDA POLÍTICA DE PRIVACIDADE DA INTEREP REPRESENTAÇÕES VIAGENS E TURISMO LTDA Nós da Interep Representações Viagens e Turismo. compreendemos que fazer reservas online envolve uma grande confiança de sua parte.

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Como criar uma estratégia de comunicação digital vencedora. São Paulo-SP Setembro/2013

Como criar uma estratégia de comunicação digital vencedora. São Paulo-SP Setembro/2013 Como criar uma estratégia de comunicação digital vencedora São Paulo-SP Setembro/2013 Introdução O Objetivo deste trabalho é criar uma estratégia de comunicação digital vencedora através do marketing por

Leia mais

SMS Marketing. Manual Clube Turismo JULHO / 2012

SMS Marketing. Manual Clube Turismo JULHO / 2012 JULHO / 2012 Manual Clube Turismo SMS Marketing Mais eficaz do que TV, rádio, panfleto, outdoor ou qualquer mídia criada pelo homem. Nada se compra à praticidade de uma mensagem de celular. Afinal, o celular

Leia mais

7 Passos Para a Criação de Uma Boa Loja Virtual. Índice

7 Passos Para a Criação de Uma Boa Loja Virtual. Índice 2 Índice Introdução... 3 Passo 1 Entender o que é Venda Online e E-commerce... 4 Passo 2 Entender o Mercado de Comércio Eletrônico... 5 Passo 3 Canais de Venda... 6 Passo 4 Como identificar uma Boa Plataforma

Leia mais

Autoatendimento Digital. Reduz custos e aprimora as relações com o cliente, criando experiências de autoatendimento personalizadas e significativas.

Autoatendimento Digital. Reduz custos e aprimora as relações com o cliente, criando experiências de autoatendimento personalizadas e significativas. Autoatendimento Digital Reduz custos e aprimora as relações com o cliente, criando experiências de autoatendimento personalizadas e significativas. Oferece aos clientes as repostas que buscam, e a você,

Leia mais

Prezado Futuro Cliente

Prezado Futuro Cliente Prezado Futuro Cliente É com grade satisfação que encaminhamos nossa apresentação institucional e certos de estabelecermos uma parceria de sucesso e duradoura. Ela foi desenvolvida com objetivo de mostrar

Leia mais

Aline Santos Carlos Augusto Peterson Almeida Rafael Rodrigues Ramon Assis

Aline Santos Carlos Augusto Peterson Almeida Rafael Rodrigues Ramon Assis Aline Santos Carlos Augusto Peterson Almeida Rafael Rodrigues Ramon Assis Marketing Digital Trabalho científico apresentado ao Professor Edvaldo Jr., docente da matéria Marketing Digital, da turma de Produção

Leia mais

POLÍTICA DE PRIVACIDADE AMBIENTAL MERCANTIL

POLÍTICA DE PRIVACIDADE AMBIENTAL MERCANTIL POLÍTICA DE PRIVACIDADE AMBIENTAL MERCANTIL Leia com atenção a nossa Política de Privacidade. Esta Política de Privacidade aplica-se à todos os usuários cadastrados no site, e integram os Termos e Condições

Leia mais

FERRAMENTAS DE COLABORAÇÃO CORPORATIVA

FERRAMENTAS DE COLABORAÇÃO CORPORATIVA FERRAMENTAS DE COLABORAÇÃO CORPORATIVA Manual de Utilização Google Grupos Sumário (Clique sobre a opção desejada para ir direto à página correspondente) Utilização do Google Grupos Introdução... 3 Página

Leia mais

Proposta Loja Virtual. Schmitt Tricot

Proposta Loja Virtual. Schmitt Tricot Proposta Loja Virtual Schmitt Tricot Apresentação: Atualmente atuo no mercado de sites e lojas virtuais desde 2010, desenvolvendo novas ideias, trabalhando com agilidade, para sempre atender a todas as

Leia mais

Você ainda não tem um Web Site? Que pena! Seu concorrente já.

Você ainda não tem um Web Site? Que pena! Seu concorrente já. 1 Porque ter um site? Você ainda não tem um Web Site? Que pena! Seu concorrente já. Em um mundo globalizado, ter um site na internet não é mais um luxo para poucos, e sim uma regra geral para empresas

Leia mais

Apostila. Comércio Eletrônico. e-commerce. Professor: Edson Almeida Junior. Comércio Eletrônico

Apostila. Comércio Eletrônico. e-commerce. Professor: Edson Almeida Junior. Comércio Eletrônico Apostila Comércio Eletrônico e-commerce Professor: Edson Almeida Junior Material compilado por Edson Almeida Junior Disponível em http://www.edsonalmeidajunior.com.br MSN: eajr@hotmail.com E-Mail: eajr@hotmail.com

Leia mais

Elementos essenciais para criar a Jornada do Cliente. para qualquer nível de profissional de marketing

Elementos essenciais para criar a Jornada do Cliente. para qualquer nível de profissional de marketing 3 Elementos essenciais para criar a Jornada do Cliente para qualquer nível de profissional de marketing Elementos essenciais para criar a Jornada do Cliente para qualquer nível de profissional de marketing

Leia mais

Manual de Boas Maneiras no E-mail Marketing

Manual de Boas Maneiras no E-mail Marketing Manual de Boas Maneiras no E-mail Marketing Conheça alguns cuidados que você precisa ter quando elaborar suas campanhas de e- mail marketing. A MailSender elaborou para você um breve manual com as melhores

Leia mais

E-commerce Fundamentos

E-commerce Fundamentos E-commerce Fundamentos Flávio Augusto Martins Wanderley Professor flavio@mwan.com.br 1 / 65 Conteúdo desta aula Conceitos. Evolução do comércio eletrônico. Modalidades. O que vem no futuro. 2 / 65 Conceito

Leia mais

Estratégias de marketing digital como diferencial competitivo para pequenas empresas

Estratégias de marketing digital como diferencial competitivo para pequenas empresas IX WORKSHOP DE PÓS-GRADUAÇÃO E PESQUISA DO CENTRO PAULA SOUZA São Paulo, 15 e 16 de outubro de 2014 Estratégias Globais e Sistemas Produtivos Brasileiros ISSN: 2175-1897 Estratégias de marketing digital

Leia mais

Universidade de São Paulo Centro de Informática de Ribeirão Preto TUTORIAL HOTMAIL

Universidade de São Paulo Centro de Informática de Ribeirão Preto TUTORIAL HOTMAIL Universidade de São Paulo Centro de Informática de Ribeirão Preto TUTORIAL HOTMAIL Tutorial Hotmail Sobre o MSN Hotmail Acessando o Hotmail Como criar uma conta Efetuando o login Verificar mensagens Redigir

Leia mais

SISTEMAS DE NEGÓCIOS B) INFORMAÇÃO GERENCIAL

SISTEMAS DE NEGÓCIOS B) INFORMAÇÃO GERENCIAL 1 SISTEMAS DE NEGÓCIOS B) INFORMAÇÃO GERENCIAL 1. SISTEMAS DE INFORMAÇÃO GERENCIAL (SIG) Conjunto integrado de pessoas, procedimentos, banco de dados e dispositivos que suprem os gerentes e os tomadores

Leia mais

Faça com que o CRM trabalhe da mesma maneira que o seu pessoal de vendas

Faça com que o CRM trabalhe da mesma maneira que o seu pessoal de vendas Faça com que o CRM trabalhe da mesma maneira que o seu pessoal de vendas APROVEITE AS TECNOLOGIAS DE HOJE PARA MAXIMIZAR A ADOÇÃO POR PARTE DOS USUÁRIOS Para os profissionais de venda, o tempo nunca havia

Leia mais

C.P.F. DOS ENVOLVIDOS: 105111179-06 085997089-29 093745209-23 KRIO. A integração entre a tecnologia e a comunicação para Jovens Aprendizes

C.P.F. DOS ENVOLVIDOS: 105111179-06 085997089-29 093745209-23 KRIO. A integração entre a tecnologia e a comunicação para Jovens Aprendizes C.P.F. DOS ENVOLVIDOS: 105111179-06 085997089-29 093745209-23 KRIO A integração entre a tecnologia e a comunicação para Jovens Aprendizes FLORIANÓPOLIS 2014 2 RESUMO: O projeto apresentado é resultado

Leia mais

Estudo de Web Marketing para a Prova NP1 Dia da prova: 07/10/2011

Estudo de Web Marketing para a Prova NP1 Dia da prova: 07/10/2011 Curso de Marketing Disciplina: Web Marketing Professor: Roberto Marcello Estudo de Web Marketing para a Prova NP1 Dia da prova: 07/10/2011 Web Marketing Web Marketing é qualquer esforço promocional realizado

Leia mais

Capítulo 1 Por que Google Marketing?

Capítulo 1 Por que Google Marketing? Capítulo 1 Por que Google Marketing? O Google modificou substancialmente a maneira como o mercado lida com a informação e informação, na nossa sociedade pós terceira onda, é tudo. Do dinheiro ao eletrodoméstico,

Leia mais

Apps de Produtividade

Apps de Produtividade Apps de Produtividade Os App s de Produtividade oferecem controle, organização e recursos para profissionalização das áreas internas e externas da empresa, proporcionando: Produtividade Controle Integração

Leia mais

O QUE É AUTOMAÇÃO DE MARKETING?

O QUE É AUTOMAÇÃO DE MARKETING? O QUE É AUTOMAÇÃO DE MARKETING? AUTOMAÇÃO DE MARKETING AJUDA A Fechar mais negócios Atrair mais potenciais clientes Entregue mais clientes já qualificados para a equipe de vendas e feche mais negócios

Leia mais

Criar Newsletters. Guia rápido sobre...

Criar Newsletters. Guia rápido sobre... Guia rápido sobre... Criar Newsletters Neste guia... Saiba como criar atrativas newsletters em texto simples ou HTML para captar a atenção de seus contatos e ir ao encontro de seus interesses e expectativas.

Leia mais

Integração com a Mídia Social

Integração com a Mídia Social Guia rápido sobre... Integração com a Mídia Social Neste guia... Vamos mostrar como integrar seu marketing com as mídias sociais para você tirar o maior proveito de todo esse burburinho online! Nós ajudamos

Leia mais

PROPOPOSTA COMERCIAL Google Adwords

PROPOPOSTA COMERCIAL Google Adwords PROPOPOSTA COMERCIAL Google Adwords Sumário Sobre a Tribusweb 3 Soluções e Proposta 6 Condições Comerciais 9 Condições gerais 10 2 Sobre a Tribusweb A Tribusweb é uma agência de marketing digital que atua

Leia mais

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr.

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr. 15 Aula 15 Tópicos Especiais I Sistemas de Informação Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Conceitos básicos sobre Sistemas de Informação Conceitos sobre Sistemas

Leia mais

5 Coisas que você deve saber sobre a ExactTarget Marketing Cloud

5 Coisas que você deve saber sobre a ExactTarget Marketing Cloud 5 Coisas que você deve saber sobre a ExactTarget Marketing Cloud Aprimore a jornada de seus clientes com a plataforma de marketing digital 1:1 líder de mercado 5 Coisas que você deve saber sobre a ExactTarget

Leia mais

FAVOR LER. SEU USO DESTE WEBSITE ESTÁ SUJEITO À SEGUINTE DECLARAÇÃO DE POLÍTICA DE PRIVACIDADE E AOS TERMOS DE SERVIÇO DO WEBSITE.

FAVOR LER. SEU USO DESTE WEBSITE ESTÁ SUJEITO À SEGUINTE DECLARAÇÃO DE POLÍTICA DE PRIVACIDADE E AOS TERMOS DE SERVIÇO DO WEBSITE. FAVOR LER. SEU USO DESTE WEBSITE ESTÁ SUJEITO À SEGUINTE DECLARAÇÃO DE POLÍTICA DE PRIVACIDADE E AOS TERMOS DE SERVIÇO DO WEBSITE. Notificação Esse website é operado pela/para Sony Pictures Entertainment

Leia mais

Especialização em Marketing Digital - NOVO

Especialização em Marketing Digital - NOVO Especialização em Marketing Digital - NOVO Apresentação Previsão de Início Agosto/2013 Inscrições em Breve - Turma 01 - Campus Stiep O ambiente de negócios tem sido modificado pelas Novas Tecnologias da

Leia mais

ALGUNS DADOS DA INTERNET NO BRASIL. (11) 3522-5338 - www.cvsweb.com.br comercial@cvsweb.com.br

ALGUNS DADOS DA INTERNET NO BRASIL. (11) 3522-5338 - www.cvsweb.com.br comercial@cvsweb.com.br ALGUNS DADOS DA INTERNET NO BRASIL 2 + 67.500.000 + 67,5 MILHÕES DE INTERNAUTAS NO BRASIL FONTE: IBOPE/NIELSEN 58.290.000 58,2 MILHOES DE INTERNAUTAS NO BRASIL ACESSAM A INTERNET SEMANALMENTE -87% FONTE:

Leia mais

Conceitos e tarefas da administração de marketing DESENVOLVIMENTO DE ESTRATEGIAS E PLANOS DE MARKETING

Conceitos e tarefas da administração de marketing DESENVOLVIMENTO DE ESTRATEGIAS E PLANOS DE MARKETING Sumário Parte um Conceitos e tarefas da administração de marketing CAPITULO I MARKETING PARA 0 SÉCULO XXI A importância do marketing O escopo do marketing 0 que é marketing? Troca e transações A que se

Leia mais

T2Ti Tecnologia da Informação Ltda T2Ti.COM http://www.t2ti.com Projeto T2Ti ERP 2.0. Bloco Comercial. CRM e AFV

T2Ti Tecnologia da Informação Ltda T2Ti.COM http://www.t2ti.com Projeto T2Ti ERP 2.0. Bloco Comercial. CRM e AFV Bloco Comercial CRM e AFV Objetivo O objetivo deste artigo é dar uma visão geral sobre os Módulos CRM e AFV, que fazem parte do Bloco Comercial. Todas informações aqui disponibilizadas foram retiradas

Leia mais

Conhecimentos de Vendas: Clientes, Produtos e Tecnologias

Conhecimentos de Vendas: Clientes, Produtos e Tecnologias Conhecimentos de Vendas: Clientes, Produtos e Tecnologias Esquema de Palestra I. Fontes de Conhecimentos Sobre Vendas A. Treinamento de Vendas atividade desenvolvida por um empregador para oferecer ao

Leia mais

POLÍTICA DE PRIVACIDADE DA INTEREP REPRESENTAÇÕES VIAGENS E TURISMO LTDA

POLÍTICA DE PRIVACIDADE DA INTEREP REPRESENTAÇÕES VIAGENS E TURISMO LTDA POLÍTICA DE PRIVACIDADE DA INTEREP REPRESENTAÇÕES VIAGENS E TURISMO LTDA Ao desenvolvermos o site Interep.com.br tivemos duas premissas como objetivos principais: tecnologia e segurança. Investimos em

Leia mais

10. Defina Sistemas Distribuídos: Um conjunto de computadores independentes que se apresenta a seus usuários como um sistema único e coerente

10. Defina Sistemas Distribuídos: Um conjunto de computadores independentes que se apresenta a seus usuários como um sistema único e coerente 1. Quais os componentes de um sistema cliente-servidor? Clientes e servidores 2. Na visão do hardware, defina o que é cliente e o que é servidor: Clientes. Qualquer computador conectado ao sistema via

Leia mais

SISTEMAS PARA INTERNET

SISTEMAS PARA INTERNET Unidade II SISTEMAS PARA INTERNET E SOFTWARE LIVRE Prof. Emanuel Matos Sumário Unidade II Comércio Eletrônico Tecnologia de Comércio Eletrônico Categorias do Comércio Eletrônico M-commerce Comércio eletrônico

Leia mais

POLÍTICA DE PRIVACIDADE DA CLICKSIGN

POLÍTICA DE PRIVACIDADE DA CLICKSIGN Data efetiva: 14 de abril de 2014. POLÍTICA DE PRIVACIDADE DA CLICKSIGN Esta Política de Privacidade abrange a coleta, uso e divulgação de informação coletada em todas as plataformas, sistemas, aplicativos,

Leia mais

Security Officer Foundation

Security Officer Foundation Security Officer Foundation As comunicações e os meios de armazenamento das informações evoluíram mais nestes últimos anos do que em outro tempo na história conhecida. A internet comercial foi consolidada

Leia mais

Aula 03 Gestão de Marketing

Aula 03 Gestão de Marketing Aula 03 Gestão de Marketing Análise SWOT, Segmentação de Mercado e Mix de Marketing Prof. Marcopolo Marinho Prof. Esp. Marcopolo Marinho Segmentação é a identificação sistemática de conjuntos e subconjuntos

Leia mais

Atividade Capitulo 6 - GABARITO

Atividade Capitulo 6 - GABARITO Atividade Capitulo 6 - GABARITO 1. A Internet é uma força motriz subjacente aos progressos em telecomunicações, redes e outras tecnologias da informação. Você concorda ou discorda? Por quê? Por todos os

Leia mais

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo Unidade III PRINCÍPIOS DE SISTEMAS DE INFORMAÇÃO Prof. Luís Rodolfo Vantagens e desvantagens de uma rede para a organização Maior agilidade com o uso intenso de redes de computadores; Grandes interações

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

O GUIA essencial para reter, engajar e fidelizar clientes em seu ecommerce

O GUIA essencial para reter, engajar e fidelizar clientes em seu ecommerce O GUIA essencial para reter, engajar e fidelizar clientes em seu ecommerce sumário >> Introdução... 03 >> Antes de qualquer coisa: conheça e entenda quem é o seu cliente... 05 >> A importância do marketing

Leia mais

APOSTILA CURSO MARKETING DIGITAL

APOSTILA CURSO MARKETING DIGITAL APOSTILA CURSO MARKETING DIGITAL Marketing digital Marketing digital são ações de comunicação que as empresas podem se utilizar por meio da Internet e da telefonia celular e outros meios digitais para

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Aula 8 Conversação e rede social na web

Aula 8 Conversação e rede social na web Aula 8 Conversação e rede social na web Aula 8 Conversação e rede social na web Meta Apresentar um programa de voz sobre IP (VoIP), o Skype, e fazer uma breve introdução ao mundo das redes sociais online,

Leia mais

I N T R O D U Ç Ã O W A P desbloqueio,

I N T R O D U Ç Ã O W A P desbloqueio, INTRODUÇÃO Para que o Guia Médico de seu Plano de Saúde esteja disponível em seu celular, antes de mais nada, sua OPERADORA DE SAÚDE terá de aderir ao projeto. Após a adesão, você será autorizado a instalar

Leia mais

ÁREA DO PROFESSOR (TUTOR)

ÁREA DO PROFESSOR (TUTOR) ÁREA DO PROFESSOR (TUTOR) 2- FÓRUM O fórum serve para avaliar os alunos através da participação na discussão sobre um ou mais assuntos, inserção de textos ou arquivos. Os fóruns de discussão compõem uma

Leia mais

http://cartilha.cert.br/

http://cartilha.cert.br/ http://cartilha.cert.br/ Quanto mais informações você disponibiliza na Internet, mais difícil se torna preservar a sua privacidade Nada impede que você abra mão de sua privacidade e, de livre e espontânea

Leia mais

TNT Radar Manual do Usuário Versão 2.1 Fevereiro 2015.

TNT Radar Manual do Usuário Versão 2.1 Fevereiro 2015. TNT Radar Manual do Usuário Versão 2.1 Fevereiro 2015. Sumário 1 - Objetivo deste manual.... 3 2 - Bem vindo ao TNT Radar.... 4 3 - Perguntas e respostas sobre a ferramenta TNT Radar.... 5 4 - Acesso a

Leia mais

Número de pessoas com acesso à internet passa de 120 milhões

Número de pessoas com acesso à internet passa de 120 milhões MÍDIA KIT INTERNET Número de pessoas com acesso à internet passa de 120 milhões Segundo pesquisa da Nielsen IBOPE, até o 1º trimestre/2014 número 18% maior que o mesmo período de 2013. É a demonstração

Leia mais

Transformação do call center. Crie interações com o cliente mais lucrativas e agregue valor adicionando insights e eficiência em todas as chamadas.

Transformação do call center. Crie interações com o cliente mais lucrativas e agregue valor adicionando insights e eficiência em todas as chamadas. Transformação do call center Crie interações com o cliente mais lucrativas e agregue valor adicionando insights e eficiência em todas as chamadas. Lucre com a atenção exclusiva de seus clientes. Agora,

Leia mais

Fundamentos em Segurança de Redes de Computadores. Pragas Virtuais

Fundamentos em Segurança de Redes de Computadores. Pragas Virtuais Fundamentos em Segurança de Redes de Computadores Pragas Virtuais 1 Pragas Virtuais São programas desenvolvidos com fins maliciosos. Pode-se encontrar algumas semelhanças de um vírus de computador com

Leia mais

Prof. Lucas Santiago

Prof. Lucas Santiago Classificação e Tipos de Sistemas de Informação Administração de Sistemas de Informação Prof. Lucas Santiago Classificação e Tipos de Sistemas de Informação Sistemas de Informação são classificados por

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Privacidade.

Privacidade. <Nome> <Instituição> <e-mail> Privacidade Agenda Privacidade Riscos principais Cuidados a serem tomados Créditos Privacidade (1/3) Sua privacidade pode ser exposta na Internet: independentemente da sua

Leia mais

Curso Marketing Político Digital Por Leandro Rehem Módulo III MULTICANAL. O que é Marketing Multicanal?

Curso Marketing Político Digital Por Leandro Rehem Módulo III MULTICANAL. O que é Marketing Multicanal? Curso Marketing Político Digital Por Leandro Rehem Módulo III MULTICANAL O que é Marketing Multicanal? Uma campanha MultiCanal integra email, SMS, torpedo de voz, sms, fax, chat online, formulários, por

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Resumo. Palavras-chave: twitter; ferramenta; planejamento; Greenpeace.

Resumo. Palavras-chave: twitter; ferramenta; planejamento; Greenpeace. O Twitter Como Ferramenta de Divulgação Para As Empresas: Um Estudo De Caso do GREENPEACE 1 Jonathan Emerson SANTANA 2 Gustavo Guilherme da Matta Caetano LOPES 3 Faculdade Internacional de Curitiba - FACINTER

Leia mais

PRIMEIROS PASSOS PARA A OTIMIZAÇÃO DO CALL CENTER EM CLÍNICAS E HOSPITAIS. Descubra como otimizar os Call Centers na área de saúde

PRIMEIROS PASSOS PARA A OTIMIZAÇÃO DO CALL CENTER EM CLÍNICAS E HOSPITAIS. Descubra como otimizar os Call Centers na área de saúde ebook GRÁTIS PRIMEIROS PASSOS PARA A OTIMIZAÇÃO DO CALL CENTER EM CLÍNICAS E HOSPITAIS Descubra como otimizar os Call Centers na área de saúde Primeiros passos para a otimização do call center em clínicas

Leia mais

1. PRÁTICA EFICAZ DE GESTÃO EDUCACIONAL Gestão do ciclo completo de relacionamento com o aluno SRM da Universidade Feevale

1. PRÁTICA EFICAZ DE GESTÃO EDUCACIONAL Gestão do ciclo completo de relacionamento com o aluno SRM da Universidade Feevale RELATÓRIO DE AVALIAÇÃO 1. PRÁTICA EFICAZ DE GESTÃO EDUCACIONAL Gestão do ciclo completo de relacionamento com o aluno SRM da Universidade Feevale 1.1 Histórico da Prática Eficaz Por meio do Departamento

Leia mais

O mercado de e-commerce e como torná-lo mais rentável usando o marketing digital. Julia Lopes - gerente de parcerias de canais

O mercado de e-commerce e como torná-lo mais rentável usando o marketing digital. Julia Lopes - gerente de parcerias de canais O mercado de e-commerce e como torná-lo mais rentável usando o marketing digital Julia Lopes - gerente de parcerias de canais Dados de e-commerce no Brasil dimensionando o mercado Faturamento do e-commerce

Leia mais

GUIA DE SOCIAIS EM REDES BOAS PRÁTICAS EM GESTÃO DO ATENDIMENTO E RELACIONAMENTO MELHORES PRÁTICAS. MELHORES RESULTADOS.

GUIA DE SOCIAIS EM REDES BOAS PRÁTICAS EM GESTÃO DO ATENDIMENTO E RELACIONAMENTO MELHORES PRÁTICAS. MELHORES RESULTADOS. GUIA DE BOAS PRÁTICAS EM GESTÃO DO ATENDIMENTO E RELACIONAMENTO EM REDES SOCIAIS MELHORES PRÁTICAS. MELHORES RESULTADOS. APRESENTAÇÃO OBJETIVO A ABA - Associação Brasileira de Anunciantes, por meio de

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

APRESENTAÇÃO. Aprecie as apresentações a seguir. Boa leitura!

APRESENTAÇÃO. Aprecie as apresentações a seguir. Boa leitura! APRESENTAÇÃO A Informatiza Soluções Empresariais está no mercado desde 2006 com atuação e especialização na criação de sites e lojas virtuais. A empresa conta com um sistema completo de administração de

Leia mais

A BRASIL ROTÁRIO FRENTE ÀS MÍDIAS ELETRÔNICAS. Carlos Jerônimo da Silva Gueiros

A BRASIL ROTÁRIO FRENTE ÀS MÍDIAS ELETRÔNICAS. Carlos Jerônimo da Silva Gueiros A BRASIL ROTÁRIO FRENTE ÀS MÍDIAS ELETRÔNICAS Carlos Jerônimo da Silva Gueiros Um mundo em transformação 1998 / 1999 Mutirão Digital apoiar as escolas públicas no acesso à Internet 2010-12 anos depois...

Leia mais

A empresa digital: comércio e negócios eletrônicos

A empresa digital: comércio e negócios eletrônicos Universidade Federal do Vale do São Francisco Curso de Administração Tecnologia e Sistemas de Informação - 06 Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti

Leia mais