Análise Preditiva com o SQL Server 2008



Documentos relacionados
Os novos usos da tecnologia da informação nas empresas Sistemas de Informação

Vensis PCP. Rua Américo Vespúcio, 71 Porto Alegre / RS (51) comercial@vensis.com.br

Novo Sistema Almoxarifado

Diferenciais do QlikView Versus Tecnologias Tradicionais

Código: Data: Revisão: Página: SUMÁRIO

Agenda. A interface de Agendamento é encontrada no Modulo Salão de Vendas Agendamento Controle de Agendamento, e será apresentada conforme figura 01.

SGCT - Sistema de Gerenciamento de Conferências Tecnológicas

WORKSHOPS SOBRE AS POSSIBILIDADES DE COOPERAÇÃO / CONCENTRAÇÃO NO SECTOR AUXILIAR NAVAL

Academia FI Finanças

ALTERAÇÕES NO SISTEMA ORION

Vensis Manutenção. Rua Américo Vespúcio, 71 Porto Alegre / RS (51) comercial@vensis.com.br

GESTÃO DE PROJETOS. Uma visão geral Baseado nas diretrizes do PMI

Anexo 03 Recomendação nº 3: estatuto padrão, estatuto fundamental e contrato social

Modelo de Negócios. TRABALHO REALIZADO POR: Antonio Gome // Jorge Teixeira

UNIVERSIDADE FEDERAL DE RONDÔNIA

ISO 9001:2008 alterações à versão de 2000

Anexo V. Software de Registro Eletrônico em Saúde. Implantação em 2 (duas) Unidades de Saúde

PROPOSTA DE DESENVOLVIMENTO

Modelagem, qualificação e distribuição em um padrão para geoinformações

INTRODUÇÃO A LOGICA DE PROGRAMAÇÃO

Manual. Autorizador da UNIMED

MANUAL DO USUÁRIO FINANCEIRO

Projetos, Programas e Portfólios

MASTERCOMP ESCOLA DE INFORMÁTICA

Versões Todos os módulos devem ser atualizados para as versões a partir de 03 de outubro de 2013.

Apresentação do Curso

Todos os direitos reservados Versão 1.2

CURSO PREPARATÓRIO PARA CERTIFICAÇÃO

Universidade Luterana do Brasil Faculdade de Informática. Disciplina de Engenharia de Software Professor Luís Fernando Garcia

Projeto de Arquitetura Objetivos. Tópicos abordados. Arquitetura de software. Vantagens da arquitetura explícita

Informática II INFORMÁTICA II

1 Criando uma conta no EndNote

Boletim Técnico. CAGED Portaria 1129/2014 MTE. Procedimento para Implementação. Procedimento para Utilização

FKcorreiosg2_cp1 - Complemento Transportadoras

Manual do Novo Pátio. Revenda. Versão 2.0

Principais Informações

Processo de envio de de marketing

Workflow. José Palazzo Moreira de Oliveira. Mirella Moura Moro

SMART CONTROLE DO ESTOQUE DE GONDOLA

CONCORRÊNCIA AA Nº 05/2009 BNDES ANEXO II PROJETO BÁSICO: JORNADA AGIR

Os Oito Principais de Sistemas de

Desenho centrado em utilização

EIKON DOCUMENTS - ESPECIFICAÇÃO TÉCNICA

GUIA DE RELACIONAMENTO MT-COR: 001 Revisão: 000

Plano de curso Planejamento e Controle da Manutenção de Máquinas e Equipamentos

5. PLANEJAMENTO E ORGANIZAÇÃO DA MANUTENÇÃO:

Aliança Estratégica com a Delta Dezembro, Uma Consistente História de Investimento

2º Passo Criar a conexão via ODBC (Object DataBase Conection)

WINDOWS AZURE E ISVS UM GUIA PARA OS RESPONSÁVEIS PELAS DECISÕES DAVID CHAPPELL JULHO DE 2009 PATROCINADO PELA MICROSOFT CORPORATION

Aproveitamento da informação permite ganho de competitividade: conhecimento é poder (e poder = $$!)

H. Problemas/outras situações na ligação com a Segurança Social;

CRONOGRAMA DELPHI para turmas Aproximadamente 84 horas - aulas de 2 horas

Versão 14.0 Junho Contato: Representação mais detalhada da operação em cada estágio: 21 blocos

3 Formulação da Metodologia 3.1. Considerações Iniciais

Autocalibração com erros relacionados ao Sistema, Auto CQ e Troca de Reagente

Pós-graduação. em Negócios e Marketing de Moda

Segue abaixo projeto para desenvolvimento de novo website para loja Virtual

MANUAL DO USUÁRIO EVENTOS

1 Institucional. 1.1 Sobre a Vensis. 1.2 Missão, Políticas e Valores Missão Política da Qualidade

MTUR Sistema FISCON. Manual do Usuário

GUIA RÁPIDO DE CONFIGURAÇÃO PARA WINDOWS

SDK (Software Development Kit) do Microsoft Kinect para Windows

HARDWARE e SOFTWARE. O Computador é composto por duas partes: uma parte física (hardware) e outra parte lógica (software).

Soluções de Maior Desempenho e de Menor Custo com o IBM InfoSphere Warehouse V10 Guia da Solução IBM Redbooks

Processo TCar Balanço Móbile

GESTÃO DE LABORATÓRIOS

DISCIPLINA: Matemática. MACEDO, Luiz Roberto de, CASTANHEIRA, Nelson Pereira, ROCHA, Alex. Tópicos de matemática aplicada. Curitiba: Ibpex, 2006.

MANUAL DOS GESTORES DAA

A Importância de Sistemas de Informação para a Competitividade Logística

MODELO DE PROGRAMAÇÃO DO WINDOWS AZURE

Orientações e Recomendações Orientações relativas à informação periódica a apresentar à ESMA pelas Agências de notação de risco

UNIVERSIDADE ESTADUAL DE CAMPINAS FACULDADE DE CIÊNCIAS APLICADAS Cidade Universitária de Limeira

PM 3.5 Versão 2 PdC Versão 1

MTUR Sistema FISCON. Manual do Usuário

Como identificar, vender e comercializar com os prospectos de pequenas empresas Parte 2/3

Descrição do serviço. Visão geral do serviço. Escopo dos serviços Copilot Optimize. Copilot Optimize CAA Escopo

PLATAFORMA EMPRESAS PELO CLIMA

MANUAL DE PROCEDIMENTOS

PM 3.5 Versão 2 PdC Versão 1

MTur Sistema Artistas do Turismo. Manual do Usuário

WEB MANAGER. Conhecendo o Web Manager!

Sistema OnixNet / TrucksNet Contagem de Estoque pelas oficinas

Tutorial de criação de um blog no Blogger

MANUAL DE PROCEDIMENTOS PARA REGISTO DE. Técnicos de Instalação e Manutenção de Edifícios e Sistemas. (TIMs)

Relatório de Gerenciamento de Riscos

REQUISITOS PRINCIPAIS: Regulamentação final sobre controles preventivos de alimentos para consumo humano Visão rápida

Metodologia de Desenvolvimento de Sistemas

Pesquisa Oficial de Demanda Imobiliária SINDUSCON Grande Florianópolis. NÃO ASSOCIADOS Apresentação

Por favor, considere a proteção ao meio ambiente antes de imprimir esse documento

Sistema de Comercialização de Radiofármacos - Manual do Cliente

Novas Salvaguardas Ambientais e Sociais

Aula 11 Bibliotecas de função

Proposta. Projeto: VENSSO. Data 25/05/2005. Andrade Lima Damires Fernandes Andrade Lima Damires Fernandes. Responsável. Autor (s)

Passo 1 - Conheça as vantagens do employeeship para a empresa

O caso de negócios do uso de análise de texto não estruturado em IBM Power Systems para tomada de decisão crítica

Exercícios de Java Aula 17

POLÍTICA DE GESTÃO DE RISCOS DAS EMPRESAS ELETROBRAS

Software Para Controle de Acesso e Ponto

Fundamentos de Informática 1ºSemestre

Transcrição:

Análise Preditiva cm SQL Server 2008 Artig Técnic d SQL Server Autr: Graeme Malclm (Cnteúd Mestre) Revisres Técnics: Rni Karassik e Dnald Farmer Editr d Prjet: Janne Hdgins Publicad: Nvembr de 2007 Aplica-se A: SQL Server 2008 Resum: O Micrsft SQL Server 2008 ferece análise preditiva através de um cnjunt cmplet e intuitiv de ferramentas de data mining. Integraçã direta cm a platafrma Micrsft de Business Intelligence ferece percepçã avançada de cada pass d cicl de vida de dads. Além diss, a platafrma flexível capacita vcê a estender a previsã a qualquer aplicativ.

Direits Autrais Este é um dcument preliminar e pde ser alterad substancialmente antes d lançament cmercial final d sftware aqui descrit. As infrmações cntidas neste dcument representam a visã atual da Micrsft Crpratin sbre s temas discutids na data da publicaçã. Cm a Micrsft deve respnder às mudanças das cndições de mercad, este dcument nã deve ser interpretad cm um cmprmiss da parte da Micrsft, e a Micrsft nã pde assegurar a exatidã de qualquer infrmaçã apresentada após a data da publicaçã. Este white paper destina-se a fins infrmativs apenas. A MICROSOFT NÃO FORNECE NENHUMA GARANTIA, EXPRESSA OU IMPLÍCITA, QUANTO ÀS INFORMAÇÕES NESTE DOCUMENTO. O cumpriment de tdas as leis pertinentes de direits autrais é de respnsabilidade d usuári. Sem limitar s direits sb direit autral, nenhuma parte deste dcument pde ser reprduzida, armazenada em u inserida em um sistema de recuperaçã de dads u transmitid de qualquer frma u pr qualquer mei (eletrônic, mecânic, ftcópia, gravaçã u utr) u para qualquer fim, sem a permissã expressa pr escrit da Micrsft Crpratin A Micrsft pde deter as patentes, as slicitações de patentes, as marcas cmerciais, s direits autrais u utras prpriedades intelectuais pertinentes a bjet deste dcument. Salv expressamente dispst em qualquer cntrat de licença escrit da Micrsft, frneciment deste dcument nã cnfere a vcê qualquer licença em relaçã a essas patentes, marcas cmerciais, direits autrais u utras prpriedades intelectuais. Salv indicaçã em cntrári, s exempls de empresas, rganizações, prduts, nmes de dmíni, endereçs de e-mail, lgtips, pessas, lugares e events aqui mencinads sã fictícis e nenhuma assciaçã cm qualquer empresa, rganizaçã, prdut, nme de dmíni, endereç de email, lgtip, pessa, lugar u event real é intencinal u deve ser deduzida cm tal. Tds s direits reservads. Micrsft, SQL Server e Virtual Earth sã marcas registradas u cmerciais da Micrsft Crpratin ns Estads Unids e/u utrs países. Os nmes de empresas e prduts reais aqui mencinads pdem ser marcas cmerciais de seus respectivs prprietáris.

Cnteúd Intrduçã...1 Análise Preditiva para Tds s Usuáris...1 Distribuiçã Difundida através d Micrsft Office... 2 Ambiente de Desenvlviment Abrangente... 5 Recurss de Nível Crprativ... 8 Algritms Avançads e Invadres... 8 Percepçã a Cada Pass d Cicl de Vida ds Dads... 10 Integraçã de Relatóris Nativa... 10 Mineraçã Durante Integraçã de Dads... 12 Análise Detalhada... 13 KPIs Preditivs... 14 Recnheciment de Data Mining em Tds s Aplicativs... 15 Prgramaçã Preditiva... 15 Algritms de Plug-In e Visualizações Persnalizadas... 15 Cnclusã... 16

Predictive Analysis with SQL Server 2008 1 Intrduçã Um ds ativs mais valiss de qualquer empresa é grande vlume de dads de negócis em váris aplicativs e sistemas pr tda a rganizaçã. Esses dads têm ptencial de frnecer percepções incríveis ds negócis e de frnecer uma base cnfiável para tmada de decisões eficiente e previsã precisa que pdem levar uma empresa a sucess. Infelizmente, cm muita freqüência, s dads sã cletads pels váris sistemas de cmputaçã e deixads drmentes em armazenaments de dads islads. Algumas rganizações pdem gerar relatóris histórics a partir desses dads e algumas pdem até mesm medir desempenh da empresa em cmparaçã cm alguns KPIs (key perfrmance indicatrs - indicadres-chave de desempenh); mas, surpreendentemente, pucas rganizações cncretizam s benefícis de minerar seus dads histórics para detectar padrões e tendências, e ainda mens incrpram análise preditiva em seus prcesss de negócis ctidians para tmar decisões e fazer previsões e melhrar a agilidade geral da empresa. A lng ds últims lançaments, a Micrsft refinu s recurss de relatóris e analítics d Micrsft SQL Server para criar uma platafrma abrangente de BI (Business Intelligence) que pde ser integrada nas atividades de negócis d dia-a-dia e usada eficientemente pels funcináris pr tda a rganizaçã em vez de pr apenas alguns pucs analistas especializads. Muitas rganizações que n passad teriam cnsiderad sluções de BI caras demais agra estã tirand prveit ds recurss de criaçã, prcessament e distribuiçã de relatóris d SQL Server Reprting Services e ds pderss serviçs OLAP (nline analytical prcessing - prcessament analític nline) frnecids pel SQL Server Analysis Services. A integraçã estreita entre esses dis prduts de servidr de BI e nipresente Micrsft Office system leva a análise de negócis às massas e prmve a evluçã de um nv tip de prfissinal da infrmaçã que pde bter uma percepçã mais prfunda ds negócis e trabalhar cm mais eficiência. Embra essa prliferaçã de relatóris e analítica multidimensinal tenha beneficiad bastante muitas rganizações de tds s tamanhs, pass seguinte na prmçã da agilidade de negócis e eficiência peracinal é dar salt de análise retrspectiva de dads histórics para ações prativas baseadas em análise preditiva de dads de negócis e incrprar as prcesss de negócis tmada de decisões inteligente e baseada em fats. A chave para se cnseguir iss é usar pderss algritms de data mining para analisar cnjunts de dads, cmparar nvs dads a fats e cmprtaments histórics, identificar classificações e relações entre entidades e atributs de negócis e prprcinar percepções preditivas precisas a tds s sistemas e usuáris que tmam decisões de negócis. Cm cm as tecnlgias de OLAP, a data mining já fi cnsiderada um camp altamente especializad que exigia sftware car e experiência rara para implementar. Entretant, incluind tecnlgias abrangentes de data mining n SQL Server Analysis Services e através da integraçã cm 2007 Micrsft Office System, a Micrsft frnece uma sluçã eficaz em terms de cust que pde estender pder da data mining a td mund e frnecer as percepções críticas para sucess, a mesm temp em que tira prveit ds recurss de escala crprativa d SQL Server Analysis Services.

Análise Preditiva cm SQL Server 2008 2 Análise Preditiva para Tds s Usuáris Uma sluçã de análise preditiva é mais eficiente quand é predminante pr tda a rganizaçã e ajuda a gerar decisões ctidianas na empresa cm seu dimensinament e desempenh de nível crprativ. Além diss, frnecer uma frma de implementar análise preditiva abrangente pssibilita intuitivamente a data mining pr autatendiment para s usuáris, que, pr sua vez, permite à empresa bter percepçã acinável prntamente. A tecnlgia de data mining n SQL Server 2008 satisfaz a esses requisits através da estreita integraçã cm 2007 Office System, um ambiente de desenvlviment abrangente, recurss de nível crprativ e um cnjunt extensível de algritms avançads e invadres de data mining que sã prjetads para atender prblemas cmuns às empresas. Distribuiçã Difundida através d Micrsft Office Tradicinalmente, a análise preditiva era limitada a apenas uma fraçã ds funcináris que eram perits treinads em estatística. Os Micrsft SQL Server 2008 Data Mining Add-Ins fr Office, mstrads na Figura 1, estendem a percepçã e previsã a um públic mais ampl permitind que prfissinais da infrmaçã cntrlem a tecnlgia de data mining altamente sfisticada dentr de um ambiente familiar de planilhas. O cnjunt de ferramentas capacita s usuáris a infrmar decisões diárias em alguns passs simples ferecend recmendações rápidas e acináveis. As Table Analysis Tls fr Micrsft Office Excel 2007 cultam a cmplexidade da data mining atrás de tarefas intuitivas, prprcinand uma experiência simples que pssibilita as usuáris fazer facilmente a transiçã entre explraçã e descberta. O Data Mining Client fr Office Excel 2007 ferece um cicl de vida de desenvlviment cmplet de data mining que capacita usuáris avançads cm mais infrmações, validaçã e cntrle. Além diss, s Data Mining Templates fr Visi permitem as usuáris prcessar visualizações gráficas ds mdels de data mining às quais se pdem adicinar antações. De md geral, a integraçã entre a data mining d SQL Server 2008 e 2007 Office System frnece um ecssistema de negócis abrangente, intuitiv e clabrativ que estende a percepçã da análise preditiva para infrmar as decisões de negócis pr tda a rganizaçã.

Análise Preditiva cm SQL Server 2008 3 Figura 1: Add-Ins de Data Mining para Micrsft Office Excel 2007 Os Add-Ins de Data Mining para 2007 Office System ferecem s seguintes benefícis: Abrangentes: frnecem uma grande variedade de ferramentas para satisfazer muitas necessidades Os Add-Ins de Data Mining para Office 2007 System fram prjetads para ferecer um cnjunt ampl e cnfiável de ferramentas de data mining. A dispnibilidade dessas ferramentas na estaçã de trabalh permite que tds s usuáris explrem e descubram tendências e relações cultas entre prduts, clientes, mercads, funcináris e utrs fatres, capacitand-s a prever necessidades, entender cmprtaments e descbrir prtunidades cultas que pdem melhrar prcesss de negócis e causar um impact psitiv diret na lucratividade. Intuitivs: frnecem percepçã sbre a qual se pde agir a tds s usuáris O acess à análise preditiva dentr d ambiente familiar d Micrsft Office ajuda s usuáris a incrprar previsã a seus prcesss ctidians. As tarefas autmatizadas frnecidas nas Table Analysis Tls fr Office Excel 2007 prprcinam percepções claras e acináveis prntamente, em três passs simples: 1. Defina seus dads. Identifique s dads necessáris para infrmar a sluçã e crie uma tabela em Office Excel 2007 que defina s dads a ser analisads.

Análise Preditiva cm SQL Server 2008 4 2. Identifique a tarefa. Selecine a tarefa de mineraçã aprpriada para executar ns dads a partir da faixa de pções Data Mining u Table Analysis. 3. Obtenha resultads. Examine prdut da tarefa frnecid através de visualizações claras e intuitivas diretamente n ambiente d Office Excel 2007. As tarefas autmatizadas frnecidas ns Data Mining Add-Ins fr Office Excel 2007 incluem: Analisar Inflenciadres-Chave Detecta as principais características que influenciam cert resultad. Um relatóri detalhad que classifica s influenciadres-chave cm base na imprtância é gerad, pssibilitand as usuáris cmparar s principais fatres para cada cnjunt de valres distints. Detectar Categrias Ajuda s usuáris a identificar e segmentar dads cm base em prpriedades em cmum. Um relatóri detalhad descrevend as categrias descbertas é gerad, pssibilitand a reclassificaçã de categrias cm nmeaçã expressiva para análise adicinal. Preencher Pel Exempl Ajuda s usuáris a preencher uma cluna parcialmente ppulada autmaticamente cm base em padrões na tabela. Um relatóri explicand s padrões detectads é gerad, permitind as usuáris analisar nvamente s dads e refinar padrões à medida que nvs cnheciments sã adquirids. Previsã Permite as usuáris predizer valres futurs cm base em tendências d cnjunt de dads. Os valres de previsã sã adicinads à tabela riginal e gráfics exibind a evluçã passada e prevista da série sã gerads. Destacar Exceções Permite as usuáris detectar cass n cnjunt de dads que incluam valres fra da faixa esperada. As linhas cntend as exceções sã destacadas e a cluna real prpensa a causar a exceçã é realçada. Análise de Cenáris: Hipóteses Permite as usuáris bter percepçã d impact de uma mudança ptencial aplicada a um valr em utrs valres d cnjunt de dads. Análise de Cenáris: Atingir Meta Permite as usuáris entender melhr s fatres subjacentes que precisam ser alterads para se alcançar um valr desejad em uma cluna-alv (cmplementar à ferramenta Hipóteses). Calculadra de Previsã Relacinada à tarefa Analisar Influenciadres-Chave, a Calculadra de Previsã gera um frmulári interativ para se registrar nvs cass. A influência de cada atribut é traduzida em um cnjunt de pnts. Um resum de uma cmbinaçã de atributs, que se aplicam a um nv cas, prediz cmprtaments futurs prváveis. Análise de Cesta de Cmpras Permite as usuáris detectar a relaçã entre itens freqüentemente cmprads junts. Um relatóri explicand as relações pde prprcinar uma melhr cmpreensã da

Análise Preditiva cm SQL Server 2008 5 significância financeira, ferecend percepçã de fertas em grup u expsiçã de prdut melhrada. O resultad gráfic fácil de usar dessas ferramentas ferece uma transiçã direta entre explraçã e descberta e capacita s usuáris cm previsã e percepçã avançadas que se traduzem claramente em recmendações e ações. Clabrativ: cmpartilhe percepções em tda a rganizaçã Depis de realizar análise preditiva dentr d Office Excel 2007, s usuáris pdem usar as pdersas ferramentas de publicaçã d 2007 Office System para partilhar descbertas e infrmar decisões de negócis pr tda a rganizaçã. Pr exempl, s usuáris pdem cmpartilhar análises através de visualizações gráficas em diagramas d Office Visi 2007 u pdem partilhar tabelas, relatóris e diagramas através d Micrsft Office SharePint Server 2007. Ambiente de Desenvlviment Abrangente O 2007 Office System é uma ferramenta de estaçã de trabalh ideal para prfissinais da infrmaçã, mas desenvlvedres de BI que implantam sluções pr tda a empresa, SQL Server Business Intelligence Develpment Studi é ambiente preferid prque pssui um ambiente basead em prjet, cmplet cm depuraçã e integraçã de cntrle de fnte que vcê pde usar para criar sluções de BI fim a fim. E a funcinalidade de distribuiçã difundida de data mining é útil apenas se s desenvlvedres puderem cnstruir sluções de data mining que atendam às necessidades da empresa rápida e facilmente. O SQL Server Business Intelligence Develpment Studi frnece ferece um ambiente de desenvlviment abrangente que se baseia n sistema de desenvlviment d Micrsft Visual Studi. Cm Business Intelligence Develpment Studi, desenvlvedres pdem criar estruturas de data mining, que identificam as tabelas e clunas a ser incluídas na análise e adicinar múltipls mdels que aplicam algritms de mining as dads naquelas tabelas. O mdel de prjet de Analysis Services n Business Intelligence Develpment Studi, mstrad na Figura 2, inclui um Designer de Data mining intuitiv para criar e exibir mdels de data mining e ferece validaçã cruzada, gráfics de cmparaçã de precisã e gráfics de lucrs para cmparar e cntrastar a qualidade de mdels visualmente e através de registrs estatístics de errs e exatidã antes de implantáls.

Análise Preditiva cm SQL Server 2008 6 Figura 2: Data Mining Designer n Business Intelligence Develpment Studi O SQL Server 2008 intrduz váris aperfeiçaments a ambiente de desenvlviment já abrangente d SQL Server 2005, incluind a capacidade de: Dividir dads em partições de treinament e testes mais eficientemente. O particinament está dispnível dentr d prcess de criaçã d mdel de data mining. Desenvlvedres pdem identificar uma prçã d cnjunt de dads de treinament para ser selecinada aleatriamente para testes. Cnstruir mdels cm dads filtrads. A filtragem de dads permite a criaçã de mdels de data mining que usam subcnjunts de dads em uma estrutura de data mining. A filtragem frnece a flexibilidade para prjetar estruturas de data mining e fntes de dads, prque s desenvlvedres pdem criar uma única estrutura de data mining, baseada em uma visualizaçã abrangente de fnte de dads e depis aplicar filtrs para usar smente uma parte ds dads para treinament e testes de uma variedade de mdels, em vez de cnstruir uma estrutura diferente e mdel relacinad para cada subcnjunt de dads. Pr exempl, um desenvlvedr pde definir a exibiçã da fnte de dads na tabela Clientes e relacinadas, cnstruir uma única estrutura de data mining que inclua tds s camps necessáris e depis criar um mdel que seja filtrad segund um determinad atribut de cliente, cm Regiã. O desenvlvedr pde entã, facilmente, fazer uma cópia daquele mdel e mudar a cndiçã d filtr para gerar um nv mdel basead em uma regiã diferente. Aplicand filtrs a mdels de dads vcê pde:

Análise Preditiva cm SQL Server 2008 7 Criar mdels separads para valres distints. Pr exempl, uma lja de rupas pde usar a demgrafia ds clientes para cnstruir mdels separads pr sex, embra s dads venham de uma única fnte para tds. Fazer experiências cm mdels criand e depis testand váris agrupaments ds mesms dads, cm de idades de 20 a 30 cntra 20 a 40 e cntra 20 a 25. Especificar filtrs cmplexs em cnteúds de tabela aninhads, cm precisar que um cas seja incluíd n mdel smente se cliente tiver cmprad pel mens dis de determinad item. Cnstruir mdels incmpatíveis dentr da mesma estrutura. Mdels usand versões cntínuas u individualizadas da mesma cluna pdem cexistir em uma única estrutura, evitand a necessidade de se criar várias versões da mesma cluna de rigem. Testar váris mdels simultaneamente cm validaçã cruzada. Os mdels criads pr algritms de data mining têm várias aplicações que exigem diferentes medições de exatidã e estabilidade. Dependend da aplicaçã, s usuáris exigem essas medições. Além diss, essas medições auxiliam em assegurar que várias definições resultem n melhr mdel para um cnjunt de dads atuais e uma determinada aplicaçã. O SQL Server 2008 ferece um rbust recurs de validaçã cruzada que pde testar simultaneamente tds s mdels em uma estrutura usand uma técnica de enlace. Iss permite as usuáris testar uma variedade de definições em um subcnjunt de dads antes de se cmprmeter cm um pass de prcessament car. Os resultads da validaçã cruzada também dizem as usuáris se s resultads d mdel sã estáveis u se pdem mudar se ele receber mais u mens dads. A Figura 3 mstra um relatóri de validaçã cruzada n Designer de Data Mining.

Análise Preditiva cm SQL Server 2008 8 Figura 3: Validaçã cruzada Recurss de Nível Crprativ A Análise Preditiva d SQL Server faz parte d SQL Server Analysis Services, que frnece vantagens de servidr de classe crprativa: desenvlviment rápid, alta dispnibilidade, desempenh superir e escalabilidade, segurança rbusta e gerenciament aperfeiçad através d SQL Server Management Studi. Esse recurs de nível crprativ significa que as tecnlgias de data mining que permitem a análise preditiva pdem crescer cm a empresa e prprcinar uma sluçã de alt desempenh e escalnável para rganizações de qualquer tamanh.. Algritms Avançads e Invadres Empresas diferentes têm metas diferentes e precisam tmar decisões diferentes. Pr iss, qualquer tecnlgia de data mining deve suprtar um cnjunt abrangente de recurss e algritms para atender a uma variedade de necessidades de negócis. O SQL Server 2008 Analysis Services inclui tecnlgias de data mining que suprtam muits algritms avançads e invadres, em sua mairia prjetads pela Micrsft Research para slucinar prblemas cmuns às empresas. Além diss, as tecnlgias de data mining d SQL Server Analysis Services sã extensíveis, permitind que vcê adicine plug-ins de algritms que atendem necessidades analíticas incmuns que sã mais específicas de uma empresa individual. A Tabela 1 mstra algumas das tarefas que a data mining d SQL Server pde ser usada para executar.

Análise Preditiva cm SQL Server 2008 9 Tarefa Descriçã Algritms Análise de Cesta de Cmpras Análise de Rtatividade Análise d Mercad Previsã Explraçã de Dads Aprendizad Sem Supervisã Análise de Site da Web Análise de Campanha Qualidade de Infrmações Descubra itens vendids junts para criar recmendações rápidas e para determinar cm a expsiçã ds prduts pde cntribuir diretamente para seus lucrs. Preveja s clientes que pdem estar cnsiderand cancelar seu serviç e identifique s benefícis que s manterã. Defina segments de mercad agrupand autmaticamente clientes semelhantes. Use esses segments para prcurar clientes lucrativs Preveja vendas e quantidades de inventári e saiba mais sbre cm elas se interrelacinam para prever afunilaments e melhrar desempenh. Analyze prfitability acrss custmers, r cmpare custmers that prefer different brands f the same prduct t discver new pprtunities.analise a lucratividade entre clientes u cmpare clientes que preferem diferentes marcas d mesm prdut para descbrir nvas prtunidades. Identifique antecipadamente relações descnhecidas entre váris elements de sua empresa para infrmar suas decisões. Entenda cm as pessas usam seu site da Web e agrupam padrões de us similares para ferecer uma experiência melhr. Gaste funds de marketing mais eficientemente visand s clientes cm mair prbabilidade de respnder a uma prmçã. Identifique e lide cm anmalias durante a inclusã u carregament de dads para melhrar a qualidade das infrmações. Assciaçã Árvres de Decisã Árvres de Decisã Regressã Linear Regressã Lgística Clustering Clustering de Seqüência Árvres de Decisã Séries de Temp Rede Neural Rede Neural Clustering de Seqüência Árvres de Decisã Naïve Bayes Clustering Regressã Linear Regressã Lgística

Análise Preditiva cm SQL Server 2008 10 Análise de Texts Analyze feedback t find cmmn themes and trends that cncern yur custmers r emplyees, infrming decisins with unstructured input.analise cmentáris para encntrar temas e tendências cmuns que dizem respeit a seus clientes u funcináris, infrmand decisões cm dads nã-estruturads. Text mining Tabela 1: Tarefas de Data Mining Percepçã a Cada Pass d Cicl de Vida ds Dads Seja cnsumind, analisand, mnitrand, planejand, explrand u relatand dads de negócis, a análise preditiva pde acrescentar percepçã valisa para expr nvas avenidas para cresciment. O SQL Server 2008 faz parte de uma família de tecnlgias de business intelligence que trabalham juntas para frnecer uma platafrma abrangente que permite a rganizações incrprar análise preditiva em cada pass d cicl de vida ds dads. Integraçã de Relatóris Nativa A criaçã de relatóris é uma atividade fundamental na mairia das empresas, e SQL Server 2008 Reprting Services frnece uma sluçã abrangente para criar, prcessar e implantar relatóris pr tda a empresa. O SQL Server Reprting Services pde prcessar relatóris diretamente a partir de um mdel de data mining usand uma cnsulta de DMX (data mining extensins). Iss permite as usuáris visualizar cnteúd de mdels de data mining para representaçã de dads timizada. Além diss, a capacidade de cnsultar diretamente a estrutura de data mining permite as usuáris incluir facilmente atributs além d escp ds requisits d mdel de mineraçã, apresentand infrmações cmpletas e substanciais. A Figura 4 mstra editr de cnsulta de DMX para Reprting Services.

Análise Preditiva cm SQL Server 2008 11 Figura 4: Editr de cnsulta de DMX para SQL Server Reprting Services O SQL Server Reprting Services ferece a capacidade de gerar relatóris rientads pr parâmetrs cm base em prbabilidade preditiva. Pr exempl, a cnsulta mstrada na Figura 4 analisa uma lista de clientes ptenciais para a empresa hiptética Adventure Wrks e usa um mdel de data mining para avaliar a prbabilidade de aqueles clientes cmprarem um bicicleta. A cnsulta é filtrada para retrnar smente clientes ptenciais que tenham prbabilidade de cmpra mair que 50%. A Figura 5 mstra relatóri resultante, que a empresa pde usar cm base para uma campanha de marketing visand smente s clientes prpenss a fazer uma cmpra, melhrand significativamente a eficiência da campanha e seu retrn de investiment.

Análise Preditiva cm SQL Server 2008 12 Figura 5: Relatóri de análise preditiva Mineraçã Durante Integraçã de Dads À medida que a BI (Business Intelligence) se trna mais difundida, as empresas estã cada vez mais implementand sluções de ETL (extract, transfrm, and lad - extraçã, transfrmaçã e carga) para cnslidar dads de tda parte da rganizaçã em data warehuse para criaçã de relatóris e análise. Entretant, s dads de rigem para essas perações pdem freqüentemente estar incmplets u, em alguns cass, entidades cmerciais, cm clientes, pdem precisar ser classificadas em categrias baseadas em características cmuns de perfil. O Micrsft SQL Server 2008 Integratin Services ferece uma platafrma de ETL pdersa e extensível que desenvlvedres de BI pdem usar para implementar perações de ETL que limpam e transfrmam s dads durante us. O SQL Server Integratin Services inclui um destin de Data Mining Mdel Training para treinar mdels de data mining e um uma transfrmaçã de Data Mining Query que pde ser usada para executar análise preditiva em dads cnfrme eles passam através d flux de dads. Integrar análise preditiva cm SQL Server Integratin Services permite às rganizações marcar dads incmuns, classificar entidades cmerciais, executar mineraçã de text e preencher valres faltantes cm base na frça e percepçã ds algritms de data mining. Pr exempl, um prcess de ETL pde extrair dads de clientes de um u mais sistemas de rigem para inclusã em um data warehuse. Tradicinalmente, a data mining pde ser usada depis que data warehuse é carregad, para classificar clientes para cmprtament de cmpra previst u utras

Análise Preditiva cm SQL Server 2008 13 tarefas de gerenciament de campanha. Cntud, cm SQL Server Integratin Services, Data Mining Query Transfrmatin pde aplicar um mdel de data mining durante prcess de ETL, resultand em um data warehuse ppulad cm dads classificads n mment d carregament. Iss reduz trabalh que deve ser feit n servidr d warehuse e assegura que s dads dispníveis para análise estejam sempre atualizads e classificads de maneira cnsistente. Além diss, a classificaçã durante prcess de ETL também pde ser usad para filtrar registrs de clientes que nã se enquadrem em nenhuma classificaçã cnhecida. Esses registrs pdem ser resultad de qualidade de dads insatisfatória u pde representar uma nva classificaçã ainda nã capturada n prcess de gerenciament de campanha. Em qualquer cas, SQL Server Integratin Services pde detectar esses registrs usand data mining e redireciná-ls para revisã manual u autmática. A Figura 6 mstra um flux de dads d SQL Server Integratin Services que inclui uma transfrmaçã de Data Mining Query. Figura 6: Data mining n SQL Server Integratin Services Análise Detalhada O SQL Server 2008 Analysis Services frnece uma platafrma altamente escalnável para análise multidimensinal de OLAP. Muits clientes já estã clhend s benefícis de criar um UDM (unified dimensinal mdel) n Analysis Services e usá-l para esmiuçar medidas de negócis em várias dimensões. A análise preditiva, send parte

Análise Preditiva cm SQL Server 2008 14 d SQL Server 2008 Analysis Services, ferece uma experiência de OLAP mais avançada, cm dimensões de data mining que dividem seus dads pels padrões cults dentr delas. Pr exempl, um departament de vendas e marketing pde criar uma estrutura de data mining baseada em uma dimensã de OLAP Cliente existente e usá-la para classificar clientes em clusters que exibem características semelhantes. Eles pdem entã usar aquela estrutura de data mining para gerar uma nva dimensã de mineraçã e usá-la para analisar infrmações de vendas cm base ns clusters de clientes identificads. A Figura 7 mstra uma dimensã de data mining em um cub de OLAP. Figura 7: Uma dimensã de data mining em um cub de OLAP Além de incrprar s resultads da data mining em dimensões de OLAP, SQL Server 2008 permite que vcê incrpre funções preditivas cm base em mdels de mineraçã em cálculs e KPIs. KPIs Preditivs Muitas empresas usam KPIs para avaliar estatísticas de negócis críticas em cmparaçã cm metas. O SQL Server 2008 Analysis Services frnece uma platafrma centralizadas para KPIs na rganizaçã e a integraçã cm Micrsft Office PerfrmancePint Server 2007 permite que s respnsáveis pr decisões mntem painéis de negócis a partir ds quais pdem mnitrar desempenh da empresa. KPIs sã tradicinalmente retrspectivs, mstrand, pr exempl, ttal de vendas d mês anterir cmparad cm a meta. Cntud, cm as percepções pssibilitadas através da data mining, as rganizações pdem cnstruir KPIs preditivs que predizem desempenh futur em cntraste cm metas, dand às empresas uma prtunidade

Análise Preditiva cm SQL Server 2008 15 de detectar e slucinar prblemas ptenciais prativamente. A Figura 8 mstra um KPI que exibe uma previsã d de númer a ser feits. Figura 8: Micrsft Office PerfrmancePint Server 2007 Além diss, a análise preditiva pde detectar atributs que influenciam KPIs. Junt cm Office PerfrmancePint Server 2007, s usuáris pdem mnitrar tendências em indicadres-chave para recnhecer atributs cm efeit prlngad, pr exempl, identificar se descnt n preç de um prdut cncrrente tem um impact duradur sbre as vendas u se gera apenas uma influência de curt praz. Tais percepções capacitam as empresas a infrmar e melhrar sua estratégia de respsta. Recnheciment de Data mining em Tds s Aplicativs Cm vcê viu nesse white paper até aqui, SQL Server 2008 frnece uma sluçã de data mining abrangente e a integraçã estreita cm a platafrma Micrsft Business Intelligence facilita frnecer análise preditiva em tda a empresa. Cntud, pde haver casiões em que as rganizações precisem incrprar a funcinalidade de data mining em um aplicativ, para intrduzir infrmações em um prcess de negócis existente u para estender tecnlgias de data mining para atender a um prblema específic. Para esse fim, SQL Server ferece uma platafrma de prgramaçã flexível e extensível para incrprar diretamente previsã e percepçã a aplicativs empresariais. Prgramaçã Preditiva O recurs de data mining d SQL Server 2008 suprta várias APIs (applicatin prgramming interfaces) que s desenvlvedres pdem usar para cnstruir sluções persnalizadas que aprveitam s recurss de análise preditiva d SQL Server. DMX, XMLA, OLEDB e ADOMD.NET e AMO (Analysis Management Objects) ferecem uma

Análise Preditiva cm SQL Server 2008 16 platafrma avançada e ttalmente dcumentada, capacitand desenvlvedres a cnstruir aplicações cmpatíveis cm data mining e a frnecer descberta em temp real e recmendaçã através de ferramentas familiares. Essa extensibilidade cria uma prtunidade para rganizações empresariais e ISVs (independent sftware vendrs - frnecedres independentes de sftware) incrprarem análise preditiva em aplicativs empresariais, intrduzind percepçã e previsões que infrmam decisões e prcesss de negócis. Pr exempl, a Analytics Fundatin adicina classificaçã preditiva a Micrsft Dynamics CRM, para permitir a prfissinais da infrmaçã em rganizações de vendas, marketing e serviçs identificar prtunidades alcançáveis que têm mair prbabilidade de levar a uma venda, aumentand a eficiência e melhrand a prdutividade (para mais infrmações, cnsulte http://www.micrsft.cm/dynamics/crm/prduct/analyticsfundatin.mspx). Algritms de Plug-In e Visualizações Persnalizadas O cnjunt de ferramentas de data mining d SQL Server é ttalmente extensível através de prcediments armazenads em Micrsft.NET, algritms de plug-in, visualizações persnalizadas e PMML. Iss permite as desenvlvedres estender as tecnlgias de data mining prntas d SQL Server 2008 para atender a necessidades de negócis incmuns que sã específicas da rganizaçã: Cnclusã Criand algritms de data mining para slucinar prblemas analítics específics da empresa. Usand algritms de data mining de utrs frnecedres de sftware. Criand visualizações persnalizadas de mdels de data mining através de APIs de visualizadr de plug-in. Neste white paper, vcê viu cm SQL Server 2008 Analysis Services frnece uma platafrma de data mining cmpleta que as rganizações pdem usar para infundir percepçã e previsã em decisões de negócis ctidianas. A distribuiçã difundida através ds Suplements de Data mining para 2007 Office System prprcina recurss de análise preditiva cm ferramentas intuitivas e resultads clars que ficam dispníveis nas estações de trabalh pr tda a empresa. O ambiente de desenvlviment abrangente e a gama extensível de algritms de data mining abrangentes cmbinads cm a escalabilidade e gerenciament de nível crprativ d SQL Server Analysis Services trna SQL Server 2008 uma frma ideal para levar s benefícis da análise preditiva à sua empresa. Os recurss de análise preditiva d SQL Server 2008, send parte da platafrma de BI Micrsft, sã estreitamente integrads em cada fase d cicl de vida ds dads, pssibilitand incrprar infrmações em relatóris, integraçã de dads, análise de OLAP e mnitrament de desempenh de negócis. Essa integraçã ampla da análise preditiva n ecssistema da rganizaçã ajuda a prduzir mair agilidade de negócis e cria uma vantagem cmpetitiva tangível. Embra a funcinalidade de data mining frnecida cm SQL Server 2008 seja abrangente suficiente para atender às necessidades de uma grande variedade de cenáris empresariais, sua extensibilidade assegura que pssa ser usada para slucinar praticamente qualquer prblema preditiv. A capacidade de estender as