Informativo Bimestral da Siqueira Campos Associados agosto de 2013 - ano VII - Número 21 Nesta edição Lean Office - Dez dicas para economizar tempo no trabalho Estatística Seis Sigma - Estatística não paramétrica Data Analytics - Modelagem Preditiva (Predictive Analytics) Catálogo de Treinamentos 2013 Treinando a sua equipe para aumentar a competitividade da sua empresa. Voz do Cliente Domínio do instrutor sobre o assunto e a possibilidade de aprofundar o conhecimento em temas relevantes da estatística. Caio Vinícius de Matos Estatística Aplicada Natura - Itapecerica da Serra / SP As múltiplas ferramentas que o curso ensinou. Trouxe para mim grande quantidade de oportunidades de melhoria no setor. Gustavo Biachi Reis Curso Lean Office Thyssen Krupp Elevadores - Guaíba / RS Exercícios práticos utilizando dados da organização, didática. Lisandro Iusry Abulatif Curso de Data Mining Prefeitura de Guaíba - Guaíba / RS
Welcome to the Process Excellence Revolution Lean Office - Dez dicas para economizar tempo no trabalho Usualmente, o aprendizado da utilização dos recursos de tecnologia ocorre pela observação dos colegas trabalhando. Não existem cursos específicos sobre isto, logo sempre existirá alguma lacuna no uso dos recursos. Abaixo, estão listadas algumas dicas de coisas simples, que nem todos conhecem, mas que podem acelerar e simplificar muito a nossa vida: 1 - Controle sua ansiedade com a chegada de e-mails em sua caixa de entrada. O e-mail é um tremendo matador de produtividade, procure não olhar a caixa de entrada a todo momento. Defina períodos e limite o tempo com os e-mails em, no máximo, 25 minutos por vez. 2 - Quando enviar um e-mail, procure abordar um só assunto, pois isto evita diversas confusões e facilita a busca no caso de pesquisas. 3 - Quando estiver fazendo uma apresentação no MS-PowerPoint e quiser avançar ou retornar para um slide específico, é só digitar o número do slide e digitar enter. 4 - Em uma apresentação no MS-PowerPoint, para deixar a tela em branco, digite a tecla C (claro) ou, e para apagar a tela, digite E (escuro) ou.. 5 - Quando utilizar o processador de texto, se quiser corrigir ou trocar de ordem uma palavra, simplesmente click duas vezes em cima da palavra em qualquer letra, e se quiser corrigir, e só digitar por cima. Evite utilizar o mouse para marcar toda a extensão da palavra. 6 - Quando navegar pela internet e quiser rolar a página para baixo, utilize a barra de espaço ao invés do mouse. 7 - Quando quiser aumentar o tamanho das imagens em uma página na internet, digite Ctrl e + e se quiser diminuir digite Ctrl e -. 8 - Quando o notebook é usado no trabalho e em casa frequentemente, tenha duas fontes de alimentação externa, uma em casa e outra no trabalho, pois além de economizar tempo e carregar menos peso, você terá um back-up, já que provavelmente o cabo da fonte irá arrebentar. 9 - Use e abuse dos atalhos no Desktop (área de trabalho) para acessar páginas na internet, arquivos, sites e pastas que são manuseados com regularidade, permitindo que sejam acessados com um só click, isto simplifica a vida e poupa muito tempo. 10 - Tendo que trabalhar com várias janelas abertas, ou minimizar programas constantemente, utilize dois monitores. Isto não é nenhum luxo, é aumento de velocidade, é produtividade. Estatística Seis Sigma - Estatística não paramétrica "Os silenciosos estatísticos mudaram o nosso mundo, não por descobrir fatos novos ou desenvolvimentos técnicos, mas mudando as maneiras como nós raciocinamos, experimentamos e formamos a nossa opinião." Ian Hacking - Filósofo e professor universitário canadense. O teste de hipóteses é uma das principais ferramentas estatísticas utilizadas no aprimoramento de processos, pois com ele confirmamos nossas suposições, assim como a efetividade das soluções. É um
método fundamental para conhecer a causa raiz. Infelizmente, para sua utilização, várias suposições necessitam ser atendidas e uma delas é a normalidade dos dados. Dados normalmente distribuídos são usuais nos processos industriais, porém quando trabalhamos com processos administrativos e comerciais, a normalidade passa ser mais uma exceção do que regra. Felizmente, nestes casos, nem tudo está perdido, pois existe um campo na estatística chamado de estatística não paramétrica, onde podem ser realizados testes de hipóteses independente da distribuição original dos dados. Os testes não paramétricos podem ser realizados em uma grande variedade de situações, porque não necessitam atender a suposições rigorosas dos testes de hipóteses clássicos (paramétricos). De forma particular, não necessitam da normalidade dos dados. Por exemplo: se quisermos comparar o desempenho de notas de duas turmas de uma escola, temos que comparar a média do desempenho destas duas turmas. Para realizarmos o teste de hipóteses clássico, os dados das duas turmas terão que ser normalmente distribuídos. Utilizando os testes não paramétricos, ordenamos todos os dados dos dois grupos e depois comparamos estatisticamente a ordem (posição) dos dois grupos, sem necessitar fazer qualquer suposição sobre os dados, como a normalidade. Os testes não paramétricos têm como vantagens: Facilidade de aplicação; Aplicação quase que universal. E as seguintes desvantagens: Desperdiça informação; É menos sensível; É necessária uma amostra maior para ter as mesmas conclusões com o mesmo grau de confiança de um teste paramétrico. Para cada situação de um teste de hipóteses paramétrico, existe um equivalente não paramétrico. A tabela e os fluxos abaixo ilustram as situações típicas de uso dos testes não paramétricos. Tabela 1
Figura 1 Os testes de hipóteses aumentam a certeza na tomada de decisão e podem ser utilizados mesmo quando os dados não seguem a distribuição normal.
Data Analytics - Modelagem Preditiva (Predictive Analytics) "A tomada de decisão, e as tecnologias para apoiá-la e automatizá-la, será o próximo campo de batalha competitivo para as organizações. Aqueles que estão usando as regras de negócios, data mining, analítica e otimização hoje serão as tropas de choque da próxima onda de inovação nos negócios." Competição Analítica, Thomas Davenport e Jeanne Harris Recentemente, uma universidade privada, preocupada com a evasão dos alunos, resolveu usar uma nova estratégia para enfrentar este problema: utilizar os métodos analíticos em particular os modelos preditivos. Através desta abordagem, analisando dados históricos dos alunos que saíram da universidade, foi possível relacionar algumas variáveis como faltas, atrasos de pagamento e notas com a evasão passada. A partir destes dados, utilizando um método estatístico denominado regressão logística foi possível prever, com um alto grau de precisão, quais os próximos alunos que provavelmente deixarão a universidade. Com esta informação foi possível desenvolver várias ações e reduzir a evasão. Este exemplo ilustra uma das diversas aplicações da modelagem preditiva, que engloba uma variedade de técnicas estatísticas, modelagem, aprendizado de máquina e mineração de dados que permitem analisar os fatos atuais e históricos para fazer previsões sobre o futuro. A modelagem preditiva faz parte do que denominamos inteligência analítica, que é bem diferente de relatórios e BI, pois o foco é na previsão e não na descrição dos eventos. A figura abaixo ilustra muito bem este fato. A inteligência analítica é a utilização extensiva de dados, análises quantitativas e estatísticas e gestão baseada em fatos para orientar decisões e ações. Figura 2 - Inteligência Analítica fonte: Adaptado Competição analítica Thomas Davenport e Jeanne Harris Nos negócios, modelos preditivos exploram padrões encontrados em dados históricos e transacionais para identificar riscos e oportunidades. Os modelos capturam relacionamentos entre muitos fatores que permitem a avaliação de risco ou potencial associado a um determinado conjunto de condições. Atualmente, são utilizados por empresas de seguro, cartões de crédito, seguradoras, seguradoras de saúde, empresas de telecomunicações, bancos e redes de varejo. Uma das aplicações mais conhecidas é o credit scoring, que é utilizado em todos os serviços financeiros. Modelos de credit scoring processam a história de um cliente de crédito, os pedidos de empréstimo/financiamento, os dados do cliente, etc, a fim de classificar os indivíduos por sua probabilidade de honrar o empréstimo/financiamento. A modelagem preditiva olha para o passado, inclui cenários hipotéticos e avaliação de riscos, para fornecer informações sobre o que acontecerá. Ela pode ser usada para a previsão, modelagem de risco, e modelagem a propensão de compras. Entre exemplos de aplicação temos:
Tabela 2 - Adaptado de Competing in Analytics, Thomas Davenport, Harvard Business Review As técnicas de modelagem preditivas se dividem em dois grupos: Técnicas de regressão: Os modelos de regressão são a base da análise preditiva. O princípio é o estabelecimento de uma equação matemática como um modelo para representar as interações entre as diferentes variáveis consideradas. Dependendo da situação, existe uma grande variedade de modelos que podem ser aplicados durante a execução de análises de previsão. Entre as mais utilizadas estão: regressão linear, regressão logística, modelos de séries temporais, classificação e árvore de regressão. Técnicas de aprendizado de máquina: Aprendizagem de máquina é um ramo da inteligência artificial, originalmente empregada para desenvolver técnicas que permitam aos computadores aprenderem, que inclui um número de métodos estatísticos avançados para a classificação. Existem diferentes níveis de aprendizagem de máquina, desde a utilização de análises de classificação, que permitem prever a variável dependente diretamente, sem focar nas relações entre as variáveis subjacentes, até métodos mais complexos, que simulam o comportamento do cérebro humano, quando existem muitos relacionamentos subjacentes que impedem a criação de um modelo matemático. Nestes casos, a aprendizagem de máquina ocorre a partir de exemplos de treinamento para prever eventos futuros. Entre as técnicas mais utilizadas estão: Redes neurais, naïve Bayes e a regra dos k-vizinhos mais próximos. Há 21 anos, a Siqueira Campos atua em métodos estatísticos, analítica e modelagem preditiva, trabalhando tanto com softwares comerciais, como com softwares livres. Tendo auxiliado centenas de organizações com treinamento, consultoria e desenvolvimento, para que a utilização de dados se transforme em vantagem competitiva. Atualmente, possui os seguintes programas de treinamento nesta área:
Data mining e analítica preditiva com o Weka (software livre) Data mining e analítica preditiva com o R (software livre) Estatística aplicada com R (software livre) Modelagem preditiva (predictive analytics) e data mining para gestores Entre as aplicações em que atuamos destacam-se: detecção de desvios (fraude/roubo), modelagem de segmentação (clustering), predição de consumo, previsão de vendas/consumo, modelagem de direcionadores de satisfação dos clientes, modelagem de direcionadores de satisfação dos funcionários e modelos de retenção. Fale com a gente A Siqueira Campos agradece seus comentários, sugestões e questionamentos sobre esta edição. 2013 Siqueira Campos Associados - info@siqueiracampos.com - www.siqueiracampos.com - Fone: 0800 7030603