Estudo comparativo entre modelos de classificação para Behavior Scoring em procedimentos de análise de risco de crédito

Tamanho: px
Começar a partir da página:

Download "Estudo comparativo entre modelos de classificação para Behavior Scoring em procedimentos de análise de risco de crédito"

Transcrição

1 Estudo comparativo entre modelos de classificação para Behavior Scoring em procedimentos de análise de risco de crédito Autoria: Rosalvo Ferreira de Oliveira Neto, Roberto Maurício Bokowski Sobrinho, Andre Marques Cavalcanti Resumo Este trabalho apresenta uma comparação de desempenho entre os modelos de classificação baseados em Redes Neurais Artificiais, Regressão Logística e Árvore de Decisão, aplicados ao banco de dados de um conhecido benchmark da importante competição internacional, para um problema de Behavior scoring. A comparação foi realizada através do processo de validação cruzada estratificada 10 fold para definir os intervalos de confiança para a avaliação de desempenho, medido pela área da curva Receiver Operating Characteristic (ROC). O teste t-student emparelhado unicaudal mostrou que o modelo de Rede Neural Artificial possui o melhor desempenho com o nível de confiança de 95%. Palavras-chave: bahavior scoring, redes neurais artificiais, avaliação de risco. Introdução Credit scoring e Behavior scoring são ferramentas que auxiliam as instituições financeiras a decidir sobre a concessão de crédito aos consumidores com base no risco de crédito de suas solicitações (Thomas, 2000). O objetivo dessas ferramentas é atribuir uma pontuação score que permita identificar o quão próximo o consumidor está de dois grupos: "bom" que é provável cumprir com suas obrigações financeiras ou um grupo de "mau, cujo pedido deve ser negado devido à sua alta probabilidade de faltar com seus compromissos na instituição financeira. Credit scoring é utilizado quando um novo consumidor faz uma solicitação de crédito. Apenas informações demográficas, como idade, sexo, renda entre outras variáveis, são levadas em consideração na atribuição do escore. Behavior scoring é utilizado quando um consumidor, que já possui histórico de transações na base de dados da instituição, está solicitando crédito (Banasiak, 2001). Neste caso, além das informações demográficas, informações comportamentais também são levadas em consideração, como histórico de pagamentos em dia, em atraso, quantidade de empréstimos, entre outras. O objetivo da análise estatística é encontrar na base de dados o perfil que separe os clientes bons dos clientes maus. O modelo de Behavior Scoring, usado como uma ferramenta automática, fornece informação instantânea ao analista e, tendo um maior poder preditivo do que o modelo de Credit Scoring, aumenta a eficiência do analista de crédito. Os pontos fortes destes dois modelos são a precisão e a eficácia, ou o que pode ser chamado de decisão eficiente. A maior precisão de análise de crédito dos modelos de Behavior Scoring vem do poder matemático capaz de analisar centenas de elementos de dados de risco de crédito para encontrar um conjunto capaz de fornecer uma melhor estimativa de predição, em seguida, de forma otimizada ponderar as variáveis de entrada para maximizar o poder preditivo do modelo. A saída de um modelo de Behavior Scoring é interpretado como a probabilidade do cliente honrar sua dívida com a instituição, ou seja, ser um bom cliente. Na indústria de crédito, modelos de Behavior Scoring e Credit Scoring em geral, são confundidos com "Sistemas Especialistas" ou "Sistemas baseado em Regras" que utilizam a 1

2 experiência do próprio gerente de crédito para escolher quais variáveis serão analisadas e criar um processo automatizado de decisão baseado nestas regras. Basicamente, Sistemas Especialistas replicam em código de programa de computador as etapas da análise manual realizada por um gestor de crédito. Portanto, Sistemas Especialistas fornecem rapidez ao processo de avaliação de crédito por minimizar a intervenção do analista de crédito em operações de rotina. No entanto, o ponto fraco de um sistema especialista é sua incapacidade de trazer maior precisão ao processo de avaliação de crédito. As principais vantagens dos modelos de Behavior Scoring em relação aos Sistemas Especialistas são: 1) O modelo de Behavior Scoring é baseado em uma análise estatística sobre o histórico de pagamento da base de dados de crédito do cliente e seus resultados de desempenho de crédito. O desempenho de crédito é normalmente medido entre 6 e 24 meses a partir da data de concessão de crédito e é classificado em bom crédito versus desempenho ruim de crédito. Por exemplo, o desempenho ruim de crédito pode ser definido como um atraso de 60 dias ou mais em uma parcela, e bom caso contrário. Vale ressaltar que a definição de mau cliente é um critério da instituição financeira e por isso pode variar de instituição para instituição. 2) A estatística determina quais variáveis são mais relevantes. A análise multivariada do histórico estatístico dos dados de decisão de crédito pode utilizar informações da declaração de contas a receber, financeiro, ou dados de agências de crédito. Esta análise determina quais elementos de dados são mais preditivos. Este processo geralmente encontra muitos dos tradicionais elementos (variáveis) de risco de crédito utilizados num sistema especialista, no entanto pode descobrir elementos menos óbvios para um gerente de crédito. 4) Estes modelos atribuem pesos ideais para as variáveis de crédito de forma a maximizar a previsibilidade. No desenvolvimento de um modelo de pontuação estatística baseada em comportamento, o gerente de crédito não escolhe os pesos do modelo. Os pesos das variáveis são determinados pelo método estatístico de máxima verossimilhança, de forma a maximizar a previsibilidade do modelo. Em outras palavras, este método melhora a separação dos clientes de alto e baixo risco. 5) Uma vez que à saída do modelo de pontuação do comportamento pode ser interpretada como a probabilidade do cliente honrar com seus compromissos financeiros e que estas probabilidades não são lineares, o gerente de crédito pode criar pontos de corte para tomada de decisão massificada, ou seja, qual é o mais baixo escore que pode ser aceito para a aprovação de crédito. Estes pontos de corte são ferramentas muito úteis na gestão do risco, pois flexibilizam o trabalho do gestor: aumentando o ponto de corte, aceita-se menos e melhores clientes, reduzindo a exposição ao risco, e vice-versa. Toda vez que estes pontos de corte são alterados, se pode prever o risco de inadimplência que a empresa será exposta. O objetivo deste trabalho é realizar um estudo comparativo para averiguar entre os principais modelos de classificação qual proporciona uma maior precisão para um problema de Behavior Scoring. No estudo comparativo foram secionadas as técnicas de modelagem: Redes Neurais Artificiais (Beale & Jackson, 1994), Regressão Logística (Hosmer & Stanley, 2004) e Árvore de Decisão (Quinlan, 1993). O trabalho utiliza uma metodologia experimental com rigorosa base estatística sobre um banco de dados de domínio público, de um conhecido benchmark de importante competição internacional, para realização da comparação. O restante do trabalho está estruturado da seguinte forma: A Seção 2 aborda a definição do problema. A Seção 3 apresenta os trabalhos relacionados. A Seção 4 detalha os modelos de classificação selecionados. A Seção 5 descreve a base de dados selecionada para o estudo. A Seção 6 2

3 mostra a metodologia experimental. A Seção 7 apresenta os resultados experimentais e a Seção 8 apresenta as conclusões e sugere trabalhos futuros. Definição do problema O Behavior Scoring pode ser descrito como um problema de classificação relacional. Em um problema de classificação relacional, os dados disponíveis para modelagem estão em um banco de dados R contendo uma determinada tabela alvo T a e um conjunto de tabelas background T b1...t bn. Cada linha pertencente a T a inclui um atributo único chamado de chave primária (identificador da linha) e uma variável categórica y, que representa o conceito a ser aprendido "variável resposta". A tarefa de classificação relacional é encontrar uma função F(x) que mapeia cada linha x da tabela alvo para a categoria Y. A Figura 1 ilustra o problema de classificação relacional binária no domínio de aplicação concessão de crédito. A tabela alvo é representada pela tabela de Empréstimo na qual a coluna status representa a variável categórica que a função F(x) deve aprender. Esta variável possui dois valores: bom, se o empréstimo foi pago em dia ou mau, caso contrário. As tabelas de background são representadas pelas tabelas que possuem relacionamento com a tabela alvo, o que é o caso no exemplo da Figura 1 das tabelas parcela e cliente. Antes de iniciar a construção dos modelos é necessário que os dados contidos no banco de dados sejam transformados em um formato que permita a aplicação do modelo e também possibilite as análises necessárias para avaliação dos resultados. Essa transformação consiste em mudar a representação multidimensional dos dados dentro de uma simples relação organizada em uma tabela desnormalizada na granularidade em que se pretende tomar a decisão. Esta tabela transformada contém uma linha para cada objeto de interesse e um conjunto de colunas que descrevem as características destes objetos. Este processo é conhecido como construção de visões de dados (Oliveira, Adeodato, Salgado, & Boratto, 2012). Relação alvo Relações de background Figura 1 - Exemplo de um esquema relacional para um problema de classificação 3

4 Trabalhos Relacionados Poucos estudos são encontrados na literatura confrontando diretamente modelos de Behavior Scoring, a maior parte das pesquisas encontradas faz comparação entre modelos de Credit Scoring, como pode ser visto em (A. Li, Li, & Shi, 2009), (H. Chen, & Chen, 2010) e (Ju, & Sohn, 2013). A escassez de trabalhos nesta área pode ser justificada pela complexidade na construção da visão dos dados, uma vez que as informações necessárias como entrada para os modelos estão em um banco de dados relacional, que é constituído por diversas tabelas, e a construção de tais visões passa a ser um processo lento e muito suscetível a erros. Outra razão se deve a carência de bases de dados públicas disponíveis, por isso grande parte dos estudos recentes sobre modelos de Behavior Scoring utilizam bases de dados privadas o que dificulta a comparação entre estudos. Sarlija and Zekic-Susac, (2009) realizou um estudo comparativo entre modelos de Redes Neurais Artificiais (RNA) e Análise de Sobrevivência (Harrell, 2001) aplicados a um problema de Behavior scoring. Os dados utilizados para a pesquisa foram coletados de uma instituição financeira privada da Croácia. Os resultados mostraram que o modelo baseado em redes neurais apresentou um desempenho superior. Os autores realizaram teste de hipóteses para assegurar que a diferença era estatisticamente significativa. Hsieh, Lee and Lee (2010) realizou um estudo comparativo entre modelos de classificação para Behavior scoring sobre uma base de dados de uma intuição financeira privada de Taiwan. Para o estudo foram selecionados os modelos de Redes Neurais Artificiais, Máquinas de Vetores Suporte do inglês Suport Vector Machine (Vapnik, 2000) e Análise Discriminante Linear. Foi utilizado como medida de avaliação de desempenho a taxa de erro, os resultaram mostraram que o modelo baseado em redes neurais apresentou um desempenho superior aos outros dois modelos, no entanto não foi realizado teste de hipótese para assegurar que a diferença era estatisticamente significativa. Em estudo recente Kennedy, Namee, Delany, O Sullivan and Watson (2013) destaca as oportunidades existentes para soluções de Behavior scoring e descreve os processos envolvidos. Para o autor, a primeira etapa do processo corresponde a seleção de uma amostra de clientes, garantido que os dados referentes aos seus produtos e consumos estejam disponíveis em um determinado ponto de observação. O período antes do ponto de observação é chamado de janela de desempenho. Os dados contidos na janela de desempenho são estruturados em atributos que serão usados como entrada para o modelo de Behavior Scoring. Exemplos de variáveis criadas nesta janela são: máximo dias de atraso, quantidade de parcelas pagas em dia, número de ofertas recebidas, entre outras (McNab & Wynn, 2000). A Figura 2 ilustra como os dados são particionados de acordo com a temporalidade. Figura 2 - Particionamento dos dados em Behavior Scoring O período após o ponto de observação é chamado de janela de resultado. Os dados contidos na janela de resultado são estruturados em atributos que serão utilizados para avaliar a precisão do modelo, é nesta janela que a variável resposta ("bom" e "mau") é construída. 4

5 Descrição das técnicas utilizadas Neste seção, descrevemos as técnicas de modelagem selecionadas para averiguarmos que elas produzem resultados com diferença estatisticamente significativa para o problema de Behavior Scoring. Redes Neurais Artificiais Dentre as redes neurais artificiais, certamente as mais populares são as redes Multi Layer Perceptron (MLP) (Beale, 1994) e (Haykin, 1994). Essas redes são constituídas por unidades de processamento simples que possuem funcionalidades semelhantes àquelas apresentadas pelos neurônios biológicos do cérebro humano. Redes MLP típicas são formadas por uma camada de entrada, uma camada de saída e n camadas escondidas (dispostas entre as duas primeiras), onde todos os neurônios de uma camada são completamente conectados com todos os neurônios da camada precedente. O método de treinamento mais popular para redes do tipo MLP é o algoritmo de retropropagação do erro (error backpropagation algorithm) (Rumelhart, Hinton, & Williams, 1986), que foi utilizado neste estudo. Regressão Logística A regressão logística é um modelo probabilístico que descreve a relação entre uma variável resposta e uma ou mais variáveis explicativas, apresentando a resposta de maneira sucinta, geralmente como um número ou uma série de números. Nos modelos de regressão logística, a variável dependente é, em geral, uma variável binária (nominal ou ordinal) e as variáveis independentes podem ser categóricas (desde que dicotomizadas após transformação) ou contínuas (Hosmer, 2004). No âmbito da aplicação ao risco de crédito, a técnica de regressão logística é utilizada para a avaliação da inadimplência de determinado grupo de clientes em situações relativas à concessão de crédito, assumindo que a probabilidade de inadimplência é logisticamente distribuída, com resultado binomial 0 ou 1. Árvore de decisão A árvore de decisão é um dos modelos de classificação mais utilizados na área de análise de risco de crédito devido a facilidade de compreensão de sua resposta, que é organizada na forma de uma árvore e a partir desta é possível extrair facilmente regras do tipo "Se-Então". Diversos algoritmos de árvore de decisão são encontrados na literatura, porém o mais conhecido é C4.5 proposto por Quinlan (1993). O C4.5 visa a geração de árvores de decisão com tratamento de atributos contínuos e discretos, construindo uma árvore com um número de partições variável e com as folhas sendo indicadas pelos valores do atributo categórico. Para evitar a geração de todas as árvores possíveis, o algoritmo C4.5 se baseia no atributo mais informativo, escolhido entre todos os atributos ainda não considerados no caminho desde a raiz. O algoritmo seleciona como sendo o atributo mais informativo aquele que possuir o maior ganho de informação, resultante da diferença do valor da informação do atributo categórico e do valor da informação do atributo em questão. Para cada atributo é calculado o seu ganho de informação. O atributo que tiver o maior ganho de informação será considerado pelo algoritmo como o próximo nodo da árvore. Assim, a partição começa pelo nodo raiz e continua pelos nodos filhos da mesma maneira, até que todos os exemplos desta partição possuam a mesma classe, rotulando-se este nodo como folha e recebendo sua respectiva classe. 5

6 Base de Dados Uma das duas bases de dados fornecidas no desafio PKDD em 1999 se refere a operações financeiras dos clientes de uma instituição bancária Checa. Esses dados são comumente referenciados na literatura como financial data set e vários trabalhos utilizaram esta base de dados, que é pública e está disponível em (Berka, 2000). Os dados descrevem os clientes do banco com as suas contas, empréstimos e outras operações sobre essas contas, também seus cartões de crédito e aspectos das regiões onde os clientes e agências bancárias estão situados. A Figura 3 exibe o esquema relacional do banco de dados. Figura 3 - Esquema relacional do banco de dados do PKDD1999 Para o desafio, as tarefas de aprendizagem não foram especificadas. No entanto, várias tarefas acabaram por se popularizar entre os participantes. Entre essas tarefas está a classificação dos empréstimos quanto ao risco de inadimplência que é o foco deste artigo. O objetivo da tarefa é permitir melhores decisões sobre a concessão de empréstimos pela instituição aos solicitantes. Para a tarefa de aprendizagem, a Tabela Loan (empréstimo) serviu como relação alvo e o atributo status foi utilizado como variável resposta. Este atributo possui quatro valores diferentes, são eles: Classe A: Empréstimo finalizado sem problemas; Classe B: Empréstimo finalizado com problemas; Classe C: Empréstimo não finalizado sem problemas até o momento; Classe D: Empréstimo não finalizado com problemas até o momento. Os problemas podem ser atrasos ou pagamentos incompletos. Seguindo a ideia dos participantes do desafio, as classes A e C foram agrupadas dentro de uma classe positiva e as classes B e D foram agrupadas dentro de uma classe negativa. Desta forma, passamos a ter um problema de Behavior Scoring. 6

7 Metodologia Experimental Como o principal objetivo desta pesquisa foi realizar uma comparação entre o desempenho de modelos de classificação em problemas de Behavior Scoring, o formalismo apresentado nesta seção é crucial para a relevância do artigo. Tanto o particionamento dos dados como a métrica de avaliação de desempenho foram escolhidos de acordo com a adequação ao problema. Validação Cruzada k-fold O método de Validação Cruzada k-fold é uma forma amplamente aceita para dividir uma única amostra (Jain & Mao, 2000) em k conjuntos de testes estatisticamente independentes, permitindo a construção de intervalos de confiança para a medida de desempenho utilizada como critério de avaliação, como recomendado pelos tradicionais autores Witten and Frank, (2005). Receiver Operating Characteristic (ROC) Para técnicas que produzem saídas contínuas, a decisão binária é tomada a partir de um limiar, abaixo do qual a decisão é feita para uma classe ou outra. Porém, a definição deste limiar é influenciada de acordo com o objetivo do problema, levando-se em consideração, geralmente, que os custos dos erros são diferentes para cada classe (Adeodato & Monteiro, 2004). Para o estudo foi utilizada uma métrica que é independente deste limiar. A métrica escolhida foi a área sobre a curva ROC. Esta métrica tem sido utilizada em importantes competições internacionais como a Pacific-Asia Knowledge Discovery and Data Mining Conference (PKDD) A curva ROC é uma ferramenta poderosa para avaliação de modelos. A análise é feita por meio de um método gráfico simples e robusto, o qual permite estudar a variação da sensibilidade e especificidade do modelo, para diferentes valores de ponto de corte (Provost & Fawcett, 1998) e (Fawcett, 2003). As curvas ROC mostram a relação das taxas de falsos positivos (FP) e verdadeiros positivos (VP) através da variação de um limiar. Esta relação prediz o comportamento dos classificadores, independentemente dos custos e da distribuição das classes. Numa curva ROC, o eixo das ordenadas (y) representa VP e o eixo das abscissas (x) representa FP. A Figura 4 e a Figura 5 ilustram a fórmula de cálculo das taxas verdadeiro positivo e falso positivo respectivamente. Figura 4 - Fórmula da taxa de verdadeiros positivos Figura 5 - Fórmula da taxa de falsos positivos Para cada ponto de corte, a sensibilidade e o complemento da especificidade (1 especificidade) são calculados e colocados um em cada eixo de um gráfico bidimensional (Figura 6), produzindo a curva ROC. A sensibilidade de um sistema de classificação é calculada a partir da razão entre os verdadeiros positivos sobre a soma dos verdadeiros 7

8 positivos e falsos negativos, e a especificidade é calculada a partir da razão entre os verdadeiros negativos sobre a soma dos verdadeiros negativos e falsos positivos. Figura 6 - Exemplo de curva ROC Teste t-student emparelhado O teste t-student emparelhado é um caso especial que se aplica quando as observações nas duas populações de interesse são coletadas em pares tendo cada par de observações tomado sob condições homogêneas (Montgomery & Runger, 2010). Para este estudo, a métrica de desempenho de interesse é a diferença na média da área sobre a curva ROC obtido por cada uma das técnicas quando avaliadas para cada conjunto de teste. A configuração do teste utilizada neste estudo está detalhada abaixo. Hipótese nula: μd= μ1-μ2=0 Hipótese alternativa: μ1> μ2 Onde μ1 representa a média da área sobre a curva ROC para a técnica que obteve o melhor desempenho médio nos conjuntos de testes; μ2 representa a média da área sobre a curva ROC para todas as demais técnicas. Resultados Experimentais As simulações foram realizadas de acordo com a configuração experimental descrita anteriormente para cada um dos três modelos de classificação selecionado, resultando em dez conjuntos de testes, todos estatisticamente independentes dos conjuntos de treinamentos. A Figura 7 ilustra o procedimento. 8

9 Figura 7 - Diagrama da metodologia experimental aplicada Os resultados obtidos são exibidos na Tabela 1, que exibe o valor médio da área sobre a curva ROC para cada um dos dez conjuntos de teste para os três modelos utilizados neste estudo. Os resultados mostraram que o modelo de Redes Neurais Artificial apresentou um melhor desempenho médio, no entanto para assegurar que o resultado é estatisticamente significativo, a Tabela 2 exibe o resumo dos resultados obtidos no teste t-student emparelhado. Uma vez que o p-value é menor que 0.05, concluímos que o modelo de Redes Neurais Artificial fornece resultados diferentes dos demais modelos. Especificamente, os dados indicam que o modelo de Redes Neurais Artificial produz, em média, maior poder discriminatórios do que os demais modelos utilizados neste estudo com um nível de confiança de 95%. 9

10 Tabela 1: Resultados obtidos na validação cruzada 10 fold FOLD/ Área sob a curva ROC MODELO REDE NEURAL ARTIFICIAL REGRESSÃO LOGISTICA ÁRVORE DE DECISÃO MÉDIA Fonte: Dados da pesquisa Tabela 2: Resultado do teste-t emparelhado µd = µ1 - µ2 Limite Inferior Limite Superior p-value µ Regressão Logística Árvore de Decisão Fonte: dados da pesquisa Figura 8. Curva ROC geral para os três modelos utilizados 10

11 Conclusão Este trabalho apresentou uma comparação entre os modelos de classificação Redes Neurais Artificiais, Regressão Logística e Árvore de Decisão, no domínio de Behavior Scoring. A comparação foi realizada utilizando um banco de dados relacional de importante competição internacional, considerada um benchmark da área. Como metodologia experimental, foi aplicado o teste t-student emparelhado unicaudal sobre o desempenho medido pela área da curva ROC nos conjuntos de teste gerados pelo processo de validação cruzada 10 fold. O estudo mostrou que o modelo de Redes Neurais Artificiais supera de forma estatisticamente significativa em desempenho os modelos de Regressão Logística e Árvore de Decisão, quando aplicado ao domínio de Behavior Scoring, com um nível de confiança de 95%. A diferença de desempenho pode ser justificada pelo maior poder de generalização do modelo de Redes Neurais Artificiais, que subdivide o seu conjunto de treinamento em duas partes estatisticamente independente. A primeira parte para ajustar os seus parâmetros livres e a segunda parte para validação. Este conjunto de validação é utilizado para evitar o fenômeno conhecido por overfitting, que é a superespecialização do modelo sobre o conjunto de treinamento o que ocasiona uma baixa capacidade de generalização. O erro estimado sobre o conjunto de validação, dados não utilizados para ajuste de seus parâmetros livre, é utilizado como critério de parada pelo algoritmo. Os modelos de Regressão Logística e Árvore de Decisão, embora apresentem um resultado inferior, oferecem uma vantagem significativa em relação aos modelos de Redes Neurais Artificiais, que é a explicação para a resposta do modelo, para o caso do modelo de regressão é fácil interpretar o escore por ser uma soma ponderada de suas entradas e para árvore de decisão são regras do tipo "Se Então" que são facilmente interpretadas pelo analista de crédito, enquanto a saída da Rede Neural Artificial ainda é considerada uma caixa preta. Como trabalhos futuros, este estudo será expandido para considerar outros modelos de classificação como o support vector machine, e também a utilização de mais bases de dados deste mesmo domínio. Referências Adeodato, P., & Monteiro, D., (2004). Neural networks vs logistic regression: a comparative study on a large data set. In International Conference on Pattern Recognition. Cambridge. Banasiak, M. (2001). Behavior Scoring. Business Credit, vol.103, pp Beale, R., & Jackson, T. (1994). Neural Computing, An Introduction, New York: Adam Hilger. Berka, P., (2000). Guide to the nancial data set. PKDD 2000 Discovery Challenge. Chen, H., & Chen, Y., (2010). A comparative study of discrimination methods for credit scoring. Computers and Industrial Engineering (CIE). 40th International Conference on, vol. 1, no. 5, pp Fawcett, T. (2003). Roc Graphs: Notes and Pratical Considerations for Data Mining Researchers, Technical Report, HPL , HP Labs. Harrell, F. E., Jr., (2001). Regression modelling strategies. New York: Springer-Verlag. Haykin, S., (2007). Neural Networks: A Comprehensive Foundation. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. Hosmer, D. W., & Lemeshow, S. (2004). Applied logistic regression. Vol Wiley- Interscience. 11

12 Hsieh, H., Lee, T., & Lee, T. S, (2010). Data Mining in Building Behavioral Scoring Models, Computational Intelligence and Software Engineering (CiSE). International Conference on, vol. 1, no. 4, pp Jain, A., & Mao, J., (2000). Statistical pattern recognition: A review. IEEE Transactions on Pattern Analysis and Machine Intelligence (22). Ju, Y. H., & Sohn, S. Y., (2013). Updating a credit-scoring model based on new attributes without realization of actual data. European Journal of Operational Research. Kennedy, K., Namee, B. M., Delany, S. J., O Sullivan, M., & Watson, N., (2013). A window of opportunity: Assessing behavioural scoring. Expert Systems with Applications, vol. 40, no. 4., pp Li, A., Li, W., & Shi, Y., (2009). Study on the Application of Data Mining Algorithms in Credit Card Management. E-Business and Information System Security. EBISS '09. International Conference on, vol. 1, no. 5, pp McNab, H., & Wynn, A., (2000). Principles and practice of consumer credit risk management. Chartered Institute of Bankers and Institute of Financial Services and University of Manchester. Institute of Science and Technology. Montgomery, D., & Runger, G. (2010). Applied Statistics and Probability for Engineers. John Wiley & Sons. Oliveira, R. F., Neto, Adeodato, P. J. L., Salgado, A. C., & Boratto, M. C. (2012). Estudo Comparativo entre Proposicionalização e Mineração de Dados Multidimensional sobre um Banco de Dados Relacional. Simpósio Brasileiro de Banco de Dados. Anais do SBBD, pp São Paulo, SP, Brasil. Provost, F., & Fawcett, T. (1998). Robust classiification systems for imprecise environments. Proc. 15th Nat. Conf. on Artificial Intelligence, pp Quinlan, R. (1993). C4.5: Programs for Machine Learning. Morgan Kaufmann, San Mateo, CA. Rumelhart, D. E., Hinton, G. E., & Williams, R. J., (1986). Parallel distributed processing: explorations in the microstructure of cognition, vol. 1. MIT Press, Cambridge, MA, USA, Learning internal representations by error propagation, pp Sarlija, N., Bensic, M., & Zekic-Susac, M., (2009). Comparison procedure of predicting the time to default in behavioural scoring. Expert Syst. Appl. 36(5), pp Thomas, L. C. (2000). A Survey of Credit and Behavioral Scoring: Forecasting Financial Risk of Lending to Consumers. International Journal of Forecasting, v. 16, pp Edinburgh, U.K.. Vapnik, V. N., (2000). The Nature of Statistical Learning Theory, 2nd ed., NY: Springer. Witten, I. H. & Frank, E., (2005). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann Series in Data Management Sys. Morgan Kaufmann. 12

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Aplicações de Behavior Scoring Roteiro - Introdução - Diferença entre Credit scoring e

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Curva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Curva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Curva ROC George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Introdução ROC (Receiver Operating Characteristics) Curva ROC é uma técnica para a visualização e a seleção de classificadores baseado

Leia mais

INTELIGÊNCIA COMPUTACIONAL

INTELIGÊNCIA COMPUTACIONAL INTELIGÊNCIA COMPUTACIONAL Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto MSc. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br

Leia mais

MLP (Multi Layer Perceptron)

MLP (Multi Layer Perceptron) MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -

Leia mais

Construção de Modelos de Previsão de Risco de Crédito Utilizando Técnicas de Estatística Multivariada

Construção de Modelos de Previsão de Risco de Crédito Utilizando Técnicas de Estatística Multivariada MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE PELOTAS PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO Construção de Modelos de Previsão de Risco de Crédito Utilizando Técnicas de Estatística Multivariada Equipe

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron. 1024 UMA ABORDAGEM BASEADA EM REDES PERCEPTRON MULTICAMADAS PARA A CLASSIFICAÇÃO DE MASSAS NODULARES EM IMAGENS MAMOGRÁFICAS Luan de Oliveira Moreira¹; Matheus Giovanni Pires² 1. Bolsista PROBIC, Graduando

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Automatização do processo de determinação do número de ciclos de treinamento de uma Rede Neural Artificial

Automatização do processo de determinação do número de ciclos de treinamento de uma Rede Neural Artificial Automatização do processo de determinação do número de ciclos de treinamento de uma Rede Neural Artificial André Ricardo Gonçalves; Maria Angélica de Oliveira Camargo Brunetto Laboratório Protem Departamento

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I! A utilização de escores na avaliação de crédito! Como montar um plano de amostragem para o credit scoring?! Como escolher as variáveis no modelo de credit

Leia mais

Simulação Transiente

Simulação Transiente Tópicos Avançados em Avaliação de Desempenho de Sistemas Professores: Paulo Maciel Ricardo Massa Alunos: Jackson Nunes Marco Eugênio Araújo Dezembro de 2014 1 Sumário O que é Simulação? Áreas de Aplicação

Leia mais

Projeto Supervisionado

Projeto Supervisionado Projeto Supervisionado Caio Almasan de Moura ra: 095620 Indice 1. Introdução 2. Principal Projeto: Modelo de Score 2.1. Objetivo... pg 3 2.2. Agentes Envolvidos... pg 3 2.3. Contextualização... pg 3 2.4.

Leia mais

Gerenciamento de Projeto: Criando o Termo de Abertura II. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

Gerenciamento de Projeto: Criando o Termo de Abertura II. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Gerenciamento de Projeto: Criando o Termo de Abertura II Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Sumário Priorizando Projetos. Métodos Matemáticos. Métodos de análise de benefícios. Selecionando

Leia mais

IN0997 - Redes Neurais

IN0997 - Redes Neurais IN0997 - Redes Neurais Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática - CIn Departamento de Sistemas da Computação aluizioa@cin.ufpe.br Conteúdo Objetivos Ementa

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

5 Conclusões e Recomendações

5 Conclusões e Recomendações 5 Conclusões e Recomendações 5.1 Conclusões O objetivo deste estudo foi utilizar a base de dados de clientes de uma empresa para desenvolver um modelo de regressão logística que determine o risco de cancelamento

Leia mais

ISO/IEC 12207: Gerência de Configuração

ISO/IEC 12207: Gerência de Configuração ISO/IEC 12207: Gerência de Configuração Durante o processo de desenvolvimento de um software, é produzida uma grande quantidade de itens de informação que podem ser alterados durante o processo Para que

Leia mais

SisDEA Home Windows Versão 1

SisDEA Home Windows Versão 1 ROTEIRO PARA CRIAÇÃO E ANÁLISE MODELO REGRESSÃO 1. COMO CRIAR UM MODELO NO SISDEA Ao iniciar o SisDEA Home, será apresentada a tela inicial de Bem Vindo ao SisDEA Windows. Selecione a opção Criar Novo

Leia mais

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE Redes Neurais Construtivas Germano Crispim Vasconcelos Centro de Informática - UFPE Motivações Redes Feedforward têm sido bastante utilizadas em aplicações de Reconhecimento de Padrões Problemas apresentados

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Função Mudar de unidade estatística

Função Mudar de unidade estatística Função Mudar de unidade estatística Frequentemente, certas pesquisas contêm informações correspondentes a níveis estatísticos diferentes. No Sphinx (Survey ou Léxica), a partir do menu Gestão, opção Mudar

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

Gerenciamento de Riscos do Projeto Eventos Adversos

Gerenciamento de Riscos do Projeto Eventos Adversos Gerenciamento de Riscos do Projeto Eventos Adversos 11. Gerenciamento de riscos do projeto PMBOK 2000 PMBOK 2004 11.1 Planejamento de gerenciamento de riscos 11.1 Planejamento de gerenciamento de riscos

Leia mais

PLANOS DE CONTINGÊNCIAS

PLANOS DE CONTINGÊNCIAS PLANOS DE CONTINGÊNCIAS ARAÚJO GOMES Capitão SC PMSC ARAÚJO GOMES defesacivilgomes@yahoo.com.br PLANO DE CONTINGÊNCIA O planejamento para emergências é complexo por suas características intrínsecas. Como

Leia mais

Este capítulo é divido em duas seções, a primeira seção descreve a base de

Este capítulo é divido em duas seções, a primeira seção descreve a base de 30 3. Metodologia Este capítulo é divido em duas seções, a primeira seção descreve a base de dados utilizada, identificando a origem das fontes de informação, apresentando de forma detalhada as informações

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

1. Introdução 2. Séries Temporais

1. Introdução 2. Séries Temporais 1. Introdução Predição de valores de ações é uma tarefa desafiadora na área de predição de séries temporais financeiras, devido à grande quantidade de variáveis que envolvem essas predições. No passado,

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 201 1. 2 Sistema de Gestão de Processos de Negócio Baseado em Modelos Declarativos Proposta de Trabalho de Graduação

Leia mais

SISTEMA. Tecnologia. Software. Hardware. Prazos. Pessoas. Qualidade. Custo GERENCIAMENTO DE RISCO: COMO GARANTIR O SUCESSO DOS PROJETOS DE TI?

SISTEMA. Tecnologia. Software. Hardware. Prazos. Pessoas. Qualidade. Custo GERENCIAMENTO DE RISCO: COMO GARANTIR O SUCESSO DOS PROJETOS DE TI? GERENCIAMENTO DE RISCO: COMO GARANTIR O SUCESSO DOS PROJETOS DE TI? Os projetos de Tecnologia de Informação possuem características marcantes, que os diferencia dos demais são projetos onde o controle

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

Evolução dos modelos de risco do sistema financeiro nacional

Evolução dos modelos de risco do sistema financeiro nacional Evolução dos modelos de risco do sistema financeiro nacional O avanço da modelagem de risco de empresas nova técnica com uma nova necessidade de processamento no ambiente Big Data julio.guedes@br.experian.com

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

4 Avaliação Econômica

4 Avaliação Econômica 4 Avaliação Econômica Este capítulo tem o objetivo de descrever a segunda etapa da metodologia, correspondente a avaliação econômica das entidades de reservas. A avaliação econômica é realizada a partir

Leia mais

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho 20 Capítulo 3 Avaliação de Desempenho Este capítulo aborda como medir, informar e documentar aspectos relativos ao desempenho de um computador. Além disso, descreve os principais fatores que influenciam

Leia mais

Instituto de Computação, Universidade Federal do Amazonas (UFAM) Manaus-AM, Brasil

Instituto de Computação, Universidade Federal do Amazonas (UFAM) Manaus-AM, Brasil Elicitação de Requisitos a partir de Modelos de Processos de Negócio e Modelos Organizacionais: Uma pesquisa para definição de técnicas baseadas em heurísticas Marcos A. B. de Oliveira 1, Sérgio R. C.

Leia mais

SAD orientado a MODELO

SAD orientado a MODELO Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a MODELO DISCIPLINA: Sistemas de Apoio a Decisão SAD Orientado a Modelo De acordo com ALTER

Leia mais

Modelagem e Simulação Material 02 Projeto de Simulação

Modelagem e Simulação Material 02 Projeto de Simulação Modelagem e Simulação Material 02 Projeto de Simulação Prof. Simão Sirineo Toscani Projeto de Simulação Revisão de conceitos básicos Processo de simulação Etapas de projeto Cuidados nos projetos de simulação

Leia mais

Avaliação de Desempenho em Sistemas de Computação e Comunicação

Avaliação de Desempenho em Sistemas de Computação e Comunicação Avaliação de Desempenho em Sistemas de Computação e Comunicação Universidade Federal do Espírito Santo - UFES Departamento de Informática - DI Laboratório de Pesquisas em Redes Multimidia - LPRM UFES Objetivos

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análise Exploratória de Dados Profª Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Programa de Pós-graduação em Saúde Coletiva email: alcione.miranda@gmail.com Introdução O primeiro passo

Leia mais

UNIVERSIDADE ESTADUAL DO AMAZONAS ESPECIALIZAÇÃO EM DESENVOLVIMENTO EM SOFTWARE LIVRE CONCEITOS E PROJETOS DE BANCO DE DADOS E SQL

UNIVERSIDADE ESTADUAL DO AMAZONAS ESPECIALIZAÇÃO EM DESENVOLVIMENTO EM SOFTWARE LIVRE CONCEITOS E PROJETOS DE BANCO DE DADOS E SQL O trabalho consiste na resolução de um exercício e na confecção de um relatório. 17/10/2005 é o último dia para entrega. O trabalho deverá entregue impresso e o seu conteúdo gravado numa mídia. O formato

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II! Como implementar o escore de crédito?! Como avaliar o escore de crédito?! Como calcular a função discriminante usando o Excel?! Como aplicar a função

Leia mais

Processos de gerenciamento de projetos em um projeto

Processos de gerenciamento de projetos em um projeto Processos de gerenciamento de projetos em um projeto O gerenciamento de projetos é a aplicação de conhecimentos, habilidades, ferramentas e técnicas às atividades do projeto a fim de cumprir seus requisitos.

Leia mais

Banco do Brasil S.A. Consulta ao Mercado - RFP - Request for Proposa Aquisição de Ferramenta de Gestão de Limites Dúvida de Fornecedor

Banco do Brasil S.A. Consulta ao Mercado - RFP - Request for Proposa Aquisição de Ferramenta de Gestão de Limites Dúvida de Fornecedor 1. Em relação ao módulo para Atribuição de Limites, entendemos que Banco do Brasil busca uma solução para o processo de originação/concessão de crédito. Frente a essa necessidade, o Banco do Brasil busca

Leia mais

1. Conceitos de sistemas. Conceitos da Teoria de Sistemas. Conceitos de sistemas extraídos do dicionário Aurélio:

1. Conceitos de sistemas. Conceitos da Teoria de Sistemas. Conceitos de sistemas extraídos do dicionário Aurélio: 1. Conceitos de sistemas Conceitos da Teoria de Sistemas OPTNER: É um conjunto de objetos com um determinado conjunto de relações entre seus objetos e seus atributos. TILLES: É um conjunto de partes inter-relacionadas.

Leia mais

PRIMAVERA RISK ANALYSIS

PRIMAVERA RISK ANALYSIS PRIMAVERA RISK ANALYSIS PRINCIPAIS RECURSOS Guia de análise de risco Verificação de programação Risco rápido em modelo Assistente de registro de riscos Registro de riscos Análise de riscos PRINCIPAIS BENEFÍCIOS

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Introdução Objetivos da Gestão dos Custos Processos da Gerência de Custos Planejamento dos recursos Estimativa dos

Leia mais

ROTEIRO PARA ELABORAÇÃO DE PROJETOS

ROTEIRO PARA ELABORAÇÃO DE PROJETOS APRESENTAÇÃO ROTEIRO PARA ELABORAÇÃO DE PROJETOS Breve histórico da instituição seguido de diagnóstico e indicadores sobre a temática abrangida pelo projeto, especialmente dados que permitam análise da

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária

NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária Alcance 1. Uma entidade que prepara e apresenta Demonstrações Contábeis sob o regime de competência deve aplicar esta Norma

Leia mais

Do neurônio biológico ao neurônio das redes neurais artificiais

Do neurônio biológico ao neurônio das redes neurais artificiais Do neurônio biológico ao neurônio das redes neurais artificiais O objetivo desta aula é procurar justificar o modelo de neurônio usado pelas redes neurais artificiais em termos das propriedades essenciais

Leia mais

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

Redes Neurais. A IA clássica segue o paradigma da computação simbólica Abordagens não simbólicas A IA clássica segue o paradigma da computação simbólica Redes Neurais As redes neurais deram origem a chamada IA conexionista, pertencendo também a grande área da Inteligência

Leia mais

Palavras-chave: Mortalidade Infantil, Análise Multivariada, Redes Neurais.

Palavras-chave: Mortalidade Infantil, Análise Multivariada, Redes Neurais. UMA ANÁLISE COMPARATIVA DE MODELOS PARA CLASSIFICAÇÃO E PREVISÃO DE SOBREVIVÊNCIA OU ÓBITO DE CRIANÇAS NASCIDAS NO RIO DE JANEIRO EM 2006 NO PRIMEIRO ANO DE VIDA Mariana Pereira Nunes Escola Nacional de

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve

Leia mais

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

Pós-Graduação em Gerenciamento de Projetos práticas do PMI Pós-Graduação em Gerenciamento de Projetos práticas do PMI Planejamento do Gerenciamento das Comunicações (10) e das Partes Interessadas (13) PLANEJAMENTO 2 PLANEJAMENTO Sem 1 Sem 2 Sem 3 Sem 4 Sem 5 ABRIL

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

ADMIRAL MARKETS UK LTD POLÍTICA DE EXECUÇÃO NAS MELHORES CONDIÇÕES

ADMIRAL MARKETS UK LTD POLÍTICA DE EXECUÇÃO NAS MELHORES CONDIÇÕES ADMIRAL MARKETS UK LTD POLÍTICA DE EXECUÇÃO NAS MELHORES CONDIÇÕES 1. Disposições gerais 1.1. As presentes Regras de Execução nas Melhores Condições (doravante Regras ) estipulam os termos, condições e

Leia mais

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA Muitas organizações terceirizam o transporte das chamadas em seus call-centers, dependendo inteiramente

Leia mais

Eduardo Alves de Oliveira. eduaopec@yahoo.com.br IME Instituo Militar de Engenharia LES PUC-Rio Laboratório de Engenharia de Software da Puc - Rio

Eduardo Alves de Oliveira. eduaopec@yahoo.com.br IME Instituo Militar de Engenharia LES PUC-Rio Laboratório de Engenharia de Software da Puc - Rio Eduardo Alves de Oliveira eduaopec@yahoo.com.br IME Instituo Militar de Engenharia LES PUC-Rio Laboratório de Engenharia de Software da Puc - Rio Processo de Desenvolvimento de Software; Produtividade:

Leia mais

UNIVERSIDADE FEDERAL DA PARAÍBA TABELAS E GRÁFICOS Departamento de Estatística Luiz Medeiros Tabela de dados multidimensionais Até agora vimos como organizar, resumir e descrever informações referentes

Leia mais

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos

Leia mais

Projeto de Sistemas I

Projeto de Sistemas I Instituto Federal de Educação, Ciência e Tecnologia de São Paulo Projeto de Sistemas I Professora: Kelly de Paula Cunha E-mail:kellypcsoares@ifsp.edu.br Requisitos: base para todo projeto, definindo o

Leia mais

TÍTULO: PROPOSTA DE METODOLOGIA BASEADA EM REDES NEURAIS ARTIFICIAIS MLP PARA A PROTEÇÃO DIFERENCIAL DE TRANSFORMADORES DE POTÊNCIA

TÍTULO: PROPOSTA DE METODOLOGIA BASEADA EM REDES NEURAIS ARTIFICIAIS MLP PARA A PROTEÇÃO DIFERENCIAL DE TRANSFORMADORES DE POTÊNCIA TÍTULO: PROPOSTA DE METODOLOGIA BASEADA EM REDES NEURAIS ARTIFICIAIS MLP PARA A PROTEÇÃO DIFERENCIAL DE TRANSFORMADORES DE POTÊNCIA CATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS E ARQUITETURA SUBÁREA: ENGENHARIAS

Leia mais

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística 1. IDENTIFICAÇÃO PLANO DE ENSINO Disciplina: Estatística Multivariada Código: PGMAT568 Pré-Requisito: No. de Créditos: 4 Número de Aulas Teóricas: 60 Práticas: Semestre: 1º Ano: 2015 Turma(s): 01 Professor(a):

Leia mais

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR 6LPXODomR GH6LVWHPDV )HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR #5,6. Simulador voltado para análise de risco financeiro 3RQWRV IRUWHV Fácil de usar. Funciona integrado a ferramentas já bastante conhecidas,

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos SENAC Pós-Graduação em Segurança da Informação: Análise de Riscos Parte 2 Leandro Loss, Dr. Eng. loss@gsigma.ufsc.br http://www.gsigma.ufsc.br/~loss Roteiro Introdução Conceitos básicos Riscos Tipos de

Leia mais

Cálculo de volume de objetos utilizando câmeras RGB-D

Cálculo de volume de objetos utilizando câmeras RGB-D Cálculo de volume de objetos utilizando câmeras RGB-D Servílio Souza de ASSIS 1,3,4 ; Izadora Aparecida RAMOS 1,3,4 ; Bruno Alberto Soares OLIVEIRA 1,3 ; Marlon MARCON 2,3 1 Estudante de Engenharia de

Leia mais

Apresentam-se, neste documento, os tópicos que se seguem.

Apresentam-se, neste documento, os tópicos que se seguem. Apresentam-se, neste documento, os tópicos que se seguem. O que é o Failure Score? O que prevê o Failure Score? Qual é a disponibilidade do Failure Score? Como é calculado o Failure Score? Qual o desempenho

Leia mais

POLÍTICA DE INVESTIMENTOS

POLÍTICA DE INVESTIMENTOS POLÍTICA DE INVESTIMENTOS Segurança nos investimentos Gestão dos recursos financeiros Equilíbrio dos planos a escolha ÍNDICE INTRODUÇÃO...3 A POLÍTICA DE INVESTIMENTOS...4 SEGMENTOS DE APLICAÇÃO...7 CONTROLE

Leia mais

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida 27 de maio de 2014 O que é a Neural Networw Toolbox? A Neural Network Toolbox fornece funções e aplicativos para a modelagem de sistemas não-lineares complexos que não são facilmente modelados com uma

Leia mais

Estratégia de Manutenção em Oficinas utilizando Caminho Critico

Estratégia de Manutenção em Oficinas utilizando Caminho Critico SEGeT Simpósio de Excelência em Gestão e Tecnologia 1 Estratégia de Manutenção em Oficinas utilizando Caminho Critico RESUMO Entre as estratégias gerenciais em empresas de médio e grande porte existe o

Leia mais

7.Conclusão e Trabalhos Futuros

7.Conclusão e Trabalhos Futuros 7.Conclusão e Trabalhos Futuros 158 7.Conclusão e Trabalhos Futuros 7.1 Conclusões Finais Neste trabalho, foram apresentados novos métodos para aceleração, otimização e gerenciamento do processo de renderização

Leia mais

2.1 Os projetos que demonstrarem resultados (quádrupla meta) serão compartilhados na Convenção Nacional.

2.1 Os projetos que demonstrarem resultados (quádrupla meta) serão compartilhados na Convenção Nacional. O Prêmio Inova+Saúde é uma iniciativa da SEGUROS UNIMED que visa reconhecer as estratégias de melhoria e da qualidade e segurança dos cuidados com a saúde dos pacientes e ao mesmo tempo contribua com a

Leia mais

Princípios de Análise e Projeto de Sistemas com UML

Princípios de Análise e Projeto de Sistemas com UML Princípios de Análise e Projeto de Sistemas com UML 2ª edição Eduardo Bezerra Editora Campus/Elsevier Capítulo 9 Modelagem de estados Todos os adultos um dia foram crianças, mas poucos se lembram disso.

Leia mais

PLANEJAMENTO E PROJETOS. Lílian Simão Oliveira

PLANEJAMENTO E PROJETOS. Lílian Simão Oliveira PLANEJAMENTO E GERENCIAMENTO DE PROJETOS Lílian Simão Oliveira Contexto Gerentes lutam com projetos assustadores e com prazos finais difíceis de serem cumpridos Sistemas não satisfazem aos usuários Gastos

Leia mais

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental Ajuda ao SciEn-Produção 1 Este texto de ajuda contém três partes: a parte 1 indica em linhas gerais o que deve ser esclarecido em cada uma das seções da estrutura de um artigo cientifico relatando uma

Leia mais

Seção 2/E Monitoramento, Avaliação e Aprendizagem

Seção 2/E Monitoramento, Avaliação e Aprendizagem Seção 2/E Monitoramento, Avaliação e Aprendizagem www.bettercotton.org Orientação Text to go here O documento Monitoramento, Avaliação e Aprendizagem da BCI proporciona uma estrutura para medir as mudanças

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

DIMENSIONANDO PROJETOS DE WEB-ENABLING. Uma aplicação da Análise de Pontos de Função. Dimensionando projetos de Web- Enabling

DIMENSIONANDO PROJETOS DE WEB-ENABLING. Uma aplicação da Análise de Pontos de Função. Dimensionando projetos de Web- Enabling DIMENSIONANDO PROJETOS DE WEB-ENABLING Uma aplicação da Análise de Pontos de Função Dimensionando projetos de Web- Enabling Índice INTRODUÇÃO...3 FRONTEIRA DA APLICAÇÃO E TIPO DE CONTAGEM...3 ESCOPO DA

Leia mais

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart. Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart. Versão 1.6 15/08/2013 Visão Resumida Data Criação 15/08/2013 Versão Documento 1.6 Projeto Responsáveis

Leia mais

Viabilidade Financeira: Calculo da TIR e VPL

Viabilidade Financeira: Calculo da TIR e VPL Terceiro Módulo: Parte 4 Viabilidade Financeira: Calculo da TIR e VPL AN V 3.0 [54] Rildo F Santos (@rildosan) rildo.santos@etecnologia.com.br www.etecnologia.com.br http://etecnologia.ning.com 1 Viabilidade

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Diagrama de transição de Estados (DTE)

Diagrama de transição de Estados (DTE) Diagrama de transição de Estados (DTE) O DTE é uma ferramenta de modelação poderosa para descrever o comportamento do sistema dependente do tempo. A necessidade de uma ferramenta deste tipo surgiu das

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Noções de. Microsoft SQL Server. Microsoft SQL Server

Noções de. Microsoft SQL Server. Microsoft SQL Server Noções de 1 Considerações Iniciais Basicamente existem dois tipos de usuários do SQL Server: Implementadores Administradores 2 1 Implementadores Utilizam o SQL Server para criar e alterar base de dados

Leia mais