FACULDADE DE INFORMÁTICA E ADMINISTRAÇÃO PAULISTA GUSTAVO DE MARI PEREIRA OSVALDO BINOTTI TEIXEIRA

Tamanho: px
Começar a partir da página:

Download "FACULDADE DE INFORMÁTICA E ADMINISTRAÇÃO PAULISTA GUSTAVO DE MARI PEREIRA OSVALDO BINOTTI TEIXEIRA"

Transcrição

1 FACULDADE DE INFORMÁTICA E ADMINISTRAÇÃO PAULISTA GUSTAVO DE MARI PEREIRA OSVALDO BINOTTI TEIXEIRA REDES NEURAIS ARTIFICIAIS APLICADAS NA EVASÃO ESTUDANTIL DO ENSINO SUPERIOR São Paulo 2012

2 GUSTAVO DE MARI PEREIRA OSVALDO BINOTTI TEIXEIRA REDES NEURAIS ARTIFICIAIS APLICADAS NA EVASÃO ESTUDANTIL DO ENSINO SUPERIOR Monografia apresentada à FIAP (Faculdade de Informática e Administração Paulista) para obtenção do título de Bacharelado em Engenharia da Computação. São Paulo 2012

3 GUSTAVO DE MARI PEREIRA OSVALDO BINOTTI TEIXEIRA REDES NEURAIS ARTIFICIAIS APLICADAS NA EVASÃO ESTUDANTIL DO ENSINO SUPERIOR Monografia apresentada à FIAP (Faculdade de Informática e Administração Paulista) para obtenção do título de Bacharelado em Engenharia da Computação. Área de Concentração: Redes Neurais Artificiais Orientador: Prof. Dr. Reinaldo Burian São Paulo 2012

4 DEDICATÓRIA Aos nossos Pais. À Clarissa Carmona pelo apoio essencial. Aos nossos amigos.

5 AGRADECIMENTOS A Deus. À FIAP (Faculdade de Informática e Administração Paulista) por possibilitar a realização e o desenvolvimento dessa pesquisa. Aos Professores Luiz Ângelo D'Amore, Reinaldo Burian e Luiz Carlos Magrini pelo acompanhamento e apoio ao longo do desenvolvimento deste trabalho. À Prof. Fabíola, pela colaboração e paciência. Aos nossos amigos e colegas pela fundamental ajuda. À nossa família.

6 Se a educação sozinha não pode tranformar a sociedade, tampouco sem ela a sociedade muda. (Paulo Freire)

7 RESUMO Este trabalho propõe o desenvolvimento de um software para classificar quais perfis de alunos do ensino superior, de instituições privadas localizadas no município de São Paulo, possuem propensão a trancar suas matriculas, evadindo-se do curso/instituição. Isso possibilita aos gestores e coordenadores da área elaborarem previamente medidas e planos de ação para contornar o problema. A evasão estudantil é, uma das dificuldades enfrentadas pelas instituições, sendo objeto de estudo de muitos trabalhos e pesquisas na área, pois a perda de estudantes que não terminam seus estudos ocasiona desperdícios sociais, acadêmicos e econômicos. Desta forma, um sistema como esse pode contribuir para a detecção de tendências à evasão de alunos, servindo como uma importante ferramenta de apoio para a tomada de decisão e planejamento. Neste trabalho foram considerados perfis de alunos de uma base de dados disponibilizada pelo Instituto Nacional de Estudos e Pesquisas Educacionais (INEP). O sistema foi desenvolvido por meio de Redes Neurais Artificiais, utilizando os conceitos de Inteligência Artificial, sendo possível fazer uma simulação que a partir da entrada de dados de um determinado aluno é então sugerido um percentual da possibilidade de ser um perfil evasor. Os resultados demonstraram que esse tipo de ferramenta é viável para a abordagem do problema em questão, pois o nível de assertividade do sistema foi satisfatório, sendo capaz de identificar aspectos relevantes que influenciam na evasão. Palavras-Chave: Redes Neurais Artificiais, Inteligência Artificial, Evasão Escolar.

8 ABSTRACT This work proposes the development of a software to classify whether a higher education student has the profile to drop out his/her studies, giving up the course / institution. This enables higher education managers and coordinators to previously develop solutions and plans of action to overcome the problem. Student dropout is one of the difficulties faced by institutions; hence it is an issue very much researched in this field, because the loss of students who do not complete their studies mean a significant waste of social, academic and economic resources. Therefore, a system like this can contribute to detect trends regarding students evasion, serving as an important tool to decision making and planning. In this study we considered students profiles from a database provided by the Instituto Nacional de Estudos e Pesquisas Educacionais (INEP). The system was developed based on Artificial Neural Networks, using the concepts of Artificial Intelligence, and from data input of different students, the system is able to make a simulation and then it suggests possible profiles of students who might drop out. The results showed that this kind of tool is feasible to approach this kind of problem, due the system assertiveness level was satisfactory, and also because it was able to identify relevant aspects which influence student drop out. Keywords: Artificial Neural Networks, Artificial Intelligence, Student drop out.

9 LISTA DE FIGURAS Figura Modelo não-linear de um neurônio Figura Gráfico da função de limiar Figura Gráfico da função linear por partes Figura Gráfico de uma função sigmóide Figura Gráfico de uma função tangente hiperbólica Figura Rede feedforward de uma única camada Figura Rede feedforward de duas camadas Figura Rede com recorrência entre saídas e camada intermediária Figura Rede com recorrência auto-associativa Figura Aprendizado supervisionado Figura Aprendizado não-supervisionado Figura Fluxo de processamento do algoritmo back-propagation Figura Modelo em Cascata Figura Etapas de Implementação da RNA Figura Tela do módulo de rede neural Figura Treinamento da RNA utilizando o módulo de rede neural Figura Tela do módulo de classificação Figura Consulta de base de dados utilizando módulo de classificação Figura Classificação massiva utilizando módulo de classificação Figura Tela do módulo de simulação Figura Simulação de perfil evasor utilizando módulo de simulação Figura Simulação de perfil não-evasor utilizando módulo de simulação Figura Fluxo dos Testes Figura Gráfico do erro quadrático médio do pior caso Figura Gráfico do erro quadrático médio do melhor caso Figura Gráfico ampliado do erro quadrático médio do melhor caso Figura Gráfico de dispersão do melhor caso Figura Gráfico de dispersão do pior caso... 66

10 LISTA DE TABELAS Tabela Definições de IA, organizadas em quatro categorias Tabela Neurônio Artificial x Neurônio Biológico Tabela Comparativo de Aprendizado entre IA Simbólica x Conexionista Tabela Principais tarefas e aplicações de RNAs Tabela Parâmetros para treinamento da RNA Tabela 4.2 Resultados do treinamento e testes da RNA... 63

11 LISTA DE ABREVIATURAS E SIGLAS IA IC IES INEP MCP MLP RNA Inteligência Artificial Inteligência Computacional Instituição de Ensino Superior Instituto Nacional de Estudos e Pesquisas Educacionais McCullochPitts Perceptron de Múltiplas Camadas (Multilayer Perceptron) Redes Neurais Artificiais

12 SUMÁRIO 1. Introdução Motivação Objetivos Organização Revisão Bibliográfica Inteligência Artificial Linha Simbólica Linha Conexionista Redes Neurais Artificiais Histórico Conceitos Características Benefícios Neurônio Artificial Funções de Ativação Principais Arquiteturas de RNAs Processos de Aprendizagem Aprendizado Supervisionado Aprendizado Não-Supervisionado Aprendizado Hebbiano (Redes de Hopfiled) Aprendizado por competição (Mapas Auto-Organizáveis) Perceptron Perceptron de Múltiplas Camadas (MLP)... 39

13 Treinamento de Redes MLP Áreas e Aplicações Evasão Escolar Projeto O Projeto Seleção das Características Aquisição e Tratamento dos Dados Estrutura da RNA Treinamento da RNA Validação Apresentação do Sistema Testes e Resultados Estrutura dos Testes Análise e Discussão Considerações Gerais Conclusão e Considerações Finais Conclusão Referências Bibliográficas Anexo A Códigos desenvolvidos... 74

14 Capítulo 1 1. Introdução Este capítulo apresenta o assunto e motivação deste trabalho, bem como a sua organização e estruturação. 1.1 Motivação A evasão escolar no ensino superior é um fenômeno complexo que gera impactos não somente econômicos, mas também acadêmicos e sociais (BAGGI; LOPES, 2010). A desistência por parte do aluno em frequentar determinado curso ou Instituição de Ensino Superior (IES) representa um desperdício de recursos e de tempo tanto para as instituições quanto para o aluno (SILVA FILHO et al, 2007). Em 2008, o número de matrículas no ensino superior foi de , e o índice de evasão foi de aproximadamente 22%; isso representa mais de um milhão de alunos desistentes. Essa é uma realidade preocupante, principalmente tendo em vista o contexto do Brasil, que apresenta um dos menores índices da América Latina de jovens matriculados no ensino superior apenas 9% dos jovens nessa faixa etária frequentam uma IES (BAGGI; LOPES, 2010). Embora esta seja uma questão de grande impacto tanto para as instituições públicas quanto privadas, são poucas as instituições que apresentam planejamento e políticas concretas para lidar com a questão da evasão (SILVA FILHO et al, 2007). Apesar de a temática da evasão estudantil ser altamente relevante para as IES e existirem muitas pesquisas nessa área, ainda pouco se sabe sobre o perfil do aluno desistente e sobre quais fatores têm maior peso na decisão de permanecer ou abandonar o ensino superior. Assim, tendo em vista a importância social e econômica da Educação, e também do ensino superior; e considerando o fato de a evasão causar impactos negativos para as instituições, para o aluno e para a sociedade em geral, faz-se importante a criação de políticas tanto governamentais como das próprias IES para o combate à evasão.

15 Introdução 15 É nesse contexto que um trabalho como este - que busca, através de um sistema inteligente, compreender o perfil do aluno desistente e os fatores que o levam à evasão - pode contribuir significativamente para a ampliação do conhecimento sobre essa questão. Isto é, o sistema permitirá compreender os fatores e características mais determinantes para a evasão de um aluno, colaborando para a criação de políticas de combate a esse problema mais eficientes e eficazes, contribuindo assim, para melhorias educacionais. 1.2 Objetivos O objetivo desse trabalho é a criação de um sistema de identificação e classificação do perfil de possíveis alunos evasores em instituições do ensino superior. Isso possibilita que profissionais responsáveis da área elaborem previamente medidas, e planos de ação, para contornar o problema da evasão escolar. O sistema utiliza como técnica de Inteligência Artificial uma Rede Neural de Múltiplas Camadas, que analisa uma base de dados (histórico) com as características de cada aluno, conforme o status de sua matricula - trancada ou ativa. Baseando-se nesses dados é descoberto um padrão do possível evasor e do não evasor, para que então sejam confrontados com os perfis de novos alunos ou até mesmo de alunos atuais. 1.3 Organização Além desta introdução, este trabalho está divido em mais cinco capítulos. No capítulo 2 são apresentadas as revisões bibliográficas com os principais conceitos referentes a Inteligência Artificial e Redes Neurais, bem como um breve panorama histórico acerca do surgimento e aplicações dessas tecnologias. Também são abordados conceitos e principais tendências sobre a evasão estudantil no ensino superior. O capítulo 3 apresenta a construção do Projeto bem como os materiais e métodos utilizados para implementação da Rede Neural. O capítulo 4, por sua vez, descreve os testes e resultados alcançados.

16 Introdução 16 No capítulo 5 é feita a análise e discussão do trabalho. Por fim, no capítulo 6 são apresentadas as conclusões e observações finais além das contribuições e aplicações futuras das soluções desenvolvidas.

17 Capítulo 2 2. Revisão Bibliográfica Apresentam-se as os principais conceitos referentes a Inteligência Artificial e Redes Neurais, bem como um breve panorama histórico acerca do surgimento e aplicações dessas tecnologias. Também são abordados conceitos e principais tendências sobre a evasão estudantil no Ensino Superior. 2.1 Inteligência Artificial A Inteligência Artificial é uma das ciências mais recentes da atualidade, tendo suas origens após a Segunda Guerra Mundial, mais especificamente, em 1956 quando o seu nome foi criado. Influenciada por áreas como Filosofia, Matemática, Economia, Psicologia e também Neurociência, o primeiro trabalho nesta área foi de Warren MacCulloch e Walter Pitts em 1943, baseado no conhecimento da fisiologia básica e da função dos neurônios do cérebro. (NORVIG; RUSSEL, 2004) Entretanto, a formação da ciência que hoje conhecemos como IA, se deu nos Estados Unidos, em Dartmouth College, tendo como um de seus precursores pesquisador John MacCarthy, que reuniu outros estudiosos de várias instituições, como IBM e MIT, em um seminário, de onde se originou efetivamente a ciência. (NORVIG; RUSSEL, 2004) São muitas as definições que buscam explicar o que é IA, mas segundo CHARNIAK e MACDERMOTT 1 (1985 apud NORVIG; RUSSEL, 2004) esta consiste essencialmente em um campo científico que estuda as faculdades mentais pelo uso de modelos computacionais com o objetivo de aplicá-las para que máquinas sejam capazes de pensar e atuar racionalmente, seguindo a lógica do pensamento humano. Isto é, segundo Winston 2 (1986 apud LINDEN, 2008) trata-se do "estudo das ideias que permitem aos computadores simular inteligência." 1 CHARNIAK, E; MCDERMOTT. Introduction to Artificial Intelligence. Massachusetts: Addison- Wesley, WINSTON, P.H. Artificial Intelligence (Third Edition). Massachusetts: Addison-Wesley, 1992.

18 Revisão Bibliográfica 18 Outro entendimento complementar acerca da IA segundo Peter Norvig e Stuart Russel (2004): Denominamos nossa espécie Homo sapiens - homem sábio - porque nossas capacidades mentais são muito importantes para nós. Durante milhares de anos, procuramos entender como pensamos;isto é, como um mero punhado de matéria pode perceber, compreender, prever e manipular um mundo muito maior e mais complicado que ela própria. O campo da inteligência artificial, ou IA, vai ainda mais além, ele tenta não apenas compreender, mas também construir entidades inteligentes. A Inteligência Artificial abrange uma imensa variedade de campos porque sistematiza e automatiza tarefas que são originalmente intelectuais, sendo amplamente utilizada na resolução de problemas em áreas como medicina, negócios, economia, mercado financeiro, etc. Embora haja várias definições do que é IA, basicamente estas variam ao longo de duas principais dimensões: Processos de pensamento e raciocínio e Comportamento. (NORVIG; RUSSEL, 2004) Isto é, há duas grandes vertentes que pautam o estudo da Inteligência Artificial: uma consiste na abordagem focada no ser humano, e em seus processos de pensamento; a outra, por sua vez, está preocupada com a racionalidade. Isso significa que a primeira mede o sucesso em termos de fidelidade ao desempenho humano e a outra mede o sucesso comparando o resultado a um conceito ideal de inteligência pré-estabelecido, conforme descrevem os autores: Devemos salientar que, ao fazermos distinção entre comportamento humano e racional, não estamos sugerindo que os seres humanos sejam necessariamente 'irracionais' no sentido de emocionalmente instáveis ou insanos'. Simplesmente precisamos observar que não somos perfeitos [...]. A tabela 2.1 demonstra resumidamente algumas definições de IA, conforme as vertentes citadas acima:

19 Revisão Bibliográfica 19 Tabela Definições de IA, organizadas em quatro categorias Fonte: NORVIG; RUSSEL, 2004 Sistemas que pensam como seres humanos "O novo e interessante esforço para fazer os computadores pensarem... máquinas com mentes, no sentido total e literal." (Haugeland, 1985) "[Automatização de] atividades que associamos ao pensamento humano, atividades como a tomada de decisões, a resolução de problemas, o aprendizado..." (Bellman, 1978) Sistemas que atuam como seres humanos "A arte de criar máquinas que executam funções que exigem inteligência quando executadas por pessoas." (Kurzweil, 1990) Sistemas que pensam racionalmente "O Estudo das faculdades mentais pelo uso de modelos computacionais." (Charniak e McDermott, 1985) "O estudo das computações que tornam possível perceber, racionar e agir." (Winston, 1992) Sistemas que atuam racionalmente "A Inteligência Computacional é o estudo do projeto de agentes inteligentes." (Poole et al., 1998) Definir o que é Inteligência Artificial, também denominada por alguns estudiosos de Inteligência Computacional (IC), é uma tarefa complexa, porque mesmo os cientistas ainda não têm certeza de como a adquirimos ou como a aperfeiçoamos a inteligência. (LINDEN, 2008) Ademais, conceituação de IA depende do pressuposto do qual parte o pesquisador: o da racionalidade ou o do comportamento humano: "Como se poderia esperar, existe uma tensão entre abordagens centradas em torno de seres humanos e abordagens centradas em torno da racionalidade." (NORVIG; RUSSEL, 2004) Neste trabalho, porém, não se entrará neste mérito e nem se aprofundará esta discussão, até porque em muitos livros não há distinção entre as abordagens e também qualquer das definições é válida para esta pesquisa. A IA que visa propor o desenvolvimento de sistemas inteligentes, está divida em duas linhas de pesquisa, simbólica e conexionista. 2.2 Linha Simbólica A linha simbólica, seguindo uma tradição lógica, utiliza formalismos do tipo lógico para simular o comportamento inteligente expresso através da linguagem, sendo símbolos normalmente formulados em termos familiares, o que tornam as representações simbólicas de IA relativamente fáceis de serem entendidas por um usuário humano, torando-a bastante adequada para a comunicação homem-

20 Revisão Bibliográfica 20 máquina. Dentre as diversas áreas de pesquisa, as principais são os sistemas especialistas, a aprendizagem, a representação e a aquisição de conhecimento, a visão computacional, a robótica e etc. (AZEVEDO, 2005; HAYKIN, 2001) 2.3 Linha Conexionista A IA conexionista propõe a modelagem da inteligência humana por meio da simulação dos componentes do cérebro (neurônios e interligações) (AZEVEDO, 2005; HAYKIN, 2001), sendo considerado já natural para os pesquisadores tentar simular o funcionamento do cérebro humano e utilizá-lo em um computador. Segundo Minsky (1990): Os sistemas conexionistas oferecem uma linguagem de representação que possibilita encerrar o conhecimento sem geralmente saber sua forma com precisão. O grande atrativo dos sistemas conexionistas é sua estrutura simples e homogênea, vista como uma maneira de representar o conhecimento sem qualquer sintaxe. Não existem regras explicitas que governam seu comportamento. As regras são induzidas a partir de um conjunto de treinamento. Esse modelo de funcionamento produz uma característica muitas vezes indesejável em agentes inteligentes: uma representação opaca do conhecimento. As seguintes características podem ser descritas pelos modelos conexionistas: Arquitetura baseada nos componentes do cérebro; Utiliza conceitos de nós e redes. Uma rede de interconexões é formada a partir dos nós; As interconexões são utilizadas para armazenar conhecimento, que é associado com outros conhecimentos da rede ou de outras redes possuindo uma relação com o associacionismo. Artificiais. A principal área de pesquisa da IA conexionista são as Redes Neurais

21 Revisão Bibliográfica Redes Neurais Artificiais Histórico Um dos primeiros estudos que deram origem as RNAs foi o trabalho de Warren McCulloch e Walter Pitts por volta de 1943, onde foi proposto um modelo artificial de um neurônio biológico (chamado de neurônio MCP devido as iniciais de seus nomes) descrevendo suas capacidades computacionais. Em 1949, Donald Hebb, foi o pioneiro ao demonstrar uma técnica de aprendizado através da variação dos pesos de entrada dos neurônios, sendo uma teoria baseada no reforço das ligações sinápticas entre neurônios. Mais tarde, Widrow e Hoff sugeriram uma técnica de aprendizado conhecida como Widrow-Hoff, ou regra delta, baseada em um método do gradiente descendente para minimização do erro na saída de um neurônio com resposta linear. Essas técnicas de aprendizado são conhecidas e bastante utilizadas até hoje em diversos algoritmos. (BRAGA et al., 2011) Em 1958, Frank Rosenblatt propôs um novo modelo, onde as RNAs poderiam ser treinadas para classificar certos tipos de padrões, denominado perceptron, este consistia em sinapses ajustáveis as RNAs com neurônios MCP, possuindo três camadas: a primeira com entradas do exterior com conexões fixas (retina), a segunda que recebe impulsos da primeira por meio de conexões (pesos) ajustáveis, enviando saídas a terceira camada (respostas). No início a RNA fornecia uma saída qualquer em função da condição inicial, porém devido ao ajuste gradual dos pesos o perceptron poderia ser treinado para fornecer saídas mais adequadas de acordo com o conjunto de treinamento. A ideia de Rosenblatt, na realidade era fazer com que as RNAs fossem capaz de gerar novas descobertas sem a necessidade de regras explícitas fornecidas pelo ser humano. (BRAGA et al., 2011) Um pouco mais adiante em 1969, Minsky e Papert chegaram a conclusão que o perceptron proposto por Rosenblatt não era capaz de executar algumas tarefas, sendo limitado à resolução de problemas linearmente separáveis, visto que o modelo tinha uma única camada de pesos ajustáveis, ficando então conhecido como perceptron simples. O principal argumento era do crescimento explosivo, tanto de espaço como de tempo requerido para a solução de problemas complexos ou problemas difíceis de aprender, porém essa foi uma visão pessimista já que as

22 Revisão Bibliográfica 22 redes neurais são capazes de resolver problemas não linearmente separáveis. (BRAGA et al., 2011) Com isso, nos anos de 1970, poucos pesquisadores continuaram com as pesquisas na área, dentre eles, podendo ser citados Igor Aleksander (redes sem pesos), na Inglaterra, Kunihiko Fukushima (cognitron e neocognitron), no Japão, Steven Grossberg (sistemas-adaptativos), nos EUA, e Teuvo Kohonen (memórias associativas e modelos auto-organizáveis), na Finlândia. (BRAGA et al., 2011) Um dos grandes marcos na história e causando o ressurgimento do interesse pelas RNAs em 1982, foi devido em grande parte pela pesquisa de John Hopfield, segundo BRAGA et al. (2011): Em 1982, John Hopfield publicou um artigo que chamou a atenção para as propriedades associativas das RNAs. Esse artigo foi, sem dúvida, mostrar a relação entre redes recorrentes auto-associativas e sistema físicos, o que também abriu espaço para a utilização de teorias correntes da Física para estudar tais modelos. Não obstante, a descrição do algoritmo de treinamento back-propagation alguns anos mais tarde mostrou que a visão de Minsky e Papert sobre o perceptron era bastante pessimista. As RNAs de múltiplas camadas são, sem dúvida, capazes de resolver problemas "difíceis de aprender". Desde então houve uma nova explosão de interesse pelas RNAs, dentre outros fatores é possível citar o avanço da tecnologia, como por exemplo a microeletrônica permitindo a realização física de modelos de neurônios e sua interconexão de um modo antes impensável. Uma boa parte das pesquisas também concentraram seus esforços em propor variações do algoritmo back-propagation que tivessem maior velocidade de convergência. (BRAGA et al., 2011) Conceitos As Redes Neurais Artificiais (RNAs), segundo Braga et al. (2011): "São modelos matemáticos que se assemelham às estruturas neurais biológicas e que têm capacidade computacional adquirida por meio de aprendizado e generalização". De uma forma em geral, uma RNA é uma máquina projetada para modelar a maneira como o nosso cérebro processa uma tarefa particular, sendo esta simulada por programação em um computador digital. Para realizar esta computação útil as

23 Revisão Bibliográfica 23 redes neurais passam por um processo de aprendizagem ou algoritmo de aprendizagem, cuja função é modificar os pesos sinápticos da rede de uma forma ordenada para alcançar um objetivo. Para isso, as redes empregam uma interligação maciça de células computacionais simples denominadas ''neurônios" ou "unidades de processamento". Essa força de conexão entre neurônios, conhecidas como pesos sinápticos, são utilizadas para armazenar o conhecimento adquirido. (HAYKIN, 2001) Ainda segundo HAYKIN (2001), "Uma Rede Neural é um processador paralelamente distribuído e constituído de unidades de processamento simples, que tem a propensão natural para armazenar conhecimento experimental e torná-lo disponível para o uso". Esse conhecimento ou aprendizado da RNAs, em outras palavras, se refere à capacidade de as mesmas adaptarem os seus parâmetros como consequência da sua interação com o meio externo, sendo um processo interativo e por meio dele a RNA deve melhorar o seu desempenho gradativamente à medida que interage com o meio externo. (REZENDE, 2005) Características As principais características de aplicações com RNAs segundo Silva (2010) são: Adaptação por experiência: A partir da apresentação sucessiva de exemplos (padrões, amostras, medidas) relacionados ao processo, ajustam-se os parâmetros internos da rede - tipicamente pesos sinápticos. Assim, tem-se o conhecimento por experimentação; Capacidade de aprendizado: A rede pode extrair o relacionamento existente entre variáveis que fazem parte da aplicação por intermédio de um método de treinamento; Habilidade de generalização: Após o processo de treinamento da rede, essa é capaz de generalizar o conhecimento adquirido, possibilitando estimar soluções que eram até então desconhecidas; Organização de dados: Baseada em características profundas envolvendo determinado conjunto de informações a respeito de um processo, a rede é capaz de

24 Revisão Bibliográfica 24 realizar a sua organização interna visando possibilitar o agrupamento de padrões que apresentam particularidades em comum; Tolerância a falhas: A rede neural torna-se tolerante a falhas quando parte de sua estrutura interna é corrompida, devido ao alto número de interconexões entre os neurônios artificiais presentes nela; Armazenamento distribuído: O conhecimento do comportamento de um processo dentro de uma arquitetura neural é realizado de forma distribuída entre as inúmeras sinapses de seus neurônios artificiais, permitindo então um incremento da força da arquitetura frente a possíveis neurônios que se tornem inoperantes; Facilidade de prototipagem: A partir de uma especificação bem elaborada da aplicação, a implementação da maioria das arquiteturas neurais torna-se facilmente prototipada em hardware ou software, já que após o processo de treinamento, os resultados são normalmente obtidos por algumas operações matemáticas elementares Benefícios De forma resumida a RNA possui duas grandes vantagens sendo a primeira por sua estrutura paralelamente distribuída e a segunda por sua habilidade de aprender. Estas duas capacidades de processamento de informação possibilitam que as RNAs resolvam problemas complexos (de grande escala) ou problemas intratáveis. (HAYKIN, 2001) Ainda de acordo com HAYKIN (2001), as RNAs oferecem propriedades úteis com diversas capacidades conforme a seguir: Não-linearidade: Um neurônio pode ser linear ou não-linear. A nãolinearidade é de um tipo especial, no sentido de ela ser distribuída por toda a rede. Mapeamento de Entrada-Saída: Um paradigma popular de aprendizagem chamado aprendizagem com um professor ou aprendizagem supervisionada envolve a modificação de pesos sinápticos de uma rede pela aplicação de um conjunto de amostras de treinamento rotuladas ou exemplos da tarefa. Cada exemplo consiste de um sinal de entrada único e de uma resposta desejada correspondente. Apresenta-se para a rede um exemplo escolhido ao acaso do conjunto, e os pesos

25 Revisão Bibliográfica 25 sinápticos (parâmetros livres) da rede são modificadas para minimizar a diferença entre a resposta desejada e a resposta da rede, produzida pelo sinal de entrada, de acordo com um critério estatístico apropriado. O treinamento da rede é repetido para muitos exemplos do conjunto até que a rede alcance um estado estável onde não haja mais modificações significativas nos pesos sinápticos. Adaptabilidade: As redes neurais possuem uma capacidade inata de adaptar seus pesos sinápticos a modificações do meio ambiente. Em particular, uma rede neural treinada para operar em um ambiente especifico pode ser facilmente retreinada para lidar com pequenas modificações nas condições operativas do ambiente. Resposta a Evidências: No contexto de classificação de padrões, uma rede neural pode ser projetada para fornecer informação não somente sobre qual padrão particular selecionar, mas também sobre a confiança ou crença na decisão tomada. Esta última informação pode ser utilizada para rejeitar padrões ambíguos, caso eles estejam presentes, e com isso melhorar o desempenho de classificação da rede. Informação Contextual: O conhecimento é representado pela própria estrutura e estado de ativação de uma rede neural. Cada neurônio da rede é potencialmente afetado pela atividade de todos os outros neurônios na rede. Consequentemente, a informação contextual é tratada naturalmente pela rede neural. Uniformidade de Análise e Projeto: Basicamente, as redes neurais desfrutam de universalidade como processadores de informação. No sentido de que a mesma notação é utilizada em todos os domínios envolvendo a aplicação de redes neurais. Esta característica se manifesta de diferentes modos: a) Os neurônios, de uma forma ou de outra, representam um ingrediente comum a todas as redes neurais. b) Esta uniformidade torna possível compartilhar teorias e algoritmos de aprendizagem em aplicações de redes neurais. c) Redes modulares podem ser construídas através de uma integração homogênea de módulos. Analogia Neurobiológica: O projeto de uma rede neural é motivado pela analogia com o cérebro humano, que é uma prova viva de que o processamento paralelo tolerante a falhas é não somente possível fisicamente mas também rápido e

26 Revisão Bibliográfica 26 poderoso. Os engenheiros olham para a neurobiologia procurando novas ideias para resolver problemas mais complexos do que aqueles baseados em técnicas convencionais de projeto por conexões fixas Neurônio Artificial O neurônio artificial, semelhante ao natural, é a unidade de processamento de informação necessária para o funcionamento da rede neural, pois recebe um ou mais sinais de entrada e devolve um sinal de saída. É possível perceber o processamento paralelo pelo fato dos sinais de entrada chegarem ao neurônio simultaneamente conforme figura 2.1 (HAYKIN, 2001) Figura Modelo não-linear de um neurônio Fonte: HAYKIN, 2001 Basicamente existem três pontos fundamentais nos neurônios: Um conjunto de sinapses, sendo caracterizada por um peso próprio. Designadamente, um sinal x j na entrada de uma sinapse j conectado a um neurônio k é multiplicado pelo peso sináptico w kj. Diferente de uma sinapse do cérebro, o peso

27 Revisão Bibliográfica 27 sináptico de um neurônio artificial pode estar em um intervalo tanto de valores negativos como também positivos. Um somador para os sinais de entrada, sendo ponderados pelas respectivas sinapses do neurônio. Uma função de ativação utilizada para restringir a amplitude da saída de um neurônio. Tipicamente, o intervalo restringido é escrito como fechado [0,1] ou [-1,1]. É possível observar na tabela 2.2, um comparativo entre o neurônio artificial e o neurônio biológico. Tabela Neurônio Artificial x Neurônio Biológico Fonte: PANICKI, 2004 Neurônio Artificial x Neurônio Biológico Entradas Pesos Função de Ativação Somador Dendritos Sinapse Disparo Soma Funções de Ativação A função de ativação define, a partir dos valores dos vetores de peso (w k1, w k1..., w km ) e de entrada (x 1, x 2... x 1 ), a saída y do neurônio. (BRAGA et al., 2011) Existem quatro tipos básicos de funções de ativação segundo HAYKIN (2001): Função de Limiar, também conhecida como função degrau, sendo referenciada na literatura como o modelo de neurônio de McCulloch-Pitts. É possível verificar através da equação 2.1, que a saída do neurônio assume o valor 1, se a combinação linear seja maior ou igual a zero, ou caso contrário assume o valor 0. ( ) { (2.1)

28 Revisão Bibliográfica 28 φ(v) 1,2 1 0,8 0,6 0,4 0, Figura Gráfico da função de limiar Fonte: HAYKIN, 2001 Função linear por partes, sendo esta uma aproximação de um amplificador não linear dada pela equação 2.2 e seu gráfico na figura 2.3. ( ) (2.2) { φ(v) 1,2 1 0,8 0,6 0,4 0, Figura Gráfico da função linear por partes Fonte: HAYKIN, 2001

29 Revisão Bibliográfica 29 Função Sigmóide, sendo a função de ativação mais utilizada na construção de RNAs. Ela pode ser definida como uma função estritamente crescente, mantendo um balanceamento entre comportamento linear e não-linear. Um exemplo de função sigmóide pode ser definida pela equação 2.3, onde a é o parâmetro de inclinação da função e quando este tende ao infinito, a função tende a se tornar uma função de limiar. A função sigmóide assume um intervalo contínuo de valores entre 0 e 1. ( ) { (2.3) φ(v) 1,2 1 0,8 0,6 0,4 0, Figura Gráfico de uma função sigmóide para parâmetro de inclinação a variável Fonte: HAYKIN, 2001 Função tangente hiperbólica, correspondente à função sigmóide anterior, porém podendo assumir um intervalo de valores contínuos de -1 a +1, ou seja, podendo assumir valores negativos conforme equação 2.4. ( ) ( ) (2.4)

30 Revisão Bibliográfica 30 φ(v) 1,5 1 0, ,5-1 -1,5 Figura Gráfico de uma função tangente hiperbólica Fonte: HAYKIN, Principais Arquiteturas de RNAs Os neurônios artificiais individuais, independente da função de ativação escolhida, possuem uma certa capacidade computacional limitada, porém um conjunto de neurônios quando interligados na forma de uma rede neural é capaz de solucionar problemas de alta complexidade (BRAGA et al., 2011). Ainda segundo Braga et al. (2011), as principais estruturas ou possíveis configurações de neurônios artificiais interligados na forma de RNAs podem ser descritas conforme a seguir: Rede feedforward de uma única camada, considerada a estrutura mais simples, é capaz de resolver problemas multivariáveis de múltiplas funções acopladas, porém com algumas restrições de complexidade por ser de uma única camada conforme ilustração da figura 2.6.

31 Revisão Bibliográfica 31 Figura Rede feedforward de uma única camada Fonte: BRAGA et al., 2011 Rede feedforward de duas camadas, semelhante a estrutura anterior porém com uma camada adicional, apresentada na figura 2.7, denominada camada intermediária que atribui à RNA uma maior capacidade computacional e universalidade na aproximação de funções contínuas.

32 Revisão Bibliográfica 32 Figura Rede feedforward de duas camadas Fonte: BRAGA et al., 2011 Rede com recorrência entre saídas e camada intermediária, diferente das redes apresentadas nas figuras 2.6 e 2.7 que são consideradas estáticas, por suas saídas dependerem apenas das entradas atuais, essa estrutura possui conexões recorrentes entre neurônios de um mesmo nível ou entre neurônios de saída e de camadas anteriores. Nessa estrutura demonstrada na figura 2.8, a saída não depende somente das entradas mas também do seu valor atual. Esse tipo de RNA é utilizada na resolução de problemas que envolvam processamento temporal, como em previsão de eventos futuros.

33 Revisão Bibliográfica 33 Figura Rede com recorrência entre saídas e camada intermediária Fonte: BRAGA et al., 2011 Rede com recorrência auto-associativa, essa estrutura apresentada na figura 2.9, possui um único nível de neurônios, sendo que a saída de cada um deles está conectada às entradas de todos os outros. Este tipo de rede não possui entradas externas, sendo uma operação em função da dinâmica de mudança dos estados dos neurônios, que atuam de forma auto-associativa, caracterizando uma estrutura típica de uma rede de Hopfiled.

34 Revisão Bibliográfica 34 Figura Rede com recorrência auto-associativa Fonte: BRAGA et al., 2011 De acordo com Braga et al., (2011), a definição da estrutura de uma RNA envolve uma série de fatores podendo ser listados conforme a seguir: complexidade do problema; dimensionalidade do espaço de entrada; características dinâmicas ou estáticas; conhecimento a priori sobre o problema; representatividade dos dados Processos de Aprendizagem Segundo Mendel e McLaren 3 (1970 apud HAYKIN, 2001): Aprendizado é o processo pelo qual os parâmetros livres de uma rede neural são ajustados por meio de uma forma continuada de 3 Mendel, J.M; R.W. McLaren, "Reinforcemente-learning control and pattern recognition systems" in Adaptive, Learning, and Pattern Recognition Systems: Theory and Applications, vol. 66, J.M. Mendel and K.S. Fu, eds., pp , New York: Academic Press.

35 Revisão Bibliográfica 35 estímulo pelo ambiente externo, sendo o tipo específico de aprendizado definido pela maneira particular como ocorrem os ajustes dos parâmetros livres. Essa definição de aprendizado de uma RNA ou sua capacidade de aprender é considerada uma das características mais importantes, sendo um processo interativo de ajuste dos pesos das conexões, que armazenam no final, o conhecimento que a rede adquiriu do ambiente externo. Essa é uma abordagem conexionista, diferente da IA simbólica que obtém o conhecimento através de regras explicitas (BRAGA et al., 2011; HAYKIN, 2001) É possível observar na tabela 2.3 um comparativo do processo de aprendizado entre as abordagens simbólica e conexionista. Tabela Comparativo de Aprendizado entre IA Simbólica x Conexionista IA Simbólica Regras explícitas Aprendizado IA Conexionista Ajuste de pesos das conexões Este conceito de aprendizado está relacionado com a melhoria do desempenho da rede de acordo com algum critério preestabelecido, por exemplo, o erro quadrático médio da resposta da rede pode ser utilizado no treinamento da RNA como critério de desempenho pelos algoritmos de correção de erros, espera-se que quando o aprendizado for avançando que esse erro diminua (BRAGA et al., 2011; HAYKIN, 2001) Ainda segundo os autores, de uma forma em geral, o valor do vetor de pesos w(t + 1) no instante t + 1 pode ser dado pela equação 2.5, onde w(t) e w(t + 1) referem-se aos valores dos pesos nos instantes t e t + 1, e Δw(t) sendo o ajuste aplicado aos pesos. ( ) ( ) ( ) (2.5) Há diversos algoritmos de treinamento para as RNAs, que basicamente, diferem na forma como Δw(t) é calculado, porém estes podem ser incorporados em

36 Revisão Bibliográfica 36 dois modelos principais sendo eles: aprendizado supervisionado e aprendizado nãosupervisionado, que serão descritos a seguir Aprendizado Supervisionado Aprendizado supervisionado, também denominado aprendizado com um professor, exige a existência de um ''supervisor'' ficando responsável por estimular as entradas da rede por meios de padrões de entrada e analisar a saída calculada pela mesma, confrontando-a com a saída desejada. (BRAGA et al., 2011) É possível observar na figura 2.10 que para cada etapa do treinamento o supervisor compara a saída da rede com a saída desejada fornecendo informações para que sejam feitos pequenos ajustes dos pesos, caminho então para uma possível solução. Professor Saída Entrada RNA _ Σ + Erro Figura Aprendizado supervisionado Fonte: BRAGA et al., 2011 É possível observar na figura 2.10 que para cada etapa do treinamento o supervisor compara a saída da rede com a saída desejada fornecendo informações para que sejam feitos pequenos ajustes dos pesos, caminho então para uma possível solução. Este tipo de aprendizado é recomendado para problemas em que

37 Revisão Bibliográfica 37 se deseja obter um mapeamento entre padrões de entrada e saída, sendo o algoritmo back-propagation um dos mais conhecidos para esta finalidade. (BRAGA et al., 2011) Aprendizado Não-Supervisionado No aprendizado não-supervisionado, ao contrário do anterior, não existe um "supervisor" para acompanhar o processo de aprendizado, sendo que somente os padrões de entrada estão disponíveis para a rede. Nesta modalidade os padrões de entrada são apresentados à rede continuamente e para que o aprendizado seja possível é fundamental a existência de características como regularidade e redundância nas entradas. (BRAGA et al., 2011) Na figura 2.11 é apresentado um modelo genérico de aprendizado nãosupervisionado. Meio externo Estado do meio externo RNA Resposta Figura Aprendizado não-supervisionado Fonte: BRAGA et al., Aprendizado Hebbiano (Redes de Hopfiled) As redes de Hopfield são formadas por um conjunto de neurônios e um conjunto correspondente de atrasos unitários, as saídas estão ligadas às entradas por um atraso de tempo, compondo um sistema de realimentação múltipla, ou seja, a resposta da rede depende sempre do seu estado no intervalo de tempo anterior. Esse modelo utiliza o aprendizado hebbiano para armazenamento de padrões, considerado um dos métodos mais importantes de aprendizado, publicado na década de 1940, por Donald Hebb, propondo que o peso de uma conexão sináptica

38 Revisão Bibliográfica 38 deve ser ajustado se houver sincronismo entre os níveis de atividade da entrada e saída. (HAYKIN, 2001) Aprendizado por competição (Mapas Auto-Organizáveis) As redes de Kohonen ou Mapas Auto-Organizáveis baseiam-se no aprendizado por competição, que como o próprio nome deduz, existe uma disputa entre os neurônios de saída para se tornarem ativos, sendo que somente um único neurônio pode estar ativo em um determinado instante. Esse é um modelo particular de aprendizado não-supervisionado sendo sua principal característica a capacidade de aprender através de exemplos, sem a necessidade de serem explicitamente programadas. (BRAGA et al., 2011; HAYKIN, 2001) De acordo com BRAGA et al. (2011), "RNAs auto-organizáveis possuem um amplo leque de aplicações potenciais, principalmente em problemas de reconhecimento de padrões e agrupamento de dados em que as classes não são conhecidas a priori." Perceptron De acordo com Haykin (2001), o perceptron pode ser definido como "a forma mais simples de uma rede neural usada para a classificação de padrões ditos linearmente separáveis". Ainda segundo o autor, ele é construído de um único neurônio com pesos sinápticos ajustáveis e bias, sendo sua criação por conta de alguns pesquisadores e suas contribuições pioneiras por volta de , dentre eles: McCulloch e Pitts (1943) por introduzirem a ideia de redes neurais como máquinas computacionais. Hebb (1949) por postular a primeira regra de aprendizagem auto-organizada Rosenblatt (1958) por propor o perceptron como primeiro modelo para aprendizagem como um professor (aprendizagem supervisionada). O perceptron, como ficou conhecido o modelo proposto por Rosenblatt, era composto por uma estrutura de rede, tendo como unidades básicas neurônios MCP,

39 Revisão Bibliográfica 39 e uma regra de aprendizado, que consistia em ajustar os parâmetros livres da rede. Anos mais tarde Rosenblatt demonstrou o teorema de convergência do perceptron com um algoritmo de aprendizado que sempre converge para um problema linearmente separavél. (BRAGA et al., 2011; HAYKIN, 2001) A topologia do perceptron era composta por unidades de entrada, por um nível intermediário formado pelas unidades de associação e por um nível de saída formado pelas unidades de resposta. Essa topologia apesar de possuir três níveis, é conhecida como perceptron de uma única camada, já que somente o nível de saída apresenta propriedades adaptativas. O modelo não teve muita aceitação na comunidade científica da época devido aos problemas de ordem não-linear enfrentados diariamente, porém mostrou-se merecedor de estudo devido suas diversas características. (BRAGA et al., 2011; HAYKIN, 2001) Perceptron de Múltiplas Camadas (MLP) Diante disso é possível constatar que as redes de uma única camada possuem uma limitação para resolver apenas problemas com características lineares, porém a grande maioria dos problemas reais possuem aspectos que consideram a nãolinearidade, sendo portanto necessário estruturas com características não-lineares para resoluções desses problemas de maior complexidade. Segundo Braga et al. (2011), o problema da não-linearidade acaba então sendo incorporado nos modelos neurais através de funções de ativação (nãolineares) de cada neurônio da rede e da composição da sua estrutura em camadas sucessivas. De acordo com o autor "a rede neural de múltiplas camadas composta por neurônios com funções de ativação sigmoidais nas camadas intermediárias dáse o nome de Perceptron de Múltiplas Camadas (MLP - Multilayer Perceptron)". Haykin (2001), define as MLPs como: Um conjunto de unidades sensoriais (nós de fonte) que constituem a camada de entrada, uma ou mais camadas ocultas de nós computacionais e uma cada de saída de nós computacionais. O sinal de entrada se propaga para frente através da rede, camada por camada. O treinamento de MLPs surgiu durante a década de 1980 com a descrição do algoritmo de retropropagação de erros, ou back-propagation, sendo o princípio

40 Revisão Bibliográfica 40 desse algoritmo, utilizando-se o gradiente descendente, estimar o erro das camadas intermediárias por meio de uma estimativa do efeito que estas causam no erro da camada de saída. (BRAGA et al., 2011) Treinamento de Redes MLP Conforme mencionado, o back-propagation é o principal algoritmo de treinamento para as redes MLPs sendo que utiliza pares de entrada e saída para, por meio de um mecanismo de correção de erros, ajustar os pesos da rede. Esse ajuste é baseado em uma regra delta proposta por Widrow e Hoff. (BRAGA et al., 2011). O treinamento ocorre em duas fases chamadas forward e backward, porque cada fase percorre a rede em um sentido. Os dados seguem da entrada para a saída no sentido forward, e os erros da saída para a entrada no sentido backward, conforme figura 2.12 (BRAGA et al., 2011). Figura Fluxo de processamento do algoritmo back-propagation Fonte: BRAGA et al., 2011

41 Revisão Bibliográfica Áreas e Aplicações As RNAs basicamente aplicam-se a problemas em que existem dados, experimentais ou gerados por meio de modelos, por meio dos quais a rede adaptará os seus pesos visando à execução de uma determinada tarefa, sendo sua forma mais comum o aprendizado por meio desse conjunto de dados. As principais tarefas de RNA, seguindo essa visão são: classificação, categorização, aproximação, previsão e otimização, sendo essas aplicadas em diversas áreas como Medicina, setor financeiro, robótica, processamento de imagens, bioinformática, automação e controle, etc. (BRAGA et al., 2011) É possível observar na tabela 2.4 as principais tarefas e exemplos de aplicação das RNAs. Tabela Principais tarefas e aplicações de RNAs Fonte: BRAGA et al., 2011 Tarefas Classificação Categorização Previsão Algumas aplicações Reconhecimento de caracteres Reconhecimento de imagens Diagnóstico (médico, equipamentos, etc.) Análise de risco de crédito Detecção de fraudes Detecção de falhas em sistemas industriais Agrupamento de sequencias de DNA Mineração de Dados Análise de expressão gênica Agrupamento de clientes Previsão do tempo Previsão financeira (câmbio, bolsa, etc.) Modelagem de sistemas dinâmicos Previsão de sequencias de DNA No caso deste trabalho, o foco está na área da evasão estudantil, mais especificamente na classificação de alunos do ensino superior de modo a fazer uma triagem dos possíveis perfis evasores. Para isso é preciso compreender os principais conceitos e características que devem ser analisadas no que se refere a evasão escolar.

42 Revisão Bibliográfica Evasão Escolar No Brasil, o ensino superior é de responsabilidade do Governo Federal, e embora existam instituições públicas estaduais e até mesmo municipais, a regulação é feita pelo governo central. No caso das IES privadas, a Federação é diretamente responsável pela autorização para o funcionamento e também pela avaliação institucional (BARREYRO, LAGORIA, 2010). O sistema está centralizado, sob jurisdição federal, sendo o Ministério da Educação e o Conselho Nacional de Educação as instituições que o regulam, contrastando com a desconcentração da educação básica em esferas estaduais e municipais de governo. Apenas 10% das instituições privadas (universidades e centros universitários) possuem algum grau de autonomia (BARREYRO, 2008, p.59). Por Instituição de Ensino Superior (IES) entende-se que são instituições que ministram educação superior, tais como universidades, faculdades, escolas, institutos, entre outros (BARREYRO, 2008). Segundo a Lei de Diretrizes e Bases da Educação Nacional (LDB nº 9.394/96), há dois tipos de instituição de ensino superior, conforme a sua organização administrativa: públicas e privadas. A respeito das privadas, estas podem ser com fins lucrativos ou sem fins lucrativos; a diferença é que as últimas possuem certas isenções de impostos. Nas décadas de 1990 e 2000 houve um expressivo crescimento no número de IES, principalmente privadas, e atualmente o sistema de ensino superior é predominantemente privado (BARREYRO, LAGORIA, 2010). Segundo o último Censo do Ensino Superior realizado pelo Inep em 2010, o Brasil possui IES, e cerca de 88% do total são instituições privadas. A respeito da evasão escolar, este é um fenômeno definido por GAIOSO (2005) como a interrupção dos estudos (BAGGI; LOPES, 2010). Trata-se, portanto, de um abandono, e não da mudança de um curso outro, neste caso chamado de mobilidade (TINTO, 1975). Além dessas diferenciações básicas, SILVA FILHO et al. (2007), apresenta duas outras:

43 Revisão Bibliográfica 43 Evasão anual média: se refere à porcentagem de alunos matriculados em certa instituição e curso que no ano ou semestre seguinte não voltam a se matricular. Evasão total: representa o número de alunos matriculados que não concluíram o curso no período adequado (duração regular) do curso. Segundo SILVA FILHO et al. (2007) o índice de evasão é geralmente calculado da seguinte maneira: A maioria dos países mede o índice de titulação no ensino superior, que seria o número de formados em um certo ano em relação ao número de ingressantes quatro anos antes, sendo a evasão medida como a diferença desse índice para 100%. Sobre os motivos que levam à evasão no ensino superior, SILVA FILHO (2007) apresenta a falta de recursos financeiros do aluno como uma das principais casusas da interrupção dos estudos; contudo, outros fatores tais como expectativas do aluno com relação ao curso ou à instituição também são relevantes (BAGGI; LOPES, 2010). Ainda segundo BAGGI e LOPES (2010), o que e geralmente ocorre é uma minimização do problema, considerando-se apenas a questão financeira do aluno, em detrimento de questões de cunho acadêmico e até mesmo estrutural da IES. Desta forma, além da questão financeira, são muitas as variáveis que podem levar o aluno a desistir de determinado curso, instituição ou mesmo do ensino superior. Questões como falta de orientação vocacional, imaturidade do aluno, reprovações sucessivas, pouco espaço no mercado de trabalho, ausência de laços afetivos na universidade, ingresso na faculdade por imposição familiar, casamentos não planejados e nascimento de filhos, são também apontadas como importantes. (BAGGI; LOPES, 2010) Autores como BAGGI e LOPES (2010) apontam a questão da avaliação institucional como alternativa para o combate da evasão: Para que haja mudanças substantivas nesse processo, seria preciso desenvolver uma reflexão mais sistemática sobre a relação entre a avaliação institucional e a evasão, e seus vários significados, para ampliar um caminho de propostas e projetos de combate ao abandono escolar do aluno [...].

44 Revisão Bibliográfica 44 Entretanto, avaliações internas e externas das instituições são apenas uma face da solução. É fundamental que se conheça o perfil do aluno, de forma que seja possível identificar perfis, características e circunstâncias mais comuns não necessariamente ligadas de forma direta às IES - que levam à evasão escolar. Somente assim, através de um conhecimento mais profundo da questão é possível a criação políticas e soluções que efetivamente combatam esse problema. Nesse contexto, no próximo capítulo será apresentado o projeto que oferece uma ferramenta para a ampliação do conhecimento sobre o perfil do aluno evasor, através do uso de Redes Neurais Artificiais.

45 Capítulo 3 3. Projeto Neste capítulo é apresentado a construção do projeto bem como os materiais e métodos utilizados para implementação da Rede Neural Artificial. 3.1 O Projeto No Capítulo 2 foram apresentados conceitos sobre as RNAs e suas diversas aplicações, bem como as principais considerações e características da evasão escolar que serão empregadas mais adiante. Neste trabalho a RNA foi usada com o objetivo de classificação. Além disso, foi utilizada a linguagem de programação Java, por ser uma linguagem orientada a objeto, pois de acordo com (DEITEL e DEITEL, 2010), objetos [...] são essencialmente componentes de software reutilizáveis, e essa abordagem tem se mostrado mais produtiva para grupos de desenvolvimento de software em relação a técnicas anteriormente populares como a programação estruturada. O ambiente de desenvolvimento utilizado foi o NetBeans versão 7.1.1, em conjunto, foi usada a biblioteca Encog versão 3, desenvolvida pelo Heaton Research, que fornece diversas ferramentas para implementação de softwares voltados à aprendizado de máquina. O banco de dados utilizado foi o MySQL versão por ser uma ferramenta open source de consistência e alta performance, funcionando em diversas plataformas. A metodologia usada para o desenvolvimento das soluções de software foi o modelo em cascata (Pressman, 2011) que permite desenvolver todos os seus blocos funcionais dentro de cada etapa, iniciando desde a fase de requerimento, progredindo, por meio da análise, para o projeto, a implementação, a verificação e a manutenção das soluções propostas, conforme apresentado na figura 3.1.

46 Projeto 46 Requerimento Projeto Implementação Verificação Manutenção Figura Modelo em Cascata Fonte: Pressman, 2002 Já na figura 3.2, é possível observar cada etapa do processo de implementação que foi utilizado para construção da RNA, sendo elas descritas nos próximos itens. Seleção das Características Aquisição e Tratamento dos Dados Estrutura da RNA Treinamento da RNA Validação Figura Etapas de Implementação da RNA

47 Projeto Seleção das Características Como foi constatado nos capítulos anteriores, a RNA precisa de dados, ou seja, um conjunto de treinamento para aprender, portanto, a escolha das variáveis de entrada e saídas são de extrema importância, uma vez que irão identificar quais as características do perfil do aluno e com base nas mesmas poderá ser descoberto um conhecimento (relação entre as variáveis). O levantamento das características relevantes devem ser variáveis informativas, não possuindo relação uma com a outra, para a descoberta do conhecimento. Caso essas variáveis não existam a análise ficará comprometida. Para este trabalho foram consideradas 12 características, sendo elas avaliadas como obrigatórias para qualquer tipo de avaliação de um determinado perfil de aluno segundo o INEP: Entradas: 1) Características Pessoais do Aluno: a) Idade (Idade que o aluno completa no ano de referência do Censo) b) Sexo (Informa o sexo do aluno) c) Cor e Raça (Cor e raça do aluno) d) Deficiência (Informa se o aluno possui alguma deficiência como física, auditiva ou mental) e) Procedência de Escola Pública (Informa se o aluno concluiu o Ensino Médio em Escola Pública) 2) Características de vínculo com o curso: a) Financiamento estudantil (Informa se o aluno possui algum financiamento estudantil como FIES e ProUNI) b) Apoio Social (Informa se o aluno recebe algum apoio social como Material didático, transporte e moradia) c) Reserva de Vagas (Informa se o aluno ingressou por meio de reserva de vagas como reserva de vagas para etnia, renda e deficiência)

48 Projeto 48 d) Atividade Complementar (Informa se o aluno participa de alguma atividade complementar como monitoria, pesquisa e extensão) Saída: Status de Matrícula (Informa se o aluno está matrículado ou não matriculado) 3.3 Aquisição e Tratamento dos Dados Para esta etapa, preparou-se a massa de dados que foi utilizada para treinamento da RNA, sendo esta constituída de registros com todas as características citadas anteriormente. Neste trabalho foram utilizadas as bases de dados com informações dos alunos referente ao Censo da Educação Superior, disponibilizada pelo INEP. Por sua vez, essas bases de dados estão disponíveis em cinco visões, da seguinte maneira: IES Curso Docente Aluno Local de Oferta Para esse estudo, foram utilizadas as bases de dados referente as IES e aos alunos. A partir disso, foi selecionada uma amostra de dados de alunos que possuíam vínculo com uma IES de categoria administrativa privada com fins lucrativos do estado de São Paulo, resultando num total de alunos. Dentro dessa amostra, foi feito um novo filtro para reduzir ruídos nos dados, verificando os atributos que possuíam os domínios como {Não declarado} ou {Não dispõe da informação}, optando por não considerá-los. Posteriormente, foi selecionado um conjunto de alunos, para ser aplicado dentro do contexto de RNAs, do qual 75% foi utilizado como conjunto de

49 Projeto 49 treinamento e 25% para realização de testes, objetivando a classificação do atributo de Status de Matrícula. Para o treinamento da RNA, é imprescindível que as características, para todos os registros da massa de dados, estejam devidamente preenchidas de forma consistente, caso contrário, no processo de leitura dos dados deverão existir validações que inibam ou que corrijam esses registros. O processamento da RNA é baseado em cálculos matemáticos, portanto para todos os registros em que as características possuem valores alfanuméricos foram transformados em números. Por exemplo, para a característica Deficiência, onde os domínios {"Sim" e "Não"}, foram codificados para 1 e 0 respectivamente. Para normalização dos dados foi utilizada a equação 3.1, adequando os valores de entrada entre 0 e 1, já que a função de ativação elegida foi a Sigmóide que também assume um intervalo contínuo de valores entre 0 e 1 (HAYKIN, 2001). ( ) (( ) ( )) ( ) (3.1) A variável x se refere ao valor de entrada; xmin ao menor valor dentro do conjunto de dados para o atributo x; xmax ao maior valor dentro do conjunto de dados para o atributo x. ymin por sua vez, representa o menor valor esperado de saída da RNA e ymax o menor valor esperado de saída da RNA. Como o valores de ymax e ymin são constantes, 1 e 0 respectivamente, podese simplificar a equação 3.1 da seguinte forma. ( ) (3.2) domínios: Para exemplificar, tem-se o atributo Cor e Raça que possui os seguintes 0. Não declarado 1. Branca 2. Preta

50 Projeto Parda 4. Amarela 5. Indígena 6. Não dispõe da informação Como já informado anteriormente, os domínios {Não declarado} e {Não dispõe da informação} foram descartados, então tem-se um intervalo entre os índices 1 e 5, que são os valores de xmin e xmax. Portanto, ao normalizar o atributo Cor e Raça, tem-se os valores entre 0 e 1, sendo 0 para Branca, 0,25 para Preta e sucessivamente até 1 para Indígena. 3.4 Estrutura da RNA Uma das grandes dificuldades de implementação das RNAs como foi observado durante a pesquisa, é definir uma estrutura que melhor se adapte a massa de dados (encontre um padrão da mesma) uma vez que cada massa de dados pode ter um conhecimento (relação entre as variáveis) distinto, dependendo do seu contexto. A definição da quantidade de neurônios tanto da camada de entrada quanto da camada de saída pode ser determinada pela quantidade de características de entrada e saída respectivas. Por exemplo, no caso desse trabalho foram utilizados doze neurônios na camada de entrada e um neurônio na camada de saída, porque tem-se doze características de entrada e uma de saída. Entretanto, quanto a camada oculta, não existe uma determinada regra para a definição de quantas camadas ocultas serão utilizadas, nem mesmo para a quantidade de neurônios que serão utilizados em cada uma dessas camadas, sendo esta escolha feita de forma empírica, ou seja, a melhor maneira é testar e fazer uma comparação dos resultados obtidos de cada estrutura e optar por aquela que apresenta um melhor resultado. É importante ressaltar que, o uso excessivo de neurônios na camada oculta podem prejudicar a generalização, no entanto, a carência dos mesmos pode contribuir para uma classificação ruim de padrões. Além do mais a quantidade de camadas ocultas pode influenciar na capacidade de representação de funções

51 Projeto 51 complexas, porém quanto mais camadas maior o esforço computacional para o processamento. A literatura existente sobre as MLPs backpropagation, modelo utilizado nesse trabalho, demonstra que para a grande maioria dos problemas e ainda mais tendo como objetivo a classificação, apenas uma camada já é o suficiente, pois quando utilizado mais do que isso não houve vantagem significativa. Diante disso, os testes foram centralizados na obtenção da melhor taxa de aprendizado, em um número ideal de épocas e na quantidade de neurônios em uma única camada oculta que serão mencionados adiante. 3.5 Treinamento da RNA O algoritmo de aprendizagem backpropagation, que por ser supervisionado, utiliza pares de entrada e saída e por meio de um mecanismo de correção de erros ajusta os pesos da rede (HAYKIN, 2001), em outras palavras processa os dados do conjunto de treinamento e ajusta os pesos até produzir uma saída desejada. No entanto, como mencionado, para alcançar esse objetivo é fundamental a correta definição de seus parâmetros, sendo que pequenas alterações podem levar a grandes diferenças seja no tempo de treinamento ou na generalização a ser obtida. Os parâmetros são descritos conforme a seguir: Taxa de Aprendizado - Este parâmetro possui grande influência no processo de treinamento da RNA, uma vez que se refere à variação aplicada na correção dos pesos. Uma taxa muito baixa torna o aprendizado muito lento, por outro lado uma taxa muito alta prova oscilações no treinamento podendo comprometer a convergência do processo de aprendizado. Quantidade de Épocas - Uma Época se refere a todo o conjunto de treinamento que será apresentado ao algoritmo de aprendizado, sendo que se esse conjunto for muito grande pode reduzir a velocidade do processo de treinamento. Erro mínimo - Consiste no erro médio quadrático aceitável, podendo-se encerrar o treinamento quando o mesmo ficar abaixo de um valor pré-definido.

52 Projeto 52 Momentum - Tem por objetivo aumentar a velocidade da rede ou reduzir a instabilidade. Este parâmetro é opcional. O algoritmo de aprendizado analisa registro por registro do conjunto de treinamento e então gera uma saída que é comparada com a saída esperada, sendo o erro calculado da diferença entre esses valores. O erro é enviado para os neurônios da rede e os pesos devidamente ajustados com o objetivo de corrigi-lo. Como critério de parada do treinamento foi preestabelecido um erro mínimo ou um número de épocas sendo que se alcançados qualquer um dos valores é então encerrado o processo de treinamento. 3.6 Validação Para este trabalho foi validado a capacidade de aprendizado da RNA de acordo com os parâmetros citados no subcapítulo anterior e os padrões existentes no conjunto de treinamento além de ser analisado o comportamento do erro médio quadrático, conforme demonstrado nos testes no capítulo a seguir. 3.7 Apresentação do Sistema O software desenvolvido foi dividido em três módulos, Rede Neural, Classificação e Simulação, respectivamente.

53 Projeto 53 O primeiro módulo é utilizado para realizar o treinamento da RNA, que tem como premissa a configuração dos parâmetros de método de treinamento, taxa de aprendizado, taxa de momento, quantidade de neurônios na camada oculta, quantidade de épocas e percentual de treinamento com relação a base de dados, conforme a figura 3.3. Figura Tela do módulo de rede neural

54 Projeto 54 Na figura 3.4, observa-se o treinamento da rede após clicado no botão treinar, tendo como apoio o gráfico e a tabela com a visão de épocas em relação ao erro quadrático médio, gerando duas saídas Erro Final e Percentual Acerto. Figura Treinamento da RNA utilizando o módulo de rede neural

55 Projeto 55 Já, no segundo módulo é possível realizar uma consulta na base de dados de alunos, listando os registros de acordo com as características da figura 3.5. Em seguida, após clicado no botão classificar os registros serão submetidos como entrada da RNA e a saída será gerada na coluna Prob. Mat. (Probabilidade de matrícula). Figura Tela do módulo de classificação

56 Projeto 56 As ações dos botões consultar e classificar são demonstradas nas figuras 3.6 e 3.7, respectivamente. Figura Consulta de base de dados utilizando módulo de classificação Figura Classificação massiva utilizando módulo de classificação

57 Projeto 57 Por fim, no último módulo o sistema permite a simulação de diferentes perfis que ficam a critério do usuário, sem a realização de consulta na base de dados, ilustrado na figura 3.8. Figura Tela do módulo de simulação

58 Projeto 58 Para exemplificar, nas figuras 3.9 e 3.10 foram inseridos dados utilizando os atributos de perfis reais, resultando em dois cenários distintos, o de evasão e não evasão. Figura Simulação de perfil evasor utilizando módulo de simulação

59 Projeto 59 Figura Simulação de perfil não-evasor utilizando módulo de simulação

60 Capítulo 4 4. Testes e Resultados Este capítulo apresenta os testes e resultados alcançados com o modelo de RNA proposto. 4.1 Estrutura dos Testes A estrutura dos testes realizados neste trabalho se baseou na comparação da saída gerada pela RNA com a saída desejada, buscando-se maximizar o nível de assertividade do sistema conforme figura 4.1. Em conjunto procurou-se minimizar o erro médio quadrático analisando o comportamento da curva de acordo com as interações de Épocas até que se chegasse a uma convergência. Processamento Entrada RNA Saída Comparação Saída Gerada x Saída Desejada Figura Fluxo dos Testes Os testes foram realizados alterando os seguintes parâmetros da rede: número de neurônios na camada oculta, taxa de aprendizado, taxa de momentum e número de épocas, ainda como citado nos subcapítulos 3.2 e 3.3, foi utilizado 75% da amostra (7.500 alunos) para treinamento e 25% (2.500 alunos) para testes. É possível observar na tabela 4.1 as configurações utilizadas durantes os testes, onde η é a taxa de aprendizado e α se refere a taxa de momentum.

61 Testes e Resultados 61 Tabela Parâmetros para treinamento da RNA Neurônios Entrada Neurônios Neurônios Oculta Saída Épocas η α ,001 0, ,003 0, ,005 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0, ,001 0, ,003 0, ,005 0, ,1 0,0 O modelo de RNA proposto, como mencionado no capítulo anterior, foi definido com 9 neurônios na camada de entrada, sendo esses características pessoais do

62 Testes e Resultados 62 aluno ou do seu vínculo com o curso, 1 neurônio na camada de saída que refere-se ao status da matrícula do aluno (matriculado ou não matriculado), permanecendo esses valores inalterados na tabela. Para ser avaliado o nível de assertividade da rede foi utilizada a equação 4.1 onde foi calculado a quantidade de vezes que a saída desejada foi igual à saída gerada, em razão da quantidade de testes realizados. Desta forma, tem-se AR como nivel de assertividade da rede, A representando a quantidade de acertos e T a quantidade total de testes realizados. (4.1) Para a análise do erro foi utilizada a equação 4.2 onde é possível identificar o erro quadrático médio da RNA, sendo a saída ideal e saída atual. ( ) (4.2) Após os testes, utilizando todas as configurações de parâmetros da RNA informados na tabela 4.1, pode-se observar na tabela 4.2 os seguintes resultados alcançados.

63 Testes e Resultados 63 Tabela 4.2 Resultados do treinamento e testes da RNA Neurônios Entrada Neurônios Oculta Neurônios Saída Épocas η α EQM % acerto ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,40% ,005 0,0 0, ,40% ,1 0,0 0, ,16% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,44% ,1 0,0 0., ,24% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,44% ,1 0,0 0, ,36% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,44% ,1 0,0 0, ,16% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,40% ,1 0,0 0, ,16% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,48% ,1 0,0 0, ,16% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,48% ,1 0,0 0, ,16% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,44% ,1 0,0 0, ,24% ,001 0,0 0, ,44% ,003 0,0 0, ,44% ,005 0,0 0, ,44% ,1 0,0 0, ,92%

64 Testes e Resultados 64 Observa-se na tabela, que para cada configuração dos parâmetros da RNA é calculado um percentual de acerto entre saída gerada e saída desejada, além do EQM alcançado. Os valores atribuídos para número de neurônios na camada oculta, η (taxa de aprendizado), α (taxa de momentum) e épocas, foram escolhidos com base na literatura existente e testados empiricamente a fim de obter-se o melhor resultado. As duas linhas destacadas referem-se aos valores obtidos no pior e no melhor caso respectivamente, que serão ilustrados adiante. Na figura 4.2, pode-se observar o comportamento do EQM no pior caso, sendo que o eixo Y se refere aos valores dos erros e o eixo X às interações das épocas (conjunto de treinamento). Nota-se uma constante oscilação do erro. Figura Gráfico do erro quadrático médio do pior caso A figura 4.3 exibe o comportamento do gráfico para o melhor caso que, ao contrário do anterior, ocorre uma oscilação do EQM no início, porém tende a zero, podendo também ser visualizado com mais detalhes na figura 4.4 de forma ampliada.

65 Testes e Resultados 65 Figura Gráfico do erro quadrático médio do melhor caso Figura Gráfico ampliado do erro quadrático médio do melhor caso

66 Testes e Resultados 66 Para melhor entendimento da assertividade da RNA, as figuras 4.5 e 4.6 ilustram os gráficos de dispersão com os pontos de saída gerada e esperada. O eixo Y corresponde ao perfil do aluno, os pontos mais próximos de 0 são evasores e os mais próximos de 1 são não evasores. O eixo X representa o número de testes realizados. Figura Gráfico de dispersão do melhor caso Figura Gráfico de dispersão do pior caso

3 Redes Neurais Artificiais

3 Redes Neurais Artificiais 3 Redes Neurais Artificiais 3.1. Introdução A capacidade de implementar computacionalmente versões simplificadas de neurônios biológicos deu origem a uma subespecialidade da inteligência artificial, conhecida

Leia mais

Introdução à Redes Neurais. Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana

Introdução à Redes Neurais. Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana Introdução à Redes Neurais Artificiais Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana 2 Introdução Redes Neurais Artificiais (RNAs)

Leia mais

REDES NEURAIS ARTIFICIAIS

REDES NEURAIS ARTIFICIAIS REDES NEURAIS ARTIFICIAIS REDES NEURAIS ARTIFICIAIS O QUE É UMA REDE NEURAL NEURÔNIOS BIOLÓGICOS CÉREBRO HUMANO E CAPACIDADE DE GENERALIZAÇÃO. Modelo McCulloch e Pitts FUNÇÕES DE ATIVAÇÃO APRENDIZADO APRENDIZADO

Leia mais

Redes Neurais Artificial. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto

Redes Neurais Artificial. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto Redes Neurais Artificial Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Definições 2. Histórico 3. Conceitos Básicos 4. Aprendizado em RNA 5. Exemplo de Aprendizado com

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Universidade Federal do Espírito Santo CCA UFES Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Redes Neurais Artificiais Redes Neurais Artificiais

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Universidade Federal do Espírito Santo CCENS UFES Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Redes Neurais Artificiais Redes Neurais Artificiais

Leia mais

IAC - Inteligência Artificial Aplicada a Controle

IAC - Inteligência Artificial Aplicada a Controle Introdução IAC - Inteligência Artificial Aplicada a Controle Prof. Dr. Alexandre da Silva Simões Homo sapiens: capacidades mentais de grande importância Como um punhado de matéria pode perceber, compreender,

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Redes Neurais Artificiais Neurônio Natural Dendritos: recebe os estímulos transmitidos por outros neurônios Soma Sinapse Axônio Soma: coleta e combina informações vindas de outros neurônios Sinapse Dendrito

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Redes Neurais Artificiais Prof. Dr. Hugo Valadares Siqueira Semana de Eletrônica e Automação 2014 Redes Neurais Artificiais Uma rede neural artificial é um circuito composto por uma grande quantidade de

Leia mais

TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais

TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais ricardo.kerschbaumer@ifc.edu.br http://professor.luzerna.ifc.edu.br/ricardo-kerschbaumer/ Introdução O Cérebro humano Mais fascinante processador

Leia mais

Redes Neurais 1. Redes Neurais. cont.) Definição (cont( Definição. Histórico. Características básicas

Redes Neurais 1. Redes Neurais. cont.) Definição (cont( Definição. Histórico. Características básicas Redes Neurais Dalma M. Falcão falcao@nacad.ufr.br http://www.nacad.ufr.br/~falcao/ Redes Neurais Definição Histórico Áreas de aplicação RNs biológicas Modelos de neurônios artificiais Arquiteturas de RNs

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.1. Introdução às Redes Neurais Artificiais (RNAs) 2.1.1. Motivação

Leia mais

INTELIGÊNCIA COMPUTACIONAL

INTELIGÊNCIA COMPUTACIONAL Rafael D. Ribeiro, M.Sc. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br A Inteligência Computacional (IC), denominada originalmente de Inteligência Artificial (IA), é uma das ciências

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Introdução às Redes Neurais Artificiais DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos

Leia mais

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Introdução a Machine Learning: Teoria, Aplicações e IA na Arquitetura Intel Vitor Hugo Ferreira, DSc - UFF Flávio Mello, DSc UFRJ e Ai2Biz

Leia mais

INTELIGÊNCIA ARTIFICIAL

INTELIGÊNCIA ARTIFICIAL INTELIGÊNCIA ARTIFICIAL REDES NEURAIS Caracterização Intuitiva: Em termos intuitivos, Redes Neurais Artificiais (RNAs) são modelos matemáticos inspirados nos princípios de funcionamento dos neurônios biológicos

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS INTRODUÇÃO Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 REDES NEURAIS ARTIFICIAIS - RNAs Inspiradas no cérebro humano São modelos computacionais inspirados nos mecanismos

Leia mais

A evolução natural deu ao cérebro humano muitas características desejáveis que não estão presentes na máquina de von Neumann:

A evolução natural deu ao cérebro humano muitas características desejáveis que não estão presentes na máquina de von Neumann: Faculdade de Engenharia de Computação Centro de Ciências Exatas, Ambientais e de Tecnologias PUC-Campinas João Luís Garcia Rosa 2004 2 A evolução natural deu ao cérebro humano muitas características desejáveis

Leia mais

Inteligência Artificial Redes Neurais

Inteligência Artificial Redes Neurais Inteligência Artificial Jarley P. Nóbrega, Dr. Faculdade Nova Roma Bacharelado em Ciência da Computação jpn@jarley.com Semestre 2018.2 Jarley P. Nóbrega, Dr. (Nova Roma) Inteligência Artificial Semestre

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo

Leia mais

Inteligência Computacional

Inteligência Computacional Inteligência Computacional INTRODUÇÃO ÀS REDES NEURAIS ARTIFICIAIS Renato Dourado Maia Faculdade de Ciência e Tecnologia de Montes Claros Fundação Educacional Montes Claros Na Aula Passada... O que é uma

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 03 Aprendizado Supervisionado / : Modelo MCP e Perceptron Max Pereira Neurônio Booleano de McCulloch- Pitts (Modelo MCP) Proposto em

Leia mais

Aula 1 Introdução - RNA

Aula 1 Introdução - RNA Aula 1 Introdução - RNA Sumário 1- Conceitos Iniciais; 2- Neurônio Biológico; 3- Neurônio Artificial; 4- Funções de Ativação; 5- Comparação Neurônio Biológico e Artificial. 1- Conceitos Iniciais - Computadores

Leia mais

serotonina (humor) dopamina (Parkinson) serotonina (humor) dopamina (Parkinson) Prozac inibe a recaptação da serotonina

serotonina (humor) dopamina (Parkinson) serotonina (humor) dopamina (Parkinson) Prozac inibe a recaptação da serotonina Redes Neurais O modelo biológico O cérebro humano possui cerca 100 bilhões de neurônios O neurônio é composto por um corpo celular chamado soma, ramificações chamadas dendritos (que recebem as entradas)

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Universidade Federal do Espírito Santo CCA UFES Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Redes Neurais Artificiais Inteligência Artificial

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Introdução às Redes Neurais Artificiais Perceptrons de Múltiplas Camadas I Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia

Leia mais

Redes Neurais Noções Gerais

Redes Neurais Noções Gerais Redes Neurais Noções Gerais Segundo Loesch (apupt Fernandes), Redes Neurais Artificiais são sistemas computacionais, de implementação em hardware e software, que imitam as habilidades computacionais do

Leia mais

Redes Neurais. Prof. Aurora Pozo. Obs: slides baseados em Prof. Marcílio Souto e Prof. Marley Vellasco

Redes Neurais. Prof. Aurora Pozo. Obs: slides baseados em Prof. Marcílio Souto e Prof. Marley Vellasco Redes Neurais Prof. Aurora Pozo Obs: slides baseados em Prof. Marcílio Souto e Prof. Marley Vellasco CONTEÚDO Introdução Motivação, Objetivo, Definição, Características Básicas e Histórico Conceitos Básicos

Leia mais

Tópicos Especiais: Inteligência Artificial REDES NEURAIS

Tópicos Especiais: Inteligência Artificial REDES NEURAIS Tópicos Especiais: Inteligência Artificial REDES NEURAIS Material baseado e adaptado do Cap. 20 do Livro Inteligência Artificial de Russell & Norvig Bibliografia Inteligência Artificial Russell & Norvig

Leia mais

3 INTELIGÊNCIA COMPUTACIONAL (IC)

3 INTELIGÊNCIA COMPUTACIONAL (IC) 40 3 INTELIGÊNCIA COMPUTACIONAL (IC) Inteligência Computacional é a área da ciência da computação que estuda a teoria e aplicação de técnicas computacionais inspiradas na natureza. Deste modo, tem por

Leia mais

Redes Neurais Artificial. Prática. Inteligência Artificial

Redes Neurais Artificial. Prática. Inteligência Artificial Redes Neurais Artificial Prática Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Introdução a MLP 2. Base de dados e Pré-Processamento 3. Prática MLP - Introdução Redes

Leia mais

Por que Redes Neurais?

Por que Redes Neurais? Redes Neurais Profa. Jaqueline Brigladori Pugliesi Por que Redes Neurais? Utilizar máquinas efetivamente para resolver problemas simples (humanos) Exemplo: distinguir padrões visuais previsão do valor

Leia mais

Primeiras Redes Neurais Artificiais: Perceptron e Adaline

Primeiras Redes Neurais Artificiais: Perceptron e Adaline Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Primeiras Redes Neurais Artificiais: Perceptron e Adaline DCA0121 Inteligência Artificial Aplicada Heitor

Leia mais

Introdução a Redes Neurais Artificiais com a biblioteca Encog em Java

Introdução a Redes Neurais Artificiais com a biblioteca Encog em Java Introdução a Redes Neurais Artificiais com a biblioteca Encog em Java Apresentação Graduada em Sistemas de Informação FAP/Parnaíba Mestranda do Programa de Pós-Graduação em Engenharia da Eletricidade -

Leia mais

Classificação Linear. André Tavares da Silva.

Classificação Linear. André Tavares da Silva. Classificação Linear André Tavares da Silva andre.silva@udesc.br Roteiro Introduzir os o conceito de classificação linear. LDA (Linear Discriminant Analysis) Funções Discriminantes Lineares Perceptron

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS REDE ADALINE e REGRA DELTA Prof. Dr. André A. P. Biscaro 2º Semestre de 2017 Aspectos históricos O ADALINE foi idealizado por Widrow & Hoff em 1960. Sua principal aplicação estava

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.3. Perceptron Multicamadas - MLP 2.3.1. Introdução ao MLP 2.3.2. Treinamento

Leia mais

3 REDES NEURAIS ARTIFICIAIS

3 REDES NEURAIS ARTIFICIAIS 47 3 REDES NEURAIS ARTIFICIAIS Neste capítulo será apresentado um breve histórico das redes neurais artificiais de modo a situar o leitor, descrevendo-se suas aplicações, teorias e finalmente detalhando-se

Leia mais

Redes Neurais Artificiais. Capítulos 1 e 2

Redes Neurais Artificiais. Capítulos 1 e 2 Redes Neurais Artificiais Introdução Capítulos 1 e 2 Redes Neurais Artificiais (RNA) São modelos computacionais inspirados nos mecanismos de aprendizagem do cérebro humano. São modelos computacionais que

Leia mais

Aprendizado de Máquina Introdução às Redes Neurais Artificiais

Aprendizado de Máquina Introdução às Redes Neurais Artificiais Aprendizado de Máquina Introdução às Redes Neurais Artificiais Marcos Oliveira Prates (Agradecimento Marcelo Azevedo Costa) Departamento de Estatística Universidade Federal de Minas Gerais Inteligência

Leia mais

Felix da Cunha 412, Pelotas RS Home-Page: s: Bolsista BIC/FAPERGS

Felix da Cunha 412, Pelotas RS Home-Page:    s: Bolsista BIC/FAPERGS UTILIZAÇÃO DE REDES NEURAIS PARA PREVISÕES EM SÉRIES TEMPORAIS 1 A. T. Gonçalez, A. C. R. Costa, G. P. Dimuro UCPEL Universidade Católica de Pelotas, ESIN Escola de Informática GMFC Grupo de Matemática

Leia mais

Inteligência Artificial. Aula 1 Prof. Nayat Sánchez Pi

Inteligência Artificial. Aula 1 Prof. Nayat Sánchez Pi Inteligência Artificial Aula 1 Prof. Nayat Sánchez Pi Curso: Inteligência Artificial Página web: http://nayatsanchezpi.com Material: Livro texto: Inteligência Artiicial, Russell & Norvig, Editora Campus.

Leia mais

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO Prof. Msc. Saulo Popov Zambiasi (saulopz@gmail.com) 12/07/08 08:09 Informação - ICPG - Criciuma - SC 1 Fundamentação Biológica, O Neurônio

Leia mais

Redes Neurais Artificiais. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 9)

Redes Neurais Artificiais. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 9) Redes Neurais Artificiais Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 9) Conceitos 2 Redes Neurais As Redes Neurais Artificias são modelos computacionais

Leia mais

Algoritmos de Aprendizado. CONTEÚDO Introdução Motivação, Objetivo, Definição, Características Básicas e Histórico. Regra de HEBB.

Algoritmos de Aprendizado. CONTEÚDO Introdução Motivação, Objetivo, Definição, Características Básicas e Histórico. Regra de HEBB. CONTEÚDO Introdução Motivação, Objetivo, Definição, Características Básicas e Histórico Conceitos Básicos Neurônio Artificial, Modos de Interconexão Processamento Neural Recall e Learning Regras de Aprendizado

Leia mais

COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1

COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1 COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1 Márcia Da Silva 2, Eldair Fabricio Dornelles 3, Rogério S. M. Martins 4, Édson L. Padoin 5. 1 Pesquisa desenvolvida

Leia mais

GT-JeDi - Curso de Desenv. de Jogos IA para Jogos

GT-JeDi - Curso de Desenv. de Jogos IA para Jogos GT-JeDi - Curso de Desenv. de Jogos IA para Jogos Gustavo Pessin 2006/2 - A07 Cronograma Conceitos Neurônio artificial Redes: Perceptron e Multi Layer Perceptron (MLP), Exemplos Separando cores Prevendo

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS PERCEPTRONS Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Forma mais simples de configuração das RNAs Rosenblatt (1958) retina área de projeção área de associação respostas

Leia mais

JAI 6 - Deep Learning Teoria e Prática

JAI 6 - Deep Learning Teoria e Prática JAI 6 - Deep Learning Teoria e Prática Esteban Clua e Cristina Nader Vasconcelos Universidade Federal Fluminense Fundamentos Computação baseada em modelos crisnv@ic.uff.br 2 Computação baseada em aprendizado

Leia mais

Redes Neurais: MLP. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação

Redes Neurais: MLP. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais: MLP DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos Redes diretas de múltiplas

Leia mais

4 Redes Neurais Artificiais RNAs

4 Redes Neurais Artificiais RNAs 66 4 Redes Neurais Artificiais RNAs Redes neurais artificial (RNA) são algoritmos que se baseiam no comportamento do cérebro humano. Dessa forma, imita a estrutura massivamente paralela do cérebro, com

Leia mais

PRINCÍPIOS DE NEUROCOMPUTAÇÃO

PRINCÍPIOS DE NEUROCOMPUTAÇÃO PRINCÍPIOS DE NEUROCOMPUTAÇÃO Neurocomputação Funcionamento do cérebro humano e os neurônios Formação das conexões e como se concebe teoricamente a aquisição do conhecimento, formalizando-os em procedimentos

Leia mais

Redes Neurais. Motivação. Componentes do neurônio. Cérebro humano. Criar máquinas capazes de operar independentemente do homem:

Redes Neurais. Motivação. Componentes do neurônio. Cérebro humano. Criar máquinas capazes de operar independentemente do homem: Motivação M. Sc. Luiz Alberto lasf.bel@gmail.com Redes Neurais Criar máquinas capazes de operar independentemente do homem: Aprenda sozinha; Interagir com ambientes desconhecidos; Possa ser chamada de

Leia mais

Previsão de Vazões utilizando Redes Neurais Artificiais MLP e NSRBN

Previsão de Vazões utilizando Redes Neurais Artificiais MLP e NSRBN Previsão de Vazões utilizando Redes Neurais Artificiais MLP e NSRBN Alan Caio Rodrigues MARQUES 1, Gelson da Cruz JUNIOR 2, Cassio Dener Noronha VINHAL 3 Escola de Engenharia Elétrica e de Computação 1

Leia mais

Redes Neurais e Sistemas Fuzzy

Redes Neurais e Sistemas Fuzzy Redes Neurais e Sistemas Fuzzy O ADALINE e o algoritmo LMS O ADALINE No contexto de classificação, o ADALINE [B. Widrow 1960] pode ser visto como um perceptron com algoritmo de treinamento baseado em minimização

Leia mais

Professor José Gomes de Carvalho Jr. Modelos Conexionistas - Redes Neurais 1 INTRODUÇÃO

Professor José Gomes de Carvalho Jr. Modelos Conexionistas - Redes Neurais 1 INTRODUÇÃO Modelos Conexionistas - Redes Neurais 1 INTRODUÇÃO Redes Neurais Artificiais ou simplesmente Redes Neurais (também conhecidas como modelos conexionistas) têm sido, ao longo dos últimos anos, uma área de

Leia mais

APRENDIZADO EM MODELOS CONEXIONISTAS

APRENDIZADO EM MODELOS CONEXIONISTAS APRENDIZADO EM MODELOS CONEXIONISAS Aprendizado é o processo pelo qual os parâmetros (os pesos das coneões entre os neurônios) de uma rede neural são austados através de uma forma continuada de estímulo

Leia mais

Inteligência Artificial Introdução

Inteligência Artificial Introdução Inteligência Artificial Introdução Professora Sheila Cáceres Introdução Que é Inteligência? Faculdade de entender, pensar, raciocinar e interpretar Teológica: dom divino que nos torna semelhantes ao Criador;

Leia mais

Redes Neurais Artificiais na Engenharia Nuclear 1 Aula-2 Ano: 2005

Redes Neurais Artificiais na Engenharia Nuclear 1 Aula-2 Ano: 2005 Redes Neurais Artificiais na Engenharia Nuclear 1 Aula-2 Ano: 2005 1.3. Alguns aspectos históricos 1.4. Principais Conceitos 1.4.1. Definições 1.4.2. Alguns tipos de Arquitetura Revisão da Aula-1 x 1 1

Leia mais

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes. HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS PERCEPTRON MULTICAMADAS Prof. Dr. André A. P. Biscaro 1º Semestre de 2018 Arquitetura Redes Perceptron de Múltiplas Camadas (PMC), também conhecidas como redes MLP (Multiple Layer

Leia mais

4 Redes Neurais Artificiais

4 Redes Neurais Artificiais 4 Redes Neurais Artificiais Inteligência computacional pode ser definida como um conjunto de modelos, algoritmos, técnicas, ferramentas e aplicações em sistemas computadorizados que emulem características

Leia mais

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons Algoritmos de Aprendizado Regra de Hebb Perceptron Delta Rule (Least Mean Square) Multi-Layer Perceptrons (Back Propagation) Radial Basis Functions (RBFs) Competitive Learning Hopfield Multi-Layer Perceptrons

Leia mais

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO AULA 8 Redes Neurais Introdução As redes neurais são um tema da computação altamente inspirada na natureza que nos

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 01 - Introdução O Que é Inteligência Artificial? [Winston, 1984]: "Inteligência artificial é o estudo das ideias que

Leia mais

REDES NEURAIS. Marley Maria B.R. Vellasco. ICA: Núcleo de Pesquisa em Inteligência Computacional Aplicada CONTEÚDO

REDES NEURAIS. Marley Maria B.R. Vellasco. ICA: Núcleo de Pesquisa em Inteligência Computacional Aplicada CONTEÚDO REDES NEURAIS Marley Maria B.R. Vellasco ICA: Núcleo de Pesquisa em Inteligência Computacional Aplicada PUC-Rio Introdução CONTEÚDO Motivação, Objetivo, Definição, Características Básicas e Histórico Conceitos

Leia mais

Figura: Capa do Livro Russell, S., Norvig, P. Artificial Intelligence A Modern Approach, Prentice-Hall.

Figura: Capa do Livro Russell, S., Norvig, P. Artificial Intelligence A Modern Approach, Prentice-Hall. Figura: Capa do Livro Russell, S., Norvig, P. Artificial Intelligence A Modern Approach, Prentice-Hall. Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado

Leia mais

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons Algoritmos de Aprendizado Regra de Hebb Perceptron Delta Rule (Least Mean Square) Back Propagation Multi-Layer Perceptrons Redes de apenas uma camada só representam funções linearmente separáveis Redes

Leia mais

Inteligência Artificial. Aula 2

Inteligência Artificial. Aula 2 Inteligência Artificial Aula 2 Retomada da aula passada O que é Inteligência Artificial Inteligência Artificial é o estudo de como fazer os computadores realizarem coisas que, no momento, as pessoas fazem

Leia mais

Paradigmas de Aprendizagem

Paradigmas de Aprendizagem Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Aprendizagem Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Redes Neurais Artificiais. Prof. João Alberto Fabro

Redes Neurais Artificiais. Prof. João Alberto Fabro Redes Neurais Artificiais Prof. João Alberto Fabro Redes Neurais Artificiais Conceitos Básicos Histórico Evolução O lugar das Redes Neurais dentro da IA Características Aplicações Redes Neurais Multicamadas

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL Disciplina Anual Assunto Aula 16 Redes Neurais Artificiais (MLP) 2 de 24 (MLP) Sumário Introdução

Leia mais

Redes Neurais Artificiais Sistemas Inteligentes Especialização em Automação Industrial SISTEMAS INTELIGENTES PROFESSOR FLÁVIO MURILO

Redes Neurais Artificiais Sistemas Inteligentes Especialização em Automação Industrial SISTEMAS INTELIGENTES PROFESSOR FLÁVIO MURILO Redes Neurais Artificiais Sistemas Inteligentes Especialização em Automação Industrial 1 Redes Neurais - Definição O que é Rede Neural ou Rede Neuronal Artificial (RNA)? É um modelo computacional que objetiva

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba

Tópicos Especiais em Informática Fatec Indaiatuba Criar máquinas capazes de operar independentemente do homem: Aprenda sozinha; Interagir com ambientes desconhecidos; Possa ser chamada de autônoma, inteligente ou cognitiva; Capacidade de lidar com eventos

Leia mais

Redes Neurais. Conexionismo. Redes Neurais, IA e IC. Abordagem Simbólica. Apresentação da disciplina Inteligência Computacional e conexionismo

Redes Neurais. Conexionismo. Redes Neurais, IA e IC. Abordagem Simbólica. Apresentação da disciplina Inteligência Computacional e conexionismo Redes Neurais, IA e IC Redes Neurais Apresentação da disciplina Inteligência Computacional e conexionismo No âmbito da Ciência da Computação, as Redes Neurais são estudadas na grande área de Inteligência

Leia mais

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes. HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Apresentação da disciplina Conceitos básicos Objetivos Apresentar uma visão geral da Inteligência Artificial, com ênfase na utilidade e aplicação das diferentes abordagens de solução

Leia mais

Tópicos sobre Redes Neurais

Tópicos sobre Redes Neurais Tópicos sobre Redes Neurais -Memórias Matriciais -Modelos Híbridos -Redes de Base Radial(RBF) -Redes Construtivas -Redes Recorrentes Prof João Alberto Fabro IF67D Sistemas Inteligentes 1 Dep de Informática

Leia mais

Redes Neurais INTELIGÊNCIA ARTIFICIAL

Redes Neurais INTELIGÊNCIA ARTIFICIAL Redes Neurais INTELIGÊNCIA ARTIFICIAL 1 2 Introdução As redes neurais são um tema da computação altamente inspirada na natureza que nos cerca. Durante anos e anos os homens trabalharam para fazer computadores

Leia mais

Inteligência Artificial. Conceitos Gerais

Inteligência Artificial. Conceitos Gerais Inteligência Artificial Conceitos Gerais Inteligência Artificial - IA IA é um campo de estudo multidisciplinar e interdisciplinar, que se apóia no conhecimento e evolução de outras áreas do conhecimento.

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Introdução às Redes Neurais Artificiais Introdução Prof. João Marcos Meirelles da Silva http://www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia Universidade

Leia mais

Fundamentos das Redes Neurais: exemplos em Java

Fundamentos das Redes Neurais: exemplos em Java Fundamentos das Redes Neurais: exemplos em Java Recife 2008 Copyringt by 2007 Mêuser Valença Impresso no Brasil Printed in Brazil Editor Tarcísio Pereira Diagramação Maria do Carmo de Oliveira Capa Valeska

Leia mais

Aplicações de redes neurais artificiais em simulações

Aplicações de redes neurais artificiais em simulações Aplicações de redes neurais artificiais em simulações Resumo Marcelo Bilobrovec (UEPG - CEFET - PR) mbilo@uepg.br Rui Francisco Martins Marçal (CEFET - PR) marcal@pg.cefetpr.br Luiz Alberto Pilatti (CEFET

Leia mais

Regra de Oja. Para taxa de aprendizagem pequena, Oja aproximou. pesos para criar uma forma útil da aprendizagem

Regra de Oja. Para taxa de aprendizagem pequena, Oja aproximou. pesos para criar uma forma útil da aprendizagem Regra de Oja A regra de Hebb necessita da normalização dos pesos para criar uma forma útil da aprendizagem i i i i i i n x n y n w n x n y n w n w 2 1 JDSS-LAC/INPE Para taxa de aprendizagem pequena, Oja

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Redes Neurais Artificiais Aplicações em Telecomunicações Prof. João Marcos Meirelles da Silva, D.Sc. Professor Adjunto II do Departamento de Engenharia de Telecomunicações Universidade Federal Fluminense

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 22 Redes Neurais Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor (KNN). Support

Leia mais

Redes Neurais Artificiais - Introdução. Visão Computacional

Redes Neurais Artificiais - Introdução. Visão Computacional Redes Neurais Artificiais - Introdução Visão Computacional Inspiração 2 Inspiração 3 Inspiração Atividade seletivanas conexões Soma os impulsos e passa a diante 4 Inspiração As conexões entre os dendritos

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais) Prof. a Joseana Macêdo Fechine Régis

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Prof. Rafael Stubs Parpinelli DCC / UDESC-Joinville parpinelli@joinville.udesc.br www.joinville.udesc.br/portal/professores/parpinelli Material de apoio: Stuart Russel, Peter Norvig.

Leia mais

Regra de Hebb Perceptron Delta Rule (Least Mean Square) Multi-Layer Perceptrons (Back Propagation) Hopfield Competitive Learning Radial Basis Function

Regra de Hebb Perceptron Delta Rule (Least Mean Square) Multi-Layer Perceptrons (Back Propagation) Hopfield Competitive Learning Radial Basis Function Algoritmos de Aprendizado Regra de Hebb Perceptron Delta Rule (Least Mean Square) Multi-Layer Perceptrons (Back Propagation) Hopfield Competitive Learning Radial Basis Function Multi-Layer Perceptrons

Leia mais

Rede RBF (Radial Basis Function)

Rede RBF (Radial Basis Function) Rede RBF (Radial Basis Function) André Tavares da Silva andre.silva@udesc.br Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação

Leia mais

Redes Neurais Pulsadas. João Fausto Lorenzato Robson David Montenegro Tarcísio Lucas

Redes Neurais Pulsadas. João Fausto Lorenzato Robson David Montenegro Tarcísio Lucas Redes Neurais Pulsadas João Fausto Lorenzato Robson David Montenegro Tarcísio Lucas Introdução Modelos de redes neurais podem ser classificados em gerações. Primeira Geração Neurônios de McCulloch-Pitts

Leia mais

RECONHECIMENTO DE CARACTERES EM PLACAS AUTOMOTIVAS UTILIZANDO REDES NEURAIS

RECONHECIMENTO DE CARACTERES EM PLACAS AUTOMOTIVAS UTILIZANDO REDES NEURAIS RECONHECIMENTO DE CARACTERES EM PLACAS AUTOMOTIVAS UTILIZANDO REDES NEURAIS Eduarda Gonçalves Dias 1 ; Wanderson Rigo 2 ; Manassés Ribeiro 3 INTRODUÇÃO Os sistemas de visão artificial vêm auxiliando o

Leia mais

Unidade 08 MATLAB Neural Network Toolkit

Unidade 08 MATLAB Neural Network Toolkit Unidade 08 MATLAB Neural Network Toolkit 1. Introdução Uma rede neural artificial (NN daqui em diante) é um modelo matemático que consiste de neurônios interconectados que imitam, em uma escala menor,

Leia mais

UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIÊNCIAS EXATAS (DEX) Estudo de Algoritmos de Aprendizado em Redes Neurais Artificiais

UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIÊNCIAS EXATAS (DEX) Estudo de Algoritmos de Aprendizado em Redes Neurais Artificiais UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIÊNCIAS EXATAS (DEX) Orientador: Prof. Fabiano Lemes Ribeiro Estudo de Algoritmos de Aprendizado em Redes Neurais Artificiais Nome: João Vitor Squillace

Leia mais

Redes Neurais Artificiais. Profa. Teresa Ludermir Sistemas Inteligentes

Redes Neurais Artificiais. Profa. Teresa Ludermir Sistemas Inteligentes Redes Neurais Artificiais Profa. Teresa Ludermir Sistemas Inteligentes Por que Redes Neurais? Utilizar máquinas efetivamente para resolver problemas simples (humanos) Exemplo1: distinguir padrões visuais

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo

Leia mais