XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL ALINE CRISTINA TEODORO DE ANDRADE INTRODUÇÃO A Avaliação Institucional constitui-se, um instrumento de grande importância para as Instituições de Ensino, em especial as Instituições de Ensino Superior, face ao crescente interesse e necessidade de melhoria da qualidade das atividades desenvolvidas nessas instituições, uma vez que elas possibilitam identificar problemas, avaliar os resultados dos processos de correção de falhas e a introdução de mudanças nas instituições educacionais, visando obter melhorias das condições de ensino. Constituindo de uma consulta aos alunos por meio de um questionário, a avaliação institucional busca conhecer a opinião dos alunos acerca de vários aspectos ligados a seu ambiente escolar, possibilitando um planejamento estratégico adequado, com vistas à qualidade acadêmica. Em geral, o resultado de uma Avaliação Institucional é analisado por meio da aplicação de ferramentas estatísticas. Para auxiliar na tarefa de análise dos dados extraídos na Avaliação Institucional, o presente trabalho propõe a utilização de técnicas de Mineração de Dados.
A Mineração de Dados surgiu como um ramo da computação, quando as empresas começaram a se preocupar com os grandes volumes de dados informáticos estocados e inutilizados dentro da empresa. Ela é constituída por um conjunto de ferramentas e técnicas que, por meio do uso de algoritmos de aprendizagem que são capazes de explorar um conjunto grande de dados, ajudando a evidenciar padrões nesses dados e auxiliando na descoberta de conhecimento. Para a aplicação da Mineração de Dados é necessária a escolha de um software apropriado. Nesta pesquisa foi utilizado o software desenvolvido pela Universidade de Waikato na Nova Zelândia denominado Weka. Essa escolha se deu devido a esse sistema ser distribuído com licença gratuita e possível de ser adquirido pela internet. OBJETIVOS O presente trabalho teve como foco central o estudo das principais técnicas de Mineração de Dados, a sua implementação no software Weka e as necessidades do tratamento de dados com a finalidade de se converter os dados dos questionários respondidos durante uma Avaliação Institucional em dados de entrada para o software Weka.. METODOLOGIA O trabalho foi dividido em um conjunto de etapas. A princípio, houve a necessidade de um estudo sobre Mineração de Dados, as principais técnicas, suas características e aplicações. A seguir realizou-se um estudo sobre o software utilizado, o Weka. A fim de se estudar como o software Weka poderia ser utilizado para análise dos dados gerados por uma Avaliação Institucional, inicialmente foi construído um pequeno banco de dados cujo conteúdo correspondia a um conjunto de questionários utilizados na Avaliação realizada na Universidade de Taubaté no ano de 2007. Vale notar que as questões 2
são exatamente as que foram utilizadas na citada avaliação, mas os dados para análise se baseiam em respostas fictícias às questões da avaliação. De posse de um conjunto de dados armazenados, o próximo passo foi prepará-los para serem processados pelo software Weka. O Weka impõe que os dados estejam armazenados em um padrão especifico, o que demandou a necessidade de se desenvolver mecanismos de pré-processamento para posterior aplicação dos algoritmos de Mineração de Dados. RESULTADOS E DISCUSSÃO Como resultado, obteve-se uma visão geral sobre a Mineração de dados, suas técnicas e aplicações. Obteve-se também conhecimento técnico ligado à instalação e configuração do sistema Weka e as particularidades existentes em seu processo de leitura de dados. Em especial nesse ponto é importante destacar o trabalho desenvolvido no sentido de padronizar os dados de entrada por meio de procedimentos de pré-processamento. Para validar o pré-processamento dos dados foram utilizadas as principais técnicas de Mineração de Dados incorporadas no software Weka, as quais puderam ser testadas sobre os dados fictícios dos questionários. Isso permitiu validar uma metodologia de preparação dos dados de entrada para o software a partir de dados tabulados em uma Avaliação Institucional. Permitiu também verificar que é real a possibilidade de utilizar o software Weka na análise dos dados de uma Avaliação Institucional. 3
O Weka aceita como dados de entrada dois tipos arquivos, o CSV e o ARFF. O tipo escolhido foi o ARFF, pois é a forma nativa utilizada no software. Para inserção dos dados, foi necessário um estudo para o entendimento dos padrões dos dados de entrada aceitos pelo software. Uma vez entendido o padrão dos dados de entrada e com os dados já pré-processados e interagidos com o software, obteve-se sucesso na execução do Weka sobre o conjunto de dados gerados utilizando diferentes configurações e técnicas de mineração de dados. Como o conjunto de dados se baseou em uma quantidade muito pequena de questionários, não se pode analisar a consistências dos parâmetros de saída apresentados pelo Weka, o que poderá ser feito em uma continuidade do presente estudo. CONCLUSÕES O presente trabalho conclui então que é possível utilizar o sistema Weka para avaliar os questionários da Avaliação institucional, e que também com o software foi possível verificar que o formato de dados definido pelo pré-processamento é possível identificar o número de instâncias e de atributos no arquivo gerado, uma representação gráfica dos dados, realizar remoção de instancias, e posteriormente gerar regras com as técnicas de classificação, agrupamento e associação. 4
REFERÊNCIAS BELLONI, Isaura. A função social da avaliação institucional. Avaliação, Campinas, v.3, nº34, 1998. FAYYAD, U.; Piatetsky-Shapiro G.; Smyth P. Data mining and knowledge discovery in databases: an overview. Comm. of the ACM, vol. 39, n.11, 1996. RESENDE, Solange Oliveira. Sistemas Inteligentes. Editora: Manole AMARRAL, Fernando C. Data Mining Técnicas e Aplicações para o Marketing. Ed Berkeley Brasil, 2001. 5
SOUZA, Michel de. Data Mining. 2003. Disponível em: <http://imasters.uol.com.br/artigo/1482/bi/data_mining/>. Acesso em 18 de fevereiro de 2008. ANDREATTO, Ricardo. Construindo um Data Warehouse e Analisando suas INFORMAÇÕES COM DATA MINING E OLAP. 1999. Disponível em: <http://www.datawarehouses.hpg.ig.com.br/index.htm>. Acesso em: 15 de abril de 2008. University of Waikato. Weka 3 Machine Learning Software in Java. Disponível em: <http://www.cs.waikato.ac.nz/ml/weka>. Acesso em: 03 de junho de 2008. GONÇALVES, Eduardo Correa. Data Mining Novos Recursos nos Sistemas de Banco de Dados. Disponível em: <www.devmedia.com.br>. Acesso em: 05 de agosto de 2008. 6