XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO



Documentos relacionados
A Grande Importância da Mineração de Dados nas Organizações

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Universidade Paulista

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

Nome: Login: CA: Cidade: UF CARTÃO RESPOSTA QUESTÃO RESPOSTA QUESTÃO RESPOSTA

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

Relatório da IES ENADE 2012 EXAME NACIONAL DE DESEMEPNHO DOS ESTUDANTES GOIÁS UNIVERSIDADE FEDERAL DE GOIÁS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

Prof. Msc. Paulo Muniz de Ávila

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES. Trabalho de Graduação

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

ATIVIDADES PRÁTICAS SUPERVISIONADAS

ü Curso - Bacharelado em Sistemas de Informação

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

Planejamento Estratégico de TI. Prof.: Fernando Ascani

ALUNOS DO 7º ANO CONSTRUINDO GRÁFICOS E TABELAS

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

IMPLEMENTAÇÃO DAS CAMADAS Inference Machine e Message Service Element PARA UM SERVIDOR DE SISTEMA DE GERENCIAMENTO DE Workflow HOSPITALAR

INTELIGÊNCIA COMPUTACIONAL

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

GARANTIA DA QUALIDADE DE SOFTWARE

PESQUISA-AÇÃO DICIONÁRIO

CONSIDERAÇÕES SOBRE USO DO SOFTWARE EDUCACIONAL FALANDO SOBRE... HISTÓRIA DO BRASIL EM AULA MINISTRADA EM LABORATÓRIO DE INFORMÁTICA

PROJETO DE PESQUISA SOBRE A UTILIZAÇÃO DE AMBIENTES VIRTUAIS DE APRENDIZAGEM COMO APOIO AO ENSINO SUPERIOR EM IES DO ESTADO DE SÃO PAULO

Curso de Educação Profissional Técnica de Nível Médio Subseqüente ao Ensino Médio, na modalidade a distância, para:

Utilizando a ferramenta de criação de aulas

Guia de Especificação de Caso de Uso Metodologia CELEPAR

CRIAÇÃO DA DISCIPLINA SISTEMA DE GESTÃO AMBIENTAL NO CURSO DE ENGENHARIA CIVIL

Ensino Médio Integrado ao Técnico

DATA WAREHOUSE. Introdução

CES-32 e CE-230 Qualidade, Confiabilidade e Segurança de Software. Conceitos de Qualidade. CURSO DE GRADUAÇÃO e DE PÓS-GRADUAÇÃO DO ITA

PRÓ-MATATEMÁTICA NA FORMAÇÃO DE PROFESSORES

OS CONHECIMENTOS DE ACADÊMICOS DE EDUCAÇÃO FÍSICA E SUA IMPLICAÇÃO PARA A PRÁTICA DOCENTE

11 de maio de Análise do uso dos Resultados _ Proposta Técnica

Formação e Capacitação de Agentes de Inclusão Digital

Iniciação científica: recursos, conhecimento e habilidades

QUALIFICAÇÃO DA ÁREA DE ENSINO E EDUCAÇÃO PERMANENTE EM SAÚDE: FORMAÇÃO PEDAGÓGICA PARA PROFISSIONAIS DE SERVIÇOS DE SAÚDE

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

MCTI/CNPq/IPEA/CEDEPLAR

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

Banco de Dados - Senado

Desenvolvimento de uma interface para uma biblioteca open-source de algoritmos de programação linear

HIBERNATE EM APLICAÇÃO JAVA WEB

Processos de Desenvolvimento de Software

GESTÃO DAS INFORMAÇÕES DAS ORGANIZAÇÕES MÓDULO 11

Débora Regina Tomazi FC UNESP- Bauru/SP Profa. Dra. Thaís Cristina Rodrigues Tezani.

Sistema Tutor Inteligente baseado em Agentes. Pedagógicas da Universidade Aberta do Piauí. Prof. Dr. Vinicius Ponte Machado

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Palavras-chave: i3geo, gvsig, Mapserver, integração, plugin. Contato: ou

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

PROJETO DE PESQUISA CIENTÍFICA: a escolha do tema e a construção do problema

FUNÇÕES POLINOMIAIS DO SEGUNDO GRAU MEDIADOS PELO SOFTWARE GEOGEBRA NA PERSPECTIVA DOS REGISTROS DE REPRESENTAÇÃO SEMIÓTICA

Uso do Netkit no Ensino de Roteamento Estático

FIC FORMAÇÃO INICIAL E CONTINUADA CURSO DE CONTROLADOR E PROGRAMADOR DE PRODUÇÃO

DIMENSIONANDO PROJETOS DE WEB-ENABLING. Uma aplicação da Análise de Pontos de Função. Dimensionando projetos de Web- Enabling

Ambiente Weka Waikato Environment for Knowledge Analysis

Avanços na transparência

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

AP_ Conta Aplicativo para digitação e envio de contas médicas no padrão TISS

NÚCLEO DE EDUCAÇÃO MATEMÁTICA E ENSINO DE FÍSICA E AS NOVAS TECNOLOGIAS NA FORMAÇÃO DE PROFESSORES

Sistemas de Informação I

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

USO DA INFORMÁTICA COMO FERRAMENTA DIDÁTICA NO ENSINO DE CIÊNCIAS NO 9º ANO

Microsoft Innovation Center

Estrutura do Trabalho: Fazer um resumo descrevendo o que será visto em cada capítulo do trabalho.

Engenharia de Domínio baseada na Reengenharia de Sistemas Legados

Módulo 4: Gerenciamento de Dados

Rotina de Discovery e Inventário

perspectivas e abordagens típicas de campos de investigação (Senra & Camargo, 2010).

ADM041 / EPR806 Sistemas de Informação

Paralelização do algoritmo SPRINT usando MyGrid

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo

Projeto 8 Servidor de estatísticas de desempenho on-line da BVS 11 de janeiro de 2005

Avaliação da Educação Básica no Brasil. Avaliação Educacional no Brasil Década de 90. Questões Básicas

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

Primeira Pesquisa TecnoAtiva de Segurança da Informação da Bahia e Sergipe 2006

Conteúdo. Disciplina: INF Engenharia de Software. Monalessa Perini Barcellos

Tecnologia e Sistemas de Informações

Prova de Conhecimento para Consultores de Implementação MPS.BR INSTRUÇÕES

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

Empresa Júnior como espaço de aprendizagem: uma análise da integração teoria/prática. Comunicação Oral Relato de Experiência

Participação Critérios de participação - Elegibilidade Procedimento para participar da chamada: Número de propostas/aplicações

CRM. Customer Relationship Management

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

2.1 Os projetos que demonstrarem resultados (quádrupla meta) serão compartilhados na Convenção Nacional.

PROJETO DE IMPLANTAÇÃO DE BIBLIOTECAS ESCOLARES NA CIDADE DE GOIÂNIA

Transcrição:

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL ALINE CRISTINA TEODORO DE ANDRADE INTRODUÇÃO A Avaliação Institucional constitui-se, um instrumento de grande importância para as Instituições de Ensino, em especial as Instituições de Ensino Superior, face ao crescente interesse e necessidade de melhoria da qualidade das atividades desenvolvidas nessas instituições, uma vez que elas possibilitam identificar problemas, avaliar os resultados dos processos de correção de falhas e a introdução de mudanças nas instituições educacionais, visando obter melhorias das condições de ensino. Constituindo de uma consulta aos alunos por meio de um questionário, a avaliação institucional busca conhecer a opinião dos alunos acerca de vários aspectos ligados a seu ambiente escolar, possibilitando um planejamento estratégico adequado, com vistas à qualidade acadêmica. Em geral, o resultado de uma Avaliação Institucional é analisado por meio da aplicação de ferramentas estatísticas. Para auxiliar na tarefa de análise dos dados extraídos na Avaliação Institucional, o presente trabalho propõe a utilização de técnicas de Mineração de Dados.

A Mineração de Dados surgiu como um ramo da computação, quando as empresas começaram a se preocupar com os grandes volumes de dados informáticos estocados e inutilizados dentro da empresa. Ela é constituída por um conjunto de ferramentas e técnicas que, por meio do uso de algoritmos de aprendizagem que são capazes de explorar um conjunto grande de dados, ajudando a evidenciar padrões nesses dados e auxiliando na descoberta de conhecimento. Para a aplicação da Mineração de Dados é necessária a escolha de um software apropriado. Nesta pesquisa foi utilizado o software desenvolvido pela Universidade de Waikato na Nova Zelândia denominado Weka. Essa escolha se deu devido a esse sistema ser distribuído com licença gratuita e possível de ser adquirido pela internet. OBJETIVOS O presente trabalho teve como foco central o estudo das principais técnicas de Mineração de Dados, a sua implementação no software Weka e as necessidades do tratamento de dados com a finalidade de se converter os dados dos questionários respondidos durante uma Avaliação Institucional em dados de entrada para o software Weka.. METODOLOGIA O trabalho foi dividido em um conjunto de etapas. A princípio, houve a necessidade de um estudo sobre Mineração de Dados, as principais técnicas, suas características e aplicações. A seguir realizou-se um estudo sobre o software utilizado, o Weka. A fim de se estudar como o software Weka poderia ser utilizado para análise dos dados gerados por uma Avaliação Institucional, inicialmente foi construído um pequeno banco de dados cujo conteúdo correspondia a um conjunto de questionários utilizados na Avaliação realizada na Universidade de Taubaté no ano de 2007. Vale notar que as questões 2

são exatamente as que foram utilizadas na citada avaliação, mas os dados para análise se baseiam em respostas fictícias às questões da avaliação. De posse de um conjunto de dados armazenados, o próximo passo foi prepará-los para serem processados pelo software Weka. O Weka impõe que os dados estejam armazenados em um padrão especifico, o que demandou a necessidade de se desenvolver mecanismos de pré-processamento para posterior aplicação dos algoritmos de Mineração de Dados. RESULTADOS E DISCUSSÃO Como resultado, obteve-se uma visão geral sobre a Mineração de dados, suas técnicas e aplicações. Obteve-se também conhecimento técnico ligado à instalação e configuração do sistema Weka e as particularidades existentes em seu processo de leitura de dados. Em especial nesse ponto é importante destacar o trabalho desenvolvido no sentido de padronizar os dados de entrada por meio de procedimentos de pré-processamento. Para validar o pré-processamento dos dados foram utilizadas as principais técnicas de Mineração de Dados incorporadas no software Weka, as quais puderam ser testadas sobre os dados fictícios dos questionários. Isso permitiu validar uma metodologia de preparação dos dados de entrada para o software a partir de dados tabulados em uma Avaliação Institucional. Permitiu também verificar que é real a possibilidade de utilizar o software Weka na análise dos dados de uma Avaliação Institucional. 3

O Weka aceita como dados de entrada dois tipos arquivos, o CSV e o ARFF. O tipo escolhido foi o ARFF, pois é a forma nativa utilizada no software. Para inserção dos dados, foi necessário um estudo para o entendimento dos padrões dos dados de entrada aceitos pelo software. Uma vez entendido o padrão dos dados de entrada e com os dados já pré-processados e interagidos com o software, obteve-se sucesso na execução do Weka sobre o conjunto de dados gerados utilizando diferentes configurações e técnicas de mineração de dados. Como o conjunto de dados se baseou em uma quantidade muito pequena de questionários, não se pode analisar a consistências dos parâmetros de saída apresentados pelo Weka, o que poderá ser feito em uma continuidade do presente estudo. CONCLUSÕES O presente trabalho conclui então que é possível utilizar o sistema Weka para avaliar os questionários da Avaliação institucional, e que também com o software foi possível verificar que o formato de dados definido pelo pré-processamento é possível identificar o número de instâncias e de atributos no arquivo gerado, uma representação gráfica dos dados, realizar remoção de instancias, e posteriormente gerar regras com as técnicas de classificação, agrupamento e associação. 4

REFERÊNCIAS BELLONI, Isaura. A função social da avaliação institucional. Avaliação, Campinas, v.3, nº34, 1998. FAYYAD, U.; Piatetsky-Shapiro G.; Smyth P. Data mining and knowledge discovery in databases: an overview. Comm. of the ACM, vol. 39, n.11, 1996. RESENDE, Solange Oliveira. Sistemas Inteligentes. Editora: Manole AMARRAL, Fernando C. Data Mining Técnicas e Aplicações para o Marketing. Ed Berkeley Brasil, 2001. 5

SOUZA, Michel de. Data Mining. 2003. Disponível em: <http://imasters.uol.com.br/artigo/1482/bi/data_mining/>. Acesso em 18 de fevereiro de 2008. ANDREATTO, Ricardo. Construindo um Data Warehouse e Analisando suas INFORMAÇÕES COM DATA MINING E OLAP. 1999. Disponível em: <http://www.datawarehouses.hpg.ig.com.br/index.htm>. Acesso em: 15 de abril de 2008. University of Waikato. Weka 3 Machine Learning Software in Java. Disponível em: <http://www.cs.waikato.ac.nz/ml/weka>. Acesso em: 03 de junho de 2008. GONÇALVES, Eduardo Correa. Data Mining Novos Recursos nos Sistemas de Banco de Dados. Disponível em: <www.devmedia.com.br>. Acesso em: 05 de agosto de 2008. 6