Marcos Rafael Machado. Modelo para a Determinação dos Perfis de Estudantes em Sistemas Web

Tamanho: px
Começar a partir da página:

Download "Marcos Rafael Machado. Modelo para a Determinação dos Perfis de Estudantes em Sistemas Web"

Transcrição

1 Marcos Rafael Machado Modelo para a Determinação dos Perfis de Estudantes em Sistemas Web Joinville, SC 2007

2 Marcos Rafael Machado Modelo para a Determinação dos Perfis de Estudantes em Sistemas Web Relatório Final de Trabalho de Conclusão de Curso (TCC) apresentado ao Curso de Graduação em Ciência da Computação, da Universidade do Estado de Santa Catarina (UDESC), como requisito parcial a disciplina de Trabalho de Conclusão de Curso. Orientador: Rafael Stubs Parpinelli Mestre Joinville, SC 2007

3 Marcos Rafael Machado Modelo para a Determinação dos Perfis de Estudantes em Sistemas Web Relatório Final de Trabalho de Conclusão de Curso (TCC) apresentado ao Curso de Ciência da Computação da UDESC, como requisito para a obtenção parcial do grau de BACHAREL em Ciência da Computação. Aprovado em BANCA EXAMINADORA Rafael Stubs Parpinelli Mestre Edino Mariano Lopes Fernandes Mestre Cinara Teresinha Menegazzo Mestre

4 Resumo Este trabalho propõe desenvolver um sistema capaz de mapear as ações dos estudantes (usuários do sistema) com o objetivo de determinar seus perfis. Para este objetivo ser alcançado serão utilizados os modelos de estilos de aprendizagem de Felder-Silverman, que define perfis de estudantes e a forma como melhor aprendem. Os dados obtidos pelo sistema será utilizado como entrada de dados em um processo de KDD, que terá a ferramenta Weka na etapa de mineração de dados. Com este sistema será possível acompanhar a evolução dos estudantes e auxiliar no aprendizado dos mesmos. Os dados também podem ajudar professores na preparação de aulas e desenvolvimento de atividades. Palavras-chaves: Mineração de Dados, Descoberta do Conhecimento em Base de Dados, Mineração na Web, Estilos de Aprendizagem, Weka.

5 Abstract This work intends to develop a system capable to chart the actions of the users (students) with the objective to determine the students profiles. This objective to be reached will be used the models of learning styles of Felder-Silverman that defines students profiles and the form as better they learn. The data gotten for the system will be used as data entry in a kdd process, the weka tool is to use in data mining stage. With this system it will be possible to follow the students evolution and assistant in the learning of the same ones. The data also can help to professors in the lessons preparation and activities development. Keywords: Data mining, Knowledge Discovery in DataBase, Web Mining, Learning Styles, Weka, web education.

6 Tem coisas que não podemos imaginar. Se não podemos imaginar, então não sabemos que coisas são estas. Barba non facit philosophum.

7 Sumário Lista de Figuras 8 Lista de Tabelas 9 1 Introdução 10 2 Descoberta de Conhecimento em Base de Dados Seleção Pré-Processamento Transformação Data Mining (Mineração de Dados) Interpretação Data Mining Tarefas do Data Mining Classificação Estimativa Previsão Agrupamento por Afinidade Agrupamento Visualização Algortimos Utilizados Algoritmo J Algoritmo BFTree Algortimo NBTree

8 4 Mineração de Dados na Web Etapas para Mineração de Dados na Web Recuperação de Informação Seleção da Informação e Pré-processamento Generalização Análise Classificação da Mineração da Web Mineração de Conteúdo da Web Mineração de Estrutura da Web Mineração do Uso da Web Perfis de Estudantes Segundo Felder-Silverman Dimensões Percepção (Sensorial x Intuitivo) Entrada de Dados (Visual x Verbal) Processamento (Ativo x Reflexivo) Compreensão (Global x Seqüencial) Questionário de Felder-Silverman Cálculo do Índice do Perfil do Estudante Coleta e Transformação dos Dados Ambiente para Captação dos Dados Sistema Utilizado para Captura dos Dados Dados Cadastrais Dados Navegacionais O Arquivo de Log Questionário de Felder-Silverman Transformações dos Dados

9 7 Módulo Classificador Módulo na Etapa de Treinamento Modelo de Funcionamento na Etapa de Uso Modelagem do Classificador Interface do Classificador O método classificar(int) : int O Método gerarregras(string=null) : int O Método getnome(void) : string O Método setdatasource(string) : void O Método setclassificador(classificador) : Estrutura de Comunicação O Classificador J O método classificar(int) : int O Método gerarregras(string=null) : int O Método getnome(void) : string O Método setdatasource(string) : void API Weka Resultados Dados Coletados Árvore Gerada Análise dos Dados Coletados e da Árvore Obtida BFTree NBTree Análise Geral Considerações Finais 60 6

10 A Questionário de Felder-Silverman 63 A.1 Cálculo do Perfil A.2 Escalas do Estilo de Aprendizagem B Arquivo Arff Gerado 71 C Código do Script de Transformação de Dados 73 Referências Bibliográficas 75

11 Lista de Figuras 2.1 Fases do Processo de KDD. Fonte: [Fayyad, Piatetsky-Shapiro e Smyth 1996] Fases do Processo de KDD na Web Página com o questionário de Felder e Silverman Página de cadastro do sistema Modelo de funcionamento na Etapa de Treinamento Modelo de funcionamento do Módulo Classificador Modelagem do Módulo Classificador Comunicação entre os componentes do processo Árvore gerada com os dados coletados Árvore gerada com o algoritmo BFTree Árvore gerada com o algoritmo NBTree

12 Lista de Tabelas 5.1 Dimensões de [Felder e Silverman 1988] Questionário de [Felder e Silverman 1988] Distribuição de alunos com relação às turmas Distribuição da dimensão Entrada de Dados Arquivo de log com informações de navegação Exemplo de algoritmo para gerar árvore de decisão Exemplo de retorno do nome do classificador Exemplo de atribuição dos dados, em formato arff Quantidade em relação ao Sexo Variação da idade dos estudantes Em relação ao estudo Quantidade de estudantes que exerciam algum trabalho remunerado na época do curso Utilização dos recursos visuais Utilização dos recursos textuais Cálculo da tendência de páginas visitadas pelos estudantes Resultado do perfil com base na entrada de dados Matrix confusão para o algoritmo J Matriz confusão para o algoritmo BFTree Matriz confusão para o algoritmo NBTree

13 10 1 Introdução Com a modernização das tecnologias de comunicação e o crescimento do fluxo de dados na Internet, diversos sistemas tiveram a quantidade de dados multiplicada, inviabilizando a análise dos mesmos por seres humanos. Este crescimento se dá pela facilidade tecnológica atualmente disponível, bem como pela crescente necessidade de se armazenar dados que sirvam para gerar informações. Esta necessidade de armazenar dados e a problemática do tamanho destes sistemas criou a necessidade de se desenvolver técnicas automáticas capazes de extrair as informações destas bases de dados [Goebel e Gruenwald 1999]. Dada estas necessidades, um novo campo teórico tecnológico surgiu a Descoberta de Conhecimento em Base de Dados, do inglês Knowledge Discovery in Database (KDD). O processo de KDD é composto por etapas que têm por objetivo a transformação dos dados em conhecimento útil [Aurélio, Vellasco e Lopes 1999]. Nestas etapas do KDD se destaca a etapa do Data Mining, por ser ela a responsável por analisar os dados e gerar os padrões de onde surgem o conhecimento [Neves, Freitas e Camara 2001]. Para os casos de utilização do processo de KDD na Web a etapa de Data Mining dá lugar para o processo de Web Mining [Marinho e Girardi 2003]. Isto acontece pelo fato de os dados na Internet serem mais variados e menos centralizados, ao contrário de base de dados padronizadas. Este fator obriga a existência de outros processos dentro da etapa de Data Mining para o tratamento dos dados [Marinho e Girardi 2003]. Dentro do contexto da Web, o Ensino a Distância (EaD) ganhou seu espaço na Internet. Isto porque a tecnologia possibilitou a construção de sistemas capazes de acompanhar o desenvolvimento do estudante, e o KDD possibilita a retirada destes dados para uma análise dos estudantes e seus desempenhos. Esta necessidade de gerar informações destes estudantes é devido à problemática da EaD, pois a tarefa de observar o aluno é dificultada pela perda do contato face-a-face entre o mesmo e o professor [Silva e Vieira 2001]. Ainda segundo [Silva e Vieira 2001] uma forma de perceber o comportamento do aluno é através das avaliações informais, das quais, em geral, ele não tem consciência, e que fornecem ao avaliador informações sobre a postura do aprendiz em relação ao curso.

14 1 Introdução 11 Na educação presencial, a avaliação informal se baseia, sobretudo, nas observações do avaliador. Apesar dos recursos de voz e imagem serem satisfatórios para sistemas de EaD, o contacto educador e estudante por s e/ou chats não são suficientes para que o primeiro consiga avaliar o segundo de forma a traçar um perfil, onde ele se encaixe e projete uma estratégia de ensino. Porém, não basta apenas recolher dados dos estudantes de sistemas de EaD. Para que o sistema seja eficiente é necessário conhecer os fatores envolvidos no processo de aprendizagem e formas de fazer este processo o mais personalizado possível para cada caso. Neste ponto é necessário o auxílio de teorias psicológicas de aprendizado. Segundo Felder e Silverman(1996) estudantes possuem quatro dimensões de aprendizagem (percepção, entrada de dados, processamento, compreensão). Estas dimensões indicam as formas mais confortáveis que os estudantes têm para o processo de aprendizagem. Neste trabalho propõe-se o desenvolvimento de um modelo para a determinação de perfis de estudantes em sistemas web dinâmicos capaz de classificar seus usuários dentro dos perfis de aprendizagem de Felder e Silverman. Esta classificação poderá ser utilizada para a personalização do sistema conforme cada perfil. Este modelo será baseado no processo de KDD e terá como ferramenta auxiliar no processo de mineração dos dados o Weka (ferramenta específica para mineração de dados) e sua API para desenvolvedores. Este trabalho está organizado como se segue. No Capítulo 1 é feita uma introdução ao trabalho. No Capítulo 2 são apresentadas as etapas do processo de KDD. A seguir, o Capítulo 3 apresenta as técnicas da etapa de Data Mining, sendo que para este trabalho será utilizada a tarefa de classificação junto com a técnica de árvore de decisão. No Capítulo 4 são apresentados os conceitos de Web Mining e suas principais características. No Capítulo 5 tem-se o modelo de [Felder e Silverman 1988], que será utilizado na determinação dos perfis dos estudantes. A modelagem do módulo e sua implementação, como também os testes, são apresentados nos capítulos posteriores.

15 12 2 Descoberta de Conhecimento em Base de Dados Diversos setores utilizam recursos computacionais para armazenar os mais variados tipos de dados, gerando um grande volume dos mesmos. Esta grande massa de dados subutilizada têm gerado uma urgência para o desenvolvimento de teorias computacionais e ferramentas para auxiliar na extração de informações úteis [Fayyad, Piatetsky-Shapiro e Smyth 1996]. Em 1996, Fayyad apresentou o processo para esta tafera, chamado de KDD (Knowlegde Discovery in Database), ou Descoberta do Conhecimento em Base de Dados. A idéia foi dividir o processo em 5 etpas modularizadas, permitido que sejam utilizadas técnicas distintas para cada uma das etapas. Este capítulo apresenta a teoria de Feyyad(1996), Knowledge Discovery in Database. Segundo [Fayyad, Piatetsky-Shapiro e Smyth 1996], o processo de KDD é composto por cinco (5) etapas, cada qual gerando um resultado que será utilizado na etapa seguinte. No entanto, sempre todas as etapas precisam ser executadas. É certo que pelo menos a etapa de Seleção, Data Mining e Interpretação são necessárias para que se tenha uma extração de conhecimento [Lacerda e Souza 2004]. Todas as etapas estão ilustradas na Figura 2.1. Nestas etapas estão envolvidos analistas, pessoas com conhecimento dos dados e dos objetivos a serem alcançados, e ferramentas capazes de auxiliar a encontrar as informações necessárias. As etapas podem ser divididas em dois grupos. O grupo das responsáveis pela preparação dos dados. A preparação se refere em trabalhar os dados de forma que possam ser utilizados para a descoberta de relações e padrões. As etapas que compões este grupo são: Seleção, Pré-Processamento, Transformação, Data Mining e Interpretação. A segunda divisão refere-se à mineração dos dados, que consiste na retirada destes padrões e relações até a interpretação dos mesmos por alguém responsável. Nas próximas seções serão explicadas as etapas que constituem o processo de KDD.

16 2.1 Seleção 13 Interpretação Data Mining Conhecimento Transformação Pré-Processamento Padrões Seleção Dados Pré Processados Dados Dados Figura 2.1: Fases do Processo de KDD. Fonte: [Fayyad, Piatetsky-Shapiro e Smyth 1996] 2.1 Seleção O primeiro ponto a ser abordado em um processo de KDD é qual seu objetivo, pois é este que irá definir os dados pertinentes à aplicação, e até mesmo a validade de todo o processo. Suponha que um professor venha percebendo a queda de desempenho de seus alunos em certas provas. Este fato observado pode levar ao levantamento de algumas perguntas, com o objetivo de descobrir o real motivo para o fraco desempenho dos alunos. Por isso, a primeira tarefa é determinar um problema [Carvalho 2001], que decidirá a definição do objetivo do KDD. Prosseguindo com o exemplo, no lugar de tentar adivinhar soluções para o problema de notas, um professor pode resolver usar de um mecanismo para encontrar um melhor entendimento para o problema. Para isto, o primeiro passo seria o levantamento dos dados que se tem dos alunos (nome, matrícula, endereço, idade, etc.) e a partir daí selecionar apenas o que for pertinente ao domínio do assunto, no caso as baixas notas. A fase de Seleção Consiste em reduzir o domínio dos dados que serão analisados à uma amostra que represente a base de todos os dados [Santana 2005]. Esta tarefa deve ser executada por alguém com um bom conhecimento do domínio de aplicação, para que se consiga discernir quais dados serão usados e quais podem ser descartados. A

17 2.2 Pré-Processamento 14 utilização de alguma ferramenta também é válida, pois existem casos em que os dados coletados estão em diversas fontes, podendo ocorrer problemas de erros, arquivos duplicados, dados com informações nulas, necessitando de grande cuidado por parte do responsável. Nesta etapa existem ainda casos em que os dados para a análise são dinâmicos. Este fator obriga que a seleção seja executada sistematicamente. Mais uma vez, para esta tarefa, é possível a utilização de programas que autonomizem as ações. 2.2 Pré-Processamento O pré-processamento diz respeito à limpeza do conjunto de dados, tratando de situações tais como: valores ausentes, redundância, ruídos (outliers) e demais problemas específicos do domínio da aplicação [Santana 2005]. Um exemplo seria a existência de um tipo de dado, sexo por exemplo, com várias formas para o mesmo significado. Isto pode ocorrer pois, como os dados podem estar em locais diferentes, pode existir um padrão em um repositório (como exemplo M de masculino e F de feminino) e em um outro H e M (homem e mulher). No pré-processamento os dados passam por uma análise e preparação, onde esses tipos de problemas são tratados para que haja uma base com dados limpos e compreensíveis. Isto garante a padronização dos dados que foram selecionados. Outro problema que recebe destaque é a questão dos valores discrepantes. Estes valores estão fora da faixa dos demais, e são conhecidos como outliers. Um exemplo poderia ser a quantidade de alunos matriculados em uma disciplina com um determinado professor. Normalmente a turma possui cerca de 25 alunos por semestre. No início de um semestre o professor verifica no sistema a quantidade de alunos, e descobre que existem 230 alunos matriculados. Assim, provavelmente existe algum erro. O erro humano é o mais comum nestes casos (por exemplo, erro de digitação, na lógica do programa, etc.) [Carvalho 2001]. Mas os outliers não necessariamente indicam uma má notícia. Pode realmente ter ocorrido de fato. Um aluno mediano que tira um dez, por exemplo. Normalmente uma boa notícia pode indicar a existência de uma nova tendência de resultados. Pode-se ainda aplicar a técnica de regressão para os valores discrepantes, sendo substituídos por valores de ajuste de uma determinada função matemática [Carvalho 2001]. Existem, ainda, muitos outros tipos de erros que se pode encontrar nos dados a

18 2.3 Transformação 15 serem filtrados. Entretanto, segundo [Figueiredo 2004], os dois mais comuns são os dados duplicados e a inconsistência. Dados duplicados são dados que estão em mais de um local, e os inconsistentes possuem algum problema (outliers são um tipo de inconsistência). Após o tratamento de dados pelo pré-processamento, pode ser interessante verificar se os dados estão certos. Nesta etapa, chamada de análise dos dados, o analista projeta um modelo com o objetivo de entender como os dados se agrupam, e qual o comportamento dos mesmos. Segundo [Figueiredo 2004] e [Lacerda e Souza 2004], quatro são as sub-etapas da análise dos dados: Especificação de modelo: Um modelo deve ser especificado pelo analista, sendo que a utilização de algum software para gerar esse modelo é possível; Ajuste de modelo: Quando o modelo está definido, então são selecionados os dados que estão no domínio com o objetivo de gerar o conhecimento. Quando houver alguma mudança no que se deseja obter deve-se alterar o conjunto de dados, fazendo um ajuste no modelo; Avaliação do modelo: Testes são realizados com o modelo, sendo que problemas encontrados são eliminados, deixando os dados mais consistentes para a aplicação de mineração de dados; Refinamento de modelo: O modelo é revisado iterativamente com o objetivo de reduzi-lo. Todo esse processo visa a adequação da base de dados e sua diminuição, mas sem perda de informação, para que a fase de Data Mining tenha um número reduzido de dados para tratar, tornando o processo de KDD mais rápido e minimizando recursos de hardware. 2.3 Transformação Nesta fase a base de dados pré-processada anteriormente é padronizada para que a etapa de Data Mining consiga entender as entradas e extrair o conhecimento desejado [Santana 2005]. Na transformação é verificada a forma que o algoritmo de Data Mining interpreta os dados e faz conversões. Caso um algoritmo trabalhe apenas com valores

19 2.4 Data Mining (Mineração de Dados) 16 binários esta etapa irá, por exemplo, converter o M e F para 0 e 1, a fim de que os dados sejam entendidos pela etapa de descoberta de padrões e relações. 2.4 Data Mining (Mineração de Dados) A fase de Data Mining é onde os padrões são de fato reconhecidos [Santana 2005]. É possível classificar o Data Mining como o processo de busca por padrões complexos escondidos em uma base de dados previamente tratada. Estes padrões, desconhecidos até então, agora podem ser conhecidos e utilizados em tomadas de decisões e modelagem de sistemas. É nesta etapa do processo de KDD que o comportamento dos dados é descoberto, e onde são estabelecidas as relações de dependência entre eles. Sendo assim, os mesmos acabam se tornando informações. Para estas transformações ocorrerem são utilizados recursos como regras de associação, árvores de decisão, regressão e clustering [Fayyad, Piatetsky-Shapiro e Smyth 1996]. No Capítulo 3 tem-se uma apresentação mais detalhada dos temas e teorias do Data Mining. 2.5 Interpretação Por fim, a última etapa do processo é a utilização das informações e padrões obtidos pelo processo de KDD por alguém que irá utilizar as informações e poderá avaliar a qualidade e utilidade do processo. Estas informações podem ser fornecidas pelo processo de Data Mining através de relatórios, incluindo dados como estatísticas de modelo, dados sobre exceções, etc. De modo geral o resultado é gerado em forma de relatórios, podendo ser utilizado recursos gráficos para melhor explicar as informações. Ações também podem ser indicadas, descrevendo os procedimentos a serem tomados para as situações apresentadas [Figueiredo 2004]. Estas são as 5 etapas do KDD, em capítulos posteriores será apresentada o processo do modelo, onde entram as etapas do KDD. No próximo capítulo é apresentado a mineração de dados com mais detalhes. A etapa de mineração é considerada a etapa mais importante do processo de KDD, inclusive considerada por alguns autores como um processo a parte.

20 17 3 Data Mining Data Mining é uma etapa do processo de KDD que consiste, segundo [Fayyad et al. 1996], no processo de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis embutidos nos dados. Isto significa que, a partir de um conjunto de dados, que passaram pelas fases anteriores de Data Mining em um processo de KDD, é possível que algoritmos computacionais sejam capazes de perceber o que um especialista não seria capaz, devido à grande quantidade de dados. O Data Mining aproveita o poder computacional existente atualmente e técnicas da Inteligência Artificial, de Estatística e outras para alcançar seus objetivos. Para que se tenha sucesso, é necessário aplicar metodologias que condizem com o nível de conhecimento de dados. Duas hipóteses podem existir: Caso não se conheça nada a respeito dos dados, e quando se conhece informações dos dados. Caso não exista um conhecimento dos dados, tem-se a descoberta não supervisionada, onde se utiliza o Data Mining para se obter informações destes dados sem preocupações com o tempo ou validações [Carvalho 2001]. Quando já se tem um conhecimento dos dados em questão tem-se a descoberta supervisionada. Aqui pode-se tirar conclusões, criar hipóteses e, com base numa metodologia, procurar validar as últimas [Carvalho 2001]. Vale salientar que os métodos diretos e indiretos não trabalham unicamente separados. Pode-se aplicar um método indireto para se obter algumas relações e, com base nestas relações, criar hipóteses e verificar suas validades com métodos diretos. O contrário também é possível. Ou seja, já com as hipóteses formuladas pode-se deixar de forma indireta que o Data Mining encontre informações que estão perdidas [Carvalho 2001]. 3.1 Tarefas do Data Mining Nesta seção apresenta-se um grupo de tarefas de Data Mining geralmente utilizadas [Carvalho 2001].

21 3.1 Tarefas do Data Mining Classificação A classificação é uma das tarefas mais utilizadas de Data Mining. A classificação divide os dados em grupos [Carvalho 2001]. Esta tarefa agrupa os dados da forma que se faça uma divisão em grupos com características semelhantes. Um exemplo da aplicação desta tarefa seria a classificação de pessoas em uma rede social, podendo existir várias classes para as pessoas (colegas, amigos, familiares, etc). Esta tarefa consiste em realizar comparações com base em dados que pertencem a classes já definidas. Isso acontece porque, quando os dados são classificados em uma classe, esta última acaba por gerar um modelo para classificar dados que futuramente farão parte desta classe [Garofalakis et al. 1999]. Para realizar estas classificações podem ser utilizados técnicas de Redes Neurais, Algoritmos Genéticos, Estatística, Árvore de Decisões, etc Estimativa Nesta tarefa, a partir de informações existentes é gerada uma nova informação, sendo que existe uma forte relação entre as relações existentes e a nova [Carvalho 2001]. Esta é uma forma de se descobrir informações sem obter os dados que gerariam a mesma. Exemplos de técnicas capazes de realizar boas estimativas são Redes Neurais Artificiais, Estatística, Algoritmos Genéticos esimulated Annealing Previsão Com base em informações passadas (modelo de série temporal) é possível determinar um valor futuro para algum índice [Carvalho 2001]. Um professor pode supor o desempenho de uma turma com base no desempenho da mesma turma em outras disciplinas. Esta tarefa procura descobrir o comportamento dos dados com base nos acontecimentos em dados semelhantes. A comprovação de que a previsão estava correta, e que o método é eficiente, ocorre quando o valor previsto for conhecido. As técnicas utilizadas podem ser Redes Neurais, Árvores de Decisão, Estatística, dentre outros.

22 3.2 Algortimos Utilizados Agrupamento por Afinidade Determinar os fatos que ocorrem simultaneamente com probabilidade razoável, ou que itens de uma massa de dados estão presentes juntos com uma certa chance, são tarefas típicas de afinidade [Carvalho 2001]. Esta análise permite criar associações entre objetos e determinar relações entre eles. Esta tarefa, é utilizada por sites para tentar vender mais produtos, fazendo sugestões aos clientes indicando quais produtos foram comprados juntamente com aquele que ele está sendo analisado no momento. Para esta tarefa, técnicas de Regras de Associação é largamente utilizado Agrupamento Agrupamento, ou clustering, procura classificar um grande conjunto de dados de uma certa classe em sub-classes. A idéia é formar grupos pela similaridade dos dados. Enquanto a classificação divide os dados em grupos bem definidos, no agrupamento as características são levadas em conta. Um exemplo de uso desta tarefa é, em posse de um grande conjunto de dados, dizer em quantas classes estes dados podem ser divididos e quais as características destas classes. A diferença entre classificação e agrupamento é que no agrupamento o algoritmo irá definir as classes. Na classificação essas classes já seriam conhecidas [Carvalho 2001]. As técnicas usadas são Redes Neurais Artificiais, Estatística, Análise de Conglomerados (Cluster Analysis) e Algoritmos Genéticos Visualização Esta tarefa consiste na representação gráfica dos dados [Carvalho 2001]. A idéia é representar graficamente os dados, para que seja possível perceber padrões que não são observados. 3.2 Algortimos Utilizados Neste trabalho os algortimos utilizados são implementações da tarefa de classificação através da técnica de árvore de decisão. Estes algortimos estão implementados dentro do

23 3.2 Algortimos Utilizados 20 Weka e fazem parte do conjunto de algortimos disponíveis no programa citado Algoritmo J48 O algoritmo J48 é uma implementação do algoritmo C4.5 release 8, que faz parte da última publicação de algoritmos desta família distribuidos gratuitamente [Witten e Frank 2005]. Este algoritmo constrói um modelo de árvore de decisão, através de várias iterações, baseado num conjunto de dados de treinamento, e usa esse modelo para classificar outras instâncias num conjunto de teste. A cada iteração o algortimo seleciona o atributo que melhor diferencia os dados com base no ganho de informação e separa o conjunto em duas partes até que restem apenas nós folhas, ou seja, respostas de classificação Algoritmo BFTree Este outro algoritmo de mineração de dados segue a mesma técnica de árvore de decisão do algortimo J48. A diferença é que o BFTree realiza uma busca no espaço de subconjuntos de atributos através de métodos gulosos, como o hillclimbing, acrescido de um facilitador de backtracking [Witten e Frank 2005] Algortimo NBTree A proposta do algoritmo NBTree é juntar a eficiência e velocidade das árvores de decisão em conjuntos de dados maiores, com a precisão das Naive-Bayes [Witten e Frank 2005]. O algoritmo é similar ao clássico esquema de partição recursiva encontrada nos algoritmos de árvore de decisão, exceto pelo fato de, nos nós folhas serem criadas instâncias de Naive- Bayes. Com esta técnica de aplicar as Naive-Bayes nos nós folha, verifica-se a utilidade do nó e seu peso em relação a classificação dos dados [Kohavi 1996]. Isto faz o algoritmo ser considerado híbrido, pois gera uma árvore de decisão, avaliando a pertinência dos resultados (nós folhas) para poder considerá-los classificações válidas.

24 21 4 Mineração de Dados na Web A Internet se tornou uma vasta rede com dados distribuídos de forma heterogênea e, em muitas situações, desordenadas [Pal, Talwar e Mitra 2002]. A mineração de dados na Internet se difere da mineração tradicional, pois no processo de Data Mining os dados estão em banco de dados com algum tipo de tratamento. Na Internet isso não necessáriamente acontece. Os dados são mais variados e dinâmicos. Outro fator que reforça esta diferença é o fato de existir vínculos de hipertexto entre muitos documentos, que podem ajudar no processo de Web Mining. Como exemplo, os motores de busca tais como Google 1 e Yahoo 2 utilizam esse fator para realizar um ranqueamento das páginas classificadas por eles, para tentar identificar comunidades tornando a busca mais inteligente [Marinho e Girardi 2003]. Uma definição ampla de Web Mining é a descoberta e análise de informação útil da World Wide Web (WWW), onde os dados podem ser coletados do lado do servidor, do cliente, em servidores proxy, base de dados, dentre outras fontes [Pal, Talwar e Mitra 2002]. Como os dados estão dispersos em vários locais e de várias formas, é natural que exista uma variação no formato (texto, imagem, áudio, etc.). Assim, existe uma variedade de casos para a construção de técnicas específicas para as tarefas envolvendo Web Mining. Algumas características dos dados usados no processo de Web Mining são [Pal, Talwar e Mitra 2002]: Não identificado: Muitos dados na Internet não possuem um rótulo definindo a que se refere. Isto causa um grande problema, como por exemplo para sistemas de busca que acabam por ter que descobrir alguma relação para estes dados, mas sem a certeza da categorização. Uma solução para isto seria o uso de Web Semântica [Suzuki 2006]; Distribuído: Os dados a serem utilizados podem estar em locais diferentes, servidores distintos; Heterogêneos: A possibilidade de se trabalhar com diversos formatos de dados e de 1 2

25 4.1 Etapas para Mineração de Dados na Web 22 mídias é ampla, incomparável com as dos banco de dados tradicionais. Por exemplo, caso uma empresa queira traçar o perfil de usuários de blogs através da análise do conteúdo, provavelmente existirão dados com contexto diversos; Variação de tempo: Como os dados podem estar em qualquer lugar e a qualquer hora, em casos em que o tempo é fundamental, é preciso tratar esta informação. Quando se deseja avaliar qual o horário que os alunos mais acessam um determinado sistema, é preciso ter em mente que se alguém acessar de um lugar onde exista uma diferença no fuso horário com relação ao servidor, esta diferença precisa ser tratada. Outro problema é com relação à data da geração de dados (eles podem estar desatualizados). 4.1 Etapas para Mineração de Dados na Web Apesar das diferenças entre a abordagem de Web Mining e de Data Mining, o primeiro pode fazer parte do processo de KDD. Para isto, é preciso que sejam incluídos no KDD as etapas necessárias para se conseguir processar os dados no Web Mining. Baseandose nesta teoria, a mineração na Web pode ser definida como a utilização de técnicas de Data Mining em um processo de KDD, sendo que os dados são provenientes de documentos e serviços da Web [Marinho e Girardi 2003]. Quatro (4) etapas são propostas por [Pal, Talwar e Mitra 2002] como mostra a Figura 4.1. Dados da Web Recuperação de Informação (Descoberta de Recursos) Extração da Informação (Seleção/Pré- Processamento) Conhecimento Análise (Validação \ Interpretação) Figura 4.1: Fases do Processo de KDD na Web Generalização (Reconhecimento De padrões / Aprendizagem de máquinas) Recuperação de Informação A etapa de recuperação de informação é responsável pela automatização do processo de recuperação de documentos relevantes para o processo. Esta etapa busca e gera a indexa

26 4.1 Etapas para Mineração de Dados na Web 23 ção dos documentos. Um índice é uma coleção de termos encontrados com ponteiros para os locais onde as informações podem ser encontradas [Pal, Talwar e Mitra 2002]. Isto economiza espaço de armazenamento. Esta indexação é mais complexa que as utilizadas em banco de dados tradicionais, isto pelo dinamismo da Internet e seus documentos. A indexação de documentos é uma técnica utilizada pelos serviços de busca como Google e Yahoo, que encontram como desafio indexar grande parte da Internet [Marinho e Girardi 2003] Seleção da Informação e Pré-processamento Atualmente a tarefa de extração de informação na Web é muito complexa, pois a maioria da Web não possui uma estrutura semântica, já que HTML é uma linguagem de formatação apenas. Após os documentos disponíveis em diversas fontes serem recuperados, a próxima etapa é transformá-los de forma que algoritmos de Data Mining sejam capazes de utilizálos como entrada de dados. Os métodos utilizados envolvem wrappers (escrita de código específico) que são responsáveis pelo mapeamento dos documentos para transformá-los em algum modelo de representação do conhecimento. É nesta etapa que se vê o problema da Web não utilizar semântica. Para cada documento é necessário escrever um código próprio a ele, tornando o trabalho manual. Esta falta de semântica inviabiliza a generalização e automatização deste processo [Marinho e Girardi 2003] Generalização Com a extração das informações é possível gerar algum modelo para representar estas informações. De posse destas informações são utilizadas técnicas de Data Mining, para que novos padrões e relações sejam descobertos. Um exemplo seria a percentagem com que um assunto está relacionado com uma pessoa, isso pode ser indicativo de que a pessoa é referência no assunto em questão e gerar um novo conjunto de possibilidades para as pessoas que procuram o assunto [Marinho e Girardi 2003]. Novamente o problema de semântica torna o trabalho mais complicado, pois é possível que não se tenha idéia do significado do texto. Para tentar solucionar este problema podem ser utilizados sites de referências, onde suas características são utilizadas

27 4.2 Classificação da Mineração da Web 24 para determinar se outros sites pertencem ao conjunto X ou Y. Outra técnica utilizada é a de agrupamento (clustering), responsável pela classificação de páginas sem a necessidade de entradas com sentido (semântica). A idéia do agrupamento é agrupar documentos de acordo com suas similaridades [Marinho e Girardi 2003] Análise A parte de análise consiste em verificar as informações obtidas. Esta análise é realizada com o auxílio de ferramentas para o entendimento, visualização, interpretação e validação das informações. 4.2 Classificação da Mineração da Web A mineração na Web possui três categorias [Pal, Talwar e Mitra 2002], cada uma com suas características e especificidades.na primeira classe o conteúdo no HTML é analisado com o objetivo de se classificá-lo conforme o contexto. Na segunda classe é analisada a relação entre páginas HTML, conforme as ligações existentes entre elas. A terceira difere das duas anteriores por se relacionar com a forma que o usuário interage com as páginas [Kosala e Blockeel 2000] Mineração de Conteúdo da Web A Mineração de Conteúdo da Web (MCW) trata do descobrimento da informação em dados, documentos e serviços. Entretanto, a MCW não trata somente de texto, mas abrange toda forma de dados: áudio, vídeo, meta-dados, vínculos de hipertexto, etc [Pal, Talwar e Mitra 2002]. Atualmente as pesquisas estão mais voltadas ao contexto do hipertexto. Os dados de texto na Web podem ter três formas: texto livre, semiestruturado (HTML) e totalmente estruturado (tabelas de banco de dados). Os textos semi-estruturados são os mais abrangentes [Marinho e Girardi 2003]. Para os textos sem estrutura é utilizado o KDT (Knowledge Discovery in Texts), ou Mineração de Dados em Textos. Existe ainda a mineração em documentos de hipertexto e de serviços. A mineração em documentos de hipertexto avalia o texto e os vínculos de hipertexto. Outras informações podem ser retiradas de serviços

28 4.2 Classificação da Mineração da Web 25 da Web. Estes serviços podem trazer informações relevantes ao objetivo da mineração [Pal, Talwar e Mitra 2002]. Existem duas estratégias básicas na mineração de conteúdo. A primeira executa uma ação direta no conteúdo dos documentos, enquanto a outra incrementa o poder de busca de outras ferramentas e serviços. No primeiro caso o conteúdo é analisado e procura-se retirar informações, apesar da falta de estrutura do texto. A segunda usa a relação dos vínculos de hipertexto para determinar o quanto uma página possui uma relevância em um determinado assunto. Por exemplo, se em cada 10 pesquisas uma página é visitada 9 vezes, ela será classificada como referência do assunto e as próximas páginas serão avaliadas com base nas características retiradas desta página modelo [Marinho e Girardi 2003] Mineração de Estrutura da Web Enquanto a MCW se preocupa com os documentos, a Mineração de Estrutura na Web (MEW) analisa a estrutura e a relação entre as páginas Web com base em seus vínculos de hipertexto [Pal, Talwar e Mitra 2002]. Isto é possível porque estes vínculos podem informar as relações que as páginas têm entre si. Por exemplo, links que apontam para uma página podem significar que a página é relevante para um determinado assunto. Já os links que uma página aponta pode indicar que o conteúdo desta página é complementado por outra(s) [Marinho e Girardi 2003]. É possível fazer uma analogia entre os links e trabalhos científicos. Quanto mais um trabalho é referenciado por outros, maior é seu valor. Isto acontece, pois, se um trabalho é muito referenciado significa que ele é relevante. O mesmo pode ser dito para as relações de links. Quando uma página possui muitos apontadores para ela significa que seu conteúdo é de grande relevância. Esta relação de indicação de uma página para outra deixa transparecer a característica de grafo orientado que a Web possui. O HITS (Hyperlinked Induced Topic Search) e o PageRank são alguns exemplos de algoritmos utilizados para determinar a relevância de páginas. Onde a regra mais comum é a da popularidade: quanto mais páginas apontar para uma determinada página, maior será o conceito da última. Esta idéia também é utilizada para a categorização das páginas e a descoberta de micro-comunidades [Marinho e Girardi 2003].

29 4.2 Classificação da Mineração da Web Mineração do Uso da Web Diferentemente dos dois outros métodos, a Mineração do Uso da Web (MUW) está relacionada à forma como o usuário interage com as páginas Web e como irá reagir. A idéia é, com base na navegação do usuário, tentar prever suas ações enquanto ele interage com as páginas [Kosala e Blockeel 2000]. A Mineração do Uso da Web trata com dados vindos da interação do usuário com a Web [Marinho e Girardi 2003]. Estes dados podem ser provenientes de logs (sejam de servidores Web, proxy, browsers, cookies), seções, consultas, cliques de mouse, etc. Tudo aquilo que possa ser gerado pela interação do usuário com a Web pode ser utilizado para este tipo de mineração [Pal, Talwar e Mitra 2002]. Segundo [Marinho e Girardi 2003], é possível classificar a MUW em duas categorias. A primeira utiliza dados registrados em servidores Web, sendo estes dados inseridos em tabelas para a utilização de técnicas de Data Mining. A segunda utiliza os dados encontrados em logs de sistemas. Neste trabalho será utilizada a segunda abordagem, onde os dados receberão um tratamento para poderem ser utilizados pelo Data Mining, como visto no processo de KDD.

30 27 5 Perfis de Estudantes Segundo Felder-Silverman Muitas são as propostas de modelos psicológicos existentes para determinação de perfis de usuários. Dentre estes modelos, neste trabalho serão abordados os modelos de estilos de aprendizagem que são voltados para o sistema educacional e estudantes. Como base para escolha do modelo a ser adotado neste trabalho seguiu-se o proposto por Marina, em [Muller 2005], tendo em vista que já fora feito todo um trabalho para decidir qual o modelo mais indicado para sistemas de computador. O modelo utilizado será o de Felder-Silverman, que é baseado em modelos como o CBIT e modelos de psicologia [Felder e Silverman 1988]. Os estilos de aprendizagem são organizados em dimensões de personalidades [Lopes 2002], possibilitando determinar os perfis em níveis de aprendizagem. Esta divisão também permite o acompanhamento de mudanças nos perfis de cada estudante, isto porque o perfis não são fixos, mas sim moldados dependendo de fatores externos ao estudante [Felder e Silverman 1988]. O modelo de Kolb dá ênfase à experimentação em todo o processo de aprendizagem [Lopes 2002]. Além de um modelo de aprendizagem, sua preocupação é entender os mecanismos utilizados na resolução de problemas. De acordo com Kolb, o processo de aprendizagem envolve quatro fases cíclicas: Envolver-se; Ouvir; Criar idéias; Tomar decisões. Para que exista uma aprendizagem duradoura é necessário que o aluno utilize estas etapas de forma flexível. Há neste ciclo de aprendizagem duas etapas apontadas por Kolb [Lopes 2002]: A percepção, que é a forma como as informações são captadas, e o processamento, que se refere ao que é realizado após a captura das informações.

31 5 Perfis de Estudantes Segundo Felder-Silverman 28 Outro trabalho que se destaca é o indicador de tipos Myers-Briggs (MBTI). Este modelo é baseado na teoria dos tipos psicológicos de Carl Jung [Lopes 2002]. Para Jung existem dois tipos marcantes de pessoas: as extrovertidas e as introvertidas. Ainda em Jung, existem quatro tipos psicológicos: pensativo, sentimental, intuitivo e o perceptivo. Então, o procedimento do inventário MBTI é classificar os indivíduos de acordo com estes modelos. O modelo proposto por Schmeck é um conjunto de estratégias utilizadas de forma consistente para aprender ou estudar diferentes situações [Lopes 2002]. São quatro os estilos propostos: Processamento profundo: é a capacidade de organização do conteúdo da aprendizagem; Processamento elaborativo: é o estilo de estudante que utiliza aquilo que aprendem em situações reais; Retenção das informações: fornece as informações: sobre o desempenho acadêmico futuro; Estudo metodológico: é característico de estudantes que apresentam facilidade de memorizar as informações. Dentre os modelos existentes será utilizado o modelo de [Felder e Silverman 1988], que é voltado para determinar os perfis de aprendizagem de estudantes. A vantagem de se usar esta metodologia é o fato dela estar voltada à classificação de perfis de estudantes, tendo como base a forma como estes conseguem entender assuntos dados em sala de aula. Ele também se baseia em outras teorias psicológicas para montar o seu próprio modelo. De acordo com [Felder e Silverman 1988], a determinação dos perfis de estudantes é de grande importância. Isto porque é possível modificar a estrutura e apresentação das aulas e seus conteúdos, direcionando-as para caminhos que facilitem a compreensão dos estudantes de determinados assuntos. Em seus estudos, [Felder e Silverman 1988] utilizou estudantes de Engenharia para seus experimentos, outro fator para a escolha deste modelo. Em [Felder e Silverman 1988] as dimensões formam os estilos de aprendizagem dos estudantes. Percepção, processamento, entrada de dados e compreensão são as formas

32 5.1 Dimensões 29 Dimensões Percepção Entrada de Dados Compreensão Processamento Visões Sensorial X Intuitivo Visual x Verbal Global x Seqüencial Ativo x Reflexivo Tabela 5.1: Dimensões de [Felder e Silverman 1988]. de aprendizagem e entendimento de conceitos. Cada dimensão possui duas possibilidades, sendo elas excludentes entre si. A Tabela 5.1 apresenta as dimensões e visões propostas por [Felder e Silverman 1988]. Na próxima seção serão explicados os tipos de dimensões. 5.1 Dimensões A aprendizagem no ambiente educacional pode ser dividida em dois processos. O primeiro processo envolve a captação das informações, e o segundo diz respeito ao processamento destas informações [Felder e Silverman 1988]. As informações recebidas pelo processo da captação podem vir de meios externos ao indivíduo (a observação por meio dos sentidos), e/ou internos (introspecção) [Felder e Silverman 1988]. Estas duas formas são usadas por todos estudantes, mas existe uma escolha entre os dois processos, sendo que para o processo não escolhido suas informações são descartadas. De acordo com [Felder e Silverman 1988] as dimensões podem ser de recepção ou processamento, sendo que dentro destas dimensões existem duas visões possíveis. O modelo de [Felder e Silverman 1988] procura analisar a preferência dos alunos em relação às visões, e assim classificar os estudantes com base nas suas escolhas [Felder e Silverman 1988]. Com base nesta classificação é possível gerar um modelo de ensino mais adequado e adaptável às formas de percepção e processamento das informações. Nas próximas subseções são apresentadas as quatro (4) dimensões propostas por [Felder e Silverman 1988].

33 5.1 Dimensões Percepção (Sensorial x Intuitivo) A percepção é a forma como as pessoas percebem o mundo ao seu redor [Felder e Silverman 1988]. Esta percepção pode ocorrer utilizando informações internas ou externas ao indivíduo. Dependendo das escolhas, uma pessoa pode ser caracterizada como sensorial ou intuitivo [Felder e Silverman 1988]. Indivíduos sensoriais procuram perceber o ambiente através da observação, obtendo informações dos canais sensoriais diretos. Gostam de fatos, de dados e experimentação. Resolvem problemas utilizando métodos padronizados e não gostam de surpresas. São pessoas mais pacientes com os detalhes, mas não gostam de complicações, e por isso podem ser consideradas lentas. Possuem facilidades com trabalhos práticos e para memorizar fatos [Felder e Silverman 1988]. Diferente dos indivíduos sensoriais, pessoas intuitivas utilizam a percepção indireta do inconsciente, a especulação, imaginação, intuição. Pessoas intuitivas preferem princípios, teorias e inovações. Não gostam de repetições. São menos apegados a detalhes mas, por outro lado, gostam de complicações. Entendem com facilidade novos conceitos [Felder e Silverman 1988]. É importante deixar claro que todas as pessoas usam ambas as formas de percepção, mas cada uma tende para um dos lados [Felder e Silverman 1988] Entrada de Dados (Visual x Verbal) As pessoas recebem informações que podem ser de três categorias: visuais (símbolos, figuras, diagramas), auditiva (sons, palavras) e sensorial (paladar, tato, olfato). Essas categorias, no caso do ensino, podem ser divididas de duas formas: visuais e verbais [Felder e Silverman 1988]. Pessoas visuais têm maior facilidade com figuras, diagramas, fluxogramas e demonstrações. Estes tipos de pessoas trabalham melhor com informações desta natureza e tendem a recordar com mais facilidade cenas, objetos e tudo que envolva figuras [Felder e Silverman 1988]. Pessoas verbais aproveitam explicações orais ou escritas, e todo o processo relacionado com estes dois meios de comunicação. Estes indivíduos apresentam maior

34 5.1 Dimensões 31 facilidade em memorizar textos [Felder e Silverman 1988] Processamento (Ativo x Reflexivo) A forma como o cérebro transforma as informações em conhecimento é um processo complexo. Por este motivo, é conveniente dividir este processo em duas categorias: experimentação ativa e observação reflexiva [Felder e Silverman 1988]. As pessoas ativas utilizam a experimentação ativa, tendendo a reter e compreender informações mais eficientemente discutindo, experimentado conceitos e/ou explicando para outras pessoas, ou qualquer outra atividade que envolva em utilizar a informação. Gostam de trabalhar em grupos. Em resumo, preferem atuar com o ambiente [Felder e Silverman 1988]. Os reflexivos, pessoas que preferem observação reflexiva, precisam de um tempo para, sozinhos, pensar sobre as informações recebidas. Preferem a observação à aplicação prática, e a introspecção aos trabalhos em equipe Compreensão (Global x Seqüencial) A educação formal envolve a apresentação de materiais em uma lógica ordenada e progressiva. Muitos estudantes se sentem confortáveis com esta metodologia. Isto porque essas pessoas compreendem as coisas de forma seqüencial. Entretanto, existem aqueles que não aprendem desta maneira [Felder e Silverman 1988]. Pessoas seqüenciais seguem uma linha lógica e ordenada para a solução de problemas. Estas pessoas são metódicas e se sentem à vontade com estilos de ensino e aprendizagem tradicionais [Felder e Silverman 1988]. Pessoas globais não seguem uma seqüência lógica de idéias. Elas fazem voltas intuitivas para um entendimento do assunto. Não seguir a seqüência de capítulos de um livro para aprender um determinado assunto pode ser uma característica de pessoas globais. Outra característica forte de pessoas deste tipo é o fato delas não serem capazes de explicar a forma como adquiriram o conhecimento [Felder e Silverman 1988].

35 5.2 Questionário de Felder-Silverman Questionário de Felder-Silverman Para classificar os alunos dentro das dimensões e visões, [Felder e Silverman 1988] desenvolveu um questionário com quarenta e quatro (44) questões, sendo que para cada dimensão existem onze (11) questões. No Apêndice A são apresentadas estas questões. Para cada questão existem duas opções de resposta, não havendo a possibilidade de se escolher as duas opções simultaneamente. Caso existam situações em que as duas respostas se aplicam ao aluno, ele deve escolher aquela que com mais freqüência escolheria. A Tabela 5.2 mostra a classificação das perguntas. Como não existe nenhuma relação de dependência entre as dimensões, existem dezesseis (16) possibilidades de perfis (4 2 ). Estas possibilidades estão colocadas a seguir: Visual, Sensorial, Sequëncial, Ativo; Visual, Sensorial, Sequëncial, Reflexivo; Visual, Sensorial, Global, Ativo; Visual, Sensorial, Global, Reflexivo; Visual, Intuitivo, Sequëncial, Ativo; Visual, Intuitivo, Sequëncial, Reflexivo; Visual, Intuitivo, Global, Ativo; Visual, Intuitivo, Global, Reflexivo; Verbal, Sensorial, Sequëncial, Ativo; Verbal, Sensorial, Sequëncial, Reflexivo; Verbal, Sensorial, Global, Ativo; Verbal, Sensorial, Global, Reflexivo; Verbal, Intuitivo, Sequëncial, Ativo; Verbal, Intuitivo, Sequëncial, Reflexivo;

36 5.3 Cálculo do Índice do Perfil do Estudante 33 Dimensão Questão Descrição Percepção 38,6,18,14,2,10,34 preferência pela informação 26,22,42,30 concreta (fatos, dados, o mundo real) ou pela abstração (interpretações, teorias, modelos) Entrada de dados 7, 31, 23, 11, 15 formato da informação na entrada Compreensão 20, 36, 44, 8,12, 32, 27, 19, 3, 35, 43, 39 formato preferível da informação 24 para relembrar da memória pensamento linear ou randômico 28, 4,16, 40 enfatiza detalhes ou o todo Processamento 25, 1, 29, 5, 17 agir ou refletir primeiro 37, 13, 9 reservado ou extrovertido 21, 33, 41 favorável ou não a trabalhos em equipe Tabela 5.2: Questionário de [Felder e Silverman 1988]. Verbal, Intuitivo, Global, Ativo; Verbal, Intuitivo, Global, Reflexivo; Para este trabalho será utilizado o questionário apresentado em [Lopes 2002] e traduzido por Marcus F. Giorgetti e Nídia Pavan Kuri da Escola de Engenharia de São Carlos - USP. 5.3 Cálculo do Índice do Perfil do Estudante Para determinar o perfil do estudante, dentre os dezesseis (16) perfis possíveis, é necessário que as quarenta e quatro questões sejam respondidas. Cada questão possui apenas duas opções, a e b, e para cada questão só é permitido assinalar uma das duas alternativas. Em casos que ambas alternativas se encaixam na resposta do estudante, deve-se optar pela alternativa que mais se adeqüe às preferências do mesmo. Após o término, é necessário realizar a contagem dos pontos de acordo com as respostas. Para isto, deve-se dividir as questões em quatro grupos que representam as

37 5.3 Cálculo do Índice do Perfil do Estudante 34 quatro dimensões já citadas. Cada grupo possui onze questões. Para auxiliar na divisão das questões por dimensões pode ser usada a Tabela 5.2. Depois da divisão em grupos, é feita a contagem de quantas letras a e letras b foram respondidas. Para cada letra a é somado uma unidade para respostas a. Para respostas b é somado uma unidade em respostas b. Depois da contagem existirão, para cada dimensão, dois valores: um correspondente à letra a e outro para b. Por fim, o resultado final de cada dimensão é obtido da subtração do maior valor pelo menor (dentro da dimensão), acrescido da letra de maior resultado. O resultado é submetido à tabela de resultados da Seção A.2 do Apêndice, para verificar o nível que se tem em cada dimensão (moderado, forte, etc). Para exemplificar, suponha que para a dimensão de entrada de dados (questões 3,7, 11, 15, 19, 23, 27, 31, 35, 39, 43) um estudante assinalou 5 vezes a letra a e 6 vezes a letra b. O cálculo final para a dimensão será 6-5 (maior pelo menor) acrescido da letra do maior (no caso b). O resultado final será 1b. Com base nesta resposta, basta verificar na escala apresentada na Seção A.2 qual o resultado obtido.

38 35 6 Coleta e Transformação dos Dados Neste capítulo são apresentadas as etapas de coleta e transformação dos dados. A coleta de dados foi realizada através de um sistema para acompanhamento de aprendizagem durante cursos realizados nos meses de outubro e novembro. A transformação dos dados foi realizada através de scripts que, com base nos logs gerados, criaram um arquivo no formato arff para leitura e análise do módulo classificador. Nas seções deste capítulo estes processos citados acima são descritos. 6.1 Ambiente para Captação dos Dados Para a captação dos dados, utilizou-se um sistema Web de auxílio à aprendizagem durante cursos ministrados. Estes cursos tiveram como tema: gnu/linux latex A proposta dos cursos referiu-se a interação dos estudantes com o sistema, juntamente com explicações de um professor. O professor explicava alguns pontos do assunto os estudantes podiam consultar aquele assunto no sistema. Apenas o conteúdo explicado pelo professor era disponibilizado ao aluno, sendo que nenhum outro recurso estava disponível, fazendo o aluno manter o foco. O conteúdo do curso de gnu/linux era uma introdução ao sistema operacional. O curso de latex 1 apresentou conceitos básicos da linguagem e sua estrutura para a construção de arquivos como monografias e artigos. O curso de gnu/linux foi ministrado na UDESC/Joinville 2, em turma única e na empresa Tecnosystem 3, uma turma. O curso de latex aconteceu na UDESC/Joinville, quatro turmas. No CEFET 4, tiveram duas turmas de latex. A distribuição de alunos por curso pode ser vista na Tabela Latex é uma linguagem para processamento de textos. 2 Universidade do Estado de Santa Catarina - Campus Joinville 3 Empresa de tecnologia de Joinville 4 Centro Federal de Educação Tecnológica - Campus Joinville

39 6.2 Sistema Utilizado para Captura dos Dados 36 linux latex UDESC Joinville 13 8 Tecnosystem 9 CEFET 20 TOTAL Tabela 6.1: Distribuição de alunos com relação às turmas. 6.2 Sistema Utilizado para Captura dos Dados Para o acompanhamento dos cursos utilizou-se um sistema Web. O objetivo do sistema era, além de auxiliar os estudantes, captar os dados dos estudantes e armazenar em arquivos de log para posterior análise. O sistema consiste em um conjunto de páginas onde os estudantes navegavam e interagiam com as páginas web. Cada página é cadastrada como visual ou verbal, isto é, cada página possui relação direta com a dimensão de Entrada de Dados, sendo que sempre a escolha do estudante por utilizar uma página verbal ou visual. Inicialmente, o estudante realiza um cadastro. Neste cadastro são solicitadas informações como idade, semestre corrente, profissão e sexo. Após o cadastro, o usuário tem acesso ao conteúdo inicial do curso, onde ele deveria escolher o tipo de visualização do material, verbal ou visual. No decorrer do curso, o conteúdo disponível no sistema é liberado conforme o assunto avança. O estudante não pode avançar, ou recuar, no conteúdo disponível, este controle impede o estudante de utilizar todos os recursos do sistema, por curiosidade, obrigando-o a escolher aquilo que mais lhe agrada e evitando disperssão. A interação do estudante com o sistema é armazenada em logs do sistema. Estes logs são associados à sessão do Web Bronwser 5, e não à um usuário específico. A associação dos logs à sessão dispensa um cadastro e beneficia cursos de pequena duração( evitando perda de tempo com cadastros demorados) e sistemas que não possuem sistema de cadastro. Ao final do curso os estudantes respondem ao questionário de Felder- Silverman, composto por 11 questões sobre a dimensão Entrada de Dados. O resultado do questionário também faz parte do log do sistema. A Figura 6.1 mostra a página do sistema 5 Navegador de páginas web. Exemplos de navegador são o Firefox e o Opera

40 6.3 Dados Cadastrais 37 com o questionário. Na Seção 6.3 é feita a descrição dos dados cadastrais selecionados, e na Seção 6.4 os dados navegacionais coletados. Figura 6.1: Página com o questionário de Felder e Silverman 6.3 Dados Cadastrais O primeiro contato dos estudantes com o sistema é através de um formulário de cadastro, Figura 6.2, sendo estes os primeiros dados captados dos estudantes e armazenados no arquivo de log. Os dados coletados foram: sexo idade semestre matriculado profissão Sendo que, o semestre matriculado é o semestre corrente do estudante, na época do curso, e a profissão apenas considerou-se como uma resposta afirmativa ou negativa, isto é, possui ou não profissão. A existência ou não de uma profissão é utilizada para verificar se o estudante está inserido em outro ambiente que obriga-o a se adaptar à ele. Estes dados compõem o primeiro grupo de dados coletados. Neste grupo é feita

41 6.4 Dados Navegacionais 38 Figura 6.2: Página de cadastro do sistema uma tentativa de captar o mundo ao redor do estudante, pois segundo Felder-Silverman o ambiente onde o estudante vive está relacionado ao seu perfil[felder e Silverman 1988]. A Tabela 6.3 mostra, dentre os alunos dos cursos, a distribuição da dimensão Entrada de Dados. Visão Quantidade Verbal 1 Visual 20 Tabela 6.2: Distribuição da dimensão Entrada de Dados. Dos outros dados obtidos, 8 do sexo feminino e 13 do sexo masculino. A idade média dos estudantes era de , sendo que a idade máxima foi 29 e a mínima 17. O semestre corrente estava entre o primero semestre e o sexto semestre. De todos os dados apenas 32 exerciam profissão remunerada. 6.4 Dados Navegacionais A primeira etapa da coleta de dados, Dados Cadastrais, captou dados relacionados ao ambiente do estudante, que pode interferir no seu perfil. Neste segunda etapa, os dados captados dizem respeito a forma do estudante de interagir com o sistema, captando suas

42 6.5 O Arquivo de Log 39 preferências. Estas preferências são relacionadas durante sua navegação dentro de um arquivo de log que armazena todas as escolhas do estudante. As opções navegacionais do estudante indicam quais os padrões de navegação de cada perfil. Com isto é possível determinar quais páginas um estudante, com um perfil determinado, irá preferir visualizar. Estas opções de navegação são armazenadas de forma a criar um grafo. Além das páginas visitadas outros dados coletados foram, a utilização de recursos visuais(ampliação de imagens e tabelas) e textuais(consuta a descrição de termos). Estes dados adicionais coletados, eram captados dentro das páginas. Então, em uma página existe uma imagem, caso o estudante resolva ampliar para uma visualização mais detalhada é considerado um uso de recurso visual. A visualização de definições de palavras no meio do texto é um exemplo de recurso textual utilizado e que também foi armazenado. 6.5 O Arquivo de Log Para o armazenamento dos dados coletados durante a utilização do sistema são utilizados arquivos de logs. Para cada estudante um arquivo de log é gerado, conforme sua sessão do navegador, sendo que a identificação do estudante é feita somente através do número da sessão. Todos os dados de interação do estudante com o ambiente são armazenados neste arquivo de log. Os dados armazenados dentro do arquivo são divididos em duas áreas. Na primeira área, correspondente a primeira linha do arquivo, são os dados cadastrais, isto é, os dados cadastrais são inseridos todos em uma única linha, sendo divididos por vírgula uns dos outros. Todas as outras linhas são dados de navegação e interação do estudante com o ambiente, sendo que a última linha armazena o perfil do estudante. A Tabela 6.3 apresenta um exemplo do arquivo de log utilizado. No exemplo da Tabela 6.3 pode-se verificar que os dados cadastrais da primeira linha correspodem ao sexo, idade, profissão e semestre corrente. As demais linhas são os dados navegacionais, analisando as páginas visualizadas é possível concluir a preferência do estudante por páginas visuais, também é possível verificar no log a utilização de um recurso visual, a ampliação de imagens.

43 6.6 Questionário de Felder-Silverman 40 F,22,estagiária,5 intro visual.php texto.php texto visual.php divisao visual.php tabelas.php tabelas visual.php imagens.php imagens visual.php ampliacao imagem(imagens visual.png) referencias.php referencias visual.php questionario.php perfil:visual Tabela 6.3: Arquivo de log com informações de navegação. 6.6 Questionário de Felder-Silverman Para todos os cursos aplicou-se o questionário de Felder-Silverman com apenas as questões relacionadas à dimensão de Entrada de Dados. O questionário serve para classificar os estudantes dentro dos seus perfis. O perfil determinado pelo questionário é armazenado dentro do arquivo de log, na final do arquivo. O perfil determinado pelo questionário é utilizado na etapa de treinamento do classificador para gerar a árvore de decisão, que classificará futuros estudantes. Na etapa de uso do sistema os perfis são armazenados e comparados, após a classificação executada pelo classificador, com os resultados obtidos e verificada a validade da árvore classificadora. O questionário completo de Felder-Silverman pode ser consultado no Apêndice A. 6.7 Transformações dos Dados Após a coleta dos dados, todos os arquivos de log foram submetidos ao algoritmo responsável por converter os logs em um arquivo Weka. Cada arquivo de log gerou uma linha na área de dados do arquivo Weka, sendo que é preciso arranjar os dados de forma a

44 6.7 Transformações dos Dados 41 obedecer o padrão do arquivo Weka. Esta etapa é exatamente a etapa de transformação do KDD. O algoritmo utilizado foi escrito em php, sendo que o código pode ser visto no Apêndice C. Inicialmente o algoritmo faz a leitura do diretório onde os arquivos estão, e submete cada arquivo ao processo de transformação. Como os logs armazenam os dados que serão coletados e o script realiza a transformação, à cada inserção de um novo tipo de dado, ou remoção, é preciso alterar o código do programa e ajustar de forma que o script não gere arquivos arff com erros. O processo de transformação dos dados é o que mais sofre alterações, isto porque novas variáveis podem ser adicionadas dentro dos logs, ou mesmo retiradas, conforme os padrões determinados pelos algoritmos. Após o processo de mineração e determinação dos dados que são relevantes para a classificação do estudante o responsável pelo sistema pode optar por remover as variáveis que não são úteis na classificação, ou mesmo adicionar novas variáveis para verificar se elas tem alguma influência no perfil do estudante. O arquivo arff gerado como resultado da etapa de transformação dos dados será utilizado pelo módulo de classificação e pode ser construído toda vez que se desejar criar os algortimos para a classificação, ou apenas ter os dados atualizados. Atualizar o arquivo arff significa que a cada classificação de perfil os dados do estudante e o seu perfil são adicionados ao arquivo que serve de base para se determinar os padrões de navegação dos estudantes, possibilitando que novos padrões sejam descobertos. Ao submeter os dados para o módulo classificador é necessário que sejam informados os tipos dos dados, caso sejam variáveis do tipo String, int, float, etc.

45 42 7 Módulo Classificador Neste capítulo é apresentado o módulo classificador, responsável por gerar as regras de classificação e classificar os estudantes. O módulo é uma parte independente do sistema utilizado na coleta de dados, isto é, pode ser utilizado por outros sistemas, basta para isto os sistemas implementarem a interface de comunicação com o módulo. A primeira parte do capítulo apresenta a modelgem do módulo, suas classes e interfaces. Na segunda parte do capítulo é apresentada a parte técnica do módulo. A Figura 7.2 apresenta o ciclo de funcionamento para a classificação, onde o estudante ao utilizar o sistema resulta em um estudate com o perfil determinado e conhecido pelo sistema. 7.1 Módulo na Etapa de Treinamento Nesta etapa a utilização do sistema teve como objetivo coletar os dados dos estudantes que participaram dos cursos oferecidos. Estes dados, armazenados em arquivos de log e convertidos em arff foram utilizados na geração das regras de classificação. A Figura 7.1 apresenta o funcionamento do processo. Figura 7.1: Modelo de funcionamento na Etapa de Treinamento Inicialmente, o estudante utiliza o sistema(1), durante a navegação os dados são

46 7.2 Modelo de Funcionamento na Etapa de Uso 43 armazenados(2) em forma de logs. Quanto existir uma quantidade suficiente de dados, os mesmos são convertidos para formato arff, sendo feita a solicitação (3) para o módulo criar as regras de classificação. Ao receber a solicitação o módulo faz a leitura do arquivo arff, executa o algortimo de classificação e as regras são geradas (4). Os padrões descobertos são armazenados pelo módulo e o sistema é informado (5) do sucesso, ou fracasso, da geração das regras. 7.2 Modelo de Funcionamento na Etapa de Uso Após a etapa da Seção 7.1, o módulo está preparado para executar a classificação dos novos estudantes. Este processo acontece como é apresentado na Figura 7.2. Figura 7.2: Modelo de funcionamento do Módulo Classificador O Estudante, sem classificação, faz a utilização do sistema(1) de forma livre(sem um direcionamento para um determinado perfil), após o sistema coletar uma quantidade necessária de dados(esta quantidade de dados pode variar de sistema para sistema, no trabalho proposto são necessários os dados cadastrais para a primeira classificação) e armazená-los em arquivos de log(2) eles são submetidos ao módulo classificador/minerador(3) para que este seja classificado. Ao classificar o estudante(4), o módulo informa ao sistema o resultado da classificação, assim a interação sistema e usuário passa a ser de um usuário com perfil definido, permitindo que o sistema faça a personalização da navegação(5).

47 7.3 Modelagem do Classificador 44 Após a utilização do sistema por um conjunto de estudantes, é feita a validação dos padrões utilizados na classificação por meio da análise dos resultados da classificação do perfil através do questionário de Felder e Silverman com a classificação feita pelo Módulo Classificador. Caso o algoritmo tenha sucesso na classificação na maioria dos casos, o sistema está pronto para a utilização e classificação dos estudantes. Esta etapa, apesar de construido o sistema e a comunicação entre módulo e sistema, não foi executada neste trabalho. A não execução desta etapa reflete o atraso do trabalho no processo de coleta de dados, os cursos oferecidos durante o trabalho não conseguiram juntar uma quantidade suficiente de estudantes para separar os dados em duas base, uma para treinamento e outra para teste. A falta de uma base de teste reflete em uma árvore de classificação que pode não classificar futuros dados corretamente, sendo necessário um novo processo de coleta e validação das regras de classificação. 7.3 Modelagem do Classificador A estrutura do módulo classificador é simples. Ele possui uma interface, pela qual o sistema utiliza seus recursos, que garante a compatibilidade dos algoritmos implementados no módulo com o sistema. A interface ainda permite que o algoritmo utilizado possa ser alterado em tempo de execução, não necessitando recompilação de código, uma técnica de padrão de projetos conhecida como estratégia [Freeman e Freeman 2005]. A Figura 7.3 mostra a modelagem da interface e uma implementação do algoritmo J48. Todas as outras implementações de classificação são implementadas respeitando a regra da interface, com isto a compatibilidade de classificadores futuros é garantida. O sistema que utiliza o módulo classificador deve possuir um objeto do tipo interface, será com ele que ocorrerá a interação do sistema com o módulo. Com o objeto do sistema inicializado toda a comunicação entre sistema e módulo é realizada através dele, será ele que receberá os pedidos e entregará as respostas. Como dito anteriormente, o objeto poderá se portar ora como um classificador do tipo J48 e ora como um outro algoritmo qualquer, desde que implementado, bastando para isto o sistema solicitar.

48 7.3 Modelagem do Classificador 45 Figura 7.3: Modelagem do Módulo Classificador Interface do Classificador A interface Classificador é responsável por garantir a compatibilidade das implementações de classificação com o sistema. Utilizando o padrão Estratégia, a interface garante que todas as implementações para cada algoritmo sejam compatíveis com o sistema, pois o sistema faz sua implementação com base na interface. Além da compatibilidade que o padrão Estratégia garante, ele permite que a instância do objeto possa ser alterada em tempo de execução, isto é, permite que os objetos sejam intercambiáveis atráves da interface comum[freeman e Freeman 2005]. Esta flexibilidade permite que o sistema decida, dentre as implementações existentes, qual algoritmo classificador irá utlizar e caso não esteja satisfeito com um determinado algoritmo permite que seja alterado sem precisar de recompilações de código. A interface é definida por três métodos principais. Nas próximas seções os métodos são explicados, sendo que na parte da interface eles não são implementados O método classificar(int) : int Este método é responsável por classificar o estudante. O id do estudante, o mesmo id da base de dados onde está cadastrado o estudante, é passado ao método que executa o

49 7.3 Modelagem do Classificador 46 algoritmo de classificação. Este método na realidade não faz a classificação, ele apenas faz a chamada ao código classificador. Este método só está disponível após a chamada do método gerarregras(), isto porque existe a dependência da existência das regras para que seja possível a classificação O Método gerarregras(string=null) : int Neste método os dados armazenados são utilizados para a geração da árvore de decisão. A árvore é gerada com base no arquivo de dados informado para o método, caso não seja informado, nenhum arquivo será utilizado e o arquivo indicado pela variável da classe datasource será utilizado O Método getnome(void) : string Este método consiste em informar ao sistema qual o algoritmo que está sendo utilizado para a classificação. Isto possibilita que o sistema saiba qual método está sendo utilizado, dando um maior controle ao sistema para alternar os métodos O Método setdatasource(string) : void Este método é responsável por definir o arquivo base que o classificador deve usar. Para que as regras de classificação sejam geradas é necessário que o arquivo arff seja passado para o módulo. O arquivo pode ser passado na execução do método gerarregras ou por meio deste método. É possível, ainda, para cada algoritmo classificador, determinar um arquivo arff, para isso ao alterar o tipo de algoritmo deve-se indicar o arquivo arff e executar o método gerarregras O Método setclassificador(classificador) : A alteração do algoritmo que executa a classificação é feita através deste método. Quando o sistema sente a necessidade de trocar de algoritmo, ele faz a chamada ao método para tal.

50 7.4 Estrutura de Comunicação Estrutura de Comunicação A estrutra de comunicação entre o sistema e o módulo definem todos os componentes envolvidos no processo de passagem dos dados para o módulo classificador à classificação dos estudantes. Um esquema pode ser visto na Figura 7.4. Figura 7.4: Comunicação entre os componentes do processo Na Figura 7.4, o Sistema solicita ao script a criação do arquivo arff, após o processo de transformação é retornado ao Sistema o resultado da operação, podendo ser sucesso ou fracasso em caso de erro sendo que o script informa qual o problema encontrado. Em caso de sucesso, o Sistema pode fazer uma solicitação para a criação das regras de classificação ao Módulo Classificador. Para que seja possível gerar as regras o sistema fornece o arquivo arff gerado na interação com o script e aguarda um retorno do Módulo. Ao receber a solicitação de criação das regras o Módulo Classificador verifica qual algoritmo está ativo e faz a solicitação das regras de classificação. Caso o algoritmo ativo tenha sucesso na geração das regras ele informa ao Módulo Classificador que foi possível gerar as regras, mas não informa as regras em si, ele apenas é informado sobre o sucesso, ou fracaso, na geração das regras. Caso exista algum tipo de erro o Sistema é informado apenas com um retorno vázio. Os métodos implementados da interface estão no Classificador, sendo que para cada algoritmo existe um Classificador com os métodos implementados.

51 7.5 O Classificador J48 48 Durante o processo de classificação o Sistema pode solicitar ao Módulo Classificador a mudança do algoritmo ativo para a classificação, isto é feito dentro do Sistema (apenas instânciando o novo tipo), sendo que a cada mudança de algortimo é necessário informar ao algortimo instanciado os dados para a geração das regras de classificação. Após a geração das regras, o Sistema pode realizar solicitações de classificação de estudantes. Caso a classificação tenha sucesso é retornado ao apenas a classificação do usuário (se visual ou verbal), e em caso de erro é retornado vázio para o Sistema. Neste modelo o Classificador não faz um controle sobre os dados, ele apenas recebe os dados do sistema e faz as classificações necessárias. Isto deixa o módulo mais flexível e dispensa alterações para ser adaptado em outros sistemas, pois a estrutura dos arquivos arff é definida pelo Sistema que utiliza o módulo. 7.5 O Classificador J48 A utilização deste algortimo, descrito na Seção no Módulo Classificador é feita através da implementação da interface padrão para comunicação entre o sistema e o módulo. Esta implementação deve respeitar o padrão Singleton. O Singleton é um padrão para garantir que existirá apenas uma instância de um determinado objeto. Garantir que cada objeto tenha apenas uma instância significa que cada tipo de classificador só existirá uma vez, então não poderá ocorrer a existência de duas instâncias do Classificador J48. Esta técnica evita a redundância de dados e, por conseqüência, problemas de memória que possam ocorrer. Nas sub-seções seguintes são apresentados trechos da implementação do Classificador J48. Além de se respeitar o padrão Singleton, deve-se implementar os métodos da interface Classificador. A implementação destas classes são descritas nas próximas subseções O método classificar(int) : int O método classificar realiza a busca do estudante na base de dados e faz a leitura dos seus dados. Com os dados armazenados o método chama o programa que possui o código de classificação e passa os dados obtidos. O retorno da chamada ao programa de classificação é retornada pelo método. O retorno consiste apenas em um inteiro que determina qual

52 7.5 O Classificador J48 49 perfil o usuário está enquadrado, 0 para verbal e 1 para visual O Método gerarregras(string=null) : int Este método é responsável por criar um programa classificador. Este programa classificador é chamado pelo método classificar() e fica externo ao módulo classificador. O programa é criado com o auxílio da API do Weka, e redirecionado para um arquivo. Quando o programa é gerado o método faz sua compilação e ele está pronto para ser utilizado. Toda vez que este método é chamado um novo programa, com novas regras de classificação, é gerado. A Tabela 7.1 apresenta um trecho do código deste método, onde os dados do arquivo arff são utilizados para gerar as regras de classificação. Tabela 7.1: Exemplo de algoritmo para gerar árvore de decisão.... if(ds == ) ds = this->datasource; DataSource datas = new DataSource(ds); Instances data = datas.getdataset(); data.setclassindex(5); J48 tree = new J48(); tree.buildclassifier(data); O Método getnome(void) : string Este método tem como código apenas o retorno do nome do classificador, este nome é atribuido na inicialização da instância do objeto, a Tabela 7.2 mostra o retorno do método. O acesso direto à variável name por parte do sistema não é permitida, devido às regras de orientação à objetos. Tabela 7.2: Exemplo de retorno do nome do classificador.... return this->name;...

53 7.6 API Weka O Método setdatasource(string) : void Este método segue o príncipio de modularização do método getnome, sendo que ele é responsável apenas por atribuir à variável datasource um valor passado pelo sistema. A Tabela 7.3 apresenta a atribuição. É importante lembrar que, apesar do tipo String da variável o conteúdo é o arquivo arff construído na etapa de transformação. Tabela 7.3: Exemplo de atribuição dos dados, em formato arff.... this->datasource = datasource; API Weka A construção do módulo classificador será baseado na API do Weka. Esta API fornece todos os recursos disponíveis no programa Weka, sendo que a interface é utilizando métodos e classes e não de forma visual como no programa. O conjunto de classes fornecem mecanismos para a construção de todos classificadores disponíveis, inclusive pode-se utilizá-los para gerar regras de classificação. Este será o mecanismo para encontrar as regras de classificação, o módulo classificador irá utilizar os recursos da API para gerar as regras de classificação, e com base nas regras de classificação construir o programa para classificar os estudantes.

54 51 8 Resultados Neste capítulo são apresentados os dados coletados durante os cursos ministrados, a árvore gerada através destes dados e uma análise sobre a árvore. Na Seção 8.1 são apresentados os dados armazenados dentro do arquivo arff pelo script que converteu os logs para arff, a Seção 8.2 mostra o resultado apresentado pelo algoritmo J48 para os dados coletados. A Seção 8.4 apresenta os resultados do algortimo BFTree e a Seção 8.5 do algoritmo NBTree, e por fim a Seção 8.3 faz uma análise dos dados coletados com a árvore gerada. 8.1 Dados Coletados Os dados coletados e suas divisões são apresentados nesta seção. Os logs coletados que não possuíam alguma das informações foram considerados não válidos para a análise, então aqui são listados apenas os logs com todos os dados necessários. Logs não válidos são aqueles com dados faltantes, como por exemplo o perfil do estudante, navegações do estudante e dados pertencentes a etapa de cadastro. Dos 50 logs coletados, 45 possuíam todas as informações necessárias, sendo que os outros 5 não tinham todos os dados, estes logs com dados incompletos foram considerados como dados inválidos portanto, não utilizados. O processo de transformar os dados dos arquivos de log em um arquivo arff pode ser visto na Seção 6.7, a seguir são apresentados as estatísticas dos dados coletados. A Tabela 8.1 apresenta a divisão dos estudantes em relação ao sexo. Nem todas as turmas apresentaram uma divisão equilibrada entre homens e mulheres, mas o resultado final apresenta um certo equilíbriode homens e mulheres nos cursos, sendo que existe uma predominância masculina. Sexo Masculino(M) 28 Feminino(F) 17 Tabela 8.1: Quantidade em relação ao Sexo. A Tabela 8.2 apresenta a variação da idade dos estudantes, a média de idade

55 8.1 Dados Coletados 52 dos estudantes ficou nos 22 anos, sendo que não existia nenhum estudante acima de trinta anos, mas haviam estudantes menores de idade. Idade Minima 17 Máxima 29 Média Tabela 8.2: Variação da idade dos estudantes. Nem todos os estudantes avaliados estavam cursando um curso pós-médio 1 ou de graduação na época do curso. Nos casos onde os estudantes não estavam cursando nenhum curso eles já eram formados em algum. Quando era informado ao sistema que o semestre corrente do estudante era 0(zero), isto significava que o estudante era formado, sendo que na amostra todos que não cursavam já haviam cursado um. A Tabela 8.3 apresenta a distribuição dos estudantes que estavam cursando algum curso pós-médio ou superior. Dos estudantes analisádos, haviam estudantes entre o primeiro e o sexto semestre, sendo que a média dos semestres ficou no segundo semestre, isto é, a maioria dos estudantes estavam no início de seus cursos. Semestre Minimo 1 Máximo 6 Média 2.5 Tabela 8.3: Em relação ao estudo. Dos estudantes analisados, a maioria possuia algum emprego fixo. O questionário de cadastro não diferenciava o tipo de atividade, mas apenas se era exercido algum tipo de trabalho remunerado ou não, estágio e bolsa trabalho foram considerados como empregos, devido as responsabilidades e rotinas similares a qualquer trabalho fixo. A Tabela 8.4 apresenta o resultado dos dados, sendo que 32 estavam empregados na época(sim) e 13 não estavam empregados(não). Além das páginas disponíveis para navegação era possível realizar ações para ampliar as imagens, estas ações eram consideradas como utilização de recursos visuais. 1 Pós-médio são cursos destinados à alunos que concluíram o ensino médio. Entretanto, estes cursos não podem ser considerados como superiores

56 8.1 Dados Coletados 53 Empregado Sim(S) 32 Não(N) 13 Tabela 8.4: Quantidade de estudantes que exerciam algum trabalho remunerado na época do curso. As ações eram armazenadas nos arquivos de log, sendo o nome da imagem indicada, mas durante a leitura dos dados para a criação do arquivo arff esta informação era ignorada. Para a criação do arquivo arff o que deveria ser levado em consideração era a utilização, ou não, destes recursos e não a quantidade de vezes utilizados ou quais foram utilizados. A Tabela 8.5 apresenta a quantidade de estudantes que utilizaram os recursos visuais. Recursos Visuais Sim(S) 44 Não(N) 1 Tabela 8.5: Utilização dos recursos visuais. Além dos recusos visuais, os estudantes tinham a disposição recursos textuais. Estes recursos eram opções para a descrição de termos que poderiam ser desconhecidos pelos estudantes. Estas descrições eram disponibilizadas através de links para os estudantes. A Tabela 8.6 apresenta a utilização destes recursos por parte dos estudantes. Recursos Textuais Sim(S) 9 Não(N) 36 Tabela 8.6: Utilização dos recursos textuais. Durante a navegação os estudantes podiam escolher entre uma página visual ou verbal. Estas escolhas foram mapeadas e, durante o processo de transformação dos dados( pelo script que converteu os logs em arquivo arff) para cada página visual escolhida era somado uma unidade ao valor de páginas visitadas, e quando era selecionada uma página verbal uma unidade era diminuida do mesmo valor. O resultado final deste cálculo resultou na preferência dos estudantes por um dos conjuntos de páginas. Os resultados mostraram que estudantes visuais também utilizam páginas verbais e vice-versa. Com isto, pode-se dizer que o sistema deve disponibilizar páginas verbais quando necessário.

57 8.2 Árvore Gerada 54 Páginas Visitadas Minimo -2 Máximo 6 Média 3 Tabela 8.7: Cálculo da tendência de páginas visitadas pelos estudantes. Em relação aos perfis coletados os estudantes apresentaram uma maioria de perfis visuais como pode ser observado na Tabela 8.8. Apenas dois estudantes não possuiam este perfil, a análise dos resultados obtidos pode ser visto na Seção 8.3 Entrada de Dados Visual 43 Verbal 2 Tabela 8.8: Resultado do perfil com base na entrada de dados. 8.2 Árvore Gerada Os dados coletados foram submetidos ao algoritmo J48, como descrito na Capítulo 7. A árvore gerada é a responsável por classificar os próximos estudantes, ela pode ser vista na Figura 8.2. Como pode ser observado, a árvore é composta de cinco nós, sendo 3 folhas o que significam 3 possibilidades de se classificar o estudante dentro das duas opções. Os nós folhas com os resultados da classificação do estudante são compostos por dois nós com a classificação visual e um nó com a verbal. Figura 8.1: Árvore gerada com os dados coletados.

58 8.3 Análise dos Dados Coletados e da Árvore Obtida 55 O estudante, à ter seus dados submetidos para classificação, terá verificada sua variável de páginas visitadas, caso o resultado seja maior ou igual à -1 o estudante é classificado como visual, caso contrário outra verificação é feita. Caso a afirmativa do nó raíz seja falsa, o próximo dado a ser analisado é o acesso aos recursos textuais do sistema, caso o estudante faça uso dos recursos textuais ele será classificado como verbal, caso contrário será visual. Para este algoritmo a taxa de acerto na classificação foi de 100% dos estudantes, sendo que a Tabela 8.9 apresenta a matriz confusão (confusion matrix), sendo que dois estudantes foram classificados como verbal e quarenta e três estudantes como visual. verbal visual verbal 2 0 visual 0 43 Tabela 8.9: Matrix confusão para o algoritmo J Análise dos Dados Coletados e da Árvore Obtida De todos os dados coletados o que mais chama a atenção é a classificação dos estudantes, com base no questionário de Felder-Silverman, dentro de seus perfis. A maioria dos estudantes, 43 dos 45, possuem a visão visual, da dimensão Entrada de Dados. Este resultado mostra a influência do desenvolvimento tecnológico no dia-à-dia do estudante, a Internet, telefone, tv e outros componentes tecnológicos tem como característica evolucionária disponibilizar imagens para seus usuários. Atualmente as imagens tornaram-se a forma mais avançada que um meio de comunicação pode transmitir informação, como a tv foi a evolução do rádio a video conferência promete ser a evolução do telefonema. Este contexto visual acaba por influênciar o estudante a esta tendência visual, e somado ao baixo indíce de leitura entre os brasileiros e outros povos, pode-se dizer que o perfil verbal está em desuso. Outro ponto relevante a ser tocado, os estudantes classificados como verbais apresentaram uma pequena tendência para este perfil. Das páginas visitadas por estes estudantes muitas foram com conteúdo visual, isto mostra que estes estudantes não possuem a visão verbal muito forte. Contudo, os estudantes visuais apresentaram um indíce de consulta à páginas verbais com certa freqüência, como mostra a média de páginas

59 8.4 BFTree 56 visitadas da Tabela 8.7, isto indica que mesmo a maioria possuir uma tendência visual, não existe um extremismo para este lado. Como apresentado na Figura 8.1, o pequeno tamanho da árvore está relacionada com o pequeno indice de estudantes com perfil verbal. Esta pequena quantidade de indivíduos verbais diminui a capacidade do algoritmo de encontrar padrões que diferenciam estas duas visões, limitando a árvore. Como a maioria dos estudantes tem o perfil visual, é possível inclusive desconsiderar para esta dimensão a classificação do estudante e sempre considerar que este pertence à visão visual. Esta classificação automatica dos estudantes pode ser alterada com o passar do tempo, após uma coleta de dados pode-se submeter os dados de um estudante ao algoritmo e obter a classificação com base neste algoritmo. Além da classificação realizada com o algortimo J48, mais duas árvores foram geradas a partir dos dados coletados. O objetivo destas árvores geradas com outros algoritmos é, além de possibilitar uma flexibilidade na escolha de quem irá classificar, é comparar os algortimos, em relação a eficiência e padrões gerados para classificação. 8.4 BFTree Diferente do J48, o BFTree, descrito na Seção 3.2.2, levou em consideração a idade dos usuários como parâmetro para classificação. Como pode ser visto na Figura 8.2, após verificar as páginas visitadas o algoritmo leva em consideração que estudantes de idade menor tenham uma tendência verbal, na dimensão de Entrada de Dados. A classificação utilizando este algoritmo teve um acerto de 95%, inferior em eficiência se comparado ao J48. Como pode ser visto na matriz de confução na Tabela 8.4 todos os usuários foram classificados como visuais. visual verbal visual 43 0 verbal 2 0 Tabela 8.10: Matriz confusão para o algoritmo BFTree O resultado da árvore, levando em conta que estudantes com menor idade tentem à visão verbal, mostra que estudantes com idade inferior à 22 anos tendem a

60 8.5 NBTree 57 Figura 8.2: Árvore gerada com o algoritmo BFTree. preferir uma abordagem verbal do assunto. Este resultado pode estar relacionado com os vestibulares necessários para o ingresso em instituições de ensino superior. A árvore também mostra que o ensino médio pode ter uma tendência maior para o lado verbal em relação aos cursos superiores. 8.5 NBTree O resultado gerado pelo algortimo BFTree, descrito na Seção 3.2.3, é um hibrido de árvore de decisão com bayes net 2. O resultado obtido foi uma árvore com apenas um nó, como pode ser visto na Figura 8.3. Para este caso, o algoritmo apresenta não apenas a árvore gerada mas uma probabilidade de classificação correta. Figura 8.3: Árvore gerada com o algoritmo NBTree. Caso o resultado do primeiro nó seja verdadeiro, existe uma probabilidade de 27% de que o estudante seja verbal, e uma probabilidade de 73% para que seja visual. Para 2 Técnica de classificação através das teorias baysianas.

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

3 Ferramentas de busca

3 Ferramentas de busca 3 Ferramentas de busca A Internet se transformou em um vasto repositório de informações. Podemos encontrar sites sobre qualquer assunto, de futebol a religião. O difícil, porém é conseguir encontrar a

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

3 OOHDM e SHDM 3.1. OOHDM

3 OOHDM e SHDM 3.1. OOHDM 32 3 OOHDM e SHDM Com a disseminação em massa, desde a década de 80, de ambientes hipertexto e hipermídia, principalmente a Web, foi identificada a necessidade de elaborar métodos que estruturassem de

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Taxonomia da aprendizagem

Taxonomia da aprendizagem Taxonomia da aprendizagem Taxonomia de Bloom Desde 1948, um grupo de educadores assumiu a tarefa de classificar metas e objetivos educacionais. Eles propuseram-se a desenvolver um sistema de classificação

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

Uma Aplicação de Ensino Orientada a Agentes na Internet

Uma Aplicação de Ensino Orientada a Agentes na Internet 1 de 5 22/7/2008 17:14 Uma Aplicação de Ensino Orientada a Agentes na Internet Adriana Soares Pereira Cláudio Fernando Resin Geyer adriana@inf.ufrgs.br Resumo Este trabalho apresenta uma proposta de desenvolvimento

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Metas de um Sistema Distribuído

Metas de um Sistema Distribuído Metas de um Sistema Distribuído Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia do

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

Interface Homem- Computador

Interface Homem- Computador Interface Homem- Computador (IHC) Profª. Leticia Lopes Leite Software Educacional I Interface Deve ser entendida como sendo a parte de um sistema computacional com a qual uma pessoa entra em contato física,

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

A RELAÇÃO ENTRE OS ESTILOS DE APRENDIZAGEM DE RICHARD FELDER E OS TIPOS PSICOLÓGICOS DE CARL JUNG

A RELAÇÃO ENTRE OS ESTILOS DE APRENDIZAGEM DE RICHARD FELDER E OS TIPOS PSICOLÓGICOS DE CARL JUNG A RELAÇÃO ENTRE OS ESTILOS DE APRENDIZAGEM DE RICHARD FELDER E OS TIPOS PSICOLÓGICOS DE CARL JUNG Cláudia M. S. Senra Geraldo F. C. A. de Lima Fábio W. O. da Silva Centro Federal de Educação Tecnológica

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

Análise e Projeto de. Aula 01. Profa Cristiane Koehler cristiane.koehler@canoas.ifrs.edu.br

Análise e Projeto de. Aula 01. Profa Cristiane Koehler cristiane.koehler@canoas.ifrs.edu.br Análise e Projeto de Sistemas I Aula 01 Profa Cristiane Koehler cristiane.koehler@canoas.ifrs.edu.br Análise e Projeto de Sistemas I Horário das Aulas: 2as feiras das 10h10 às 11h40 e 5as feiras das 08h25

Leia mais

ANÁLISE E DESENVOLVIMENTO DE SISTEMAS TURMA 2008 4º PERÍODO - 7º MÓDULO AVALIAÇÃO A4 DATA 22/10/2009 ENGENHARIA DE USABILIDADE

ANÁLISE E DESENVOLVIMENTO DE SISTEMAS TURMA 2008 4º PERÍODO - 7º MÓDULO AVALIAÇÃO A4 DATA 22/10/2009 ENGENHARIA DE USABILIDADE ANÁLISE E DESENVOLVIMENTO DE SISTEMAS TURMA 2008 4º PERÍODO - 7º MÓDULO AVALIAÇÃO A4 DATA 22/10/2009 ENGENHARIA DE USABILIDADE 2009/2 GABARITO COMENTADO QUESTÃO 1: Quando nos referimos à qualidade da interação

Leia mais

Revista Mundo PM Edição dez/2007-jan/2008

Revista Mundo PM Edição dez/2007-jan/2008 Revista Mundo PM Edição dez/2007-jan/2008 Paula Geralda Barbosa Coelho Torreão paula@cleverpal.com Recife, 02 de setembro de 2008 Motivação Treinamento como ferramenta de desenvolvimento da equipe de projeto

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

Sistemas de Banco de Dados Aspectos Gerais de Banco de Dados

Sistemas de Banco de Dados Aspectos Gerais de Banco de Dados Sistemas de Banco de Dados Aspectos Gerais de Banco de Dados 1. Conceitos Básicos No contexto de sistemas de banco de dados as palavras dado e informação possuem o mesmo significado, representando uma

Leia mais

Médio Integrado Aula 01 2014 Thatiane de Oliveira Rosa

Médio Integrado Aula 01 2014 Thatiane de Oliveira Rosa Aplicativos Web e Webdesign Aula 01 2014 Thatiane de Oliveira Rosa 1 Roteiro Apresentação da disciplina e Introdução ao HTML Desenvolvimento de Web sites e Sistemas Web; Projeto de sites web; 2 Quem é

Leia mais

ANÁLISE DE SITES EDUCACIONAIS PELO PROFESSOR E PELO ALUNO

ANÁLISE DE SITES EDUCACIONAIS PELO PROFESSOR E PELO ALUNO Análise do professor: Parâmetros para avaliação Ao navegar por Web sites é importante observar alguns tópicos para determinar se um site é bom ou não. Navegação, design, conteúdo, velocidade de acesso,

Leia mais

1 UML (UNIFIED MODELING LANGUAGE)

1 UML (UNIFIED MODELING LANGUAGE) 1 UML (UNIFIED MODELING LANGUAGE) Segundo Tonsig (2003), para conseguir desenvolver um software capaz de satisfazer as necessidades de seus usuários, com qualidade, por intermédio de uma arquitetura sólida

Leia mais

EVOLUÇÃO DE SOFTWARE

EVOLUÇÃO DE SOFTWARE EVOLUÇÃO DE SOFTWARE Dinâmica da evolução de programas Manutenção de software Processo de evolução Evolução de sistemas legados 1 Mudança de Software 2 Manutenção de software Mudança de software é inevitável

Leia mais

Unidade 4: Contextualização de Objetos de Aprendizagem

Unidade 4: Contextualização de Objetos de Aprendizagem Coordenação: Juliana Cristina Braga Autoria: Rita Ponchio Você aprendeu na unidade anterior a importância da adoção de uma metodologia para a construção de OA., e também uma descrição geral da metodologia

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Unified Modeling Language UML - Notações

Unified Modeling Language UML - Notações Unified Modeling Language UML - Notações Prof. Ms. Elvio Gilberto da Silva elvio@fmr.edu.br UML Ponto de Vista É gerada com propósito geral de uma linguagem de modelagem visual usada para especificar,

Leia mais

RSS no desenvolvimento de uma Central de Notícias

RSS no desenvolvimento de uma Central de Notícias RSS no desenvolvimento de uma Central de Notícias Darley Passarin 1, Parcilene Fernandes de Brito 1 1 Sistemas de Informação Centro Universitário Luterano de Palmas (CEULP/ULBRA) Palmas TO Brasil darley@centralrss.com.br,

Leia mais

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis Gabriel Galvão da Gama 1 ; Reginaldo Rubens da Silva 2 ; Angelo Augusto Frozza 3 RESUMO Este artigo descreve um projeto

Leia mais

Características do Software

Características do Software Questionamentos Por que tanta demora para entregar? Por que os prazos se atrasam? Por que os custos são altos? Por que não achar todos os erros antes de entregar? Por que dificuldade em medir o progresso

Leia mais

MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES. MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com. URL: http://esganarel.home.sapo.

MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES. MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com. URL: http://esganarel.home.sapo. MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com URL: http://esganarel.home.sapo.pt GABINETE: 1G1 - A HORA DE ATENDIMENTO: SEG. E QUA. DAS 11H / 12H30 (MARCAÇÃO

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Engenharia de Software I

Engenharia de Software I Engenharia de Software I Rogério Eduardo Garcia (rogerio@fct.unesp.br) Bacharelado em Ciência da Computação Aula 05 Material preparado por Fernanda Madeiral Delfim Tópicos Aula 5 Contextualização UML Astah

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

A Computação e as Classificações da Ciência

A Computação e as Classificações da Ciência A Computação e as Classificações da Ciência Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Classificações da Ciência A Computação

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS INTRODUÇÃO À COMPUTAÇÃO 60 h 1º Evolução histórica dos computadores. Aspectos de hardware: conceitos básicos de CPU, memórias,

Leia mais

Banco de Dados 1 Prof. MSc Wagner Siqueira Cavalcante

Banco de Dados 1 Prof. MSc Wagner Siqueira Cavalcante Banco de Dados 1 Programação sucinta do curso:. Conceitos fundamentais de Banco de Dados.. Arquitetura dos Sistemas Gerenciadores de Banco de Dados (SGBD ou DBMS).. Características típicas de um SGBD..

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Algoritmos: Lógica para desenvolvimento de programação de computadores. Autor: José Augusto Manzano. Capítulo 1 Abordagem Contextual

Algoritmos: Lógica para desenvolvimento de programação de computadores. Autor: José Augusto Manzano. Capítulo 1 Abordagem Contextual Algoritmos: Lógica para desenvolvimento de programação de computadores Autor: José Augusto Manzano Capítulo 1 Abordagem Contextual 1.1. Definições Básicas Raciocínio lógico depende de vários fatores para

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Programação Orientada a Objetos Prof. Rone Ilídio UFSJ/CAP

Programação Orientada a Objetos Prof. Rone Ilídio UFSJ/CAP Programação Orientada a Objetos Prof. Rone Ilídio UFSJ/CAP 1) Introdução Programação Orientada a Objetos é um paradigma de programação bastante antigo. Entretanto somente nos últimos anos foi aceito realmente

Leia mais

Data Mining na Web para Inteligência Competitiva

Data Mining na Web para Inteligência Competitiva Data Mining na Web para Inteligência Competitiva Simone de Almeida (CEFET/PR) simonea@pg.cefetpr.br Rui Francisco Martins Marçal (CEFET/PR) marcal@pg.cefetpr.br Luciano Scandelari (CEFET/PR) luciano@cefetpr..br

Leia mais

XDR. Solução para Big Data.

XDR. Solução para Big Data. XDR Solução para Big Data. ObJetivo Principal O volume de informações com os quais as empresas de telecomunicações/internet têm que lidar é muito grande, e está em constante crescimento devido à franca

Leia mais

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 Rational Quality Manager Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 1 Informações Gerais Informações Gerais sobre o RQM http://www-01.ibm.com/software/awdtools/rqm/ Link para o RQM https://rqmtreina.mvrec.local:9443/jazz/web/console

Leia mais

RECONHECIMENTO DE PADRÕES RECONHECIMENTO DE VOZ

RECONHECIMENTO DE PADRÕES RECONHECIMENTO DE VOZ RECONHECIMENTO DE PADRÕES RECONHECIMENTO DE VOZ O ESQUEMA DE CLASSIFICAÇÃO É GERALMENTE BASEADO NA DISPONIBILIDADE DE UM CONJUNTO DE PADRÕES QUE FORAM ANTERIORMENTE CLASSIFICADOS, O "CONJUNTO DE TREINAMENTO";

Leia mais

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO FUNDAÇÃO UNIVERSIDADE DO TOCANTINS CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO Identificação do Curso Nome do Curso: Sistemas de Informação Titulação: Bacharelado Modalidade de ensino: Presencial

Leia mais

CAPÍTULO 4. AG8 Informática

CAPÍTULO 4. AG8 Informática 2ª PARTE CAPÍTULO 4 Este capítulo têm como objetivo: 1. Tratar das etapas do projeto de um Website 2. Quais os profissionais envolvidos 3. Administração do site 4. Dicas para não cometer erros graves na

Leia mais

Uso de Técnicas de Data mining no Monitoramento de Alunos On-line *

Uso de Técnicas de Data mining no Monitoramento de Alunos On-line * Uso de Técnicas de Data mining no Monitoramento de Alunos On-line * Fabrício Rangel Cunha Rafael Lucena Pessoa de Araújo Neide dos Santos neide@ime.uerj.br Resumo A Internet oferece amplas possibilidades

Leia mais

Módulo 6: Inteligência Artificial

Módulo 6: Inteligência Artificial Módulo 6: Inteligência Artificial Assuntos: 6.1. Aplicações da IA 6.2. Sistemas Especialistas 6.1. Aplicações da Inteligência Artificial As organizações estão ampliando significativamente suas tentativas

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios?

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? RESUMO DA SOLUÇÃO CA ERwin Modeling Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? O CA ERwin Modeling fornece uma visão centralizada das principais definições de

Leia mais

SISTEMAS INTELIGENTES DE APOIO À DECISÃO

SISTEMAS INTELIGENTES DE APOIO À DECISÃO SISTEMAS INTELIGENTES DE APOIO À DECISÃO As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas

Leia mais

CURSO DE SISTEMAS DE INFORMAÇÃO

CURSO DE SISTEMAS DE INFORMAÇÃO 1 CURSO DE SISTEMAS DE INFORMAÇÃO EMENTÁRIO DAS DISCIPLINAS 2011.1 BRUSQUE (SC) 2015 2 SUMÁRIO 1ª FASE... 4 01 ARQUITETURA DE COMPUTADORES... 4 02 FILOSOFIA... 4 03 FUNDAMENTOS MATEMÁTICOS PARA COMPUTAÇÃO...

Leia mais

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de Técnicas e Aplicações na Área Bancária São Paulo 2011 FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de

Leia mais

Engenharia de Software Introdução. Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 1

Engenharia de Software Introdução. Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 1 Engenharia de Software Introdução Ricardo Argenton Ramos UNIVASF Engenharia de Software I - Aula 1 Tópicos Apresentação da Disciplina A importância do Software Software Aplicações de Software Paradigmas

Leia mais

Engenharia de Software

Engenharia de Software Engenharia de Software Requisitos de Software Prof. MSc. Edilberto Silva prof.edilberto.silva@gmail.com http://www.edilms.eti.br Requisito O que é um REQUISITO? Em software: É a CARACTERIZAÇÃO do que o

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados Neste capítulo serão descritos alguns modelos para o design de sistemas interativos e suas limitações, apontando as motivações práticas e teóricas para se criar novas representações

Leia mais

Softwares educativos com tecnologias Multimídia: uma ferramenta para apoio ao ensino da Matemática

Softwares educativos com tecnologias Multimídia: uma ferramenta para apoio ao ensino da Matemática Softwares educativos com tecnologias Multimídia: uma ferramenta para apoio ao ensino da Matemática Carlos Vitor de Alencar Carvalho1 1 Universidade Severino Sombra, Docente do Programa de Pós-Graduação

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Laboratório de Mídias Sociais

Laboratório de Mídias Sociais Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais parte I Prof. Dalton Martins dmartins@gmail.com Gestão da Informação Universidade Federal de Goiás O que é Análise Textual? Análise

Leia mais

Ferramentas de informações e comunicações e as interações possíveis Tecnologias populares para uma Educação à Distância mais Popular.

Ferramentas de informações e comunicações e as interações possíveis Tecnologias populares para uma Educação à Distância mais Popular. Trabalha de Conclusão do Curso Educação a Distância : Um Novo Olhar Para a Educação - Formação de Professores/Tutores em EaD pelo Portal Somática Educar Ferramentas de informações e comunicações e as interações

Leia mais

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP 1 Data de entrega dos originais à redação em 15/03/2013 e recebido

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

COMO CRIAR MAPAS CONCEITUAIS UTILIZANDO O CMAPTOOLS

COMO CRIAR MAPAS CONCEITUAIS UTILIZANDO O CMAPTOOLS COMO CRIAR MAPAS CONCEITUAIS UTILIZANDO O CMAPTOOLS Luiz Antonio Schalata Pacheco schalata@cefetsc.edu.br Sabrina Moro Villela Pacheco sabrinap@cefetsc.edu.br EDIÇÃO PRELIMINAR Sumário 1 INTRODUÇÃO...3

Leia mais

UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE CIÊNCIA DA COMPUTAÇÃO ENGENHARIA DE SOFTWARE II. Primeiro Trabalho

UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE CIÊNCIA DA COMPUTAÇÃO ENGENHARIA DE SOFTWARE II. Primeiro Trabalho UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE CIÊNCIA DA COMPUTAÇÃO ENGENHARIA DE SOFTWARE II Primeiro Trabalho Descrição do trabalho: Escrever um Documento de Visão. Projeto: Automatização do sistema que

Leia mais

ÁREA DO PROFESSOR (TUTOR)

ÁREA DO PROFESSOR (TUTOR) ÁREA DO PROFESSOR (TUTOR) 2- FÓRUM O fórum serve para avaliar os alunos através da participação na discussão sobre um ou mais assuntos, inserção de textos ou arquivos. Os fóruns de discussão compõem uma

Leia mais