ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS

Tamanho: px
Começar a partir da página:

Download "ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS"

Transcrição

1 ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Abrantes Diniz 1, Fabiano Rosemberg de Moura Silva 2, Roberto Douglas da Costa 3, Thiago Reis da Silva 4, Íthalo Bruno Grigório de Moura 5, Angélica Felix Castro 6 1 Mestrando em Ciência da Computação, UERN/UFERSA, Mossoró - RN, fabio.abrantes.diniz@gmail.com 2 Mestrando em Ciência da Computação, UERN/UFERSA, Mossoró - RN, fabiano.rosemberg.silva@gmail.com 3 Mestrando em Ciência da Computação, UERN/UFERSA, Mossoró - RN, robertodcosta@gmail.com 4 Mestrando em Ciência da Computação, UERN/UFERSA, Mossoró - RN, trsilva.si@gmail.com 5 Mestrando em Ciência da Computação, UERN/UFERSA, Mossoró - RN, 6 Professora Doutora do Departamento de Informática da UFERSA, Mossoró RN, angelicafcastro@ gmail.com RESUMO: O Rio Grande do Norte (RN) é um estado rico em recursos naturais, apresenta um desenvolvimento educacional concentrado em algumas regiões. Diante dessa realidade, este trabalho descreve a distribuição da educação na população do RN, mostrando a sua disparidade entre seus municípios. Logo, foram utilizados alguns indicadores da educação do Instituto Brasileiro de Geografia e Estatística (IBGE), juntamente com o Sistema de Informação Geográfico (SIG) TerraView para a elaboração de mapas, utilizando técnicas do geoprocessamento e da estatística. Além disto, também foram utilizadas técnicas de Mineração de Dados (MD) para identificar padrões que ajudam a caracterizar a qualidade do sistema educacional do RN, mostrando assim, a desigualdade entre seus municípios e evidenciando um desenvolvimento educacional concentrado em algumas regiões. Por fim, os resultados mostram que a maioria dos municípios do RN apresenta qualidade educacional abaixo da meta e que a situação é pior em regiões do estado que possuem pequenas atividades econômicas. PALAVRAS-CHAVE: Sistema de informação geográfico, Mineração de dados, Árvore de decisão. INTRODUÇÃO: O RN é composto por 167 municípios, que se agrupam em quatro mesorregiões e 19 microrregiões (IBGE 2012). De acordo com a Secretaria de Estadual de Educação e Cultura (SEEC), o RN possui 16 Diretorias Regionais de Educação (DIRED) que direcionam as instituições educacionais e mantêm uma rede de escolas do Ensino Fundamental das quais 620 são estaduais, são municipais, 470 são particulares e uma federal. O ensino médio foi ministrado em 420 estabelecimentos, com a matrícula de alunos. Dos discentes, estavam nas escolas públicas e nas particulares (SEEC, 2012). Diante dessa realidade, este artigo tem por objetivo analisar as características do sistema educacional do RN, que enfatizam as diferenças sociais e econômicas entre as regiões mais ricas e as menos desenvolvidas do estado. Para realizar este trabalho foram utilizados os indicadores demográficos e educacionais do RN obtidos através do IBGE, tais como: população em idade escolar, número de matrículas, taxa de escolaridade, aprovação, abandono, reprovação e os índices de desenvolvimento de educação básica (IDEB). Alguns desses indicadores são utilizados na elaboração de algumas análises espaciais, a fim de mostrar a qualidade e a equidade da educação nas redes públicas e privadas em todo o estado do RN. A mineração de dados é definida como um processo de descoberta de padrões nos dados (Fayyad, 1996). Desta forma, sua utilização neste trabalho visa encontrar um padrão comportamental de variáveis que descrevem a distribuição da educação na população do RN. Portanto, para a realização desse estudo aplicou o uso de técnicas de Mineração de Dados (MD) para estimar alguns resultados que demonstram relações significativas entre a educação e o desenvolvimento local. Juntamente, utilizou-se uso das técnicas e ferramentas de geoprocessamento, contida no Sistema de informação Geográfica (SIG) TerraView. Nesta ferramenta foram utilizados os recursos de visualização dos dados espaciais para dar subsídios em tomadas de decisões no setor educativo. A fim de ajudar o Governo

2 em decisões para cumprir e otimizar as metas e objetivos na melhoria do serviço de educação do estado do RN. MATERIAS E MÉTODOS: A área de estudo é o Estado do Rio Grande do Norte, com uma área de aproximadamente km2, dividido politicamente em 167 municípios, com mais de três milhões de habitantes (IBGE, 2012). Foram utilizadas 167 amostras (número de municípios do RN), com seus respectivos dados de educacionais, como o conjunto de treinamento para geração da árvore de decisão. Através da árvore selecionada foi possível extrapolar a estimativa da distribuição da qualidade da educação. Cada amostra possui atributos que trazem informações políticos, sociais e educacionais, referentes ao Estado do RN. As informações referentes ao Estado do RN tais como área, municípios, micro e mesorregiões, população, Índice de Desenvolvimento Humano (IDH), renda domiciliar per capita, entre outras, foram obtidas do Censo Demográfico 2010, através da página do IBGE na Internet. Os atributos utilizados, referentes à educação, foram: as taxas de abandono escolar, aprovação, desempenho médio, o Índice de Desenvolvimento da Educação Básica (IDEB), entre outros, todos obtidos da página da SEEC na Internet e do Censo Escolar Também foram obtidos, da página do IBGE, os mapas nos quais foram utilizadas técnicas de agrupamento - quantil (equipartição de amostras em 5,4 e 3 intervalos, com dos valores da amostra em cada intervalo). Neste estudo, foram utilizadas técnicas de geoprocessamento (BRETERNITZ, 2010) através do software TerraView e dados disponibilizados pelo IBGE e pela SEEC sobre o Estado do RN (SEEC, 2012). O TerraView é um SIG desenvolvido pelo Instituto Nacional de Pesquisas Espaciais (INPE) sobre a biblioteca de geoprocessamento do TerraLib, também desenvolvida pelo INPE e tem como seus principais objetivos oferecer à comunidade um fácil visualizador de dados geográficos com recursos de consulta e análise de dados (INPE 2012). As árvores de decisão são um dos modelos mais simples e mais usados em inferência indutiva. Estas árvores são treinadas de acordo com um conjunto de dados de treinamento previamente classificadas e posteriormente, usa essa árvore para classificar a exatidão do classificador num conjunto de teste. Existem vários algoritmos de classificação que utilizam árvores de decisão. Dependendo do problema, um algoritmo pode ser mais eficiente do que o outro. Dentre os algoritmos, os mais usados são: o ID3, ASSISTANT, C4.5 e CART (Classification and Regression Trees) (DINIZ et. al. 2011). Nesse trabalho foi utilizado o algoritmo C4.5, pois trabalha com valores indisponíveis, com valores contínuos, poda árvores de decisão e não depende de suposições sobre a distribuição dos valores das variáveis ou da independência entre si das variáveis (FAYYAD; PIATESKY-SHAPIRO; SMYTH, 1996). Características cruciais quando se usa dados de SIG juntamente com dados de imagem. A ferramenta utilizada para aplicar a técnica de mineração de dados foi o denominado Weka (Waikato Environment for Knowledge Analysis), da Universidade de Waikato, Nova Zelândia. O pacote Weka possui uma suíte que contém diversas técnicas de mineração de dados, totalmente gratuito por ser um software livre (WEKA, 2012). O Weka usa arquivos de dados de treinamento onde devem ser explicitadas quais variáveis são permitidas para uma relação específica, bem como o tipo de dado de cada variável (isto é, nominal ou valor numérico). O Weka pode detectar padrões em dados que podem ser explorados mediante regras. Das técnicas disponíveis, foi utilizado o algoritmo de indução de árvore de decisão C4.5 desenvolvido por (Quilan 1993) e implementado em sua versão para linguagem Java, no Weka, com o nome J4.8, para gerar árvores de decisão (WEKA, 2012). Para a utilização do conjunto de dados, foi feito um pré-processamento nos dados a fim de torná-los compatíveis com o formato da ferramenta utilizada. O algoritmo de classificação do Weka necessita de atributos preditivos para representar os padrões a serem classificados. Foram utilizados quatro

3 atributos para a descoberta do modelo nesse trabalho, tais como: o IDH, a renda domiciliar per capita, a taxa de abandono escolar e o IDEB. Todos são atributos preditivos que influenciam direta e indiretamente na qualidade da educação em uma determinada região. Além disso, o algoritmo de classificação do Weka precisa de uma variável nominal denominada atributo-classe que classificam os dados. Portanto, foi criado, a partir dos valores dos atributos preditivos, o atributo-classe MetaqualEd (Meta da qualidade da Educação) o qual possui três categorias de valores (acima, media, abaixo) que classifica o nível da meta da qualidade educacional do RN. Caracterizando as instâncias da base de dados como acima, abaixo ou na média da meta nacional, estipulada pelo governo do RN para o nível da qualidade da educação para o ano de RESULTADOS E DISCUSSÃO: Como mencionado, a ferramenta Weka foi utilizada como apoio durante a execução da etapa de MD. As classificações com pequeno número de instâncias (167) evidenciadas na base de dados, a árvore de decisão alcançou 87,5% das instâncias classificadas corretamente. Uma estimativa válida que pode não ter sido a melhor devido ao número reduzido de informação, além do fato de existirem poucas instâncias com prevalência muito alta em relação às outras classes. O classificador foi testado utilizando-se o método de validação cruzada 10- Fold-Cross- Validation para obtenção da proporção de acertos (acurácia). Com a Mineração de Dados, foi possível analisar as diferenças no padrão do conjunto de reações das variáveis em relação à melhora da meta da qualidade da educação nos municípios do RN. Para avaliação das classificações foi utilizada a estatística de Kappa que é um método estatístico que serve para medir a concordância entre diferentes medidas (LANDIS; KOCH, 1977), sendo muito usada para avaliação da precisão, determinada por uma matriz de confusão. Sua grande vantagem é que para o seu cálculo não se incluem somente os elementos da diagonal principal e sim todos os elementos da matriz de erro (MOREIRA, 2001). A classificação desse trabalho gerou um índice de Kappa de aproximadamente 73%. O algoritmo J4.8 possui regras decisão e uma matriz de confusão. Nesse trabalho foi elaborada uma matriz de confusão durante os treinamentos e testes das instâncias (Tabela 1). Analisando a matriz, foram detectados possíveis problemas na classificação e também na separabilidade entre as classes. Classe Real Tabela 1. Matriz de confusão. Classe Prevista Classe = acima Classe = media Classe = abaixo Acima (28) Media (23) Abaixo (116) Observa-se também na Tab. 2 que das 167 instâncias, 146 ( ) são classificadas corretamente, sendo que 21 ( ) instâncias são classificadas incorretamente, 19 ( ) foram classificadas com um erro de classe e 2 (1+1) classificada com dois erros. Para um total de 28 instâncias com classe real rotulada como acima, tiveram 22 instâncias (78,9%) classificadas corretamente, 5 instâncias (17,9%) foram classificadas como media e somente 1 (3,5%) foi classificada como abaixo. Esse resultado pode ser considerado satisfatório, uma vez que os recursos para o melhoramento da educação de uma região são pequenos, e com essa classificação pode transferir boa parte dos recursos da educação destinados a municípios que tiveram uma qualidade da educação acima da meta estipulada para municípios que estão com uma qualidade educacional abaixo do esperado. Já com as instâncias com classe real média, um pouco a mais da metade (56,5%) delas são classificadas corretamente. Esse resultado mostra que mesmo que essas áreas estejam alcançando a média de qualidade da educação, ainda precisam de atenção na melhora do seu sistema educacional, pois podem sofrer baixas se não tiverem o investimento necessário. Já para a classe de prevalência

4 abaixo, foram classificadas corretamente 111 das 116 amostras (96%), sendo que 4 amostras (3,4%) foram classificas como media e apenas 1 amostra (0,6%) de prevalência foi classificada como acima. Esse resultado evidencia a comprovação do padrão, mostrando que o RN precisa melhorar tanto a qualidade do ensino e a infraestrutura da educação como a diminuição da desigualdade social, provando que melhorando a qualidade da educação melhora a qualidade de vida. O algoritmo J4.8 determina a variável com maior quantidade de informação e a coloca na raiz da árvore de decisão. Em cada nó da árvore, foi feita a divisão em conjuntos cada vez mais homogêneos. A variável colocada na raiz da árvore foi IDEBEFfin09 (Índice de Educação Básica do Ensino Funda mental final de 2009), correspondendo à divisão em dois grupos: para valores desta variável menores ou iguais a 3.2 e maiores que 3.2. A Figura 1 mostra a árvore de decisão (obtida a partir do algoritmo J4.8 do Weka) para a prevalência da meta da qualidade da educação em relação a algumas variáveis preditivas que foram selecionadas pelo Weka por conterem maior quantidade de informação. Foram ainda selecionado outras variáveis tais como: índices de desenvolvimento humano (IDH2000), renda domiciliar (renda) e taxa de abandono (TAbanEMed10). Figura 1: Árvore de decisão obtida a partir do algoritmo J4.8 do Weka. O resultado da classificação gerado pela árvore de decisão, acima, pode ser considerado coerente em relação à realidade. Pela análise da árvore vemos a qualidade da educação do Estado do RN esta abaixo da média estabelecida. Dos 167 municípios 115 estão com a qualidade abaixo da média. Seguindo o ramo da árvore até a folha que apresenta o maior número de classes abaixo, os 115 municípios se caracterizam com um IDEB menor que 3.2, IDH menor que 0.7 e taxa de abandono maior que 11.1%. Contrario as metas estabelecidas os quais são possuir um IDEB maior que 3.2, taxa de abandono menor que 10% e IDH na média da nacional que é É apresentado na Figura 2, os dados classificados através das regras da árvore de decisão espacializados num mapa temático utilizando o aplicativo TerraView. Figura 2: Meta da qualidade da educação estimada através da árvore de decisão.

5 Logo, podemos ver que as vantagens de árvore de decisão incluem a capacidade de lidar com dados que estão em diferentes escalas de medidas, não serem necessárias suposições sobre as distribuições de frequência dos dados em cada uma das classes, a flexibilidade e a capacidade de lidar com relações não lineares entre variáveis e classes. E a simplicidade para encontrar os padrões torna essa técnica muito útil nesse trabalho. CONCLUSÕES E TRABALHOS FUTUROS: Esse trabalho demonstrou que o uso de árvore de decisão é fundamental na descoberta de padrões, pois lida com dados de diferentes escalas de medidas e têm a flexibilidade e a capacidade de trabalhar com relações não lineares entre variáveis e classes. Foi possível constatar que a maioria dos municípios Estado do RN apresenta qualidade educacional abaixo da meta e que a situação é pior em regiões do Estado que possuem pequenas atividades econômicas, pois esses municípios apresentam as mais baixas rendas familiares e IDH, além dos investimentos educacionais serem baixos. Como trabalho futuro propõe-se integrar as técnicas de geoprocessamento com a exploração desta base de dados utilizando outras técnicas de mineração de dados, tais como: Clusterização e Máquinas de Vetores de Suporte (SVM). A fim de identificar novos padrões ou tendências de desenvolvimento e deficiências educacionais dos municípios do Estado do RN, e melhorar a precisão dos resultados. AGRADECIMENTOS: Os autores agradecem a CAPES pela concessão das bolsas de pesquisa. REFERÊNCIAS: Breternitz, V. J. Sistemas de informações geográficas: uma visão para administradores e profissionais de tecnologia da informação IBGE. Instituto Brasileiro de Geografia e Estatística. Disponível em: < Acesso em: ago INPE. Manual do Sistema de Processamento de Informações Georreferenciados versão 4.3 (SPRING-4.3). Divisão de Processamento de Imagens, INPE- São José dos Campos. Disponível em: < Acesso em: jul Diniz, F. A.; Costa, R. D.; Silva, F. R. M.; Castro, A. F.; Silva, M. P. S. O Uso do Geoprocessamento na Análise dos Índices Educacionais do Rio Grande Norte. In: Escola Potiguar de Computação e Suas Aplicações EPOCA Natal RN. Fayyad, U.; Piatesky-Shapiro, G.; Smyth, P. From Data Mining to Knowledge Discovery: An Overview. Cambridge: AAAI Press,1996. Landis, J. R.; Koch, G. G. The measurement of observer agreement for categorical data in Biometrics. v. 33, p , Moreira, M. A. Fundamentos de Sensoriamento Remoto. Instituto Brasileiro de Pesquisas Espaciais, São Paulo: São José dos Campos, Quinlan, J. R. C4.5: Programs For Machine Learning. Morgan Kaufmann, Los Altos, SEEC. Secretaria de Estado da Educação e da Cultura. Disponível em: < Acesso em: jul WEKA. Waikato Environment for Knowledge Analysis. Disponível em: < Acesso em: jul

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Alternativas para construção de classificadores de solos brasileiros

Alternativas para construção de classificadores de solos brasileiros 48 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Alternativas para construção de classificadores de solos brasileiros Matheus Agostini Ferraciolli¹ Luiz Manoel Silva Cunha² Resumo: Este

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos Carla Fernandes da SILVA 1 ; Clayton Silva MENDES 2. RESUMO A evasão escolar é um dos principais desafios a ser superado

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

Relatório Técnico - SVM na base Breast Cancer Wisconsin

Relatório Técnico - SVM na base Breast Cancer Wisconsin Relatório Técnico - SVM na base Breast Cancer Wisconsin Matheus Gutoski Universidade Tecnológica Federal do Paraná - CPGEI/PPGCA Mineração de Dados 4 de novembro de 2016 1 Objetivo O objetivo deste trabalho

Leia mais

Métodos de Análise de Dados (AO-802)

Métodos de Análise de Dados (AO-802) Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de

Leia mais

5 Experimentos Corpus

5 Experimentos Corpus 5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD

Leia mais

PROCESSO DE MINERAÇÃO DE DADOS NA DEFINIÇÃO DE ARQUITETURAS DE SATÉLITES PARA MISSÕES ESPACIAIS

PROCESSO DE MINERAÇÃO DE DADOS NA DEFINIÇÃO DE ARQUITETURAS DE SATÉLITES PARA MISSÕES ESPACIAIS sid.inpe.br/mtc-m19/2010/10.05.14.22-rpq PROCESSO DE MINERAÇÃO DE DADOS NA DEFINIÇÃO DE ARQUITETURAS DE SATÉLITES PARA MISSÕES ESPACIAIS Wanderson Gomes de Almeida Relatório final da disciplina Princípios

Leia mais

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA. APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.NET Heloína Alves Arnaldo (bolsista do PIBIC/UFPI), Vinicius Ponte

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

XXVI ENCONTRO UNIVERSITÁRIO DE INICIAÇÃO À PESQUISA - UFC TIAGO MAIA MAGALHÃES ORIENTADOR: JÚLIO FRANCISCO BARROS NETO

XXVI ENCONTRO UNIVERSITÁRIO DE INICIAÇÃO À PESQUISA - UFC TIAGO MAIA MAGALHÃES ORIENTADOR: JÚLIO FRANCISCO BARROS NETO XXVI ENCONTRO UNIVERSITÁRIO DE INICIAÇÃO À PESQUISA - UFC TIAGO MAIA MAGALHÃES ORIENTADOR: JÚLIO FRANCISCO BARROS NETO DEMA - JUNHO DE 2007 SISTEMAS DE INFORMAÇÕES GEOGRÁFICAS E ANÁLISE ESPACIAL Caracterizando

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

COMPARAÇÃO ENTRE OS MÉTODOS DE CLASSIFICAÇÃO SUPERVISIONADA MAXVER E DISTÂNCIA MÍNIMA NA ANÁLISE DO USO E COBERTURA DO SOLO NA REGIÃO DO ALTO ARAGUAIA

COMPARAÇÃO ENTRE OS MÉTODOS DE CLASSIFICAÇÃO SUPERVISIONADA MAXVER E DISTÂNCIA MÍNIMA NA ANÁLISE DO USO E COBERTURA DO SOLO NA REGIÃO DO ALTO ARAGUAIA COMPARAÇÃO ENTRE OS MÉTODOS DE CLASSIFICAÇÃO SUPERVISIONADA MAXVER E DISTÂNCIA MÍNIMA NA ANÁLISE DO USO E COBERTURA DO SOLO NA REGIÃO DO ALTO ARAGUAIA Rodrigo Moura Pereira¹ (UEG) Gustavo Henrique Mendes

Leia mais

Classificação de áreas algodoeiras utilizando séries temporais de imagens Modis

Classificação de áreas algodoeiras utilizando séries temporais de imagens Modis 34 Classificação de áreas algodoeiras utilizando séries temporais de imagens Modis João Paulo Sampaio Werner¹ Stanley Robson de Medeiros Oliveira² Júlio César Dalla Mora Esquerdo³ Resumo: O objetivo deste

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

MODELAGEM E CRIAÇÃO DE BANCOS DE DADOS

MODELAGEM E CRIAÇÃO DE BANCOS DE DADOS MODELAGEM E CRIAÇÃO DE BANCOS DE DADOS Anderson Reis Soares Relatório de atividades sobre o Laboratório 1 da disciplina de Introdução ao Geoprocessamento (SER-300) do Curso de Pós-Graduação em Sensoriamento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

Sensoriamento Remoto

Sensoriamento Remoto LABORATÓRIOS DIDÁTICOS DE GEOPROCESSAMENTO Sensoriamento Remoto Classificação Supervisionada de Imagens de Sensoriamento Remoto Elaboração: Cláudia Soares Machado Mariana Giannotti Rafael Walter de Albuquerque

Leia mais

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada

Leia mais

Mapeamento do uso do solo para manejo de propriedades rurais

Mapeamento do uso do solo para manejo de propriedades rurais 1/28 Mapeamento do uso do solo para manejo de propriedades rurais Teoria Eng. Allan Saddi Arnesen Eng. Frederico Genofre Eng. Marcelo Pedroso Curtarelli 2/28 Conteúdo programático: Capitulo 1: Conceitos

Leia mais

Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados

Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados Nome: Alex Sandro de Paula Rodrigues; Orientadora: Profª. Dra. Regina Barwaldt ORGANIZAÇÃO

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Taxa de analfabetismo: 10 a 14 anos: 13,1 % 15 ou mais: 31,8 % Fonte: IBGE

Taxa de analfabetismo: 10 a 14 anos: 13,1 % 15 ou mais: 31,8 % Fonte: IBGE Piacabucu População: 17.203 (2010) População em idade escolar: 5.206 (2010) PIB (R$ 1.000,00): R$ 57.615,32 (2008) Renda Média (R$): R$ 82,96 (2000) Taxa de analfabetismo: 10 a 14 anos: 13,1 % 15 ou mais:

Leia mais

Taxa de analfabetismo: 10 a 14 anos: 8,6 % 15 ou mais: 28,9 % Fonte: IBGE

Taxa de analfabetismo: 10 a 14 anos: 8,6 % 15 ou mais: 28,9 % Fonte: IBGE Teotonio Vilela População: 41.152 (2010) População em idade escolar: 13.594 (2010) PIB (R$ 1.000,00): R$ 162.502,26 (2008) Renda Média (R$): R$ 82,56 (2000) Taxa de analfabetismo: 10 a 14 anos: 8,6 % 15

Leia mais

Mineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará

Mineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará Universidade Federal do Pará Centro de Ciências Exatas e Naturais Departamento de Informática Mineração de Dados Profa. MSc. Miriam Lúcia Domingues Curso de Especialização em Sistemas de Banco de Dados

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..

Leia mais

Métodos para Classificação: - Naïve Bayes.

Métodos para Classificação: - Naïve Bayes. Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo

Leia mais

Laboratório 4. Disciplina. Introdução ao Geoprocessamento SER 300. Prof. Dr. Antonio Miguel Vieira Monteiro

Laboratório 4. Disciplina. Introdução ao Geoprocessamento SER 300. Prof. Dr. Antonio Miguel Vieira Monteiro Laboratório 4 Disciplina Introdução ao Geoprocessamento SER 300 Prof. Dr. Antonio Miguel Vieira Monteiro Aluno: Isaque Daniel Rocha Eberhardt INPE, São José dos Campos. Maio, 2013. Introdução Entre as

Leia mais

Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba

Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Utilização de técnicas de Mineração de Dados para diagnóstico de rendimento dos alunos do ensino básico do município de Indaiatuba Thaís Barros Nascimento 1, Maria das Graças J. M. Tomazela 1 1 Faculdade

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Tutorial básico de classificação em RapidMiner

Tutorial básico de classificação em RapidMiner Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.

Leia mais

A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe

A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe A contribuição de Mineração de Dados no processo de Autoavaliação dos cursos superiores do Instituto Federal de Sergipe Leopoldo Ramos de Oliveira 1, Fausto Bernard Melo Soares 2, José Acácio de Jesus

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB Acadêmico: Leonardo José Correia Orientador: Prof. Ricardo Alencar Azambuja Blumenau, Julho/2004 1 Roteiro Introdução Objetivo

Leia mais

Alterações no padrão de cobertura da terra na Zona Oeste da cidade do Rio de Janeiro/RJ nos anos de 1985 e DOMINIQUE PIRES SILVA

Alterações no padrão de cobertura da terra na Zona Oeste da cidade do Rio de Janeiro/RJ nos anos de 1985 e DOMINIQUE PIRES SILVA Alterações no padrão de cobertura da terra na Zona Oeste da cidade do Rio de Janeiro/RJ nos anos de 1985 e 2010. DOMINIQUE PIRES SILVA Universidade Federal Rural do Rio de Janeiro E-mail: nique_rhcp@hotmail.com

Leia mais

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio

Leia mais

A seguir descrevem-se os procedimentos utilizados na construção da tipologia das CIR s.

A seguir descrevem-se os procedimentos utilizados na construção da tipologia das CIR s. 27/09/2012 Relatório Metodológico da Tipologia das CIR Com o objetivo de elucidar os condicionantes estruturais do processo recente de regionalização nos estados, por meio da construção de uma tipologia

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução 19 Congresso de Iniciação Científica IMPLEMENTAÇÃO DE GUIAS E ALGORITMOS PARA REGRAS DE ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es)

Leia mais

Observação da influência do uso de séries temporais no mapeamento de formações campestres nativas e pastagens cultivadas no Cerrado brasileiro

Observação da influência do uso de séries temporais no mapeamento de formações campestres nativas e pastagens cultivadas no Cerrado brasileiro Observação da influência do uso de séries temporais no mapeamento de formações campestres nativas e pastagens cultivadas no Cerrado brasileiro Wanderson Santos Costa Trabalho do curso de Introdução ao

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

ANÁLISE DO RENDIMENTO DOMICILIAR POR BAIRRO NA CIDADE DE CORUMBÁ-MS RESUMO

ANÁLISE DO RENDIMENTO DOMICILIAR POR BAIRRO NA CIDADE DE CORUMBÁ-MS RESUMO ANÁLISE DO RENDIMENTO DOMICILIAR POR BAIRRO NA CIDADE DE CORUMBÁ-MS Ana Paula Vieira da Silva 1 ; Daniella de Souza Masson 1 ; Orlando Marcos Santos Veroneze 1 ; Joelson Gonçalves Pereira 2 UFGD/FCBA Caixa

Leia mais

APLICAÇÃO DE UM MÉTODO MULTIVARIADO PARA GERAÇÃO DE SUPERFÍCIES DE DISTRIBUIÇÃO POPULACIONAL

APLICAÇÃO DE UM MÉTODO MULTIVARIADO PARA GERAÇÃO DE SUPERFÍCIES DE DISTRIBUIÇÃO POPULACIONAL APLICAÇÃO DE UM MÉTODO MULTIVARIADO PARA GERAÇÃO DE SUPERFÍCIES DE DISTRIBUIÇÃO POPULACIONAL ANDRÉ AUGUSTO GAVLAK Divisão de Processamento de Imagens - DPI Instituto Nacional de Pesquisas Espaciais - INPE

Leia mais

Conjunto de técnicas (ou tecnologias) ligadas à informação espacial, que engloba a coleta, tratamento e análise de dados.

Conjunto de técnicas (ou tecnologias) ligadas à informação espacial, que engloba a coleta, tratamento e análise de dados. Thaís Celina Conjunto de técnicas (ou tecnologias) ligadas à informação espacial, que engloba a coleta, tratamento e análise de dados. Topografia; Fotogrametria; Cartografia; SIG. Coleta Armazenamento

Leia mais

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

Classificação de Sentença

Classificação de Sentença Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Aluno: Pablo Freire Matos Orientador: Dr. Ricardo Rodrigues Ciferri

Leia mais

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto Rodrigo Rodrigues Antunes e Israel Rodrigues Gonçalves Resumo: O objetivo

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

CST 312: Padrões e Processos em Dinâmica de Uso e Cobertura da Terra Prática com o Plugin de preenchimento de células do TerraView

CST 312: Padrões e Processos em Dinâmica de Uso e Cobertura da Terra Prática com o Plugin de preenchimento de células do TerraView CST 312: Padrões e Processos em Dinâmica de Uso e Cobertura da Terra Prática com o Plugin de preenchimento de células do TerraView André A. Gavlak {gavlak@dpi.inpe.br} Quem sou eu... Gerente de Negócios:

Leia mais

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR 10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir

Leia mais

SISTEMATIZAÇÃO DAS INFORMAÇÕES GEOGRÁFICAS DA REGIÃO NORTE-FLUMINENSE - RJ. (SIGNO)

SISTEMATIZAÇÃO DAS INFORMAÇÕES GEOGRÁFICAS DA REGIÃO NORTE-FLUMINENSE - RJ. (SIGNO) Andreza Rohem Gualberto, Maurício Nunes Lamonica. Instituto Federal Fluminense- Campus Campos Centro, e-mail: andrezarohem@hotmail.com; lamonica@iff.edu.br SISTEMATIZAÇÃO DAS INFORMAÇÕES GEOGRÁFICAS DA

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

Comparação de métodos de classificação da cobertura do solo urbano utilizando imagens IKONOS II com e sem o auxílio de dados LiDAR

Comparação de métodos de classificação da cobertura do solo urbano utilizando imagens IKONOS II com e sem o auxílio de dados LiDAR Comparação de métodos de classificação da cobertura do solo urbano utilizando imagens IKONOS II com e sem o auxílio de dados LiDAR Leonardo Rodrigues de Deus 1 Rafael Santos 1 Leila Maria G. Fonseca 1

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Implementação de um sistema de validação estatística configurável de dados

Implementação de um sistema de validação estatística configurável de dados Implementação de um sistema de validação estatística configurável de dados Eduardo Dias Filho Supervisores: João Eduardo Ferreira e Pedro Losco Takecian 16 de novembro de 2014 Introdução Table of Contents

Leia mais

Classificação de imagens de Sensoriamento Remoto. Disciplina: Geoprocessamento Profª. Agnes Silva de Araujo

Classificação de imagens de Sensoriamento Remoto. Disciplina: Geoprocessamento Profª. Agnes Silva de Araujo Classificação de imagens de Sensoriamento Remoto Disciplina: Geoprocessamento Profª. Agnes Silva de Araujo Conteúdo programático e Objetivos Conceito de classificação e fotointerpretação Classificações

Leia mais

Diagnóstico. Cidade de Deus (CDD)

Diagnóstico. Cidade de Deus (CDD) Diagnóstico Cidade de Deus (CDD) Área Geográfica Fonte: Instituto Pereira Passos. Rio+Social. Panorama dos Territórios. Janeiro. 2017 População 36.515 - Censo 2010 IBGE 37.148 Rio Como Vamos 47.795 Instituto

Leia mais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação Estatística: Aplicação ao Sensoriamento Remoto SER 204 - ANO 2018 Avaliação de Classificação Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ Classificação e Incerteza

Leia mais

Extração de conhecimento a partir de bancos de dados oceanográficos mistos

Extração de conhecimento a partir de bancos de dados oceanográficos mistos www.scientiaplena.org.br VOL. 11, NUM. 08 2015 doi: 10.14808/sci.plena.2015.081326 Extração de conhecimento a partir de bancos de dados oceanográficos mistos Knowledge discovery using mixed oceanographic

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

Avaliação de métodos de classificação para o mapeamento de remanescentes florestais a partir de imagens HRC/CBERS

Avaliação de métodos de classificação para o mapeamento de remanescentes florestais a partir de imagens HRC/CBERS http://dx.doi.org/10.12702/viii.simposfloresta.2014.131-592-1 Avaliação de métodos de classificação para o mapeamento de remanescentes florestais a partir de imagens HRC/CBERS Juliana Tramontina 1, Elisiane

Leia mais

Nota sobre a geografia do Programa Bolsa Família

Nota sobre a geografia do Programa Bolsa Família Nota sobre a geografia do Programa Bolsa Família Rogério Vianna, 6/2016, rsvianna@hotmail.com, www.incio.com.br Existem muitos estudos, a maioria de natureza acadêmica, sobre o PBF (ex: IPEA). E os jornais

Leia mais

Mineração de Dados Educacionais nos Resultados do ENEM de 2015

Mineração de Dados Educacionais nos Resultados do ENEM de 2015 Mineração de Dados Educacionais nos Resultados do ENEM de 2015 Augusto Simon 1, Sílvio César Cazella 2,3 1 Programa de Pós-Graduação em Educação (PPGEDU) Universidade Federal do Rio Grande do Sul (UFRGS)

Leia mais

Boas Maneiras em Aprendizado de Máquinas

Boas Maneiras em Aprendizado de Máquinas Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos.

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos. 84 5 Estudos de Caso A seguir serão apresentados três estudos de caso. Os dois primeiros estudos de caso têm por objetivo demonstrar a facilidade de uso do aplicativo, e o último estudo de caso é focado

Leia mais

Análise de Risco de Crédito Bancário

Análise de Risco de Crédito Bancário UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UFCG Curso de Mestrado em Informática Aluno: Francisco Fabian de Macedo Almeida Disciplina: Mineração de Dados Professor: Marcos Sampaio Data: 20 de dezembro de 2007

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003 UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

MODELAGEM PREDITIVA. Big Data e Machine Learning para a redução de custos médicos

MODELAGEM PREDITIVA. Big Data e Machine Learning para a redução de custos médicos MODELAGEM PREDITIVA Big Data e Machine Learning para a redução de custos médicos Você sabia que 5% da população de alto risco é responsável por 25% do custo total com saúde?* *Em relação ao modelo de Alto

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

EEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução

EEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução 1 Introdução 1. Introdução 1.1. O que é Aprendizado de Máquina? 1.2. Por que Machine Learning é o Futuro? 1.3. Algumas Aplicações 1.4. Tipos de Aprendizado 1. Introdução 17 1. Introdução 1.1. O que é Aprendizado

Leia mais

Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Árvore de Decisão George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Tópicos Introdução Representando Árvores de Decisão O algoritmo ID3 Definições Entropia Ganho de Informação Overfitting Objetivo

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Saulo Martiello Mastelini Departamento de Computação - UEL 1 o Semestre Assunto Aula 11 Modelos Preditivos - Árvore de Decisão

Leia mais

Os slides das aulas, tutoriais de aulas práticas e outros documentos relevantes serão disponibilizados no link:

Os slides das aulas, tutoriais de aulas práticas e outros documentos relevantes serão disponibilizados no link: Geoprocessamento Graduação em Geografia 4º ano / 1º Semestre Profa. Dra. Fernanda Sayuri Yoshino Watanabe Departamento de Cartografia fernanda.watanabe@unesp.br 2019 LEMBRETE! Os slides das aulas, tutoriais

Leia mais