Mestrado em Análise de Dados e Sistemas de Apoio à Decisão. Faculdade de Economia. Universidade de Porto. Extracção de Conhecimento de Dados I

Tamanho: px
Começar a partir da página:

Download "Mestrado em Análise de Dados e Sistemas de Apoio à Decisão. Faculdade de Economia. Universidade de Porto. Extracção de Conhecimento de Dados I"

Transcrição

1 Mestrado em Análise de Dados e Sistemas de Apoio à Decisão Faculdade de Economia Universidade de Porto Extracção de Conhecimento de Dados I PROBLEMAS DE CLASSIFICAÇÃO Manuel José Ferreira Monteiro Novembro de 2005

2 ÍNDICE 1. Objectivo Descrição do problema Descrição do Dataset Aplicações utilizadas Aplicação do método OneR Explicação do modelo obtido pelo método OneR Listas de Decisão Métodos de Procura Construção de regras usando procura Hill-Climbing Construção de regras usando procura em largura-primeiro Construção de regras usando o procura em profundidade-primeiro Conclusão dos métodos de procura Outros métodos do WEKA Algumas Comparações Medir taxa erro e de acerto sobre uma parte de teste Comparação entre métodos Conclusões Bibliografia e Endereços de Internet... 22

3 1. Objectivo Pretende-se com este trabalho a consolidação de conhecimentos na área de introdução ao data mining. Em simultâneo com o resumo do tema será analisado um caso prático onde serão aplicadas algumas das técnicas apresentadas. O que é o Data Mining? O Data Mining (DM) é um processo que usa uma variedade de ferramentas de análise de dados para descobrir de forma automática ou semi-automática padrões e relações (modelos de decisão, tendências, afinidades, desvios) nos dados. Usa ferramentas das ciências da computação, Inteligência Artificial e Estatística. As tarefas habituais do DM são a Classificação, Regressão, Previsão, Associação e Agrupamento, entre outras. 2. Descrição do problema A análise de um dataset só fará sentido se a pessoa que faz a analise é minimamente versada nos domínios do problema em estudo. É importante que o analista possa interpretar de forma eficaz os resultados obtidos. Se o analista não é versado no problema em análise, poderá obviamente ser assessorado por profissionais da área. Neste estudo privilegiou-se, acima de tudo, a compreensão dos conceitos introdutórios do Data Mining, decidiu-se por isso utilizar um dataset simples que permitisse absorver com clareza os conceitos associados à matéria e que permitisse alguma flexibilidade na aplicação de métodos manuais. Após testar diversos datasets, nomeadamente os disponibilizados pela UCI (reconhecimento de caracteres, diabetes, doenças de coração, entre outros) optou-se por um conjunto de dados associados à população do Titanic. O caso do afundamento do Titanic é um evento famoso que qualquer pessoa entende. 3

4 O objectivo é analisar os dados e procurar um padrão (por exemplo: a maior parte dos sobreviventes eram do sexo masculino) e obter a probabilidade de uma dada pessoa sobreviver ou não ao acidente do Titanic, confirmar alguns dos dados que fazem parte do nosso senso comum, como por exemplo se terá sido adoptada a regra de Mulheres e crianças primeiro, ou ainda se terá sido a 1ª classe privilegiada no momento de atribuição dos barcos salva-vidas. 3. Descrição do Dataset Os dados foram originalmente recolhidos pela British Board of Trade na sua investigação ao acidente. Esta base de dados contém quatro atributos para cada uma das 2201 pessoas no Titanic quando este se afundou. Os atributos são: Classe: {1ª Classe, 2ª Classe, 3ª Classe, Tripulação} Idade: {Adulto, Criança} Sexo: {M, F} Sobreviveu: {Sim, Não} O conjunto de dados original inclui os nomes dos tripulantes, mas não foram usados por serem irrelevantes para o estudo. 4

5 4. Aplicações utilizadas Utilizou-se o Weka como aplicação principal. O que é o WEKA? É uma colecção de algoritmos de Machine Learning para tarefas de Data Mining. Os algoritmos podem ser aplicados directamente aos datasets ou chamados de aplicações JAVA próprias. O WEKA (Waikato Environment for Knowledge Analysis) contém ferramentas para pré-processamento, classificação, regressão, clustering, regras de associação e visualização de dados. Para mais informações e download da aplicação consultar: Utilizou-se igualmente o Excel para algumas estatísticas de base e preparação dos dados para input do WEKA. 5

6 5. Aplicação do método OneR Um dos métodos aplicados neste estudo é o OneR. O que é o OnerR? O modelo OneR é usado em problemas de classificação e baseia-se no pressuposto de que frequentemente um atributo é suficiente para determinar a classe. O atributo escolhido pelo OneR é aquele que possuir menor erro. É o algoritmo mais simples. Como o nome sugere, este sistema gera uma regra (One Rule). Em algumas circunstâncias é tão poderoso como sistemas mais sofisticados como o J48 e o PART. Aplicando-se o método OneR ao dataset obtém-se o seguinte modelo: === Classifier model (full training set) === Sexo: M -> Não F -> Sim (1708/2201 instances correct) O atributo escolhido pelo OneR foi o sexo. Como se poderá verificar nos dados obtidos classificou correctamente 1708 instâncias. Como se verifica no extracto de Weka seguinte representa uma classificação correcta de 77.6%. === Evaluation on training set === === Summary === Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error

7 Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances 2201 Continuando a analisar os dados obtidos consegue-se ainda obter o nível de precisão para cada uma das classes, assim temos (73,2%) de precisão para o Sim e (78,9%) para o Não. === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class Sim Não Outro dos elementos fornecidos pelo WEKA quando se aplica o OnerR é a matriz de confusão. A matriz de confusão fornece na sua diagonal principal o número de instâncias classificadas correctamente para cada classe. Assim, o Sim teve 344 instâncias classificadas correctamente e 126 erradamente. De forma análoga, o Não obteve 1364 instâncias classificadas correctamente contra 367 classificadas incorrectamente. === Confusion Matrix === a b <-- classified as a = Sim b = Não Num dataset com mais classes é interessante verificar como se distribuem as classificações incorrectas pelas restantes classes. Quanto maior for a absorção de instâncias pela diagonal principal, mais optimizado está o modelo obtido. 7

8 6. Explicação do modelo obtido pelo método OneR Como o OnerR chegou ao modelo apresentado? O OneR diz: Para cada atributo A Para cada valor V1,..., Vn do atributo, construir a regra A=Vi -> C: C é a classe mais frequente nos exemplos com A=Vi calcular o erro da regra (#respostas erradas) / (#respostas) calcular o erro da hipótese baseada em A Escolher a hipótese com menor erro Seguindo essa regra obtemos: Atributo Valor Atributo Classe # Classe mais frequente # Respostas Erradas # Respostas #Erradas / #Respostas Classe 1ª Classe Sim % Não 122 2ª Classe Sim 118 Não % 3ª Classe Sim 178 Não % Tripulação Sim 212 Não % Idade Adulto Sim 654 Não % Criança Sim % Não 52 Sexo Masculino Sim 367 Não % Feminino Sim % Não 126 Observa-se que o menor erro na coluna #Erradas/#Respostas é 21%, o que implica que o atributo seleccionado seja o atributo Sexo. 8

9 7. Listas de Decisão Aplicaram-se outros métodos ao dataset utilizando o WEKA, o PRISM e o PART. Estes dois métodos permitem criar listas de decisão. Os dados obtidos foram: Método PRISM PART Correctly Classified Instances ,304% ,055% Incorrectly Classified Instances ,697% ,945% Ou seja, o PRISM não se adequa ao dataset estudado dado apenas classificar correctamente 32,304% das instâncias. Optou-se por isso analisar o método PART por ter uma taxa de classificação correcta de 79,055%, superior ao OneR analisado anteriormente. A lista obtida no PART foi: PART decision list Sexo = M AND Classe = 2ª_Classe AND Idade = Adulto: Não (168.0/14.0) Sexo = M AND Classe = Tripulação: Não (862.0/192.0) Sexo = M AND Classe = 3ª_Classe: Não (510.0/88.0) Sexo = F AND Classe = 3ª_Classe: Não (196.0/90.0) Sexo = F: Sim (274.0/20.0) Idade = Adulto: Não (175.0/57.0) : Sim (16.0) Number of Rules : 7 9

10 Foram geradas sete regras com o PART. Pode-se ainda verificar o grau de precisão obtido. === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class Sim Não Verifica-se uma excelente precisão para o SIM com 93.1%, o Não consegue apenas uma precisão de 76,9%. Tal como no OneR também no PART é gerada a matriz de confusão. === Confusion Matrix === a b <-- classified as a = Sim b = Não 10

11 8. Métodos de Procura Aplicaram-se os métodos de procura Hill-Climbing, Profundidade-Primeiro e Largura-Primeiro à totalidade dos dados do dataset. A abordagem foi data driven. 8.1 Construção de regras usando procura Hill-Climbing Para descrever a construção das regras, considera-se o método de procura Hill- Climbing, em que a abordagem a seguir será o Data Driven. Usando uma abordagem Data Driven, este método de procura heurística começa com uma regra maximamente geral, neste caso classe= Sim e verifica-se a qualidade da regra através do seu erro. Método de Procura Hill-Climbing Dados: H0 (maximamente geral), Obj, Rel. Gen. Fila <- [ ] H<-H0 Até H satisfazer Obj Gera hipóteses: especializações max. gerais de H Junta novas hipóteses a Fila Selecciona : H Fila : argmax q(h) esvazia fila (poupa memória) Repete retorna H Aplicando o método obtemos uma primeira iteração: 1ª Iteração #Erradas #Respostas % Classe=1ª Classe Sobrevive=Sim ,38 Classe=2ª Classe Sobrevive=Sim ,59 Classe=3ª Classe Sobrevive=Sim ,75 Sim Classe=Tripulação Sobrevive=Sim ,76 Idade=Adulto Sobrevive=Sim ,69 Idade=Criança Sobrevive=Sim ,48 Sexo=Feminino Sobrevive=Sim ,27 Sexo=Masculino Sobrevive=Sim ,79 11

12 Como na primeira iteração não foi encontrada nenhuma regra com zero erros, então terá que se continuar a refinar a regra que optimiza localmente a heurística, ou seja aquela que errasse num menor número de exemplos, e que neste caso será: Idade=Criança Sobrevive=Sim. Esta regra serve de base para a 2ª iteração do método: 2ª Iteração #Erradas #Respostas % Classe=1ª Classe Sobrevive=Sim Idade=Criança & Sobrevive=Sim Classe=2ª Classe Sobrevive=Sim Classe=3ª Classe Sobrevive=Sim ,66 Classe=Tripulação Sobrevive=Sim Sexo=Feminino Sobrevive=Sim ,38 Sexo=Masculino Sobrevive=Sim ,55 Na 2ª iteração encontraram-se duas ocorrências com zero respostas erradas que satisfaz o objectivo (heurística), a procura termina aqui. Para este exemplo, obtêm-se duas regras que optimizam a classe Sim : Idade=Criança & Classe=1ª Classe Sobrevive=Sim Idade=Criança & Classe=2ª Classe Sobrevive=Sim De referir que nesta 2ª iteração aparece um 3º registo com erro igual a zero. Porém, este não pode utilizado porque representa igualmente uma classificação que não retorna resultados no dataset. 8.2 Construção de regras usando procura em largura-primeiro Considerando o mesmo conjunto de dados do ponto anterior, começa-se a procura, com a hipótese maximamente geral, tentando chegar à especialização que satisfaz a condição zero erros para o exemplo. 12

13 Método de Procura em Largura-Primeiro - Completa Se existe solução encontra - Pouco prática (em geral) Processamento Memória Procura bottom-up em largura primeiro começa com hipótese maximamente específica Dados: H0 (maximamente geral), objectivo Obj, Relação de generalidade Fila <- [ ] H<-H0 Até H satisfazer Obj Gera hipóteses: especializações max. gerais de H Junta novas hipóteses ao fim de Fila Selecciona: H <- primeiro(fila) Retira primeiro da fila Repete Retorna H Considera-se a procura de regras para a classe-> SIM. Neste método de procura, as novas hipóteses geradas, são acrescentadas ao fim da fila, e a nova hipótese a testar retira-se sempre do início da fila. 13

14 Fila H Erro # % [] -->Sim ,67 [Classe=1ª Classe;Idade=Criança;Sexo=Masculino] Classe=1ª Classe Sim ,38 [Idade=Criança;Sexo=Masculino;Classe=1ª Classe & Idade=Criança;Classe=1ª Classe & Sexo=Masculino] Idade=Criança Sim ,48 [Sexo=Masculino;Classe=1ª Classe & Idade=Criança;Classe=1ª Classe & Sexo=Masculino;Idade=Criança & Sexo=Masculino] Sexo=Masculino Sim ,79 [Classe=1ª Classe & Idade=Criança;Classe=1ª Classe & Sexo=Masculino;Idade=Criança & Sexo=Masculino;Classe=1ª Classe & Idade=Criança & Sexo=Masculino] Classe=1ª Classe & Idade=Criança Sim Nesta primeira iteração consegue-se zero erros. Assim consegue-se gerar a primeira regra: Classe=1ª Classe & Idade=Criança Sobrevive=SIM A árvore representativa da utilização do método de procura em Largura-Primeiro é a seguinte: 14

15 8.3 Construção de regras usando o procura em profundidade-primeiro Neste método as novas hipóteses geradas são acrescentadas no início da fila, e a nova hipótese a testar sai sempre do início da fila. Método de Procura em Profundidade-Primeiro - Problema dos caminhos infinitos - Retrocesso (backtracking) - Pouco prática (em geral) Processamento Apesar de gastar pouca memória Dados: H0 (maximamente geral), Obj, Rel. Gen. Fila <- [ ] H<-H0 Até H satisfazer Obj Gera hipóteses: especializações max. gerais de H Junta novas hipóteses ao início de Fila Selecciona: H <- primeiro(fila) Retira primeiro da fila Repete Retorna H Fila H Erro # % [] -->Sim ,68 [Classe=1ª Classe;Idade=Criança;Sexo=Masculino] Classe=1ªClasse-->Sim ,38 [Classe=1ª Classe & Idade=Criança;Classe=1ª Classe & Sexo=Masculino;Idade=Criança;Sexo=Ma sculino] Classe=1ª Classe & Idade=Criança-->Sim A regra obtida é: 15

16 Classe=1ª Classe & Idade=Criança Sobrevive=Sim A árvore representativa da utilização do método de procura em Profundidade-Primeiro é a seguinte: 8.4 Conclusão dos métodos de procura Neste caso específico o método que se revelou mais rápido foi o Método de Procura em Profundidade-Primeiro. O mais eficaz foi o Hill-Climbing tendo em conta que conseguiu gerar duas regras em simultâneo. 16

17 9. Outros métodos do WEKA Analisaram-se outros métodos do WEKA de forma a avaliar outras capacidades deste sistema. O método J 48, por exemplo, permite a construção de árvores de decisão. Aplicando este método obtemos: === Classifier model (full training set) === J48 pruned tree Sexo = M Classe = 1ª_Classe Idade = Adulto: Não (175.0/57.0) Idade = Criança: Sim (5.0) Classe = 2ª_Classe Idade = Adulto: Não (168.0/14.0) Idade = Criança: Sim (11.0) Classe = 3ª_Classe: Não (510.0/88.0) Classe = Tripulação: Não (862.0/192.0) Sexo = F Classe = 1ª_Classe: Sim (145.0/4.0) Classe = 2ª_Classe: Sim (106.0/13.0) Classe = 3ª_Classe: Não (196.0/90.0) Classe = Tripulação: Sim (23.0/3.0) Number of Leaves : 10 Verifica-se ainda que este modelo classifica correctamente 79,055% das instâncias. === Evaluation on training set === === Summary === Correctly Classified Instances % Incorrectly Classified Instances % 17

18 O nível de precisão é elevado, nomeadamente 93,1% para o Sim e 76,9% para o Não === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class Sim Não A matriz de confusão é a seguinte: === Confusion Matrix === a b <-- classified as a = Sim b = Não A árvore de decisão gerada pelo J48 é a seguinte: Árvores de Decisão Árvores de Decisão são um meio de representar uma série de regras que levam a uma classe ou valor. 18

19 10. Algumas Comparações 10.1 Medir taxa erro e de acerto sobre uma parte de teste Pretende-se verificar com a seguinte tabela se o uso de diferentes formas de utilização do dataset implica resultados muito diferentes, isto no que diz respeito à escolha dos dados de treino e de teste. Classificadas Classificadas Precisão Precisão Correctamente Incorrectamente "SIM" "NÃO" Cross-Validation 77,60% 22,40% 0,732 0,788 ONER Use Training Set 77,60% 22,40% 0,732 0,788 Percentage Split (66%) 77,44% 22,56% 0,762 0,777 Cross-Validation 79,06% 20,95% 0,931 0,769 PART Use Training Set 79,06% 20,95% 0,931 0,769 Percentage Split (66%) 78,24% 21,76% 0,946 0,759 Cross-Validation 78,92% 21,08% 0,93 0,768 J48 Use Training Set 79,06% 20,95% 0,931 0,769 Percentage Split (66%) 77,17% 22,83% 0,941 0,75 Cross-Validation 32,30% 67,70% PRISM Use Training Set 32,30% 67,70% 0,323 0 Percentage Split (66%) 32,84% 67,16% 0,

20 As variações dentro do mesmo método não são significativas, não chegando em nenhum dos casos a diferenças de 2% Comparação entre métodos Excluindo o PRISM, as variações entre os diferentes sistemas apresentados não são muito significativas. Foram avaliados todos os métodos disponibilizados no WEKA e nenhum conseguiu ultrapassar o desempenho do PART. O PRISM permite-nos concluir que a escolha do método não pode ser feita ao acaso pois pode apresentar valores muito insatisfatórios. De referir que o PRISM aplicado a outros datasets (diabetes, reconhecimento de caracteres e outros) obteve óptimos resultados. 20

21 11. Conclusões Os diferentes dados obtidos nas comparações realizadas permitem concluir que o OnerR, apesar do seu conceito simples e da sua facilidade de utilização, consegue obter excelentes resultados, comparando-o com métodos mais complexos como o PART ou o J48. Relembrando alguns dos possíveis objectivos do trabalho, por exemplo, saber se foram privilegiadas as classes sociais mais elevadas ou se a máxima Mulheres e crianças primeiro se tinha aplicado, poderemos tirar algumas conclusões analisando a árvore de decisão gerada pelo J48. Sexo = M Classe = 1ª_Classe Idade = Adulto: Não (175.0/57.0) Idade = Criança: Sim (5.0) Classe = 2ª_Classe Idade = Adulto: Não (168.0/14.0) Idade = Criança: Sim (11.0) Classe = 3ª_Classe: Não (510.0/88.0) Classe = Tripulação: Não (862.0/192.0) Sexo = F Classe = 1ª_Classe: Sim (145.0/4.0) Classe = 2ª_Classe: Sim (106.0/13.0) Classe = 3ª_Classe: Não (196.0/90.0) Classe = Tripulação: Sim (23.0/3.0) É notória que a 3ª Classe está associada a Não Sobreviveu, induzindo que provavelmente a classe social inferior foi preterida em relação às mais elevadas. Quanto à máxima Mulheres e crianças primeiro poderemos igualmente verificar pela árvore que para o sexo Masculino, em todas as classes sociais e tripulação, os adultos ficaram associados a um Não Sobreviveu. Poderá isto induzir que efectivamente as mulheres e crianças tiveram algum tipo de prioridade na hora do salvamento. 21

22 Bibliografia e Endereços de Internet - Acetatos das aulas de ECDI, Professor Doutor Alípio Jorge - The "Unusual Episode" Data Revisited Robert J. MacG. Dawson Saint Mary's University Journal of Statistics Education v.3, n.3 (1995) - Data Mining: Concepts and Techniques Jiawei Han and Micheline Kamber Simon Fraser University - Introduction to Data Mining and Knowledge Discovery Third Edition By Two Crows Corporation Endereços de Internet - WEKA - Data Mining with Weka - WEKA - Machine Learning Algorithms in Java Tutorial - UCI Machine Learning Repository 22

23 Trabalho realizado por Manuel José Ferreira Monteiro Disciplina Extracção do Conhecimento dos Dados I Docente Professor Doutor Alípio Jorge Mestrado Análise de Dados e Sistemas de Apoio à Decisão Faculdade de Economia - Universidade do Porto 14 de Novembro de 2005

Data Mining: Ferramenta JAVA

Data Mining: Ferramenta JAVA Data Mining: Ferramenta JAVA JAVA para Data Mining Weka 3: Data Mining Software em Java http://www.cs.waikato.ac.nz/ml/weka/ Coleção de algoritmos para as tarefas de data mining; Free software. WEKA: JAVA

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Computação Adaptativa

Computação Adaptativa Departamento de Engenharia Informática Faculdade de Ciências e Tecnologia Universidade de Coimbra 2007/08 Computação Adaptativa TP2 OCR Optical Character Recognition Pedro Carvalho de Oliveira (MEI) Nº

Leia mais

Mobilidade na FEUP Deslocamento Vertical

Mobilidade na FEUP Deslocamento Vertical Mobilidade na FEUP Deslocamento Vertical Relatório Grupo 515: Carolina Correia Elder Vintena Francisco Martins Salvador Costa Sara Palhares 2 Índice Introdução...4 Objectivos...5 Método...6 Dados Obtidos...7

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003 UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

Usando o Excel ESTATÍSTICA. Funções

Usando o Excel ESTATÍSTICA. Funções Funções Podemos usar no Excel fórmulas ou funções. Anteriormente já vimos algumas fórmulas. Vamos agora ver o exemplo de algumas funções que podem ser úteis para o trabalho de Excel. Para começar podemos

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

AS DESIGUALDADES DE REMUNERAÇÕES ENTRE HOMENS E MULHERES AUMENTAM COM O AUMENTO DO NIVEL DE ESCOLARIDADE E DE QUALIFICAÇÃO DAS MULHERES

AS DESIGUALDADES DE REMUNERAÇÕES ENTRE HOMENS E MULHERES AUMENTAM COM O AUMENTO DO NIVEL DE ESCOLARIDADE E DE QUALIFICAÇÃO DAS MULHERES Desigualdades graves entre Homens e Mulheres com escolaridade e qualificação elevadas Pág. 1 AS DESIGUALDADES DE REMUNERAÇÕES ENTRE HOMENS E MULHERES AUMENTAM COM O AUMENTO DO NIVEL DE ESCOLARIDADE E DE

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

COMO CALCULAR A PERFORMANCE DOS FUNDOS DE INVESTIMENTOS - PARTE II

COMO CALCULAR A PERFORMANCE DOS FUNDOS DE INVESTIMENTOS - PARTE II COMO CALCULAR A PERFORMANCE DOS FUNDOS DE INVESTIMENTOS - PARTE II O que é o Índice de Treynor? Índice de Treynor x Índice de Sharpe Restrições para as análises de Sharpe e Trynor A utilização do risco

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores Trabalhos Práticos Programação II Curso: Engª Electrotécnica - Electrónica e Computadores 1. Objectivos 2. Calendarização 3. Normas 3.1 Relatório 3.2 Avaliação 4. Propostas Na disciplina de Programação

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

yuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnm qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxc

yuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnm qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxc qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwe rtyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyui opasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopas

Leia mais

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela Aula 01 - Formatações prontas e Sumário Formatar como Tabela Formatar como Tabela (cont.) Alterando as formatações aplicadas e adicionando novos itens Removendo a formatação de tabela aplicada Formatação

Leia mais

Observação das aulas Algumas indicações para observar as aulas

Observação das aulas Algumas indicações para observar as aulas Observação das aulas Algumas indicações para observar as aulas OBJECTVOS: Avaliar a capacidade do/a professor(a) de integrar esta abordagem nas actividades quotidianas. sso implicará igualmente uma descrição

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Instituto Politécnico de Beja. Escola Superior de Tecnologia e Gestão

Instituto Politécnico de Beja. Escola Superior de Tecnologia e Gestão Instituto Politécnico de Beja Escola Superior de Tecnologia e Gestão Curso de Engenharia Informática Disciplina de Estrutura de dados e Algoritmos 2º Ano - 1º Semestre Relatório Connected Component Labeling

Leia mais

CAP. I ERROS EM CÁLCULO NUMÉRICO

CAP. I ERROS EM CÁLCULO NUMÉRICO CAP. I ERROS EM CÁLCULO NUMÉRICO 0. Introdução Por método numérico entende-se um método para calcular a solução de um problema realizando apenas uma sequência finita de operações aritméticas. A obtenção

Leia mais

SISTEMAS DE INFORMAÇÃO PARA GESTÃO

SISTEMAS DE INFORMAÇÃO PARA GESTÃO 07-05-2013 1 SISTEMAS DE INFORMAÇÃO PARA GESTÃO Aula I Docente: Eng. Hercílio Duarte 07-05-2013 2 Objectivo Sistemas Modelos Dados Vs. Informação Introdução aos sistemas de Informação 07-05-2013 3 Introdução

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Resoluções comentadas das questões de Estatística da prova para ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Realizada pela Fundação João Goulart em 06/10/2013 41. A idade média de todos

Leia mais

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR Wesley Humberto da Silva (Fundação Araucária), André Luis Andrade Menolli (Orientador) e-mail: wesleyhumberto11@mail.com

Leia mais

Nota técnica nº 1 Importar mapas de quantidades em Excel

Nota técnica nº 1 Importar mapas de quantidades em Excel Índice 1) Introdução... 2 2) Preparação... 2 3) Copiar... 2 4) Importar... 3 5) Identificação das colunas... 4 6) Opções de importação... 5 7) Verificação... 5 8) Definição das especialidades... 6 9) Dúvidas...

Leia mais

A Grande Importância da Mineração de Dados nas Organizações

A Grande Importância da Mineração de Dados nas Organizações A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil

Leia mais

ActivALEA. active e actualize a sua literacia

ActivALEA. active e actualize a sua literacia ActivALEA active e actualize a sua literacia N.º 25 HIISTOGRAMA Por: Maria Eugénia Graça Martins Departamento de Estatística e Investigação Operacional da FCUL memartins@fc.ul.pt Emília Oliveira Escola

Leia mais

Sistemas de Apoio à Decisão

Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Alternativas para modelar o processo de tomada de decisões: consultar o gestor/perito e elaborar um modelo a partir dessa informação. construir um modelo a partir de dados.

Leia mais

Cresce o numero de desempregados sem direito ao subsidio de desemprego Pág. 1

Cresce o numero de desempregados sem direito ao subsidio de desemprego Pág. 1 Cresce o numero de desempregados sem direito ao subsidio de desemprego Pág. 1 CRESCE O DESEMPREGO E O NUMERO DE DESEMPREGADOS SEM DIREITO A SUBSIDIO DE DESEMPREGO, E CONTINUAM A SER ELIMINADOS DOS FICHEIROS

Leia mais

Aula 4 Estatística Conceitos básicos

Aula 4 Estatística Conceitos básicos Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a

Leia mais

MS 777 Projeto Supervisionado Professor: Laércio Luis Vendite Ieda Maria Antunes dos Santos RA: 033337

MS 777 Projeto Supervisionado Professor: Laércio Luis Vendite Ieda Maria Antunes dos Santos RA: 033337 1 Análise de Investimentos MS 777 Projeto Supervisionado Professor: Laércio Luis Vendite Ieda Maria Antunes dos Santos RA: 033337 2 Sumário 1- Juros------------------------------------------------------------------------------------------------------

Leia mais

Guia de Estudo Folha de Cálculo Microsoft Excel

Guia de Estudo Folha de Cálculo Microsoft Excel Tecnologias da Informação e Comunicação Guia de Estudo Folha de Cálculo Microsoft Excel Estrutura geral de uma folha de cálculo: colunas, linhas, células, endereços Uma folha de cálculo electrónica ( electronic

Leia mais

FEDERAÇÃO PORTUGUESA DE GOLFE COMISSÃO DE HANDICAPS E COURSE RATING

FEDERAÇÃO PORTUGUESA DE GOLFE COMISSÃO DE HANDICAPS E COURSE RATING REVISÃO ANUAL 2008 O Sistema de Handicaps EGA, para além dos ajustes automáticos efectuados ao handicap do jogador após cada volta válida prevê dois elementos fundamentais de intervenção por parte das

Leia mais

Regulamento de Vigilâncias de Provas Escritas de Avaliação do DEEC

Regulamento de Vigilâncias de Provas Escritas de Avaliação do DEEC Regulamento de Vigilâncias de Provas Escritas de Avaliação do DEEC Autores: Aprovação: Comissão Executiva do DEEC Comissão Executiva do DEEC Data: 3 de Fevereiro de 2011 Distribuição: Docentes do DEEC

Leia mais

POS-Tagging usando Pesquisa Local

POS-Tagging usando Pesquisa Local POS-Tagging usando Pesquisa Local João Laranjinho and Irene Rodrigues and Lígia Ferreira Universidade de Évora Abstract. Neste artigo apresenta-se um sistema de part-of-speech tagging, independente do

Leia mais

Utilização do SOLVER do EXCEL

Utilização do SOLVER do EXCEL Utilização do SOLVER do EXCEL 1 Utilização do SOLVER do EXCEL José Fernando Oliveira DEEC FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO MAIO 1998 Para ilustrar a utilização do Solver na resolução de

Leia mais

SISTEMA DE INFORMAÇÃO DAS PARTICIPAÇÕES DO ESTADO

SISTEMA DE INFORMAÇÃO DAS PARTICIPAÇÕES DO ESTADO SISTEMA DE INFORMAÇÃO DAS PARTICIPAÇÕES DO ESTADO SIPART (versão Setembro/2004) Manual de Utilização ÍNDICE 1. INTRODUÇÃO...3 2. ACEDER À APLICAÇÃO...4 3. CRIAR NOVO UTILIZADOR...5 4. CARACTERIZAÇÃO GERAL

Leia mais

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Saúde

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Saúde Avaliação da Satisfação dos Utentes dos Serviços de Saúde Entidade Promotora Concepção e Realização Enquadramento Avaliação da Satisfação dos Utentes dos Serviços de Saúde Índice RESUMO EXECUTIVO...

Leia mais

Engenharia de Software. Enunciado da Segunda Parte do Projecto

Engenharia de Software. Enunciado da Segunda Parte do Projecto LEIC-A, LEIC-T, LETI, MEIC-T, MEIC-A Engenharia de Software 2 o Semestre 2013/2014 Enunciado da Segunda Parte do Projecto 1. Segunda Parte do Projecto ES A segunda parte do projecto consiste na realização

Leia mais

Lógica de Programação

Lógica de Programação Lógica de Programação Unidade 20 ArrayList: Operações de Busca Curso Técnico em Informática SUMÁRIO INTRODUÇÃO... 3 TIPOS DE BUSCAS... 3 BUSCA ESPECÍFICA... 3 BUSCA ABRANGENTE... 3 PROCEDIMENTO DE BUSCA...

Leia mais

Múltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II

Múltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II O seguinte exercício contempla um processo com três estágios. Baseia-se no Inquérito de Satisfação Fase II, sendo, por isso, essencial compreender primeiro o problema antes de começar o tutorial. 1 1.

Leia mais

Manual de Utilizador Carregamento e Processamento de Ficheiros via Internet Banking. Português - V1

Manual de Utilizador Carregamento e Processamento de Ficheiros via Internet Banking. Português - V1 Manual de Utilizador Carregamento e Processamento de Ficheiros via Internet Banking Português - Índice Introdução... 2 Capitulo I... 3 1.1 Localização da funcionalidade... 3 1.2 Tipo de Ficheiros... 3

Leia mais

Comunicação documentos de transporte AT via Webservice Singest Sistema Integrado de Gestão. 22-05-2013 Cambragest Serviços de Gestão e Software

Comunicação documentos de transporte AT via Webservice Singest Sistema Integrado de Gestão. 22-05-2013 Cambragest Serviços de Gestão e Software Comunicação documentos de transporte AT via Webservice 22-05-2013 Cambragest Serviços de Gestão e Software I. Índice I. Índice... 1 II. Introdução... 2 III. Configuração de documentos de transporte...

Leia mais

3. ANÁLISE DE RISCO NA CONSTRUÇÃO CIVIL

3. ANÁLISE DE RISCO NA CONSTRUÇÃO CIVIL Gestão de Operações s 2007/2008 3. ANÁLISE DE RISCO NA CONSTRUÇÃO CIVIL Jorge Moreira da Costa Professor Associado SCC/FEUP FEP_Fev Mar.2008 Top.3.1 Gestão de Operações s Análise de Risco 1 CONCEITOS GERAIS

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Engenharia Informática (ramos de Gestão e Industrial) Departamento de Sistemas e Informação Reconhecimento de Padrões Projecto Final 2004/2005 Realizado por: Prof. João Ascenso. Departamento de Sistemas

Leia mais

Localização dos inquéritos de rua para Arroios e Gulbenkian

Localização dos inquéritos de rua para Arroios e Gulbenkian Project IAAPE Pedestrian Accessibility and Attractiveness Indicators: Tool for Urban Walkability Assessment and Management Working Paper No. WP-8 Localização dos inquéritos de rua para Arroios e Gulbenkian

Leia mais

UML (Unified Modelling Language) Diagrama de Classes

UML (Unified Modelling Language) Diagrama de Classes UML (Unified Modelling Language) Diagrama de Classes I Classes... 2 II Relações... 3 II. Associações... 3 II.2 Generalização... 9 III Exemplos de Modelos... III. Tabelas de IRS... III.2 Exames...3 III.3

Leia mais

MANUAL DO UTILIZADOR

MANUAL DO UTILIZADOR MANUAL DO UTILIZADOR Versão 1.6 PÁGINA DE PESQUISA A página principal do PacWeb permite a realização de um número muito variado de pesquisas, simples, ou pelo contrário extremamente complexas, dependendo

Leia mais

EXEMPLO DE COMO FAZER UMA MALA DIRETA

EXEMPLO DE COMO FAZER UMA MALA DIRETA EXEMPLO DE COMO FAZER UMA MALA DIRETA OBS: Para esta nota de aula foi utilizada como referência: Apostila Mala Direta Santos, Jorge Rodrigues dos. Foram adaptados os comando para utilizar mala direta no

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO BACHARELADO AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS Orientando: Oliver Mário

Leia mais

Competição internacional de Literacia Estatística do ISLP http://www.stat.auckland.ac.nz/~iase/islp/competition

Competição internacional de Literacia Estatística do ISLP http://www.stat.auckland.ac.nz/~iase/islp/competition Competição internacional de Literacia Estatística do ISLP http://www.stat.auckland.ac.nz/~iase/islp/competition 1.- Beber Coca-Cola e a saúde dos ossos. http://figurethis.org/ Os dados organizados em tabelas

Leia mais

Avaliação de riscos de empréstimo: Um caso de estudo de Data Mining.

Avaliação de riscos de empréstimo: Um caso de estudo de Data Mining. Curso de Engenharia de Sistemas e Informática - 5º Ano Ficha T. Prática n.º 8 Análise Inteligente de Dados Objectivo: Tomar contacto a descrição relativa a um caso prático de utilização de ferramentas

Leia mais

24 O uso dos manuais de Matemática pelos alunos de 9.º ano

24 O uso dos manuais de Matemática pelos alunos de 9.º ano 24 O uso dos manuais de Matemática pelos alunos de 9.º ano Mariana Tavares Colégio Camões, Rio Tinto João Pedro da Ponte Departamento de Educação e Centro de Investigação em Educação Faculdade de Ciências

Leia mais

Exercícios de Excel com Programação em VBA. Luís Vieira Lobo

Exercícios de Excel com Programação em VBA. Luís Vieira Lobo Exercícios de Excel com Programação em VBA Luís Vieira Lobo Programação das aulas de Excel: Exercícios 1 e 2 até 13/3/2004 (2 ou 3 aulas) Exercício 4 na semana de 15 a 20/3/2004 Exercício 5 na semana de

Leia mais

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ESTATÍSTICA MULTIVARIADA Ano Lectivo 2014/2015

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ESTATÍSTICA MULTIVARIADA Ano Lectivo 2014/2015 Programa da Unidade Curricular ESTATÍSTICA MULTIVARIADA Ano Lectivo 2014/2015 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Gestão de Recursos Humanos 3. Ciclo de Estudos 1º

Leia mais

Controle do Arquivo Técnico

Controle do Arquivo Técnico Controle do Arquivo Técnico Os documentos existentes de forma física (papel) no escritório devem ser guardados em pastas (normalmente pastas suspensas) localizadas no Arquivo Técnico. Este Arquivo pode

Leia mais

Internet Update de PaintManager TM. Manual de instalação e utilização do programa de actualização

Internet Update de PaintManager TM. Manual de instalação e utilização do programa de actualização Internet Update de PaintManager TM Manual de instalação e utilização do programa de actualização ÍNDICE O que é o programa Internet Update? 3 Como se instala e executa o programa? 3 Aceder ao programa

Leia mais

MANUAL DO GESTOR DE FINANÇAS

MANUAL DO GESTOR DE FINANÇAS MANUAL DO GESTOR DE FINANÇAS Manual de utilização e dicas para que conheça melhor esta nova ferramenta do millenniumbcp.pt.. 1 02 ÍNDICE 03 1 PORQUÊ USAR O GESTOR DE FINANÇAS? 04 2 ADESÃO 04 Como aderir?

Leia mais

3 Classificação. 3.1. Resumo do algoritmo proposto

3 Classificação. 3.1. Resumo do algoritmo proposto 3 Classificação Este capítulo apresenta primeiramente o algoritmo proposto para a classificação de áudio codificado em MPEG-1 Layer 2 em detalhes. Em seguida, são analisadas as inovações apresentadas.

Leia mais

Análise da mortalidade em Portugal.

Análise da mortalidade em Portugal. Análise da mortalidade em Portugal. Paulo Canas Rodrigues; João Tiago Mexia (E-mails: paulocanas@fct.unl.pt; jtm@fct.unl.pt) Resumo Neste trabalho apresentam-se tabelas de mortalidade para a população

Leia mais

CONTABILIDADE NACIONAL 1

CONTABILIDADE NACIONAL 1 CONTABILIDADE NACIONAL 1 Ópticas de cálculo do valor da produção O produto de um país pode ser obtido por três ópticas equivalentes: Óptica do Produto permite-nos conhecer o valor do produto por sector

Leia mais

Universidade Federal de Minas Gerais ICEx / DCC

Universidade Federal de Minas Gerais ICEx / DCC Universidade Federal de Minas Gerais ICEx / DCC Belo Horizonte, 15 de dezembro de 2006 Relatório sobre aplicação de Mineração de Dados Mineração de Dados em Bases de Dados de Vestibulares da UFMG Professor:

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

Fórmulas e Funções 7

Fórmulas e Funções 7 Fórmulas e Funções 7 7.9. Visualização automática do resultado Para visualizar rapidamente o resultado das funções mais simples média, soma, contar, mínimo e máximo: 1. Menu de contexto sobre a barra de

Leia mais

Nos itens de resposta fechada curta, é atribuída a classificação total à resposta correcta. É classificada com zero pontos qualquer outra situação.

Nos itens de resposta fechada curta, é atribuída a classificação total à resposta correcta. É classificada com zero pontos qualquer outra situação. 1. CRITÉRIOS GERAIS DE CLASSIFICAÇÃO Quando o examinando responder ao mesmo item mais do que uma vez, deve ter eliminado, inequivocamente, a(s) resposta(s) que considerou incorrecta(s). No caso de tal

Leia mais

Caracterização dos cursos de licenciatura

Caracterização dos cursos de licenciatura Caracterização dos cursos de licenciatura 1. Identificação do ciclo de estudos em funcionamento Os cursos de 1º ciclo actualmente em funcionamento de cuja reorganização resultam os novos cursos submetidos

Leia mais

CAP. 2 CONSIDERAÇÕES SOBRE OS CRITÉRIOS DE DECISÃO

CAP. 2 CONSIDERAÇÕES SOBRE OS CRITÉRIOS DE DECISÃO CAP. 2 CONSIDERAÇÕES SOBRE OS CRITÉRIOS DE DECISÃO 1. OS CRITÉRIOS DE DECISÃO Dentre os métodos para avaliar investimentos, que variam desde o bom senso até os mais sofisticados modelos matemáticos, três

Leia mais

PLANILHA PARA GERENCIAR NOTAS DAS TURMAS

PLANILHA PARA GERENCIAR NOTAS DAS TURMAS PLANILHA PARA GERENCIAR NOTAS DAS TURMAS INTRODUÇÃO Faça download de um dos arquivos de acordo com o software de planilha eletrônica disponível em sua máquina: Excel 97-03 https://dl.dropboxusercontent.com/u/5308498/rem_planilhaexemplo.xls

Leia mais

RELATÓRIO REALIZAÇÃO DO 3º SIMULADO DO ENADE DO CURSO DE ADMINISTRAÇÃO 2014.2

RELATÓRIO REALIZAÇÃO DO 3º SIMULADO DO ENADE DO CURSO DE ADMINISTRAÇÃO 2014.2 SERVIÇO PÚBLICO FEDERAL MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL RURAL DO SEMIÁRIDO DEPARTAMENTO DE AGROTECNOLOGIA E CIÊNCIAS SOCIAIS RELATÓRIO REALIZAÇÃO DO 3º SIMULADO DO ENADE DO CURSO DE ADMINISTRAÇÃO

Leia mais

Engenharia de Software. Enunciado da Primeira Parte do Projecto

Engenharia de Software. Enunciado da Primeira Parte do Projecto LEIC-A, LEIC-T, LETI, MEIC-T, MEIC-A Engenharia de Software 2 o Semestre 2014/2015 Enunciado da Primeira Parte do Projecto 1. Primeira Parte do Projecto ES Este enunciado descreve o trabalho a realizar

Leia mais

3. Características amostrais. Medidas de localização e dispersão

3. Características amostrais. Medidas de localização e dispersão Estatística Descritiva com Excel Complementos. 77 3. Características amostrais. Medidas de localização e dispersão 3.1- Introdução No módulo de Estatística foram apresentadas as medidas ou estatísticas

Leia mais

(Docentes, Não-Docentes, Alunos e Encarregados de Educação) NOTA IMPORTANTE Esta apresentação não dispensa e leitura do Relatório da Função Manuel Leão. Tendo como preocupação fundamental a procura da

Leia mais

Beja com Ciência Relatório 1. Beja com Ciência

Beja com Ciência Relatório 1. Beja com Ciência Relatório Tema: Iniciação à ciência Atividade Data Horas despendidas 27/0/4 2 28/0/4 3 Regras básicas de comportamento em laboratório. 29/0/4 Saber ler e identificar os rótulos presentes em 30/0/4 5 laboratório

Leia mais

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. Conceitos relativos à Informação 1. Informação O que á a informação? Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. 2. Dados Em informática designa-se

Leia mais

BOLETIM INFORMATIVO TÉCNICO LIBERAÇÃO DE ATUALIZAÇÃO - CORDILHEIRA VERSÃO 2

BOLETIM INFORMATIVO TÉCNICO LIBERAÇÃO DE ATUALIZAÇÃO - CORDILHEIRA VERSÃO 2 BOLETIM INFORMATIVO TÉCNICO LIBERAÇÃO DE ATUALIZAÇÃO - CORDILHEIRA VERSÃO 2 Cordilheira Recursos Humanos CRH 2.85A As rotinas de Retiradas de Pró-labore e Autônomos tiveram diversas alterações, com o objetivo

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Engenharia Informática

Engenharia Informática Escola Superior de Ciência e Tecnologia Engenharia Informática Análise de Sistemas Informáticos 3º ano Exame 12 de Julho de 2006 Docentes: José Correia e João Paulo Rodrigues Duração: 90 m; Tolerância:

Leia mais

SPSS Statistical Package for the Social Sciences Composto por dois ambientes:

SPSS Statistical Package for the Social Sciences Composto por dois ambientes: Introdução ao SPSS Essa serie de aulas sobre SPSS foi projetada para introduzir usuários iniciantes ao ambiente de trabalho do SPSS 15, e também para reavivar a memória de usuários intermediários e avançados

Leia mais

Barómetro Regional da Qualidade Avaliação das Atitudes e Conhecimentos dos Residentes sobre a Qualidade. Enquadramento.

Barómetro Regional da Qualidade Avaliação das Atitudes e Conhecimentos dos Residentes sobre a Qualidade. Enquadramento. Avaliação das Atitudes e Conhecimentos dos Residentes sobre a Qualidade 2011 Entidade Promotora Concepção e Realização Enquadramento Vice-Presidência Avaliação das Atitudes e Conhecimentos dos Residentes

Leia mais

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu 1 Programação Não Linear Aula 25: Programação Não-Linear - Funções de Uma única variável Mínimo; Mínimo Global; Mínimo Local; Optimização Irrestrita; Condições Óptimas; Método da Bissecção; Método de Newton.

Leia mais

Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009. Como fazer um trabalho

Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009. Como fazer um trabalho Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009 Como fazer um trabalho Etapas na elaboração de um trabalho 1ª Etapa Penso sobre o tema 2ª Etapa Onde vou encontrar a informação? 3ª

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

Engenharia de Software Sistemas Distribuídos

Engenharia de Software Sistemas Distribuídos Engenharia de Software Sistemas Distribuídos 2 o Semestre de 2009/2010 FEARSe Requisitos para a 1 a entrega 18 de Março de 2010 1 Introdução O projecto conjunto das disciplinas de Engenharia de Software

Leia mais