Universidade do Algarve Faculdade de Ciências e Tecnologia Licenciatura em Informática Ramo Tecnológico
|
|
- Rui Desconhecida Viveiros
- 8 Há anos
- Visualizações:
Transcrição
1 Universidade do Algarve Faculdade de Ciências e Tecnologia Licenciatura em Informática Ramo Tecnológico Técnicas de clustering Relatório Discentes: Ricardo Seromenho, N.º Docente: Prof.º Doutor Patrício Serendero 7 de Julho de 2008
2 Índice 1 Introdução 3 2 Objectivo 3 3 Data Mining O que é? Os dados Funcionalidades Classificação Clustering Regressão Linear Previsão 7 4 Clustering K-Means Expectation Maximization COBWEB 9 5 Descrição do Problema 9 6 Preparação dos dados 10 7 Análise dos dados Preparação (Preprocess) Clustering Para k = Para k = Para k = Re-clustering Para k = Para k = Para k = Conclusões e Trabalho Futuro 22 9 Referências 23 Índice de Tabelas Tabela 1 5 Tabela 2 10 Tabela 3 12 Tabela
3 1. Introdução O data mining é uma evolução natural das bases de dados. Com o crescimento das bases de dados tornou-se quase uma necessidade ter ferramentas que extraíssem alguma informação útil da grande brutidade de dados ali existentes. Desde à muito que o Homem tem a tendência para fazer registos do que quer que seja. Os dados climatéricos não são excepção, e é com base nos dados climatéricos de 2003 da Ria Formosa em Faro que efectuarei o meu trabalho. 2. Objectivo O objectivo deste trabalho é estudar algumas das técnicas de clustering que existem. Compreender o que é o clustering e para que serve. Das técnicas estudadas escolher apenas uma, aplicá-la a um conjunto de dados e mostrar os resultados. 3
4 3. Data Mining As capacidades para gerar e guardar dados têm vindo a aumentar nas últimas décadas [6]. Podemos, talvez, até dizer que a Lei de Moore [5] também se aplica à quantidade de informação produzida. Calcula-se que até ao final de 1999 já se teria produzido 12 exabytes de informação, e no final de 2002 já íamos em 24 exabytes [3]. Do avanço da tecnologia que nos permitiu produzir/armazenar maior quantidade dados, rapidamente surgiu a necessidade de arranjar forma de os analisar. 3.1 O que é? Duas definições comummente aceites de Data Mining são: Procura de padrões de interesse numa determinada forma de representação, ou conjunto de representações: classificação, árvores de decisão, regras de indução, regressão, segmentação, e assim por diante (Fayyad e tal., 1996) [1] e Exploração e análise, através de meios automáticos ou semi-automáticos, de grandes quantidades de dados com o objectivo de daí descobrir padrões e regras com interesse [2]. Data mining não é mais do que uma ferramenta que nos permite extrair informações úteis de grandes quantidades de dados, os quais, em bruto, podem nem significar nada. É utilizado em várias áreas, nomeadamente, por empresas para obterem conhecimento dos seus dados concretos e com esse conhecimento poderem melhorar as suas campanhas de marketing, aumentar as suas vendas e muito mais. Outros exemplos são as agências financeiras, a ciência, o comércio electrónico, a astronomia, entre outros. 3.2 Os dados Os dados são um conjunto de medidas ou de observações retiradas de qualquer ambiente ou de um processo [7]. No caso mais simples, temos uma colecção de n objectos, e para cada objecto temos um conjunto das mesmas medidas p. Neste caso podemos pensar numa colecção de medidas nos n objectos numa matriz de forma n x p. As n linhas representam os objectos para os quais as medidas foram tiradas (por exemplo: utentes de um consultório, clientes de um cartão de crédito, jogadores de 4
5 futebol). Essas linhas devem ser referenciadas como indivíduos, entidades, objectos ou registos, dependendo do contexto. A outra dimensão da nossa matriz de dados contém o conjunto de p medidas em cada objecto. Normalmente, assume-se que todas as medidas p são registadas individualmente em cada objecto, contudo poderão existir conjuntos de dados em que isso não aconteça (por exemplo: diferentes testes médicos em diferentes pacientes). As p colunas da matriz podem ser referenciadas como variáveis, campos, atributos ou características; neste caso, também o nome depende do contexto no qual estamos a trabalhar. Tabela 1 Exemplo de um conjunto de dados. (Melhores marcadores - bwin LIGA 2007/2008 [8]) # Nome Clube Posição Golos Jogos Média 1 Lisandro Porto Avançado ,89 2 Cardozo Benfica Avançado ,45 3 Weldon Belenenses Médio ,44 4 Wesley P. Ferreira Avançado ,50 5 Liedson Sporting Avançado ,42 6 Linz Braga Avançado ,41 7 Marcelinho Naval Avançado ,35 8 Lito Académica Médio ,33 9 João Paulo Leiria Médio ,47 10 Jorge Ribeiro Boavista Defesa ,31 Os tipos de dados podem ser vários, como por exemplo: categorias, sequências, intervalos ou booleanos [10]. Uma variável discreta tem elementos que tanto podem ser numeráveis, como números inteiros ou ainda, um conjunto finito. 3.3 Funcionalidades Existem várias funcionalidades de data mining que são utilizadas como base da aplicação. Estas funcionalidades servem para especificar o tipo de padrões a encontrar nas tarefas de data mining. Em geral, estas funcionalidades podem ser classificadas em 5
6 dois tipos: descritivas e preditivas [3]. As descritivas procuram identificar um conjunto de categorias para a descrição dos dados, enquanto as preditivas procuram fazer inferência nos dados, para poder prever valores futuros ou desconhecidos de outras variáveis [1]. De seguida, explicarei sucintamente em que consistem algumas das funcionalidades de data mining: Classificação Para classificar temos de adquirir o conhecimento que nos vai fazer prever a classe de um objecto [1]. Por exemplo, na Vodafone Portugal existem classes para os telemóveis que estão à venda, tais como Vodafone live!, Vodafone live! 3G, etc; e conceitos para os clientes, dividindo-os em duas grandes classes: clientes empresariais e clientes particulares Clustering Clustering é o processo pelo qual objectos discretos são atribuídos a grupos com características similares [9]. É assim possível identificar um conjunto finito de categorias ou segmentos para descrever os dados. Este processo não descobre um número de classes definidas pelo utilizador, descobre sim, um número de classes naturais existentes nos dados Regressão Linear A regressão linear consiste em encontrar uma função para a previsão de uma variável. E consiste na procura de uma variável que represente, de uma forma aproximada, comportamentos de variáveis [1]. Os métodos de regressão linear permitem a discriminação dos dados através da combinação dos atributos de entrada 6
7 3.3.4 Previsão A previsão tenta encontrar valores futuros desconhecidos de variáveis de interesse, com base nas variáveis que temos em nosso poder. O objectivo é quase como que saber o futuro, ou seja, o que vai acontecer a seguir. 4. Clustering O clustering é uma funcionalidade descritiva do data mining, pois permite identificar um conjunto finito de categorias ou segmentos para descrever os dados [1]. O processo de clustering consiste em agrupar os dados em clusters para que esses dados tenham, dentro de um cluster, um grande grau de semelhança entre si. Para além disso, esses dados têm que ser muito diferentes dos dados de outros clusters. As diferenças ou as semelhanças entre os dados são descobertas com base nos atributos de cada objecto. De seguida apresentarei 3 algoritmos de clustering. Os algoritmos que escolhi apresentar são o Cobweb, o K-Means e o Expectation-Maximization, três dos cinco que vêm, por defeito, no pacote do WEKA. O WEKA é uma aplicação que, automaticamente, analisa grandes quantidades de dados e decide qual é a informação mais relevante [13]. 4.1 K-Means Este algoritmo aceita k como parâmetro de entrada. Este k é o número de partições em que os n objectos vão ficar divididos, k < n. A semelhança entre os clusters é medida em relação aos centróides dos clusters, que podem ser vistos como o centro de gravidade dos clusters [6]. Como funciona o algoritmo? Primeiramente, selecciona ao acaso k objectos. Cada um desses k objectos representa, inicialmente, o centro (centróide) de um cluster ou um mean. No que diz respeito ao resto dos objectos, cada um deles é atribuído ao cluster que é mais semelhante, baseado na distância entre o objecto e o centróide. Depois são actualizados os valores dos centróides em cada cluster. Este processo continua até à convergência dos clusters ou outro critério de paragem [9]. 7
8 Uma vez que este algoritmo aceita o parâmetro de entrada k e os centróides são escolhidos ao acaso, as soluções encontradas podem nem sempre ser as mesmas. Pode-se dizer que é relativamente eficiente, pois a ordem de complexidade do algoritmo é O(tkn), onde n corresponde ao número de objectos, k ao número de clusters e t ao número de iterações do algoritmo. 4.2 Expectation Maximization Expectation-maximization, ao qual me referirei como EM, é um algoritmo que pertence à família de algoritmos de distribuição de probabilidades e densidades. É parecido ao K-means na medida em que o conjunto de dados é computado até que o valor de convergência desejado seja atingido. Trata-se de obter a FDP (Função de Densidade de Probabilidade) desconhecida a que pertencem o conjunto de todos os dados. Esta FDP pode-se calcular mediante uma combinação linear de componentes. Cada cluster corresponde a uma amostra de dados na qual pertence cada uma das densidades que se mede. Pode-se fazer uma estimativa da FDP de forma aleatória, utilizando FDP normais, Brernoulli, Poission O ajuste dos parâmetros do modelo requer uma medida likeihood. Essa medida é a decisão de o quão bem se encaixa os dados sobre a distribuição que estamos a utilizar. Trata-se então de ir à procura destes parâmetros. Maximizar o likelihood é conhecido como ML-Máximo likelihood. Normalmente, quando se quer calcular, utiliza-se o logaritmo log-likelihoo que tem uma forma analítica de cálculo, por isso fácil de determinar. Depois temos uma série de iterações de EM, cuja expectation utiliza os valores dos parâmetros iniciais ou proporcionados por Maximization, e Maximization obtém novos valores para os parâmetros. Finalmente, obtêm-se um conjunto de clusters que agrupam os objectos originais. Cada um destes clusters estará definido pelos parâmetros da distribuição normal. 8
9 4.3 COBWEB Este algoritmo pertence à categoria de clustering hierárquico. O clustering hierárquico trabalha agrupando os objectos numa árvore de clusters [6]. O clustering COBWEB cria o seu trabalho utilizando a forma de uma árvore. As folhas representam cada objecto e o nó de raiz representa todo o conjunto de dados. Os ramos representam o que se pretende obter, ou seja, os clusters. E se existirem subramos, estes representam os sub-clusters. Não existe limite para o número total de ramos e de sub-ramos da árvore sem ser, claro, o imposto pelo número de objectos que o conjunto de dados tem [17]. Como funciona o algoritmo? O COBWEB começa a sua árvore contendo apenas o nó de raiz, todo o conjunto de dados. A partir daí os objectos são adicionados um a um, com a árvore a ser actualizada a cada etapa do algoritmo. Quando um objecto é adicionado, é necessário encontrar o melhor sítio para o incluir. Esta operação pode requerer toda a reestruturação da árvore, incluindo a criação de um novo ramo e/ou a fusão de ramos já existentes, ou ainda, no caso mais simples, incluir o objecto num ramo que já exista. A função para actualizar a árvore denomina-se de utilidade de categoria, que mede a qualidade geral de uma partição de instâncias num cluster. A reestruturação que obtenha maior função de utilidade de categoria é a que se utiliza nesse passo. C1, C2,, CK são os k clusters; ai é o atributo que toma os valores vi1, vi2, ; Pr[a] refere-se à probabilidade do evento A ocorrer e Pr[A B] refere-se á probabilidade do evento A ocorrer condicionado pelo evento B. 5. Descrição do Problema Nós associamos o Inverno aos dias de frio, de chuva e algum vento e, por outro lado, o Verão aos dias de calor, pouco húmidos e apenas com uma aragem de vento. O conjunto de dados no qual decidi aplicar a técnica de clustering incide nas análises climatéricas referentes ao ano de 2003 em Faro. As medições de vento, precipitação e temperatura efectuadas ao longo do dia permitiram ao Instituto Superior de Agronomia tirar médias diárias e, com as mesmas, 9
10 fazer a respectiva média mensal ao longo do ano. Assim sendo, o conjunto dos dados é composto por 12 objectos, sendo que cada um tem 4 atributos. Os objectos correspondem aos 12 meses do ano, e os atributos utilizados foram: o nome do mês; e as médias mensais para o vento, a precipitação e a temperatura. 6. Preparação dos dados Os dados foram retirados de um artigo do Instituto de Conservação da Natureza e da Biodiversidade [15]. Primeiramente, coloquei os dados numa tabela, pois estavam espalhados ao longo de todo o relatório. Tabela 2 Conjunto de dados Mês Precipitação Vento Temperatura Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Os dados serão analisados no WEKA. O WEKA tem um formato de ficheiro próprio, o arff [16]; isto é, tem um cabeçalho que contém o nome da relação e a lista dos atributos da relação. A título de exemplo: 10
11 % 1. Title: Iris Plants Database % % 2. Sources: % (a) Creator: R.A. Fisher % (b) Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov) % (c) Date: July, sepallength sepalwidth petallength petalwidth class {Iris-setosa,Iris-versicolor,Iris-virginica} E depois tem o conjunto dos dados. Cada objecto é escrito numa linha e os atributos são separados por vírgulas. A título de 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa Posto isto, a estrutura do ficheiro para dar como entrada de dados do WEKA MES PRECIPITACAO VENTO TEMPERATURA 1,73.6,13.4,12.4 2,70.9,14.6,12.7 3,45.1,14,13.8 4,27.7,14.6,15.3 5,19.6,14.6,17.3 6,10.9,13.5,21 7,1.4,12.9,23.8 8,3.9,12.4,23.9 9,11.9,12.2, ,58.6,12.2, ,86.2,12.5, ,87.9,13.1,
12 7. Análise dos dados Os dados serão analisados utilizando o programa WEKA que o professor sugeriu. O algoritmo que decidi utilizar é um dos que vem no pacote, por defeito, do WEKA, e um acerca do qual encontrei mais referências enquanto efectuei a minha pesquisa em livros e na internet: o K-Means. 7.1 Preparação (Preprocess) Numa primeira fase abre-se o ficheiro arff criado para o efeito e podemos desde logo tirar alguns valores dos vários atributos de cada mês. De relembrar que os dados correspondem ao ano de Tabela 3 Preprocess Valores observados Estatística Precipitação Vento Temperatura Mínimo Máximo Mean Desvio Padrão O WEKA tem o poder de mostrar visualmente como estão dispostos os valores em todas as funcionalidades de que se dispõe no programa. No Preprocess conseguimos observar como estão distribuídos os valores, tendo em conta os dados estatísticos da tabela anterior: Desta primeira análise dos dados, no que diz respeito à precipitação, podemos concluir que esta está bem dividida ao longo do ano, pois temos seis meses que se 12
13 encontram entre o valor mínimo e o valor central e outros 6 meses entre o valor central e o máximo. Quanto ao vento podemos observar que existem cinco meses em que faz mais vento (os meses encontram-se acima do valor central) e sete meses em que a força do vento é menor, pois encontram-se abaixo do valor central. Já com a temperatura não se passa o mesmo que com a precipitação e o vento, em que tínhamos mais ou menos o mesmo número de meses, acima ou abaixo do valor central, durante o ano. A temperatura teve quatro meses acima do valor central e oito meses abaixo do valor central. 7.2 Clustering Uma vez que estamos a falar de clima ao longo de um ano parece-me que faz algum sentido fazer clustering para vários valores de k e daí tentar tirar alguma conclusão. Irei correr o algoritmo três vezes com k=2, k=3 e k = 4. K é o número de clusters que irei ter ao fim de correr o algoritmo. Na visualização cada cor corresponderá a um cluster. No final de cada visualização direi a que meses correspondem cada cluster. 13
14 7.2.1 Para k = 2 O output do clustering é o seguinte: === Run information === Scheme: weka.clusterers.simplekmeans -N 2 -S 10 Relation: CLIMA Instances: 12 Attributes: 4 MES PRECIPITACAO VENTO TEMPERATURA Test mode: evaluate on training data === Model and evaluation on training set === kmeans ====== Number of iterations: 3 Within cluster sum of squared errors: Cluster centroids: Cluster 0 Mean/Mode: Std Devs: Cluster 1 Mean/Mode: Std Devs: Clustered Instances 0 7 ( 58%) 1 5 ( 42%) Precipitação Cluster0 Janeiro, Fevereiro, Março, Abril, Maio, Cluster1 Junho, Julho, Agosto, Setembro, Outubro, Novembro, Dezembro São notórios os clusters que se formam se dividirmos os meses do ano em dois clusters. Temos praticamente metade do ano de um lado e a outra metade do outro. 14
15 Vento Cluster0 Janeiro, Fevereiro, Março, Abril, Maio Cluster1 Junho, Julho, Agosto, Setembro, Outubro, Novembro, Dezembro Quanto ao vento observa-se a mesma coisa. Consegue-se verificar, sem nenhuma dúvida, que os meses mais ventosos de 2003 foram os cinco primeiros meses do ano, seguindo-se meses com pouco índice de vento. Temperatura Cluster0 Janeiro, Fevereiro, Março, Abril, Maio Cluster1 Junho, Julho, Agosto, Setembro, Outubro, Novembro, Dezembro Se optarmos por ter uma visualização da temperatura, observamos que a temperatura vai subindo até ao mês de Junho e ganha o seu pico nos meses de Julho e Agosto, voltando, depois, a baixar. Clusters 15
16 7.2.2 Para k = 3 O output do clustering é o seguinte: === Run information === Scheme: weka.clusterers.simplekmeans -N 3 -S 10 Relation: CLIMA Instances: 12 Attributes: 4 MES PRECIPITACAO VENTO TEMPERATURA Test mode: evaluate on training data === Model and evaluation on training set === kmeans ====== Number of iterations: 3 Within cluster sum of squared errors: Cluster centroids: Cluster 0 Mean/Mode: Std Devs: Cluster 1 Mean/Mode: Std Devs: Cluster 2 Mean/Mode: Std Devs: Clustered Instances 0 4 ( 33%) 1 5 ( 42%) 2 3 ( 25%) Precipitação Cluster0 Janeiro, Fevereiro, Março, Abril, Maio Cluster1 Junho, Julho, Agosto, Setembro Cluster2 Outubro, Novembro, Dezembro A precipitação dividida em três partes dá mais ou menos quatro meses para cada parte. Podemos então dizer que as partes estão quase bem divididas. Temos um cluster até ao mês de Maio, a partir de Junho, quando o tempo começa a ficar mais quente, 16
17 temos outro, (como se irá verificar mais à frente na análise do gráfico da temperatura). Depois em Outubro dá-se o início de mais outro cluster. Vento Cluster0 Janeiro, Fevereiro, Março, Abril, Maio Cluster1 Junho, Julho, Agosto, Setembro Cluster2 Outubro, Novembro, Dezembro O vento tem exactamente os mesmo clusters que a precipitação. Os primeiros cinco meses do ano são mais ventosos, mas chegada a altura do Verão, o vento fica menos forte/intenso. Quando o Outono começa inicia-se outro cluster. Também podemos verificar que o mês de Dezembro é semelhante ao mês de Janeiro. Temperatura Cluster0 Janeiro, Fevereiro, Março, Abril, Maio Cluster1 Junho, Julho, Agosto, Setembro Cluster2 Outubro, Novembro, Dezembro A temperatura vem confirmar o que foi observado nos gráficos anteriores. O ano de 2003 ficaria quase bem dividido, se o dividíssemos em três clusters. Os clusters são os mesmos que para os gráficos anteriores. 17
18 Clusters Para k = 4 O output do clustering é o seguinte: === Run information === Scheme: weka.clusterers.simplekmeans -N 4 -S 10 Relation: CLIMA Instances: 12 Attributes: 4 MES PRECIPITACAO VENTO TEMPERATURA Test mode: evaluate on training data === Model and evaluation on training set === kmeans ====== Number of iterations: 3 Within cluster sum of squared errors: Cluster centroids: Cluster 0 Mean/Mode: Std Devs: Cluster 1 Mean/Mode: Std Devs: Cluster 2 Mean/Mode: Std Devs: Cluster 3 Mean/Mode: Std Devs: Clustered Instances 0 3 ( 25%) 1 3 ( 25%) 2 3 ( 25%) 3 3 ( 25%) 18
19 Precipitação Cluster0 Janeiro, Fevereiro, Março Cluster1 Abril, Maio, Junho Cluster2 Julho, Agosto, Setembro Cluster3 Outubro, Novembro, Dezembro Com o ano dividido em quatro clusters podemos constatar que em 2003, existiram quatro períodos distintos entre si. Os meses de menor precipitação foram Julho, Agosto e Setembro. Vento Cluster0 Janeiro, Fevereiro, Março Cluster1 Abril, Maio, Junho Cluster2 Julho, Agosto, Setembro Cluster3 Outubro, Novembro, Dezembro Fevereiro, Abril e Maio foram os meses em que a força do vento mais se fez sentir. Depois em Setembro, Outubro e Novembro deu-se o oposto, ou seja, quase que não houve vento. Temperatura Cluster0 Janeiro, Fevereiro, Março Cluster1 Abril, Maio, Junho Cluster2 Julho, Agosto, Setembro Cluster3 Outubro, Novembro, Dezembro 19
20 Os dois primeiros e os dois últimos meses do ano foram os meses em que tivemos as temperaturas mais baixas, Sendo que o pico foi atingido, como era de esperar, em Julho e Agosto. Clusters 7.3 Re-clustering O termo que estou a utilizar para descrever este ponto do relatório pode não existir, mas o que quero dizer com isto é que fiz de novo o clustering aos dados. Não fiquei contente com a separação dos clusters, pois não me fazia sentido não constarem no mesmo cluster, por exemplo, meses como Janeiro e Dezembro. Então fiz o clustering mas com o atributo mês a não entrar nas contas do K-Means. Os valores dos atributos visualizados para a precipitação, o vento e a temperatura são os mesmos que no ponto anterior, por isso vou apenas mostrar os resultados dos clusters obtidos com este novo clustering. Com base nos valores do ponto 7.2, em que se pode ver a precipitação, o vento e a temperatura, as conclusões retiradas dos clusters são as apresentadas nos pontos seguintes: Para k = 2 Cluster0 Junho, Julho, Agosto, Setembro, Outubro Cluster1 Janeiro, Fevereiro, Março, Abril, Maio, Novembro, Dezembro 20
21 O ano de 2003 teve os primeiros meses do ano até Maio incluídos num cluster e de Junho a Outubro noutro cluster. Novembro e Dezembro pertenceram ao primeiro cluster. Daqui podemos concluir que ao longo do ano, de um modo geral, o cluster0 tem os meses mais quentes, menos ventosos e húmidos Para k = 3 Cluster0 Junho, Julho, Agosto, Setembro Cluster1 Fevereiro, Março, Abril, Maio Cluster2 Janeiro, Outubro, Novembro, Dezembro Se dividirmos o ano em três grupos de meses, verificamos que temos o mesmo número em cada grupo Para k = 4 Cluster0 Junho, Julho, Agosto, Setembro Cluster1 Março, Abril, Maio Cluster2 Outubro, Novembro Cluster3 Janeiro, Fevereiro, Dezembro Esta era a análise pela qual eu estava à espera. Não no sentido de saber o que iria dar, mas porque verifiquei que talvez possa ter errado no ponto 7.2, quando coloquei o número do mês nas contas do K-Means para analisar os dados. Temos aqui quatro clusters quase bem distribuídos. Mas ao contrário da primeira análise do ponto 7.2 em que os meses estavam agrupados de seguida no mesmo cluster, 21
22 esta análise, na minha opinião, é a correcta, pois tem em conta apenas os atributos de precipitação, vento e temperatura, obtendo assim uma distribuição verdadeira dos meses. Sabendo que as estações do ano estão distribuídas da seguinte forma: Tabela 4 Estações do ano Estação Data Início Primavera 20 de Março Verão 20 de Junho Outono 22 de Setembro Inverno 21 de Dezembro Então, esta distribuição dos clusters quase que corresponde às estações do ano. Poderíamos atribuir a cada cluster uma estação do ano. O cluster0 seria o Verão, o cluster1 a Primavera, o cluster2 o Outono e, por fim, o cluster3 o Inverno. 8. Conclusões e Trabalho Futuro Consegui efectuar o clustering a um conjunto de dados. Esse conjunto de dados era pequeno, mas deu para perceber e compreender a ideia geral do que é o clustering. Só à segunda tentativa é que entendi um erro que tinha cometido na tentativa anterior. Na primeira tentativa estava a obter sempre os meses seguidos, começando em Janeiro o mesmo cluster. O ano de 2003 não foi um ano fora do normal, pois teoricamente o ano tem quatro períodos distintos, e isso foi confirmado no segundo clustering que fiz com k = 4. Não foi muito fácil encontrar este tipo de dados estatísticos. Para trabalho futuro seria interessante obter mais dados de anos anteriores e posteriores a 2003 e ter uma quantidade mais ou menos razoável de dados para se poder comparar a evolução dos clusters em cada ano. As partes interessantes deste trabalho futuro poderiam ser, por exemplo, concluir se na zona da Ria Formosa a temperatura está a aumentar e a precipitação a diminuir (resultante do efeito de estufa que se possa fazer sentir na zona), ou ainda utilizar os dados para poder prever os anos vindouros. 22
23 9. Referências [1] DATA MINING Descoberta de Conhecimento em Base de Dados, M Santos Carla Sousa Azevedo, [2] Data Mining Techniques For Marketing, Sales, and Customer Support, Michael J. A. Berry, Gordon Linoff [3] Patricio Serendero. Apontamentos de aula. Acedido a 29 de Março de 2008, in [4] Apache Software Fundation (2007). What is Apache Derby. Acedido a 7 de Fevereiro de 2008, in [5] Intel, Moore's Law Made real by Intel innovation. Acedido a 2 de Junho de 2008, in [6] Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber [7] Principles of Data Mining, David Hand, Heikki Mannila, Padhraic Smyth [8] Liga Portuguesa de Futebol Profissional, Estatísticas de jogos. Acedido a 5 de Junho de 2008, in [9] Patricio Serendero, Clustering. Acedido a 6 de Junho de 2008, in [10] Patricio Serendero, Dados e o seu domínio. Acedido a 6 de Junho de 2008, in 0o%20seu%20dominio.pdf [11] Microsoft, Rafal Lukawiecki Introduction to Data Mining. Visualizado a 8 de Junho de 2008, in [12] Ian H. Witten and Eibe Frank (2005) "Data Mining: Practical machine learning tools and techniques", 2nd Edition, Morgan Kaufmann, San Francisco, [13] WEKA The University of Waikato, Machina Learning Project. Acedido a 18 de Junho, in [14] The EM Algorithm for Unsupervised Clustering. Acedido a 22 de Junho, in [15] Revisão do Plano de Ordenamento do Parque Natural da Ria Formosa. Acedido a 26 de Junho de 2008, in 23
24 [16] Attribute-Relation File Format (ARFF) Acedido a 27 de Junho de 2008, in [17] 3.11 COBWEB. Acedido a 28 de Junho de 2008, in 24
MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
Leia maisExtração de Árvores de Decisão com a Ferramenta de Data Mining Weka
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de
Leia maisSistema de mineração de dados para descobertas de regras e padrões em dados médicos
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas
Leia maisUniversidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados
Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:
Leia maisXIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL
Leia maisTarefa Orientada 18 Tabelas dinâmicas
Tarefa Orientada 18 Tabelas dinâmicas Análise de dados através de tabelas dinâmicas. Conceitos teóricos As Tabelas Dinâmicas são tabelas interactivas que resumem elevadas quantidades de dados, usando estrutura
Leia maisDadas a base e a altura de um triangulo, determinar sua área.
Disciplina Lógica de Programação Visual Ana Rita Dutra dos Santos Especialista em Novas Tecnologias aplicadas a Educação Mestranda em Informática aplicada a Educação ana.santos@qi.edu.br Conceitos Preliminares
Leia maisMúltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II
O seguinte exercício contempla um processo com três estágios. Baseia-se no Inquérito de Satisfação Fase II, sendo, por isso, essencial compreender primeiro o problema antes de começar o tutorial. 1 1.
Leia maisPesquisa com Professores de Escolas e com Alunos da Graduação em Matemática
Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática Rene Baltazar Introdução Serão abordados, neste trabalho, significados e características de Professor Pesquisador e as conseqüências,
Leia maisFaculdade de Ciências da Universidade de Lisboa CURSO DE GPS. Módulo x. (Aula Prática) Reliance - Ashtech. Suas Aplicações Em SIG.
Faculdade de Ciências da Universidade de Lisboa CURSO DE GPS Módulo x (Aula Prática) Reliance - Ashtech e Suas Aplicações Em SIG (Carlos Antunes) INTODUÇÃO O Sistema Reliance baseia-se na utilização do
Leia maisManual de Utilizador. Disciplina de Projecto de Sistemas Industriais. Escola Superior de Tecnologia. Instituto Politécnico de Castelo Branco
Escola Superior de Tecnologia Instituto Politécnico de Castelo Branco Departamento de Informática Curso de Engenharia Informática Disciplina de Projecto de Sistemas Industriais Ano Lectivo de 2005/2006
Leia maisCAP. I ERROS EM CÁLCULO NUMÉRICO
CAP. I ERROS EM CÁLCULO NUMÉRICO 0. Introdução Por método numérico entende-se um método para calcular a solução de um problema realizando apenas uma sequência finita de operações aritméticas. A obtenção
Leia maisTENHA MAIS MÃO NAS SUAS CONTAS
de Finanças Pessoais Dicas para que conheça melhor esta nova ferramenta do activobank TENHA MAIS MÃO NAS SUAS CONTAS 02 ÍNDICE 03 1.VANTAGENS DO Gestor Activo 04 2.ATIVAÇÃO 04 Para ativar 05 Agora que
Leia maisTarefa 18: Criar Tabelas Dinâmicas a partir de Listas de Excel
Tarefa 18: Criar Tabelas Dinâmicas a partir de 1. Alguns conceitos sobre Tabelas Dinâmicas Com tabelas dinâmicas podemos criar dinâmica e imediatamente resumos de uma lista Excel ou de uma base de dados
Leia maisUTILIZANDO O SOFTWARE WEKA
UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia
Leia maisAula 4 Estatística Conceitos básicos
Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a
Leia mais5 Equacionando os problemas
A UA UL LA Equacionando os problemas Introdução Nossa aula começará com um quebra- cabeça de mesa de bar - para você tentar resolver agora. Observe esta figura feita com palitos de fósforo. Mova de lugar
Leia maisLógicas de Supervisão Pedagógica em Contexto de Avaliação de Desempenho Docente ENTREVISTA - Professor Avaliado - E 2
Sexo Idade Grupo de docência Feminino 40 Inglês (3º ciclo/secundário) Anos de Escola serviço 20 Distrito do Porto A professora, da disciplina de Inglês, disponibilizou-se para conversar comigo sobre o
Leia maisTendo isso em conta, o Bruno nunca esqueceu que essa era a vontade do meu pai e por isso também queria a nossa participação neste projecto.
Boa tarde a todos, para quem não me conhece sou o Ricardo Aragão Pinto, e serei o Presidente do Concelho Fiscal desta nobre Fundação. Antes de mais, queria agradecer a todos por terem vindo. É uma honra
Leia maisADM041 / EPR806 Sistemas de Informação
ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes
Leia maisZS Rest. Manual Avançado. Menus. v2011 - Certificado
Manual Avançado Menus v2011 - Certificado 1 1. Índice 2. Introdução... 2 3. Iniciar o ZSRest... 3 4. Menus... 4 b) Novo Produto:... 5 i. Separador Geral.... 5 ii. Separador Preços e Impostos... 7 iii.
Leia maisManual de utilização do Moodle
Manual de utilização do Moodle Iniciação para docentes Universidade Atlântica Versão: 1 Data: Fevereiro 2010 Última revisão: Fevereiro 2010 Autor: Ricardo Gusmão Índice Introdução... 1 Registo no Moodle...
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Leia maisINTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por
INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca
Leia maisMANUAL DO GESTOR DE FINANÇAS
MANUAL DO GESTOR DE FINANÇAS Manual de utilização e dicas para que conheça melhor esta nova ferramenta do millenniumbcp.pt.. 1 02 ÍNDICE 03 1 PORQUÊ USAR O GESTOR DE FINANÇAS? 04 2 ADESÃO 04 Como aderir?
Leia maisTrabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores
Trabalhos Práticos Programação II Curso: Engª Electrotécnica - Electrónica e Computadores 1. Objectivos 2. Calendarização 3. Normas 3.1 Relatório 3.2 Avaliação 4. Propostas Na disciplina de Programação
Leia maisEngenharia de Software. Enunciado da Segunda Parte do Projecto
LEIC-A, LEIC-T, LETI, MEIC-T, MEIC-A Engenharia de Software 2 o Semestre 2013/2014 Enunciado da Segunda Parte do Projecto 1. Segunda Parte do Projecto ES A segunda parte do projecto consiste na realização
Leia maisControle Financeiro. 7 dicas poderosas para um controle financeiro eficaz. Emerson Machado Salvalagio. www.guiadomicroempreendedor.com.
Controle Financeiro 7 dicas poderosas para um controle financeiro eficaz Emerson Machado Salvalagio Quando abrimos uma empresa e montamos nosso próprio negócio ou quando nos formalizamos, após algum tempo
Leia maisSistema de Informação de Licenciamento de Operações de Gestão de Resíduos
Sistema de Informação de Licenciamento de Operações de Gestão de Resíduos Indice Indice... 2 1. Introdução... 3 2. Sistema de Informação de Licenciamento de Operações de Gestão de Resíduos (SILOGR)....
Leia maisTECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO
TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO CONCEITOS BÁSICOS 1 Necessidade das base de dados Permite guardar dados dos mais variados tipos; Permite
Leia maisyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnm qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxc
qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwe rtyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyui opasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopas
Leia maisManual do Gestor da Informação do Sistema
Faculdade de Engenharia da Universidade do Porto Licenciatura Informática e Computação Laboratório de Informática Avançada Automatização de Horários Manual do Gestor da Informação do Sistema João Braga
Leia maisSoftware PHC com MapPoint
Software PHC com MapPoint A análise de informação geográfica A integração entre o Software PHC e o Microsoft Map Point permite a análise de informação geográfica, desde mapas a rotas, com base na informação
Leia maisDWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS
DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.
Leia maisMobilidade na FEUP Deslocamento Vertical
Mobilidade na FEUP Deslocamento Vertical Relatório Grupo 515: Carolina Correia Elder Vintena Francisco Martins Salvador Costa Sara Palhares 2 Índice Introdução...4 Objectivos...5 Método...6 Dados Obtidos...7
Leia maisComo incluir artigos:
Como incluir artigos: O WordPress é uma ferramenta muito flexível, com muitas variações e ajustes que podem torná-lo algo muito simples e também muito sofisticado conforme os recursos que são configurados
Leia maisgettyimages.pt Guia do site área de Film
gettyimages.pt Guia do site área de Film Bem-vindo à área de Film do novo site gettyimages.pt. Decidimos compilar este guia, para o ajudar a tirar o máximo partido da área de Film, agora diferente e melhorada.
Leia maisCopyright 2008 GrupoPIE Portugal, S.A.
WinREST Sensor Log A Restauração do Séc. XXI WinREST Sensor Log Copyright 2008 GrupoPIE Portugal, S.A. 2 WinREST Sensor Log Índice Índice Pag. 1. WinREST Sensor Log...5 1.1. Instalação (aplicação ou serviço)...6
Leia maisAplicação de Estatísticas de Ensino Superior
Instituto Politécnico de Beja Escola Superior de Tecnologia e Gestão Curso de Engenharia Informática Disciplina de Linguagens de Programação Aplicação de Estatísticas de Ensino Superior Linguagem: Python
Leia maisCresce o numero de desempregados sem direito ao subsidio de desemprego Pág. 1
Cresce o numero de desempregados sem direito ao subsidio de desemprego Pág. 1 CRESCE O DESEMPREGO E O NUMERO DE DESEMPREGADOS SEM DIREITO A SUBSIDIO DE DESEMPREGO, E CONTINUAM A SER ELIMINADOS DOS FICHEIROS
Leia maisZS Rest. Manual Profissional. BackOffice Mapa de Mesas. v2011
Manual Profissional BackOffice Mapa de Mesas v2011 1 1. Índice 2. Introdução... 2 3. Iniciar ZSRest Backoffice... 3 4. Confirmar desenho de mesas... 4 b) Activar mapa de mesas... 4 c) Zonas... 4 5. Desenhar
Leia maisWEBSITE DEFIR PRO WWW.DEFIR.NET
MANUAL DO UTILIZADOR WEBSITE DEFIR PRO WWW.DEFIR.NET 1. 2. PÁGINA INICIAL... 3 CARACTERÍSTICAS... 3 2.1. 2.2. APRESENTAÇÃO E ESPECIFICAÇÕES... 3 TUTORIAIS... 4 3. DOWNLOADS... 5 3.1. 3.2. ENCOMENDAS (NOVOS
Leia maisDisciplina: Unidade III: Prof.: E-mail: Período:
Encontro 08 Disciplina: Sistemas de Banco de Dados Unidade III: Modelagem Lógico de Dados Prof.: Mario Filho E-mail: pro@mariofilho.com.br Período: 5º. SIG - ADM Relembrando... Necessidade de Dados Projeto
Leia maisMICROSOFT ACCESS MICROSOFT ACCESS. Professor Rafael Vieira Professor Rafael Vieira
MICROSOFT ACCESS MICROSOFT ACCESS Professor Rafael Vieira Professor Rafael Vieira - Access - Programa de base de dados relacional funciona em Windows Elementos de uma Base de Dados: Tabelas Consultas Formulários
Leia maisFEDERAÇÃO PORTUGUESA DE GOLFE COMISSÃO DE HANDICAPS E COURSE RATING
REVISÃO ANUAL 2008 O Sistema de Handicaps EGA, para além dos ajustes automáticos efectuados ao handicap do jogador após cada volta válida prevê dois elementos fundamentais de intervenção por parte das
Leia maiswww.enviarsms.smsvianetportugal.com Descrição de Como Utilizar
www.enviarsms.smsvianetportugal.com Descrição de Como Utilizar Este interface de utilizador, do serviço www.smsvianetportugal.com, permite a ceder à mesma conta de cliente, que através do interface simplesms.smsvianetportugal.
Leia maisOFICIAL DA ORDEM MILITAR DE CRISTO MEDALHA DE EDUCAÇÃO FÍSICA E BONS SERVIÇOS. Circular n.º 029/2014 PORTAL FPT Abertura aos atletas
Circular n.º 029/2014 PORTAL FPT Abertura aos atletas Exmo. Sr. Presidente, Após muitos meses de desenvolvimento e melhorias contínuas na nova plataforma informática onde se inclui o amplamente divulgado
Leia maisFaculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu
1 Programação Não Linear Aula 25: Programação Não-Linear - Funções de Uma única variável Mínimo; Mínimo Global; Mínimo Local; Optimização Irrestrita; Condições Óptimas; Método da Bissecção; Método de Newton.
Leia maisBases de Dados. Lab 1: Introdução ao ambiente
Departamento de Engenharia Informática 2010/2011 Bases de Dados Lab 1: Introdução ao ambiente 1º semestre O ficheiro bank.sql contém um conjunto de instruções SQL para criar a base de dados de exemplo
Leia maisProf. Msc. Paulo Muniz de Ávila
Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida
Leia maisMANUAL DO GESTOR DE FINANÇAS
MANUAL DO GESTOR DE FINANÇAS Manual de utilização e dicas para que conheça melhor esta nova ferramenta do millenniumbcp.pt. e da App Millennium para equipamentos ipad/ iphone / ipod touch.. 1 02 ÍNDICE
Leia maisOrientação a Objetos
1. Domínio e Aplicação Orientação a Objetos Um domínio é composto pelas entidades, informações e processos relacionados a um determinado contexto. Uma aplicação pode ser desenvolvida para automatizar ou
Leia maisClustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining
Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro
Leia maisCalculando probabilidades
A UA UL LA Calculando probabilidades Introdução evento E é: P(E) = Você já aprendeu que a probabilidade de um nº deresultadosfavoráveis nº total de resultados possíveis Nesta aula você aprenderá a calcular
Leia maisAlgoritmos. Objetivo principal: explicar que a mesma ação pode ser realizada de várias maneiras, e que às vezes umas são melhores que outras.
6 6 NOME DA AULA: 6 Algoritmos Duração da aula: 45 60 minutos Tempo de preparação: 10-25 minutos (dependendo da disponibilidade de tangrans prontos ou da necessidade de cortá-los à mão) Objetivo principal:
Leia maisGERIR ENERGIA: A VERDADE SOBRE A GESTÃO DO TEMPO
GERIR ENERGIA: A VERDADE SOBRE A GESTÃO DO TEMPO Gestão do tempo como gestão das energias Ninguém gere o tempo. Não conseguimos colocar as 17 horas antes das 15. 2004 só chega depois de 2003. Gerimos energias,
Leia maisPara criar a conta faça clique no separador. Abre um formulário com campos que terá que preencher. Basta ir seguindo
CRIAR UMA CONTA DE CORREIO ELECTRÓNICO Ex: No hotmail: Abrir o Explorer Na barra de endereços escrever: http://www.hotmail.com Surge a página representada na fig.1. Fig. 1 Para criar a conta faça clique
Leia maisData Mining Software Weka. Software Weka. Software Weka 30/10/2012
Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.
Leia maisBase de Dados para Administrações de Condomínios
Base de Dados para Administrações de Condomínios José Pedro Gaiolas de Sousa Pinto: ei03069@fe.up.pt Marco António Sousa Nunes Fernandes Silva: ei03121@fe.up.pt Pedro Miguel Rosário Alves: alves.pedro@fe.up.pt
Leia maisGuia para a declaração de despesas no Programa SUDOE
Guia para a declaração de despesas no Programa SUDOE CAPÍTULO 1: INTRODUÇÃO... 2 CAPÍTULO 2: ACESSO AO MÓDULO DE GESTÃO DE DESPESAS PAGAS... 3 CAPÍTULO 3: GESTÃO DAS DESPESAS PAGAS... 4 3.1 Incorporação
Leia maisUtilização do SOLVER do EXCEL
Utilização do SOLVER do EXCEL 1 Utilização do SOLVER do EXCEL José Fernando Oliveira DEEC FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO MAIO 1998 Para ilustrar a utilização do Solver na resolução de
Leia maisFACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>
FACULDADE DE ENGENHARIA DE COMPUTAÇÃO PROJETO FINAL I e II PLANO DE TRABALHO O Trabalho de Conclusão de Curso (TCC) a ser desenvolvido
Leia maisO jogo da Árvore. A forma de mudança. O texto da Lição 6: O jogo da Árvore do livro. A Forma de Mudança
O jogo da Árvore A forma de mudança O texto da Lição 6: O jogo da Árvore do livro A Forma de Mudança De Rob Quaden e Alan Ticotsky Com Debra Lyneis Ilustrado por Nathan Walker Publicado pelo Creative Learning
Leia maisTarefa Orientada 13 Agrupamento e sumário de dados
Tarefa Orientada 13 Agrupamento e sumário de dados Objectivos: Funções de agregação Agrupamento e sumário de dados Funções de agregação Nesta tarefa orientada iremos formular consultas que sumariam os
Leia maisAcronis Servidor de Licença. Manual do Utilizador
Acronis Servidor de Licença Manual do Utilizador ÍNDICE 1. INTRODUÇÃO... 3 1.1 Descrição geral... 3 1.2 Política de licenças... 3 2. SISTEMAS OPERATIVOS SUPORTADOS... 4 3. INSTALAR O SERVIDOR DE LICENÇA
Leia maisSAFT para siscom. Manual do Utilizador. Data última versão: 07.11.2008 Versão: 1.01. Data criação: 21.12.2007
Manual do Utilizador SAFT para siscom Data última versão: 07.11.2008 Versão: 1.01 Data criação: 21.12.2007 Faro R. Dr. José Filipe Alvares, 31 8005-220 FARO Telf. +351 289 899 620 Fax. +351 289 899 629
Leia maisCriação de Páginas Web - MS Word 2000
Gestão Comercial e da Produção Informática I 2003/04 Ficha de Trabalho N.º 9 Criação de Páginas Web - MS Word 2000 1. Criação de uma página Web (HTML): Escreva o seu texto e introduza as imagens pretendidas
Leia maisPlataforma de Benefícios Públicos Acesso externo
Índice 1. Acesso à Plataforma... 2 2. Consulta dos Programas de Beneficios Públicos em Curso... 3 3. Entrar na Plataforma... 4 4. Consultar/Entregar Documentos... 5 5. Consultar... 7 6. Entregar Comprovativos
Leia maisPRIMAVERA EXPRESS: Funcionalidades do Produto
PRIMAVERA EXPRESS: Funcionalidades do Produto Como efetuo a mudança de ano do Ponto de Venda? No Programa Express aceda a Tabelas Pontos de Venda Postos de Venda abrir o separador Movimentos Caixa e: -
Leia maisTarefa Orientada 16 Vistas
Tarefa Orientada 16 Vistas Objectivos: Vistas só de leitura Vistas de manipulação de dados Uma vista consiste numa instrução de SELECT que é armazenada como um objecto na base de dados. Deste modo, um
Leia maisNovo Formato de Logins Manual de Consulta
Gestão Integrada de Acessos Novo Formato de Logins Manual de Consulta Gestão Integrada de Acessos Histórico de Alterações Versão Descrição Autor Data 1.0 Versão inicial DSI/PPQ 2014-07-11 Controlo do documento
Leia maisA VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO
DOMINE A 110% ACCESS 2010 A VISTA BACKSTAGE Assim que é activado o Access, é visualizado o ecrã principal de acesso na nova vista Backstage. Após aceder ao Access 2010, no canto superior esquerdo do Friso,
Leia maisFerramenta de Apoio ao Jogo 2 (Ensino da Leitura) incluído nos Jogos da Mimocas
As Palavras Ferramenta de Apoio ao Jogo 2 (Ensino da Leitura) incluído nos Jogos da Mimocas 1. Introdução A Associação Portuguesa de Portadores de Trissomia 21 (APPT21) e a Escola Superior de Gestão de
Leia mais4Distribuição de. freqüência
4Distribuição de freqüência O objetivo desta Unidade é partir dos dados brutos, isto é, desorganizados, para uma apresentação formal. Nesse percurso, seção 1, destacaremos a diferença entre tabela primitiva
Leia maisImportação de Ficheiros SAFT
Importação de Ficheiros SAFT Foi Criada na contabilidade uma rotina de integração de ficheiros SAF-T PT para permitir integrar de forma simples e rápida o ficheiro utilizado para enviar a faturação mensal
Leia maisAplicações de Escritório Electrónico
Universidade de Aveiro Escola Superior de Tecnologia e Gestão de Águeda Curso de Especialização Tecnológica em Práticas Administrativas e Tradução Aplicações de Escritório Electrónico Folha de trabalho
Leia maisUNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo
UNIVERSIDADE DE SÃO PAULO Faculdade de Arquitetura e Urbanismo DISTRIBUIÇÃO AMOSTRAL ESTIMAÇÃO AUT 516 Estatística Aplicada a Arquitetura e Urbanismo 2 DISTRIBUIÇÃO AMOSTRAL Na aula anterior analisamos
Leia maisTarefa Orientada 14 Subconsultas
Tarefa Orientada 14 Subconsultas Objectivos: Subconsultas não correlacionadas Operadores ALL, SOME e ANY Subconsultas correlacionadas Operador EXISTS Subconsultas incluídas na cláusula FROM de uma consulta
Leia maisCOMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS
COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO
Leia maisExercícios Teóricos Resolvidos
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Matemática Exercícios Teóricos Resolvidos O propósito deste texto é tentar mostrar aos alunos várias maneiras de raciocinar
Leia maisAlgoritmos e Estrutura de Dados III. Árvores
Algoritmos e Estrutura de Dados III Árvores Uma das mais importantes classes de estruturas de dados em computação são as árvores. Aproveitando-se de sua organização hierárquica, muitas aplicações são realizadas
Leia maisRock In Rio - Lisboa
Curso de Engenharia Informática Industrial Rock In Rio - Lisboa Elaborado por: Ano Lectivo: 2004/05 Tiago Costa N.º 4917 Turma: C Gustavo Graça Patrício N.º 4757 Turma: C Docente: Professora Maria Estalagem
Leia maisA Grande Importância da Mineração de Dados nas Organizações
A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil
Leia maisUsando o Excel ESTATÍSTICA. Funções
Funções Podemos usar no Excel fórmulas ou funções. Anteriormente já vimos algumas fórmulas. Vamos agora ver o exemplo de algumas funções que podem ser úteis para o trabalho de Excel. Para começar podemos
Leia maisObservação das aulas Algumas indicações para observar as aulas
Observação das aulas Algumas indicações para observar as aulas OBJECTVOS: Avaliar a capacidade do/a professor(a) de integrar esta abordagem nas actividades quotidianas. sso implicará igualmente uma descrição
Leia maisConceitos importantes
Conceitos importantes Informática Informação + Automática Tratamento ou processamento da informação, utilizando meios automáticos. Computador (Provem da palavra latina: computare, que significa contar)
Leia maisUNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS
UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário
Leia maisDEMONSTRAÇÕES FINANCEIRAS COMBINADAS
24 DEMONSTRAÇÕES FINANCEIRAS COMBINADAS Os mercados de capitais na Europa e no mundo exigem informações financeiras significativas, confiáveis, relevantes e comparáveis sobre os emitentes de valores mobiliários.
Leia maisUm sistema bem dimensionado permite poupar, em média, 70% a 80% da energia necessária para o aquecimento de água que usamos em casa.
Mais Questões Isildo M. C. Benta, Assistência Técnica Certificada de Sistemas Solares Quanto poupo se instalar um painel solar térmico? Um sistema bem dimensionado permite poupar, em média, 70% a 80% da
Leia maisAULA 6 - Operações Espaciais
6.1 AULA 6 - Operações Espaciais Essa aula descreve as operações espaciais disponíveis no TerraView. Antes de iniciar sua descrição é necessário importar alguns dados que serão usados nos exemplos. Exercício:
Leia maisExemplo de Aplicação do DataMinig
Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta
Leia maisManual de Utilizador Plataforma de Estágios TIC. www.estagiostic.gov.pt
Manual de Utilizador Plataforma de Estágios TIC www.estagiostic.gov.pt 1 Índice 1 Introdução 3 1.1 Programa de Estágios TIC 3 1.2 Objectivo da plataforma 3 1.3 Perfis 4 1.3.1 Escola 4 1.3.2 Empresa 4 1.3.3
Leia maisRelatório de Estágio
ÍNDICE 1. Descrição da empresa 2. Descrição do problema 2.1 Subcontratação da produção 2.2 Relacionamento da empresa 2.3 Dois departamentos de qualidade 2.4 Inspecções actualmente efectuadas 2.5 Não conformidades
Leia maisOFICIAL DA ORDEM MILITAR DE CRISTO MEDALHA DE EDUCAÇÃO FÍSICA E BONS SERVIÇOS. Circular n.º 023-A/2014 Portal F.P.T. - Inscrições (Aditamento)
Circular n.º 023-A/2014 Portal F.P.T. - Inscrições (Aditamento) Exmo. Sr. Presidente, A Direcção da F.P.T. tem emitido, ao longo dos últimos meses, diversas Circulares, com o objectivo de ir informando,
Leia mais24 O uso dos manuais de Matemática pelos alunos de 9.º ano
24 O uso dos manuais de Matemática pelos alunos de 9.º ano Mariana Tavares Colégio Camões, Rio Tinto João Pedro da Ponte Departamento de Educação e Centro de Investigação em Educação Faculdade de Ciências
Leia mais2. Utilitários de sistema para ambiente Windows. 2.1. Ferramentas de gestão de ficheiros
2. Utilitários de sistema para ambiente Windows 2.1. Ferramentas de gestão de Os compressores de são programas com capacidade para comprimir ou pastas, tornando-as mais magras, ou seja, ocupando menos
Leia maisMÓDULO 6 INTRODUÇÃO À PROBABILIDADE
MÓDULO 6 INTRODUÇÃO À PROBBILIDDE Quando estudamos algum fenômeno através do método estatístico, na maior parte das vezes é preciso estabelecer uma distinção entre o modelo matemático que construímos para
Leia maisDesenvolvimento de Sistema de Software
Desenvolvimento de Sistema de Software Grupo 5 Abel Matos 51776 João Amorim 51771 João Guedes 51755 Luís Oliveira 51801 Pedro Reis 51829 Introdução Neste relatório, realizado no âmbito da primeira fase
Leia maisCRM e Prospecção de Dados
CRM e Prospecção de Dados Marília Antunes aula de 4 de Maio 09 5 Modelos preditivos para classificação (continuação) 5.6 Modelos naive Bayes - classificador bayesiano simples O método ganha a designação
Leia mais