INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

Tamanho: px
Começar a partir da página:

Download "INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por"

Transcrição

1 INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1

2 2

3 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3

4 LEMBRE-SE que PROBLEMA em IA Uma busca em um espaço de estados com o objetivo de partir de um estado inicial e se chegar a um estado-meta (estado final). 4

5 5 Análise de agrupamentos

6 6

7 7

8 8

9 9

10 Análise de agrupamentos Algoritmos hierárquicos Problema (baseado no exemplo do livro Introdução à análise de agrupamentos W. O. Bussab,E.S. Miazaki e D.F. Andrade 9 o Simpósio Brasileiro de Probabilidade e Estatística São Paulo, julho/1990) Tarefa: formar agrupamentos (clusters) em uma amostra de seis indivíduos (A,B,C,D,E,F) com base na altura e no peso dos mesmos A matriz de dados é o material básico para aplicação das técnicas de A.A. As variáveis apresentam unidades de medidas diferentes: variável X1(Altura) está em cm e a variável X2 (Peso) está em Kg. Ok, é possível aplicar as técnicas de diretamente sobre as variáveis mas... as vezes é interessante padronizar (relativizar) os valores... 10

11 Vamos padronizar as variáveis Altura e Peso usando o escore Z: São 2 as variáveis que iremos padronizar: Altura e Peso. Precisamos da média e do desvio padrão dessas variáveis: Agora sim podemos padronizar as variáveis. Veja por exemplo a padronização da altura e do peso do indivíduo A 11

12 Então as variáveis Altura e Peso ficam padronizadas assim: Note que com a variável padronizada (escore Z) não temos mais unidades de medidas (cm e kg). Aliás, podemos dizer que nossa unidade de medida é o desvio padrão (DP). Podemos então falar, por exemplo, que o escore Z da variável Altura para o indivíduo B vale 0,33 DP, e que o escore Z da variável Peso para o indivíduo D vale -0,93 DP Observe também que toda variável padronizada apresenta média 0 e desvio padrão 1 12

13 Queremos então agrupar os objetos (indivíduos no exemplo) com base nas variáveis padronizadas Zalt e Zpeso. Como verificar se o objeto (indivíduo no exemplo) A é mais parecido com B do que C? Devemos usar coeficientes de parecença para atributos quantitativos. Exemplo: métricas de Minkowsky 13

14 Vamos usar a distância euclideana, a mais popular Vamos então calcular a distância euclidiana entre A e B, A e C, A e D,..., B e C, B e D, B e E, B e F,..., E e F. Vamos registrar todas as distâncias euclideanas na matriz de similiaridade (distância). Veja abaixo: Os autores do exemplo usam uma generalização da distância euclidiana denominada distância euclidiana média... mas aqui vamos usar a distância euclidiana simples. Continuando, vamos aplicar então uma técnica de agrupamento hierárquico aglomerativo. Incialmente, cada objeto (indivíduo) é um grupo (um cluster). À medida que o algoritmo avança, os objetos vão sendo agrupados pela reunião de pares semelhantes até reunir todos os objetos em um único grupo. 14

15 Trabalhamos com a matriz de similaridades... A cada passo realizamos a junção de dois grupos (clusters), no caso, os grupos com menor distância entre si. A cada passo a matriz de similaridades fica com uma linha e uma coluna a menos, justamente por se juntarem dois grupos... Passo 1 Inicialmente temos 6 grupos: (A), (B), (C), (D), (E) e (F). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (D) e (F) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (D) e (F) é 0,52. Então vamos juntá-los num grupo só. Então passaremos a ter 5 grupos (clusters): (A), (B), (C), (DF) e (E). Mas e agora? Qual a distância euclidiana entre (DF) e (A)? Entre (DF) e (B)? Entre (DF) e (C)? Entre (DF) e (E)? Neste ponto devemos utilizar um entre distintos métodos de definição de valor representativo quando o grupo (cluster) tem 2 ou mais objetos: Método do centroide (centroid linkage) Método da ligação simples ou vizinho mais próximo (single linkage) Método da ligação completa ou vizinho mais longe (complete linkage) Método da ligação por média (average linkage) Método das medianas (median linkage) Método de Ward (Ward linkage) 15

16 Vamos usar o método dos centroides. O ponto centroide é o ponto cujas coordenadas apresentam como valor a média de cada uma das variáveis em questão. No exemplo, as variáveis em questão são Zalt e Zpeso. Então vamos calcular o ponto centroide do grupo (DF): Agora sim podemos responder qual a distância euclidiana entre (DF) e (A)? Entre (DF) e (B)? Entre (DF) e (C)? Entre (DF) e (E)? 16

17 Vamos refazer a matriz de similaridades contendo agora 5 grupos: (A), (B), (C), (DF) e (E) Passo 2 Agora temos 5 grupos: (A), (B), (C), (DF) e (E). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (A) e (B) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (A) e (B) é 0,95. Note que os grupos (B) e (E) também apresentam valor 0,95. Então podemos escolher qualquer um deles para agrupar. Escolhemos aqui agrupar (A) e (B). Então vamos juntá-los num grupo só. Então passaremos a ter 4 grupos (clusters): (AB), (C), (DF) e (E). Mas e agora? Qual a distância euclidiana entre (AB) e (C)? Entre (AB) e (DF)? Entre (AB) e (E)? Primeiro calculamos o centroide do grupo (AB): Agora sim podemos responder qual a distância euclidiana entre (AB) e (C)? Entre (AB) e (DF)? Entre (AB) e (E)? 17

18 Vamos refazer a matriz de similaridades contendo agora 4 grupos: (AB), (C), (DF) e (E) Passo 3 Agora temos 4 grupos: (AB), (C), (DF) e (E). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (AB) e (E) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (AB) e (E) é 0,92. Então vamos juntá-los num grupo só. Então passaremos a ter 3 grupos (clusters): (ABE), (C) e (DF). Mas e agora? Qual a distância euclidiana entre (ABE) e (C)? Entre (ABE) e (DF)? Primeiro calculamos o centroide do grupo (ABE): Agora sim podemos responder qual a distância euclidiana entre (ABE) e (C)? Entre (ABE) e (DF)? 18

19 Vamos refazer a matriz de similaridades contendo agora 3 grupos: (ABE), (C) e (DF) Passo 4 Agora temos 3 grupos: (ABE), (C) e (DF). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (C) e (DF) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (C) e (DF) é 1,34. Então vamos juntá-los num grupo só. Então passaremos a ter 2 grupos (clusters): (ABE) e (CDF). Como restaram 2 clusters, o próximo agrupamento certamente será (ABCDEF). De toda forma, vamos calcular a distância euclideana entre (ABE) e (CDF)... Primeiro calculamos o centróide do grupo (CDF): Agora sim podemos responder qual a distância euclidiana entre (ABE) e (CDF) 19

20 Passo 5 Agora temos somente 2 grupos: (ABE) e (CDF). Vamos juntar estes grupos. Juntando os 2 grupos, chegamos ao fim do algoritmo de agrupamento juntando todos os objetos (indivíduos no exemplo) num único grupo (ABCDEF). Partimos de 6 distintos clusters e fomos aglomerando-os a cada iteração do algoritmo. Daí porquê ser uma técnica aglomerativa. O nível de parecença (similaridade) ente (ABE) e (CDF) vale 2,25. 20

21 Apresentação dos resultados A cada passo, o algoritmo foi agrupando dois subgrupos distintos de acordo com um valor de parecença (um nível de similaridade). Por exemplo, no passo 3 foram agrupados os subgrupos (AB) e (E) com um nível de similaridade de 0,92. Vamos tabular os valores: Passo Junção Nível de Similaridade 1 (D) com (F) 0,52 2 (A) com (B) 0,95 3 (AB) com (E) 0,92 4 (DF) com (C) 1,34 5 (ABE) com (CDF) 2,25 Agora vamos construir um mapa denominado dendrograma, que é um gráfico em forma de árvore mostrando os possíveis agrupamentos com os respectivos valores de parecença (níveis de similaridade) 21

22 Podemos cortar o dendrograma em diversas partes para definir 2, 3, 4, 5 ou 6 clusters. Por exemplo podemos cortar o dendrograma e registar a existência de 2 clusters com nível de similaridade 2,25: (ABE) e (CDF). Veja: Podemos cortar o dendrograma e registar a existência de 3 clusters: (ABE), e (DF). Veja: 22

23 Avaliação e interpretação dos resultados O dendrograma pode ser considerado como uma representação simplificada da matriz de similaridades mas... será que é uma boa simplificação? Uma forma de verificar quão bom é o dendrograma é avaliar se o dendrograma é capaz de reproduzir a matriz de similaridades. Para verificar isto, inicialmente montamos a matriz cofenética. A matriz cofenética é a matriz de distâncias entre os objetos obtidos a partir do dendrograma. Por exemplo, a distância (cofenética) entre A e C é dada pelo nível em que os dois são agrupados, no caso 2,25. Já a distância entre A e E e entre B e E vale 0,92. 23

24 Agora tomamos a matriz de similaridades e a matriz cofenética e calculamos o coeficiente de correlação linear r dos valores. O coeficiente de correlação linear r pode assumir valores entre 1 e 1: -1 r 1 Quanto mais próximo de 1 estiver r, melhor será a representação do dendrograma ao agrupamento. E quanto mais próximo de zero estiver r menor qualidade tem o agrupamento. A fórmula do coeficiente de correlação é a seguinte: Vamos então calcular o coeficiente de correlação r das matrizes: 24

25 O valor r = 0,756 é alto ou baixo? Responder isto é tão difícil como responder, na maioria das situações, o que é um alto coeficiente de correlação entre duas variáveis. Depende da área de estudo e de padrões que vão se desenvolvendo com a prática. Podese adiantar que em A.A. algo em torno de 0,8 já pode ser considerado bom ajuste. Analisando todos os resultados do exemplo ilustrado, poder-se-ia concluir que a amostra piloto sugere dois tipos de indivíduos: pequenos e grandes. Para continuar o estudo retrospectivo bastaria escolher (ou sortear) apenas duas pessoas: uma do conjunto (A,B,E) e outra de (C, D, F) e teríamos elementos representativos do grupo, segundo critérios de altura e peso, na crença de que essas variáveis sejam substitutas da característica de interesse * * * FIM do algoritmo hierárquico aglomerativo * * * 25

26 Análise de Agrupamentos (Clustering) Algoritmo K-Means Clustering K-means algorithm - ( algoritmo básico ).O algoritmo K-means é um algoritmo não hierárquico sendo, portanto, um algoritmo cujo método é baseado em partição. K-means é um dos mais simples algoritmos de aprendizagem não supervisionada voltado para o propósito de resolver o problema de clusterização (formação de agrupamento). K-means clustering - idéias básicas (I) 1) Determinar a amostra de N objetos (padrões) a serem agrupados ( clusterizados ) 2) Considerar P atributos (variáveis) do padrão em questão que servirão de base para a inclusão deste nos agrupamentos a serem formados 3) Definir, a priori, K clusters (agrupamentos) para alocar os N objetos (padrões) da amostra 4) Após definir o número K de clusters, gerar K pontos centróides, C 1 para o cluster 1, C 2 para o cluster 2,..., C k para o cluster K. 5) Aplicar o algoritmo K-means para alocar cada um dos N objetos (padrões) da amostra em algum dos K clusters (agrupamentos) 26

27 5.1) Para alocar um determinado ponto n dos N objetos em algum dos K clusters, a idéia é alocá-lo ao cluster m, 1 m k, cuja distância entre o objeto n e o centróide C m do cluster m seja a menor entre todas as distâncias entre n e os centróides C 1, C 2,... C k. K-means clustering - idéias básicas (II) Para entender a idéia básica do algoritmo K-means vamos analisar a seguinte situação: Suponha que desejemos agrupar algumas cidades em função do seu consumo per capita mensal de laranja e limão. As cidades e os valores de consumo per capita mensal (medidos, digamos, em litros/habitante/mês) são os abaixo apresentados: Desta forma, temos determinados os N objetos (padrões) a serem agrupados (clusterizados): N = 20 cidades Temos também determinados os P atributos (variáveis) do padrão em questão no caso cidades que servirão de base para a inclusão deste nos agrupamentos a serem formados. P = 2 atributos a saber: (1) consumo per capita mensal de laranja e (2) consumo per capita mensal de limão. 27

28 K-means clustering - idéias básicas (II) Vamos estabelecer, a priori, que desejamos classificar as 20 cidades em K = 3 grupos (clusters). Em seguida, definido que K = 3, vamos gerar 3 pontos de centróides, C 1, C 2 e C 3. 28

29 K-means clustering - idéias básicas (II) Em seguida, ao se executar o algoritmo de clusterização efetivamente, obtemos o resultado abaixo apresentado: Note que os centróides C 1, C 2 e C 3 mudaram espacialmente de lugar ao final da execução do algoritmo (compare com a situação inicial de C 1, C 2 e C 3 ). No exemplo, pode-se observar no grid que as cidades A, C, D e E estão no CLUSTER 2, as cidades B e G estão no CLUSTER 1 e F está no CLUSTER 3. 29

30 K-means clustering - idéias básicas (II) Se executássemos o algoritmo de clusterização para 2, 4 e 5 clusters obteríamos os seguintes resultados: Algumas Questões levantadas Questão 1: Como inicializar os centróides dos K clusters? Questão 2: Como calcular a distância entre um determinado ponto (padrão) n e o centróide C 1, C 2,..., C k de cada um dos K clusters? Questão 3: Em termos semânticos (ou, em termos analíticos) o que representa cada um dos clusters gerados? Vamos começar tentando responder a Questão 3, depois a Questão 2 e depois a Questão 1: 30

31 K-means clustering - idéias básicas (III) Questão 3: Em termos semânticos (ou, em termos analíticos) o que representa cada um dos clusters gerados? A designação qualitativa dos grupamentos são de responsabilidade exclusiva do usuário/analista de negócio. O algoritmo K-means não apresentará tal designação qualitativa. Para o exemplo citado anteriormente podemos ter, por exemplo: 31

32 K-means clustering - idéias básicas (III) Questão 2: Como calcular a distância entre um determinado ponto (padrão) n e o centróide C 1, C 2,..., C k de cada um dos K clusters? Existem diversos coeficientes usados para medir distância e similaridade entre padrões, com base nos tipos de atributos (variávies) dos padrões. Quando os atributos (variáveis) são quantitativos, uma medida de distância bastante popular é a distância euclideana, que foi utilizada no exemplo dos perfis de padrões de cidades com relação ao consumo per capita mensal de laranja e limão. Distância Euclideana Fórmula de Cálculo 32

33 K-means clustering - idéias básicas (III) Questão 1: Como inicializar os centróides dos K clusters? Os centróides representam o ponto médio do cluster em formação e/ou já formado. Não existe um método único de inicialização dos K centróides para os K clusters. É possível, por exemplo: Inicializar os K centróides escolhendo por sorteio K pontos (padrões) entre os N objetos (padrões) a serem agrupados. Escolher, por sorteio, K pontos (não necessariamente pontos entre os N objetos a serem agrupados) com range entre os valores máximos e mínimos de cada uma das P variáveis de classificação do padrão em questão. No exemplo das cidades, foi utilizado o seguinte critério de geração de centróides iniciais: Registrou-se o valor máximo e valor mínimo de cada dimensão do padrão (no caso valor máximo e mínimo do consumo de laranja e limão) Sabendo o número K de clusters desejado escolheram-se valores dos pontos médios de cada um dos K intervalos: 33

34 K-means clustering - idéias básicas (III) Exemplo de sorteio de 3 centróides iniciais para o agrupamento das N = 20 cidades em termos de consumo per capita mensal de laranja e limão e K = 3 clusters: 34

35 K-means clustering - Idéia do algoritmo básico (1) Informar o valor de K (número de clusters desejado); (2) Informar o valor de P (número de atributos do padrão que servirão de base para a clusterização); (3) Gerar C 1, C 2,... C k pontos de centróides para os K clusters; (incialmente os clusters estão vazios, contendo somente os pontos centróides gerados na etapa (3)) (4) Ler o arquivo de padrões e, para cada registro n (ou seja, cada padrão) associá-lo a um dos K clusters, através do cálculo de distância de n aos C 1, C 2,... C k pontos centróides, considerando a menor distância. (neste momento, após o passo (4), o cluster 1 tem n 1 pontos, o cluster 2 tem n 2 pontos,..., e o cluster k tem n k pontos devido a anexação de pontos lidos do arquivo de padrões). (5) Recalcular o novo valor dos pontos centróides dos K clusters com base na média aritmética de cada uma das P dimensões de seus pontos. (a idéia de centróide aqui pode ser vista como centro geométrico ) (6) Com base nos novos valores de centróides, voltar ao passo (4) para reavaliar a localização em clusters dos padrões de classificação. No caso de nenhum dos n padrões do arquivo ser realocado em outro cluster, o algoritmo termina e a clusterização, portanto está concluída. 35

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS Luciene Bianca Alves ITA Instituto Tecnológico de Aeronáutica Praça Marechal Eduardo Gomes, 50 Vila das Acácias

Leia mais

Técnicas de Clustering: Algoritmos K-means e Aglomerative

Técnicas de Clustering: Algoritmos K-means e Aglomerative Técnicas de Clustering: Algoritmos K-means e Aglomerative Danilo Oliveira, Matheus Torquato Centro de Informática Universidade Federal de Pernambuco 9 de outubro de 2012 Danilo Oliveira, Matheus Torquato

Leia mais

3 MATERIAL E MÉTODOS

3 MATERIAL E MÉTODOS 3 MATERIAL E MÉTODOS 3.1 Fundamentação Teórica Quando se quer obter informações de um grupo de variáveis ou de um conjunto total dos dados de uma região, usualmente recorre-se à análise multivariada. A

Leia mais

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

Recuperação de Informação em Bases de Texto. Aula 10

Recuperação de Informação em Bases de Texto. Aula 10 Aula 10 1 Agrupamento/ clustering de documentos: Agrupar os documentos em classes/grupos, de acordo com a sua semelhança Aprendizagem não supervisionada Sem conjunto de treino/exemplos 2 3 Agrupamento/

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti. Distribuição Normal

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti. Distribuição Normal Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti Distribuição Normal 1. Introdução O mundo é normal! Acredite se quiser! Muitos dos fenômenos aleatórios que encontramos na

Leia mais

4 Aplicativo para Análise de Agrupamentos

4 Aplicativo para Análise de Agrupamentos 65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Escola Secundária Gabriel Pereira Évora Matemática A 10º ano. Planificação da Unidade Geometria

Escola Secundária Gabriel Pereira Évora Matemática A 10º ano. Planificação da Unidade Geometria Escola Secundária Gabriel Pereira Évora Matemática A 10º ano Planificação da Unidade Geometria 1. Generalidades Objecto da estatística e breve nota histórica sobre a evolução desta ciência; utilidade na

Leia mais

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE INE 5 LISTA DE EERCÍCIOS DE PROBABILIDADE INE 5 Gabarito da Lista de Exercícios de Probabilidade ) Em um sistema de transmissão de dados existe uma probabilidade igual a 5 de um dado ser transmitido erroneamente.

Leia mais

Sumário. Parte l. 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3

Sumário. Parte l. 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3 Sumário Parte l 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3 2. Entrevistas 5 2.1 Tipos de entrevistas 8 2.2 Preparação e condução

Leia mais

PROF. CÍCERO JOSÉ Matemática e Estatística

PROF. CÍCERO JOSÉ Matemática e Estatística UNIBAN UNIVERSIDADE BANDEIRANTE DE SÃO PAULO Instituto de Administração e Negócios Tecnologia em Logística PROF. CÍCERO JOSÉ Matemática e Estatística São Paulo 2º semestre de 2010 SUMÁRIO CAPÍTULO I MATEMÁTICA

Leia mais

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder Comentário Geral: Prova muito difícil, muito fora dos padrões das provas do TCE administração e Economia, praticamente só caiu teoria. Existem três questões (4, 45 e 47) que devem ser anuladas, por tratarem

Leia mais

Pré processamento de dados II. Mineração de Dados 2012

Pré processamento de dados II. Mineração de Dados 2012 Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir

Leia mais

Palavras-Chaves: Agrupamento Hierárquico; Acordo de Resultados.

Palavras-Chaves: Agrupamento Hierárquico; Acordo de Resultados. Estatística Multivariada: Grupos Homogêneos no Combate à Criminalidade em Minas Gerais 1 Formação de Regiões Homogêneas no Combate à Criminalidade Violenta de Minas Gerais utilizando técnica de agrupamento

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE PRESBITERIANA MACKENZIE UNIVERSIDADE PRESBITERIANA MACKENZIE MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO São Paulo 4 MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

Estatística Aplicada ao Serviço Social Módulo 1:

Estatística Aplicada ao Serviço Social Módulo 1: Estatística Aplicada ao Serviço Social Módulo 1: Introdução à Estatística Importância da Estatística Fases do Método Estatístico Variáveis estatísticas. Formas Iniciais de Tratamento dos Dados Séries Estatísticas.

Leia mais

A Estatística e o Mercado de Seguros

A Estatística e o Mercado de Seguros A Estatística e o Mercado de Seguros Semana de Estatística (SEMANEST) Vitor A. Ozaki Curitiba - 2007 Outline Apresentação Pessoal / Profissional Formação Acadêmica Histórico Profissional Carreira Profissional

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos Compreensão Agrupa documentos relacionados

Leia mais

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO

Leia mais

Instituto Superior de Engenharia do Porto. Agrupamento Clustering

Instituto Superior de Engenharia do Porto. Agrupamento Clustering Instituto Superior de Engenharia do Porto Engenharia Informática Projecto Agrupamento Clustering Manuel Altino Torres Aniceto Castro Orientadora Profª Fátima Rodrigues Julho 2003 Agradecimentos A realização

Leia mais

CORSAN GESTÃO DE CUSTOS

CORSAN GESTÃO DE CUSTOS CORSAN GESTÃO DE CUSTOS 3 Seminário de Boas Práticas de Gestão PGQP Porto Alegre, novembro 2015 A CORSAN EM GRANDES NÚMEROS 7 Milhões de Gaúchos 316 Municípios Atendidos Faturamento 2014 R$ 1,9 Bilhão

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais . O Mapa Auto-Organizável (SOM) Redes Neurais Mapas Auto-Organizáveis Sistema auto-organizável inspirado no córtex cerebral. Nos mapas tonotópicos do córtex, p. ex., neurônios vizinhos respondem a freqüências

Leia mais

Vetor Quantização e Aglomeramento (Clustering)

Vetor Quantização e Aglomeramento (Clustering) (Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

DESENVOLVIMENTO DE UM MÉTODO HÍBRIDO INTEGRANDO OS MÉTODOS: HIERARCHICAL CLUSTERING E BISECTING K-MEANS

DESENVOLVIMENTO DE UM MÉTODO HÍBRIDO INTEGRANDO OS MÉTODOS: HIERARCHICAL CLUSTERING E BISECTING K-MEANS DESENVOLVIMENTO DE UM MÉTODO HÍBRIDO INTEGRANDO OS MÉTODOS: HIERARCHICAL CLUSTERING E BISECTING K-MEANS BENTO, Renan Delazari 1 CHICON, Patricia Mariotto Mozzaquatro 2 Resumo: O presente artigo apresenta

Leia mais

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type. Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/ Factor Analysis (FACAN) Abrir o arquivo ven_car.sav Utilizar as 10 variáveis a

Leia mais

CLASSIFICAÇÃO DE IMAGENS

CLASSIFICAÇÃO DE IMAGENS CLASSIFICAÇÃO DE IMAGENS SIG Profa.. Dra. Maria Isabel Castreghini de Freitas ifreitas@rc.unesp.br Profa. Dra. Andréia Medinilha Pancher medinilha@linkway.com.br O que é classificação? É o processo de

Leia mais

AULAS 13, 14 E 15 Correlação e Regressão

AULAS 13, 14 E 15 Correlação e Regressão 1 AULAS 13, 14 E 15 Correlação e Regressão Ernesto F. L. Amaral 23, 28 e 30 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de

Leia mais

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Unidade 2 Distribuições de Frequências e Representação Gráfica UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Ao finalizar esta Unidade, você deverá ser capaz de: Calcular

Leia mais

COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA METODOLOGIA DE MONTE CARLO

COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA METODOLOGIA DE MONTE CARLO COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA O que é risco? Quais são os tipos de riscos? Quais são os tipos de análises? Qual a principal função do Excel para gerar simulações aleatórias? O que é distribuição

Leia mais

A Estatística, um ramo da Matemática, é aplicada em diferentes áreas, como Administração, Engenharia, Medicina, Psicologia, Ciências Sociais etc.

A Estatística, um ramo da Matemática, é aplicada em diferentes áreas, como Administração, Engenharia, Medicina, Psicologia, Ciências Sociais etc. ESTATÍSTICA DESCRITIVA MÓDULO 1 - INTRODUÇÃO À ESTATÍSTICA DESCRITIVA A Estatística, um ramo da Matemática, é aplicada em diferentes áreas, como Administração, Engenharia, Medicina, Psicologia, Ciências

Leia mais

4 Avaliação Econômica

4 Avaliação Econômica 4 Avaliação Econômica Este capítulo tem o objetivo de descrever a segunda etapa da metodologia, correspondente a avaliação econômica das entidades de reservas. A avaliação econômica é realizada a partir

Leia mais

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas.

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas. Definições Básicas Introdução à Estatística ESTATÍSTICA: estudo dos métodos para coletar, organizar, apresentar e analisar dados. População: conjunto constituído por todos os indivíduos que apresentem

Leia mais

Estatística e Probabilidade

Estatística e Probabilidade Correlação Estatística e Probabilidade Uma correlação é uma relação entre duas variáveis. Os dados podem ser representados por pares ordenados (x,y), onde x é a variável independente ou variável explanatória

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Resoluções comentadas das questões de Estatística da prova para ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Realizada pela Fundação João Goulart em 06/10/2013 41. A idade média de todos

Leia mais

Algoritmos de Agrupamento - Aprendizado Não Supervisionado. Fabrício Jailson Barth

Algoritmos de Agrupamento - Aprendizado Não Supervisionado. Fabrício Jailson Barth Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth Abril de 2013 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento Plano Agrupamento Hierárquico

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Análise de componentes principais (PCA)

Análise de componentes principais (PCA) Análise de componentes principais (PCA) Redução de dados Sumarizar os dados que contém muitas variáveis (p) por um conjunto menor de (k) variáveis compostas derivadas a partir do conjunto original. p k

Leia mais

Métodos e Algoritmos de Data Mining(parte 1)

Métodos e Algoritmos de Data Mining(parte 1) Robert Groth Métodos e Algoritmos de Data Mining(parte 1) Usama Fayyad et al 1 Métodos e Algoritmos de Data Mining Soluções distância (K-NN e clustering) Naïve-Bayes Arvores de decisão Regras de associação

Leia mais

Leia o texto abaixo para resolver as questões sobre população e amostra.

Leia o texto abaixo para resolver as questões sobre população e amostra. Leia o texto abaixo para resolver as questões sobre população e amostra. População e amostra População e amostra referem-se ao conjunto de entes cujas propriedades desejamos averiguar. População estatística

Leia mais

Análise de agrupamento para taxa de incidência de dengue entre os anos de 1990 e 2010 nos estados brasileiros

Análise de agrupamento para taxa de incidência de dengue entre os anos de 1990 e 2010 nos estados brasileiros Análise de agrupamento para taxa de incidência de dengue entre os anos de 1990 e 2010 nos estados brasileiros Jader da Silva Jale 1 2 Joseilme Fernandes Gouveia 3 Prof. Dr. Borko Stosic 4 1 Introdução

Leia mais

Usando o Excel para construir a Tabela de Distribuição de Freqüência

Usando o Excel para construir a Tabela de Distribuição de Freqüência Usando o Excel para construir a Tabela de Distribuição de Freqüência Uma empresa fabricante de lâmpadas deseja testar uma parte de sua produção. Selecionou 60 lâmpadas de 100W e deixou-as ligadas te que

Leia mais

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos

Leia mais

Capítulo 7 Medidas de dispersão

Capítulo 7 Medidas de dispersão Capítulo 7 Medidas de dispersão Introdução Para a compreensão deste capítulo, é necessário que você tenha entendido os conceitos apresentados nos capítulos 4 (ponto médio, classes e frequência) e 6 (média).

Leia mais

VIDEOCONFERENCIA NACIONAL SESI-CNI FAP BONUS x MALUS

VIDEOCONFERENCIA NACIONAL SESI-CNI FAP BONUS x MALUS MINISTÉRIO DA PREVIDÊNCIA SOCIAL SECRETARIA PREVIDENCIA SOCIAL VIDEOCONFERENCIA NACIONAL SESI-CNI FAP BONUS x MALUS Proposta de Hoje DISCUTIR O FAP - FATOR ACIDENTARIO PREVIDENCIARIO PPP Perguntas Condutoras

Leia mais

Treinando a sua equipe para aumentar a competitividade da sua empresa.

Treinando a sua equipe para aumentar a competitividade da sua empresa. Informativo Bimestral da Siqueira Campos Associados março de 2015 - ano IX - Número 24 Catálogo de Cursos 2015 Treinando a sua equipe para aumentar a competitividade da sua empresa. Nesta edição Pesquisas

Leia mais

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A. IMES Catanduva Probabilidades e Estatística Estatística no Excel Matemática Bertolo, L.A. Aplicada Versão BETA Maio 2010 Bertolo Estatística Aplicada no Excel Capítulo 3 Dados Bivariados São pares de valores

Leia mais

BRUNO CAETANO VIDIGAL AVALIAÇÃO DE AGRUPAMENTOS EM MISTURA DE VARIÁVEIS

BRUNO CAETANO VIDIGAL AVALIAÇÃO DE AGRUPAMENTOS EM MISTURA DE VARIÁVEIS BRUNO CAETANO VIDIGAL AVALIAÇÃO DE AGRUPAMENTOS EM MISTURA DE VARIÁVEIS Dissertação apresentada à Universidade Federal de Viçosa, como parte das exigências do Programa de Pós- Graduação em Estatística

Leia mais

CURSO ON-LINE PROFESSOR GUILHERME NEVES

CURSO ON-LINE PROFESSOR GUILHERME NEVES Olá pessoal! Neste ponto resolverei a prova de Matemática Financeira e Estatística para APOFP/SEFAZ-SP/FCC/2010 realizada no último final de semana. A prova foi enviada por um aluno e o tipo é 005. Os

Leia mais

Na resolução de um problema por meio de um programa, a primeira providência é conceber um algoritmo adequado.

Na resolução de um problema por meio de um programa, a primeira providência é conceber um algoritmo adequado. Estrutura de Dados Introdução Extraído de : Estruturas de Dados Homero L. Pícollo Na resolução de um problema por meio de um programa, a primeira providência é conceber um algoritmo adequado. A eficiência

Leia mais

UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA)

UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA) UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA) Métodos Estatísticos 1º ano -1º Trimestre 2009/2010 Ficha de trabalho nº 1 Exercícios usando o SPSS PARTE 1 - Estatística Descritiva 1. As notas de 32 alunos

Leia mais

Estatística stica para Metrologia

Estatística stica para Metrologia Aula 5 Estatística stica para Metrologia Aula 5 Variáveis Contínuas Uniforme Exponencial Normal Lognormal Mônica Barros, D.Sc. Maio de 008 1 Distribuição Uniforme A probabilidade de ocorrência em dois

Leia mais

MEDIDAS DE DISPERSÃO

MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO 1) (PETROBRAS) A variância da lista (1; 1; 2; 4) é igual a: a) 0,5 b) 0,75 c) 1 d) 1,25 e) 1,5 2) (AFPS ESAF) Dada a seqüência de valores 4, 4, 2, 7 e 3 assinale a opção que dá o valor

Leia mais

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo UNIVERSIDADE DE SÃO PAULO Faculdade de Arquitetura e Urbanismo DISTRIBUIÇÃO AMOSTRAL ESTIMAÇÃO AUT 516 Estatística Aplicada a Arquitetura e Urbanismo 2 DISTRIBUIÇÃO AMOSTRAL Na aula anterior analisamos

Leia mais

Classificação de Imagens

Classificação de Imagens Universidade do Estado de Santa Catarina Departamento de Engenharia Civil Classificação de Imagens Profa. Adriana Goulart dos Santos Extração de Informação da Imagem A partir de uma visualização das imagens,

Leia mais

Aulas de Estatística / Prof. Jones Garcia da Mata / www.professorjones.hpg.com.br. Sumário

Aulas de Estatística / Prof. Jones Garcia da Mata / www.professorjones.hpg.com.br. Sumário Capítulo 1: Introdução à Estatística Definição de estatística Sumário É uma ciência que envolve um corpo de técnicas e uma metodologia desenvolvida para a coleta, a tabulação, a classificação e simplificação

Leia mais

Pesquisa Operacional

Pesquisa Operacional Pesquisa Operacional Prof. José Luiz Resolver um problema de Programação Linear significa basicamente resolver sistemas de equações lineares; Esse procedimento, apesar de correto, é bastante trabalhoso,

Leia mais

CONSULTA PÚBLICA Nº 008/2010. Revisão da Metodologia de Estabelecimento dos Limites dos Indicadores Coletivos de Continuidade

CONSULTA PÚBLICA Nº 008/2010. Revisão da Metodologia de Estabelecimento dos Limites dos Indicadores Coletivos de Continuidade CONSULTA PÚBLICA Nº 008/2010 Revisão da Metodologia de Estabelecimento dos Limites dos Indicadores Coletivos de Continuidade Rio de Janeiro, 23 de Agosto de 2010 Apresentamos a seguir as nossas respostas

Leia mais

Atividade 4 - Acerte no alvo

Atividade 4 - Acerte no alvo Atividade 4 - Acerte no alvo 1. Justificativa Para entender um processo estatístico, é possível criar um experimento em que os alunos possam vivenciá-lo, organizando, selecionando, interpretando e criticando

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

LISTA DE MATEMÁTICA. Aluno(a): Nº. 1. Determinada editora pesquisou o número de páginas das revistas mais vendidas em uma cidade.

LISTA DE MATEMÁTICA. Aluno(a): Nº. 1. Determinada editora pesquisou o número de páginas das revistas mais vendidas em uma cidade. LISTA DE MATEMÁTICA Aluno(a): Nº. Professor: Rosivane Série: 2 ano Disciplina: Matematica Data da prova: Pré Universitário Uni-Anhanguera MEDIDAS DE DISPERSÃO 1. Determinada editora pesquisou o número

Leia mais

AULAS 04 E 05 Estatísticas Descritivas

AULAS 04 E 05 Estatísticas Descritivas 1 AULAS 04 E 05 Estatísticas Descritivas Ernesto F. L. Amaral 19 e 28 de agosto de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro:

Leia mais

Aula 5 Técnicas para Estimação do Impacto

Aula 5 Técnicas para Estimação do Impacto Aula 5 Técnicas para Estimação do Impacto A econometria é o laboratório dos economistas, que busca reproduzir o funcionamento do mundo de forma experimental, como se faz nas ciências naturais. Os modelos

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 1 a LISTA DE EXERCÍCIOS Bioestatística Professor: Ednaldo Carvalho Guimarães

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 1 a LISTA DE EXERCÍCIOS Bioestatística Professor: Ednaldo Carvalho Guimarães UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA a LISTA DE EXERCÍCIOS Bioestatística Professor: Ednaldo Carvalho Guimarães ) Um pesquisador obteve os seguintes valores de umidade (%) em casa

Leia mais

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior Gestão de TI Evanivaldo Castro Silva Júnior Porque estudar Estatística em um curso de Gestão de TI? TI trabalha com dados Geralmente grandes bases de dados Com grande variabilidade Difícil manipulação,

Leia mais

AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM. Victor Marinho Furtado

AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM. Victor Marinho Furtado AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM Victor Marinho Furtado Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia de Sistemas e Computação, COPPE, da Universidade

Leia mais

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados Algoritmos Genéticos em Mineração de Dados Descoberta de Conhecimento Descoberta do Conhecimento em Bancos de Dados Processo interativo e iterativo para identificar padrões válidos, novos, potencialmente

Leia mais

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências Probabilidade Introdução Tabelas Estatísticas População, Amostra e Variáveis Gráficos e Distribuição de Freqüências Renata Souza Conceitos Antigos de Estatística stica a) Simples contagem aritmética Ex.:

Leia mais

Aula 5 Metodologias de avaliação de impacto

Aula 5 Metodologias de avaliação de impacto Aula 5 Metodologias de avaliação de impacto Metodologias de Avaliação de Impacto Objetiva quantificar as mudanças que o projeto causou na vida dos beneficiários. Plano de Aula Método experimental: regressão

Leia mais

Coleta e Análise de Dados da Pesquisa

Coleta e Análise de Dados da Pesquisa Coleta e Análise de Dados da Pesquisa Metodologia de Pesquisa UNISO Prof.Dr. Daniel Bertoli Gonçalves Execução da pesquisa Etapa da pesquisa que tem a função de: Preparar o campo (pré-teste) Ir para o

Leia mais

Introdução à Inferência Estatística

Introdução à Inferência Estatística Introdução à Inferência Estatística 1. População: conjunto de indivíduos, ou itens, com pelo menos uma característica em comum. Também será denotada por população objetivo, que é sobre a qual desejamos

Leia mais

Teorema do Limite Central e Intervalo de Confiança

Teorema do Limite Central e Intervalo de Confiança Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),

Leia mais

CRM e Prospecção de Dados

CRM e Prospecção de Dados CRM e Prospecção de Dados Marília Antunes aula de 9 Março 09 2 Dados e medição 2.1 Introdução O objectivo a que nos propomos é o de descobrir relações existentes no mundo real a partir de dados que o descrevem.

Leia mais

Métodos Matemáticos para Gestão da Informação

Métodos Matemáticos para Gestão da Informação Métodos Matemáticos para Gestão da Informação Aula 05 Taxas de variação e função lineares III Dalton Martins dmartins@gmail.com Bacharelado em Gestão da Informação Faculdade de Informação e Comunicação

Leia mais

MANUAL COMO CRIAR UM PROJETO

MANUAL COMO CRIAR UM PROJETO MANUAL COMO CRIAR UM PROJETO MICROSOFT PROJECT 2010 Menu: Projeto > Informações do Projeto 1º Passo: Criando um novo projeto Um projeto pode ser agendado a partir da Data de inicio do projeto ou Data de

Leia mais

DESENVOLVENDO HABILIDADES CIÊNCIAS DA NATUREZA I - EM

DESENVOLVENDO HABILIDADES CIÊNCIAS DA NATUREZA I - EM Olá Caro Aluno, Você já reparou que, no dia a dia recebemos inúmeros panfletos com figuras de mapas ou plantas de imóveis sendo entregues até mesmo no trânsito. Vamos ampliar nossos conhecimentos sobre

Leia mais

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Introdução O que é Estatística? É a parte da matemática aplicada que

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO! Fazendo regressão linear! Relacionando variáveis e criando uma equação para explicá-las! Como checar se as variáveis estão relacionadas!

Leia mais

6) Estatística Gráfica:

6) Estatística Gráfica: Estatística Descritiva Básica prof. Ilydio Pereira de Sá 36 UNIDADE II: ESTATÍSTICA GRÁFICA E MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL Gráficos: barras, colunas, histogramas e polígonos de freqüências.

Leia mais

ESTATÍSTICA. aula 1. Insper Ibmec São Paulo. Prof. Dr. Marco Antonio Leonel Caetano

ESTATÍSTICA. aula 1. Insper Ibmec São Paulo. Prof. Dr. Marco Antonio Leonel Caetano ESTATÍSTICA aula 1 Prof. Dr. Marco Antonio Leonel Caetano Insper Ibmec São Paulo ESTATÍSTICA COISAS DO ESTADO ESTATÍSTICA: - Apresentação e Análise de dados - Tomadas de Decisões baseadas em análises -

Leia mais

MESTRADO EM PESQUISA DE MERCADOS 2006 2007

MESTRADO EM PESQUISA DE MERCADOS 2006 2007 MESTRADO EM PESQUISA DE MERCADOS 2006 2007 PROGRAMA DAS DISCIPLINAS 1 1º trimestre PESQUISA DE MERCADOS Objectivos Pretende-se que os alunos: (a) adquiram os conceitos e semântica próprios do tema, (b)

Leia mais

Aplicação do algoritmo SimpleKMeans em experimento de milho verde

Aplicação do algoritmo SimpleKMeans em experimento de milho verde Aplicação do algoritmo SimpleKMeans em experimento de milho verde Wesley Viana 1, Prof. MSc. Marcos de Moraes Sousa 1, Prof. MSc. Júnio César de Lima 1 Prof. Dr. Milton Sérgio Dornelles 1 1 Instituto Federal

Leia mais

CAPÍTULO 9 Exercícios Resolvidos

CAPÍTULO 9 Exercícios Resolvidos CAPÍTULO 9 Exercícios Resolvidos R9.1) Diâmetro de esferas de rolamento Os dados a seguir correspondem ao diâmetro, em mm, de 30 esferas de rolamento produzidas por uma máquina. 137 154 159 155 167 159

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II! Como implementar o escore de crédito?! Como avaliar o escore de crédito?! Como calcular a função discriminante usando o Excel?! Como aplicar a função

Leia mais

Módulo 13. Regulação em reprodutores contínuos: a eq. logística

Módulo 13. Regulação em reprodutores contínuos: a eq. logística Módulo 13. Regulação em reprodutores contínuos: a eq. logística Objectivos Suponhamos que se dispõe de observações da densidade populacional ( 1, 2, 3,...) duma população de reprodutores contínuos, na

Leia mais

Aula 4 Estatística Conceitos básicos

Aula 4 Estatística Conceitos básicos Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a

Leia mais

Métodos Quantitativos. aula 3

Métodos Quantitativos. aula 3 Métodos Quantitativos aula 3 Prof. Dr. Marco Antonio Insper Ibmec São Paulo Simulação Empresarial Auxílio na tomada de decisão. Criação de cenários otimistas e pessimistas. Poder de previsão baseada em

Leia mais

CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE

CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE Número de classes a considerar (k): a) Tabela de Truman L. Kelley n 5 10 25 50 100 200 500 1000 k 2 4 6 8 10 12 15 15 b) k=5 para n 25 e para n >25.

Leia mais

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais Cleyton Zanardo de Oliveira CER, DEs, UFSCar Vera Lúcia Damasceno Tomazella, DEs, UFSCar Resumo Uma única pessoa

Leia mais