INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

Tamanho: px
Começar a partir da página:

Download "INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por"

Transcrição

1 INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1

2 2

3 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3

4 LEMBRE-SE que PROBLEMA em IA Uma busca em um espaço de estados com o objetivo de partir de um estado inicial e se chegar a um estado-meta (estado final). 4

5 5 Análise de agrupamentos

6 6

7 7

8 8

9 9

10 Análise de agrupamentos Algoritmos hierárquicos Problema (baseado no exemplo do livro Introdução à análise de agrupamentos W. O. Bussab,E.S. Miazaki e D.F. Andrade 9 o Simpósio Brasileiro de Probabilidade e Estatística São Paulo, julho/1990) Tarefa: formar agrupamentos (clusters) em uma amostra de seis indivíduos (A,B,C,D,E,F) com base na altura e no peso dos mesmos A matriz de dados é o material básico para aplicação das técnicas de A.A. As variáveis apresentam unidades de medidas diferentes: variável X1(Altura) está em cm e a variável X2 (Peso) está em Kg. Ok, é possível aplicar as técnicas de diretamente sobre as variáveis mas... as vezes é interessante padronizar (relativizar) os valores... 10

11 Vamos padronizar as variáveis Altura e Peso usando o escore Z: São 2 as variáveis que iremos padronizar: Altura e Peso. Precisamos da média e do desvio padrão dessas variáveis: Agora sim podemos padronizar as variáveis. Veja por exemplo a padronização da altura e do peso do indivíduo A 11

12 Então as variáveis Altura e Peso ficam padronizadas assim: Note que com a variável padronizada (escore Z) não temos mais unidades de medidas (cm e kg). Aliás, podemos dizer que nossa unidade de medida é o desvio padrão (DP). Podemos então falar, por exemplo, que o escore Z da variável Altura para o indivíduo B vale 0,33 DP, e que o escore Z da variável Peso para o indivíduo D vale -0,93 DP Observe também que toda variável padronizada apresenta média 0 e desvio padrão 1 12

13 Queremos então agrupar os objetos (indivíduos no exemplo) com base nas variáveis padronizadas Zalt e Zpeso. Como verificar se o objeto (indivíduo no exemplo) A é mais parecido com B do que C? Devemos usar coeficientes de parecença para atributos quantitativos. Exemplo: métricas de Minkowsky 13

14 Vamos usar a distância euclideana, a mais popular Vamos então calcular a distância euclidiana entre A e B, A e C, A e D,..., B e C, B e D, B e E, B e F,..., E e F. Vamos registrar todas as distâncias euclideanas na matriz de similiaridade (distância). Veja abaixo: Os autores do exemplo usam uma generalização da distância euclidiana denominada distância euclidiana média... mas aqui vamos usar a distância euclidiana simples. Continuando, vamos aplicar então uma técnica de agrupamento hierárquico aglomerativo. Incialmente, cada objeto (indivíduo) é um grupo (um cluster). À medida que o algoritmo avança, os objetos vão sendo agrupados pela reunião de pares semelhantes até reunir todos os objetos em um único grupo. 14

15 Trabalhamos com a matriz de similaridades... A cada passo realizamos a junção de dois grupos (clusters), no caso, os grupos com menor distância entre si. A cada passo a matriz de similaridades fica com uma linha e uma coluna a menos, justamente por se juntarem dois grupos... Passo 1 Inicialmente temos 6 grupos: (A), (B), (C), (D), (E) e (F). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (D) e (F) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (D) e (F) é 0,52. Então vamos juntá-los num grupo só. Então passaremos a ter 5 grupos (clusters): (A), (B), (C), (DF) e (E). Mas e agora? Qual a distância euclidiana entre (DF) e (A)? Entre (DF) e (B)? Entre (DF) e (C)? Entre (DF) e (E)? Neste ponto devemos utilizar um entre distintos métodos de definição de valor representativo quando o grupo (cluster) tem 2 ou mais objetos: Método do centroide (centroid linkage) Método da ligação simples ou vizinho mais próximo (single linkage) Método da ligação completa ou vizinho mais longe (complete linkage) Método da ligação por média (average linkage) Método das medianas (median linkage) Método de Ward (Ward linkage) 15

16 Vamos usar o método dos centroides. O ponto centroide é o ponto cujas coordenadas apresentam como valor a média de cada uma das variáveis em questão. No exemplo, as variáveis em questão são Zalt e Zpeso. Então vamos calcular o ponto centroide do grupo (DF): Agora sim podemos responder qual a distância euclidiana entre (DF) e (A)? Entre (DF) e (B)? Entre (DF) e (C)? Entre (DF) e (E)? 16

17 Vamos refazer a matriz de similaridades contendo agora 5 grupos: (A), (B), (C), (DF) e (E) Passo 2 Agora temos 5 grupos: (A), (B), (C), (DF) e (E). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (A) e (B) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (A) e (B) é 0,95. Note que os grupos (B) e (E) também apresentam valor 0,95. Então podemos escolher qualquer um deles para agrupar. Escolhemos aqui agrupar (A) e (B). Então vamos juntá-los num grupo só. Então passaremos a ter 4 grupos (clusters): (AB), (C), (DF) e (E). Mas e agora? Qual a distância euclidiana entre (AB) e (C)? Entre (AB) e (DF)? Entre (AB) e (E)? Primeiro calculamos o centroide do grupo (AB): Agora sim podemos responder qual a distância euclidiana entre (AB) e (C)? Entre (AB) e (DF)? Entre (AB) e (E)? 17

18 Vamos refazer a matriz de similaridades contendo agora 4 grupos: (AB), (C), (DF) e (E) Passo 3 Agora temos 4 grupos: (AB), (C), (DF) e (E). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (AB) e (E) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (AB) e (E) é 0,92. Então vamos juntá-los num grupo só. Então passaremos a ter 3 grupos (clusters): (ABE), (C) e (DF). Mas e agora? Qual a distância euclidiana entre (ABE) e (C)? Entre (ABE) e (DF)? Primeiro calculamos o centroide do grupo (ABE): Agora sim podemos responder qual a distância euclidiana entre (ABE) e (C)? Entre (ABE) e (DF)? 18

19 Vamos refazer a matriz de similaridades contendo agora 3 grupos: (ABE), (C) e (DF) Passo 4 Agora temos 3 grupos: (ABE), (C) e (DF). Vamos juntar os grupos com menor distância entre si. Observando a matriz de similaridades acima, percebemos que os grupos (C) e (DF) são os que apresentam menor distância euclidiana (maior similaridade portanto) entre todas as similaridades possíveis. A similaridade entre (C) e (DF) é 1,34. Então vamos juntá-los num grupo só. Então passaremos a ter 2 grupos (clusters): (ABE) e (CDF). Como restaram 2 clusters, o próximo agrupamento certamente será (ABCDEF). De toda forma, vamos calcular a distância euclideana entre (ABE) e (CDF)... Primeiro calculamos o centróide do grupo (CDF): Agora sim podemos responder qual a distância euclidiana entre (ABE) e (CDF) 19

20 Passo 5 Agora temos somente 2 grupos: (ABE) e (CDF). Vamos juntar estes grupos. Juntando os 2 grupos, chegamos ao fim do algoritmo de agrupamento juntando todos os objetos (indivíduos no exemplo) num único grupo (ABCDEF). Partimos de 6 distintos clusters e fomos aglomerando-os a cada iteração do algoritmo. Daí porquê ser uma técnica aglomerativa. O nível de parecença (similaridade) ente (ABE) e (CDF) vale 2,25. 20

21 Apresentação dos resultados A cada passo, o algoritmo foi agrupando dois subgrupos distintos de acordo com um valor de parecença (um nível de similaridade). Por exemplo, no passo 3 foram agrupados os subgrupos (AB) e (E) com um nível de similaridade de 0,92. Vamos tabular os valores: Passo Junção Nível de Similaridade 1 (D) com (F) 0,52 2 (A) com (B) 0,95 3 (AB) com (E) 0,92 4 (DF) com (C) 1,34 5 (ABE) com (CDF) 2,25 Agora vamos construir um mapa denominado dendrograma, que é um gráfico em forma de árvore mostrando os possíveis agrupamentos com os respectivos valores de parecença (níveis de similaridade) 21

22 Podemos cortar o dendrograma em diversas partes para definir 2, 3, 4, 5 ou 6 clusters. Por exemplo podemos cortar o dendrograma e registar a existência de 2 clusters com nível de similaridade 2,25: (ABE) e (CDF). Veja: Podemos cortar o dendrograma e registar a existência de 3 clusters: (ABE), e (DF). Veja: 22

23 Avaliação e interpretação dos resultados O dendrograma pode ser considerado como uma representação simplificada da matriz de similaridades mas... será que é uma boa simplificação? Uma forma de verificar quão bom é o dendrograma é avaliar se o dendrograma é capaz de reproduzir a matriz de similaridades. Para verificar isto, inicialmente montamos a matriz cofenética. A matriz cofenética é a matriz de distâncias entre os objetos obtidos a partir do dendrograma. Por exemplo, a distância (cofenética) entre A e C é dada pelo nível em que os dois são agrupados, no caso 2,25. Já a distância entre A e E e entre B e E vale 0,92. 23

24 Agora tomamos a matriz de similaridades e a matriz cofenética e calculamos o coeficiente de correlação linear r dos valores. O coeficiente de correlação linear r pode assumir valores entre 1 e 1: -1 r 1 Quanto mais próximo de 1 estiver r, melhor será a representação do dendrograma ao agrupamento. E quanto mais próximo de zero estiver r menor qualidade tem o agrupamento. A fórmula do coeficiente de correlação é a seguinte: Vamos então calcular o coeficiente de correlação r das matrizes: 24

25 O valor r = 0,756 é alto ou baixo? Responder isto é tão difícil como responder, na maioria das situações, o que é um alto coeficiente de correlação entre duas variáveis. Depende da área de estudo e de padrões que vão se desenvolvendo com a prática. Podese adiantar que em A.A. algo em torno de 0,8 já pode ser considerado bom ajuste. Analisando todos os resultados do exemplo ilustrado, poder-se-ia concluir que a amostra piloto sugere dois tipos de indivíduos: pequenos e grandes. Para continuar o estudo retrospectivo bastaria escolher (ou sortear) apenas duas pessoas: uma do conjunto (A,B,E) e outra de (C, D, F) e teríamos elementos representativos do grupo, segundo critérios de altura e peso, na crença de que essas variáveis sejam substitutas da característica de interesse * * * FIM do algoritmo hierárquico aglomerativo * * * 25

26 Análise de Agrupamentos (Clustering) Algoritmo K-Means Clustering K-means algorithm - ( algoritmo básico ).O algoritmo K-means é um algoritmo não hierárquico sendo, portanto, um algoritmo cujo método é baseado em partição. K-means é um dos mais simples algoritmos de aprendizagem não supervisionada voltado para o propósito de resolver o problema de clusterização (formação de agrupamento). K-means clustering - idéias básicas (I) 1) Determinar a amostra de N objetos (padrões) a serem agrupados ( clusterizados ) 2) Considerar P atributos (variáveis) do padrão em questão que servirão de base para a inclusão deste nos agrupamentos a serem formados 3) Definir, a priori, K clusters (agrupamentos) para alocar os N objetos (padrões) da amostra 4) Após definir o número K de clusters, gerar K pontos centróides, C 1 para o cluster 1, C 2 para o cluster 2,..., C k para o cluster K. 5) Aplicar o algoritmo K-means para alocar cada um dos N objetos (padrões) da amostra em algum dos K clusters (agrupamentos) 26

27 5.1) Para alocar um determinado ponto n dos N objetos em algum dos K clusters, a idéia é alocá-lo ao cluster m, 1 m k, cuja distância entre o objeto n e o centróide C m do cluster m seja a menor entre todas as distâncias entre n e os centróides C 1, C 2,... C k. K-means clustering - idéias básicas (II) Para entender a idéia básica do algoritmo K-means vamos analisar a seguinte situação: Suponha que desejemos agrupar algumas cidades em função do seu consumo per capita mensal de laranja e limão. As cidades e os valores de consumo per capita mensal (medidos, digamos, em litros/habitante/mês) são os abaixo apresentados: Desta forma, temos determinados os N objetos (padrões) a serem agrupados (clusterizados): N = 20 cidades Temos também determinados os P atributos (variáveis) do padrão em questão no caso cidades que servirão de base para a inclusão deste nos agrupamentos a serem formados. P = 2 atributos a saber: (1) consumo per capita mensal de laranja e (2) consumo per capita mensal de limão. 27

28 K-means clustering - idéias básicas (II) Vamos estabelecer, a priori, que desejamos classificar as 20 cidades em K = 3 grupos (clusters). Em seguida, definido que K = 3, vamos gerar 3 pontos de centróides, C 1, C 2 e C 3. 28

29 K-means clustering - idéias básicas (II) Em seguida, ao se executar o algoritmo de clusterização efetivamente, obtemos o resultado abaixo apresentado: Note que os centróides C 1, C 2 e C 3 mudaram espacialmente de lugar ao final da execução do algoritmo (compare com a situação inicial de C 1, C 2 e C 3 ). No exemplo, pode-se observar no grid que as cidades A, C, D e E estão no CLUSTER 2, as cidades B e G estão no CLUSTER 1 e F está no CLUSTER 3. 29

30 K-means clustering - idéias básicas (II) Se executássemos o algoritmo de clusterização para 2, 4 e 5 clusters obteríamos os seguintes resultados: Algumas Questões levantadas Questão 1: Como inicializar os centróides dos K clusters? Questão 2: Como calcular a distância entre um determinado ponto (padrão) n e o centróide C 1, C 2,..., C k de cada um dos K clusters? Questão 3: Em termos semânticos (ou, em termos analíticos) o que representa cada um dos clusters gerados? Vamos começar tentando responder a Questão 3, depois a Questão 2 e depois a Questão 1: 30

31 K-means clustering - idéias básicas (III) Questão 3: Em termos semânticos (ou, em termos analíticos) o que representa cada um dos clusters gerados? A designação qualitativa dos grupamentos são de responsabilidade exclusiva do usuário/analista de negócio. O algoritmo K-means não apresentará tal designação qualitativa. Para o exemplo citado anteriormente podemos ter, por exemplo: 31

32 K-means clustering - idéias básicas (III) Questão 2: Como calcular a distância entre um determinado ponto (padrão) n e o centróide C 1, C 2,..., C k de cada um dos K clusters? Existem diversos coeficientes usados para medir distância e similaridade entre padrões, com base nos tipos de atributos (variávies) dos padrões. Quando os atributos (variáveis) são quantitativos, uma medida de distância bastante popular é a distância euclideana, que foi utilizada no exemplo dos perfis de padrões de cidades com relação ao consumo per capita mensal de laranja e limão. Distância Euclideana Fórmula de Cálculo 32

33 K-means clustering - idéias básicas (III) Questão 1: Como inicializar os centróides dos K clusters? Os centróides representam o ponto médio do cluster em formação e/ou já formado. Não existe um método único de inicialização dos K centróides para os K clusters. É possível, por exemplo: Inicializar os K centróides escolhendo por sorteio K pontos (padrões) entre os N objetos (padrões) a serem agrupados. Escolher, por sorteio, K pontos (não necessariamente pontos entre os N objetos a serem agrupados) com range entre os valores máximos e mínimos de cada uma das P variáveis de classificação do padrão em questão. No exemplo das cidades, foi utilizado o seguinte critério de geração de centróides iniciais: Registrou-se o valor máximo e valor mínimo de cada dimensão do padrão (no caso valor máximo e mínimo do consumo de laranja e limão) Sabendo o número K de clusters desejado escolheram-se valores dos pontos médios de cada um dos K intervalos: 33

34 K-means clustering - idéias básicas (III) Exemplo de sorteio de 3 centróides iniciais para o agrupamento das N = 20 cidades em termos de consumo per capita mensal de laranja e limão e K = 3 clusters: 34

35 K-means clustering - Idéia do algoritmo básico (1) Informar o valor de K (número de clusters desejado); (2) Informar o valor de P (número de atributos do padrão que servirão de base para a clusterização); (3) Gerar C 1, C 2,... C k pontos de centróides para os K clusters; (incialmente os clusters estão vazios, contendo somente os pontos centróides gerados na etapa (3)) (4) Ler o arquivo de padrões e, para cada registro n (ou seja, cada padrão) associá-lo a um dos K clusters, através do cálculo de distância de n aos C 1, C 2,... C k pontos centróides, considerando a menor distância. (neste momento, após o passo (4), o cluster 1 tem n 1 pontos, o cluster 2 tem n 2 pontos,..., e o cluster k tem n k pontos devido a anexação de pontos lidos do arquivo de padrões). (5) Recalcular o novo valor dos pontos centróides dos K clusters com base na média aritmética de cada uma das P dimensões de seus pontos. (a idéia de centróide aqui pode ser vista como centro geométrico ) (6) Com base nos novos valores de centróides, voltar ao passo (4) para reavaliar a localização em clusters dos padrões de classificação. No caso de nenhum dos n padrões do arquivo ser realocado em outro cluster, o algoritmo termina e a clusterização, portanto está concluída. 35

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro

Leia mais

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS Luciene Bianca Alves ITA Instituto Tecnológico de Aeronáutica Praça Marechal Eduardo Gomes, 50 Vila das Acácias

Leia mais

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE INE 5 LISTA DE EERCÍCIOS DE PROBABILIDADE INE 5 Gabarito da Lista de Exercícios de Probabilidade ) Em um sistema de transmissão de dados existe uma probabilidade igual a 5 de um dado ser transmitido erroneamente.

Leia mais

3 MATERIAL E MÉTODOS

3 MATERIAL E MÉTODOS 3 MATERIAL E MÉTODOS 3.1 Fundamentação Teórica Quando se quer obter informações de um grupo de variáveis ou de um conjunto total dos dados de uma região, usualmente recorre-se à análise multivariada. A

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

PROF. CÍCERO JOSÉ Matemática e Estatística

PROF. CÍCERO JOSÉ Matemática e Estatística UNIBAN UNIVERSIDADE BANDEIRANTE DE SÃO PAULO Instituto de Administração e Negócios Tecnologia em Logística PROF. CÍCERO JOSÉ Matemática e Estatística São Paulo 2º semestre de 2010 SUMÁRIO CAPÍTULO I MATEMÁTICA

Leia mais

Exercícios Teóricos Resolvidos

Exercícios Teóricos Resolvidos Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Matemática Exercícios Teóricos Resolvidos O propósito deste texto é tentar mostrar aos alunos várias maneiras de raciocinar

Leia mais

Estatística Aplicada ao Serviço Social Módulo 1:

Estatística Aplicada ao Serviço Social Módulo 1: Estatística Aplicada ao Serviço Social Módulo 1: Introdução à Estatística Importância da Estatística Fases do Método Estatístico Variáveis estatísticas. Formas Iniciais de Tratamento dos Dados Séries Estatísticas.

Leia mais

Recuperação de Informação em Bases de Texto. Aula 10

Recuperação de Informação em Bases de Texto. Aula 10 Aula 10 1 Agrupamento/ clustering de documentos: Agrupar os documentos em classes/grupos, de acordo com a sua semelhança Aprendizagem não supervisionada Sem conjunto de treino/exemplos 2 3 Agrupamento/

Leia mais

Técnicas de Clustering: Algoritmos K-means e Aglomerative

Técnicas de Clustering: Algoritmos K-means e Aglomerative Técnicas de Clustering: Algoritmos K-means e Aglomerative Danilo Oliveira, Matheus Torquato Centro de Informática Universidade Federal de Pernambuco 9 de outubro de 2012 Danilo Oliveira, Matheus Torquato

Leia mais

4 Aplicativo para Análise de Agrupamentos

4 Aplicativo para Análise de Agrupamentos 65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido

Leia mais

Métodos Matemáticos para Gestão da Informação

Métodos Matemáticos para Gestão da Informação Métodos Matemáticos para Gestão da Informação Aula 05 Taxas de variação e função lineares III Dalton Martins dmartins@gmail.com Bacharelado em Gestão da Informação Faculdade de Informação e Comunicação

Leia mais

Palavras-Chaves: Agrupamento Hierárquico; Acordo de Resultados.

Palavras-Chaves: Agrupamento Hierárquico; Acordo de Resultados. Estatística Multivariada: Grupos Homogêneos no Combate à Criminalidade em Minas Gerais 1 Formação de Regiões Homogêneas no Combate à Criminalidade Violenta de Minas Gerais utilizando técnica de agrupamento

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

Atividade 4 - Acerte no alvo

Atividade 4 - Acerte no alvo Atividade 4 - Acerte no alvo 1. Justificativa Para entender um processo estatístico, é possível criar um experimento em que os alunos possam vivenciá-lo, organizando, selecionando, interpretando e criticando

Leia mais

Guia do professor. Ministério da Ciência e Tecnologia. Ministério da Educação. Secretaria de Educação a Distância.

Guia do professor. Ministério da Ciência e Tecnologia. Ministério da Educação. Secretaria de Educação a Distância. números e funções Guia do professor Objetivos da unidade 1. Analisar representação gráfica de dados estatísticos; 2. Familiarizar o aluno com gráfico de Box Plot e análise estatística bivariada; 3. Utilizar

Leia mais

Capítulo 7 Medidas de dispersão

Capítulo 7 Medidas de dispersão Capítulo 7 Medidas de dispersão Introdução Para a compreensão deste capítulo, é necessário que você tenha entendido os conceitos apresentados nos capítulos 4 (ponto médio, classes e frequência) e 6 (média).

Leia mais

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Resoluções comentadas das questões de Estatística da prova para ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Realizada pela Fundação João Goulart em 06/10/2013 41. A idade média de todos

Leia mais

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type. Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/ Factor Analysis (FACAN) Abrir o arquivo ven_car.sav Utilizar as 10 variáveis a

Leia mais

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A. IMES Catanduva Probabilidades e Estatística Estatística no Excel Matemática Bertolo, L.A. Aplicada Versão BETA Maio 2010 Bertolo Estatística Aplicada no Excel Capítulo 3 Dados Bivariados São pares de valores

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos Compreensão Agrupa documentos relacionados

Leia mais

CURSO ONLINE RACIOCÍNIO LÓGICO

CURSO ONLINE RACIOCÍNIO LÓGICO AULA QUINZE: Matrizes & Determinantes (Parte II) Olá, amigos! Pedimos desculpas por não ter sido possível apresentarmos esta aula na semana passada. Motivos de força maior nos impediram de fazê-lo, mas

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II! Como implementar o escore de crédito?! Como avaliar o escore de crédito?! Como calcular a função discriminante usando o Excel?! Como aplicar a função

Leia mais

TRATAMENTO DA INFORMAÇÃO/ANÁLISE DE DADOS AULA 09. Universidade Federal Fluminense

TRATAMENTO DA INFORMAÇÃO/ANÁLISE DE DADOS AULA 09. Universidade Federal Fluminense CURSO DE ESPECIALIZAÇÃO EM ENSINO DE MATEMÁTICA INSTITUTO DE MATEMÁTICA E ESTATÍSTICA 7 DE OUTUBRO DE 2014 TRATAMENTO DA INFORMAÇÃO/ANÁLISE DE DADOS AULA 09 Humberto José Bortolossi http://www.professores.uff.br/hjbortol/

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Unidade 2 Distribuições de Frequências e Representação Gráfica UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Ao finalizar esta Unidade, você deverá ser capaz de: Calcular

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

VIDEOCONFERENCIA NACIONAL SESI-CNI FAP BONUS x MALUS

VIDEOCONFERENCIA NACIONAL SESI-CNI FAP BONUS x MALUS MINISTÉRIO DA PREVIDÊNCIA SOCIAL SECRETARIA PREVIDENCIA SOCIAL VIDEOCONFERENCIA NACIONAL SESI-CNI FAP BONUS x MALUS Proposta de Hoje DISCUTIR O FAP - FATOR ACIDENTARIO PREVIDENCIARIO PPP Perguntas Condutoras

Leia mais

Leia o texto abaixo para resolver as questões sobre população e amostra.

Leia o texto abaixo para resolver as questões sobre população e amostra. Leia o texto abaixo para resolver as questões sobre população e amostra. População e amostra População e amostra referem-se ao conjunto de entes cujas propriedades desejamos averiguar. População estatística

Leia mais

Aula 4 Estatística Conceitos básicos

Aula 4 Estatística Conceitos básicos Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a

Leia mais

AULAS 04 E 05 Estatísticas Descritivas

AULAS 04 E 05 Estatísticas Descritivas 1 AULAS 04 E 05 Estatísticas Descritivas Ernesto F. L. Amaral 19 e 28 de agosto de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro:

Leia mais

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO

Leia mais

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder Comentário Geral: Prova muito difícil, muito fora dos padrões das provas do TCE administração e Economia, praticamente só caiu teoria. Existem três questões (4, 45 e 47) que devem ser anuladas, por tratarem

Leia mais

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea 2 O objetivo geral desse curso de Cálculo será o de estudar dois conceitos básicos: a Derivada e a Integral. No decorrer do curso esses dois conceitos, embora motivados de formas distintas, serão por mais

Leia mais

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas.

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas. Definições Básicas Introdução à Estatística ESTATÍSTICA: estudo dos métodos para coletar, organizar, apresentar e analisar dados. População: conjunto constituído por todos os indivíduos que apresentem

Leia mais

CAPÍTULO 9 Exercícios Resolvidos

CAPÍTULO 9 Exercícios Resolvidos CAPÍTULO 9 Exercícios Resolvidos R9.1) Diâmetro de esferas de rolamento Os dados a seguir correspondem ao diâmetro, em mm, de 30 esferas de rolamento produzidas por uma máquina. 137 154 159 155 167 159

Leia mais

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS MATEMÁTICA 7.º ANO PLANIFICAÇÃO GLOBAL Planificação 7º ano 2012/2013 Página 1 DOMÍNIO TEMÁTICO: NÚMEROS

Leia mais

Revisão de Estatística Básica:

Revisão de Estatística Básica: Revisão de Estatística Básica: Estatística: Um número é denominado uma estatística (singular). Ex.: As vendas de uma empresa no mês constituem uma estatística. Estatísticas: Uma coleção de números ou fatos

Leia mais

Análise de Arredondamento em Ponto Flutuante

Análise de Arredondamento em Ponto Flutuante Capítulo 2 Análise de Arredondamento em Ponto Flutuante 2.1 Introdução Neste capítulo, chamamos atenção para o fato de que o conjunto dos números representáveis em qualquer máquina é finito, e portanto

Leia mais

Instituto Superior de Engenharia do Porto. Agrupamento Clustering

Instituto Superior de Engenharia do Porto. Agrupamento Clustering Instituto Superior de Engenharia do Porto Engenharia Informática Projecto Agrupamento Clustering Manuel Altino Torres Aniceto Castro Orientadora Profª Fátima Rodrigues Julho 2003 Agradecimentos A realização

Leia mais

Experimento. Guia do professor. Qual é o cone com maior volume? Secretaria de Educação a Distância. Ministério da Ciência e Tecnologia

Experimento. Guia do professor. Qual é o cone com maior volume? Secretaria de Educação a Distância. Ministério da Ciência e Tecnologia geometria e medidas Guia do professor Experimento Qual é o cone com maior volume? Objetivos da unidade 1. Dado um círculo de cartolina, investigar qual seria o cone com maior volume que se poderia montar;

Leia mais

ATENÇÃO: Escreva a resolução COMPLETA de cada questão no espaço reservado para a mesma.

ATENÇÃO: Escreva a resolução COMPLETA de cada questão no espaço reservado para a mesma. 2ª Fase Matemática Introdução A prova de matemática da segunda fase é constituída de 12 questões, geralmente apresentadas em ordem crescente de dificuldade. As primeiras questões procuram avaliar habilidades

Leia mais

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos

Leia mais

AULAS 13, 14 E 15 Correlação e Regressão

AULAS 13, 14 E 15 Correlação e Regressão 1 AULAS 13, 14 E 15 Correlação e Regressão Ernesto F. L. Amaral 23, 28 e 30 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de

Leia mais

Aula 5 Metodologias de avaliação de impacto

Aula 5 Metodologias de avaliação de impacto Aula 5 Metodologias de avaliação de impacto Metodologias de Avaliação de Impacto Objetiva quantificar as mudanças que o projeto causou na vida dos beneficiários. Plano de Aula Método experimental: regressão

Leia mais

Treinando a sua equipe para aumentar a competitividade da sua empresa.

Treinando a sua equipe para aumentar a competitividade da sua empresa. Informativo Bimestral da Siqueira Campos Associados março de 2015 - ano IX - Número 24 Catálogo de Cursos 2015 Treinando a sua equipe para aumentar a competitividade da sua empresa. Nesta edição Pesquisas

Leia mais

AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO

AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO 1 AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO Amostra aleatória. Também conhecida como amostra probabilística. A melhor maneira de evitar uma amostra enviesada ou não-representativa é selecionar uma amostra

Leia mais

CI202 - Métodos Numéricos

CI202 - Métodos Numéricos CI202 - Métodos Numéricos Lista de Exercícios 2 Zeros de Funções Obs.: as funções sen(x) e cos(x) devem ser calculadas em radianos. 1. Em geral, os métodos numéricos para encontrar zeros de funções possuem

Leia mais

A Curva Normal Luiz Pasquali

A Curva Normal Luiz Pasquali Capítulo 3 A Curva Normal Luiz Pasquali 1 A História da Curva Normal A curva normal, também conhecida como a curva em forma de sino, tem uma história bastante longa e está ligada à história da descoberta

Leia mais

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências Probabilidade Introdução Tabelas Estatísticas População, Amostra e Variáveis Gráficos e Distribuição de Freqüências Renata Souza Conceitos Antigos de Estatística stica a) Simples contagem aritmética Ex.:

Leia mais

O B. Podemos decompor a pirâmide ABCDE em quatro tetraedros congruentes ao tetraedro BCEO. ABCDE tem volume igual a V = a2.oe

O B. Podemos decompor a pirâmide ABCDE em quatro tetraedros congruentes ao tetraedro BCEO. ABCDE tem volume igual a V = a2.oe GABARITO - QUALIFICAÇÃO - Setembro de 0 Questão. (pontuação: ) No octaedro regular duas faces opostas são paralelas. Em um octaedro regular de aresta a, calcule a distância entre duas faces opostas. Obs:

Leia mais

Sumário. Parte l. 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3

Sumário. Parte l. 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3 Sumário Parte l 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3 2. Entrevistas 5 2.1 Tipos de entrevistas 8 2.2 Preparação e condução

Leia mais

3. Características amostrais. Medidas de localização e dispersão

3. Características amostrais. Medidas de localização e dispersão Estatística Descritiva com Excel Complementos. 77 3. Características amostrais. Medidas de localização e dispersão 3.1- Introdução No módulo de Estatística foram apresentadas as medidas ou estatísticas

Leia mais

LISTA DE MATEMÁTICA. Aluno(a): Nº. 1. Determinada editora pesquisou o número de páginas das revistas mais vendidas em uma cidade.

LISTA DE MATEMÁTICA. Aluno(a): Nº. 1. Determinada editora pesquisou o número de páginas das revistas mais vendidas em uma cidade. LISTA DE MATEMÁTICA Aluno(a): Nº. Professor: Rosivane Série: 2 ano Disciplina: Matematica Data da prova: Pré Universitário Uni-Anhanguera MEDIDAS DE DISPERSÃO 1. Determinada editora pesquisou o número

Leia mais

Com uma coleção de figuras e de formas geométricas que mais parecem um jogo, mostre à turma que os números também têm seu lado concreto

Com uma coleção de figuras e de formas geométricas que mais parecem um jogo, mostre à turma que os números também têm seu lado concreto Universidade Severino Sombra Fundamentos Teóricos e Metodologia de Matemática 1 1 Com uma coleção de figuras e de formas geométricas que mais parecem um jogo, mostre à turma que os números também têm seu

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior Gestão de TI Evanivaldo Castro Silva Júnior Porque estudar Estatística em um curso de Gestão de TI? TI trabalha com dados Geralmente grandes bases de dados Com grande variabilidade Difícil manipulação,

Leia mais

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1 CURSO ON-LINE PROFESSOR GUILHERME NEVES 1 Olá pessoal! Resolverei neste ponto a prova de Matemática e Estatística para Técnico Administrativo para o BNDES 2008 organizado pela CESGRANRIO. Sem mais delongas,

Leia mais

Empurra e puxa. Domingo, Gaspar reúne a família para uma. A força é um vetor

Empurra e puxa. Domingo, Gaspar reúne a família para uma. A força é um vetor A U A UL LA Empurra e puxa Domingo, Gaspar reúne a família para uma voltinha de carro. Ele senta ao volante e dá a partida. Nada. Tenta outra vez e nada consegue. Diz então para todos: O carro não quer

Leia mais

SAD orientado a MODELO

SAD orientado a MODELO Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a MODELO DISCIPLINA: Sistemas de Apoio a Decisão SAD Orientado a Modelo De acordo com ALTER

Leia mais

Teorema de Pitágoras. Módulo 1 Unidade 10. Para início de conversa... Matemática e Suas Tecnologias Matemática 1

Teorema de Pitágoras. Módulo 1 Unidade 10. Para início de conversa... Matemática e Suas Tecnologias Matemática 1 Módulo 1 Unidade 10 Teorema de Pitágoras Para início de conversa... Certamente, você já deve ter ouvido falar no Teorema de Pitágoras. Pois bem, nesta unidade, ele será o centro das atenções, mas vamos

Leia mais

Capítulo 1. x > y ou x < y ou x = y

Capítulo 1. x > y ou x < y ou x = y Capítulo Funções, Plano Cartesiano e Gráfico de Função Ao iniciar o estudo de qualquer tipo de matemática não podemos provar tudo. Cada vez que introduzimos um novo conceito precisamos defini-lo em termos

Leia mais

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti. Distribuição Normal

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti. Distribuição Normal Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti Distribuição Normal 1. Introdução O mundo é normal! Acredite se quiser! Muitos dos fenômenos aleatórios que encontramos na

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

REPARTIÇÃO INTERMODAL DO TRÁFEGO

REPARTIÇÃO INTERMODAL DO TRÁFEGO REPARTIÇÃO INTERMODAL DO TRÁFEGO 1.Introdução A divisão modal pode ser definida como a divisão proporcional de total de viagens realizadas pelas pessoas e cargas, entre diferentes modos de viagem. Se refere

Leia mais

Escola Secundária Gabriel Pereira Évora Matemática A 10º ano. Planificação da Unidade Geometria

Escola Secundária Gabriel Pereira Évora Matemática A 10º ano. Planificação da Unidade Geometria Escola Secundária Gabriel Pereira Évora Matemática A 10º ano Planificação da Unidade Geometria 1. Generalidades Objecto da estatística e breve nota histórica sobre a evolução desta ciência; utilidade na

Leia mais

Histogramas. 12 de Fevereiro de 2015

Histogramas. 12 de Fevereiro de 2015 Apêndice B Histogramas Uma situação comum no laboratório e na vida real é a de se ter uma grande quantidade de dados e deles termos que extrair uma série de informações. Encontramos essa situação em pesquisas

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

4Distribuição de. freqüência

4Distribuição de. freqüência 4Distribuição de freqüência O objetivo desta Unidade é partir dos dados brutos, isto é, desorganizados, para uma apresentação formal. Nesse percurso, seção 1, destacaremos a diferença entre tabela primitiva

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

Teorema do Limite Central e Intervalo de Confiança

Teorema do Limite Central e Intervalo de Confiança Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),

Leia mais

Correlação e Regressão Linear

Correlação e Regressão Linear Correlação e Regressão Linear A medida de correlação é o tipo de medida que se usa quando se quer saber se duas variáveis possuem algum tipo de relação, de maneira que quando uma varia a outra varia também.

Leia mais

Aula 5 Técnicas para Estimação do Impacto

Aula 5 Técnicas para Estimação do Impacto Aula 5 Técnicas para Estimação do Impacto A econometria é o laboratório dos economistas, que busca reproduzir o funcionamento do mundo de forma experimental, como se faz nas ciências naturais. Os modelos

Leia mais

Usando o Excel para construir a Tabela de Distribuição de Freqüência

Usando o Excel para construir a Tabela de Distribuição de Freqüência Usando o Excel para construir a Tabela de Distribuição de Freqüência Uma empresa fabricante de lâmpadas deseja testar uma parte de sua produção. Selecionou 60 lâmpadas de 100W e deixou-as ligadas te que

Leia mais

Aulas de Estatística / Prof. Jones Garcia da Mata / www.professorjones.hpg.com.br. Sumário

Aulas de Estatística / Prof. Jones Garcia da Mata / www.professorjones.hpg.com.br. Sumário Capítulo 1: Introdução à Estatística Definição de estatística Sumário É uma ciência que envolve um corpo de técnicas e uma metodologia desenvolvida para a coleta, a tabulação, a classificação e simplificação

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

Pré processamento de dados II. Mineração de Dados 2012

Pré processamento de dados II. Mineração de Dados 2012 Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir

Leia mais

Sincronização. Sincronização de Relógios. Relógios Físicos

Sincronização. Sincronização de Relógios. Relógios Físicos Sincronização Embora a comunicação entre processos seja essencial em Sistemas Distribuídos, a sincronização de processos é também muito importante. Por exemplo: o É importante que vários processos não

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE PRESBITERIANA MACKENZIE UNIVERSIDADE PRESBITERIANA MACKENZIE MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO São Paulo 4 MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO

Leia mais

CURSO ON-LINE PROFESSOR GUILHERME NEVES

CURSO ON-LINE PROFESSOR GUILHERME NEVES Olá pessoal! Neste ponto resolverei a prova de Matemática Financeira e Estatística para APOFP/SEFAZ-SP/FCC/2010 realizada no último final de semana. A prova foi enviada por um aluno e o tipo é 005. Os

Leia mais

Vetor Quantização e Aglomeramento (Clustering)

Vetor Quantização e Aglomeramento (Clustering) (Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

QUADRADO MÁGICO - ORDEM 4

QUADRADO MÁGICO - ORDEM 4 CONCEITO Partindo da definição original, os QUADRADOS MÁGICOS devem satisfazer três condições: a) tabela ou matriz quadrada (número de igual ao número de ); b) domínio: com elementos assumindo valores

Leia mais

Decis: dividem os dados em décimas partes (cada parte tem 10% dos dados). São indicados por D 1, D 2,..., D 9.

Decis: dividem os dados em décimas partes (cada parte tem 10% dos dados). São indicados por D 1, D 2,..., D 9. Quartis, Decis e Percentis Probabilidade e Estatística I Antonio Roque Aula 7 A mediana é o valor que separa a quantidade de dados em duas partes igus: 50% dos dados abxo dela e 50% acima. Assim como a

Leia mais

Por que o quadrado de terminados em 5 e ta o fa cil? Ex.: 15²=225, 75²=5625,...

Por que o quadrado de terminados em 5 e ta o fa cil? Ex.: 15²=225, 75²=5625,... Por que o quadrado de terminados em 5 e ta o fa cil? Ex.: 15²=225, 75²=5625,... 0) O que veremos na aula de hoje? Um fato interessante Produtos notáveis Equação do 2º grau Como fazer a questão 5 da 3ª

Leia mais

EXPERIMENTO N o 6 LENTES CONVERGENTES INTRODUÇÃO

EXPERIMENTO N o 6 LENTES CONVERGENTES INTRODUÇÃO EXPERIMENTO N o 6 LENTES CONVERGENTES INTRODUÇÃO Ao incidir em uma lente convergente, um feixe paralelo de luz, depois de passar pela lente, é concentrado em um ponto denominado foco (representado por

Leia mais

FUNÇÃO REAL DE UMA VARIÁVEL REAL

FUNÇÃO REAL DE UMA VARIÁVEL REAL Hewlett-Packard FUNÇÃO REAL DE UMA VARIÁVEL REAL Aulas 01 a 04 Elson Rodrigues, Gabriel Carvalho e Paulo Luís Ano: 2015 Sumário INTRODUÇÃO AO PLANO CARTESIANO... 2 PRODUTO CARTESIANO... 2 Número de elementos

Leia mais

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais . O Mapa Auto-Organizável (SOM) Redes Neurais Mapas Auto-Organizáveis Sistema auto-organizável inspirado no córtex cerebral. Nos mapas tonotópicos do córtex, p. ex., neurônios vizinhos respondem a freqüências

Leia mais

ATIVIDADES PRÁTICAS SUPERVISIONADAS

ATIVIDADES PRÁTICAS SUPERVISIONADAS ATIVIDADES PRÁTICAS SUPERVISIONADAS 4ª Série Informática Industrial CST em Mecatrônica Industrial A atividade prática supervisionada (ATPS) é um método de ensinoaprendizagem desenvolvido por meio de um

Leia mais

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO! Fazendo regressão linear! Relacionando variáveis e criando uma equação para explicá-las! Como checar se as variáveis estão relacionadas!

Leia mais

Fonte: http://revistaescola.abril.com.br/gestao-escolar/coordenador-pedagogico/projeto-formacao-professoresmatematica-623627.shtml

Fonte: http://revistaescola.abril.com.br/gestao-escolar/coordenador-pedagogico/projeto-formacao-professoresmatematica-623627.shtml Fonte: http://revistaescola.abril.com.br/gestao-escolar/coordenador-pedagogico/projeto-formacao-professoresmatematica-623627.shtml Projeto de formação de professores em Matemática Um projeto exclusivo

Leia mais

Matemática - UEL - 2010 - Compilada em 18 de Março de 2010. Prof. Ulysses Sodré Matemática Essencial: http://www.mat.uel.

Matemática - UEL - 2010 - Compilada em 18 de Março de 2010. Prof. Ulysses Sodré Matemática Essencial: http://www.mat.uel. Matemática Essencial Equações do Primeiro grau Matemática - UEL - 2010 - Compilada em 18 de Março de 2010. Prof. Ulysses Sodré Matemática Essencial: http://www.mat.uel.br/matessencial/ Resumo: Notas de

Leia mais

Estudo de Caso Entendendo os Códigos

Estudo de Caso Entendendo os Códigos Estudo de Caso Entendendo os Códigos Este estudo de caso foi inspirado por alguém que queria uma explicação da amostra de código abaixo. Sub Teste1() With Range("B2:B" & Cells(Rows.Count, 1).End(xlUp).Row).SpecialCells(4).Formula

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análise Exploratória de Dados Profª Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Programa de Pós-graduação em Saúde Coletiva email: alcione.miranda@gmail.com Introdução O primeiro passo

Leia mais

A função do primeiro grau

A função do primeiro grau Módulo 1 Unidade 9 A função do primeiro grau Para início de conversa... Já abordamos anteriormente o conceito de função. Mas, a fim de facilitar e aprofundar o seu entendimento, vamos estudar algumas funções

Leia mais

Equações Diferenciais

Equações Diferenciais Equações Diferenciais EQUAÇÕES DIFERENCIAS Em qualquer processo natural, as variáveis envolvidas e suas taxas de variação estão interligadas com uma ou outras por meio de princípios básicos científicos

Leia mais

AT = X MÁX - X MÍN. Σ F i =n

AT = X MÁX - X MÍN. Σ F i =n UNIVERSIDADE FEDERAL DA PARAÍBA DISTRIBUIÇÃO DE FREQUÊNCIA Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/ DISTRIBUIÇÃO DE FREQUÊNCIA Quando se estuda uma massa de dados é de frequente

Leia mais