Os Dados. Mineração de Dados 2011

Tamanho: px
Começar a partir da página:

Download "Os Dados. Mineração de Dados 2011"

Transcrição

1 Os Dados Mineração de Dados 2011 Luís Rato (Capítulo 2 do livro Introduction to Data Mining ) Universidade de Évora, 2011 Mineração de dados / Data Mining 1

2 Os Dados Bibliografia Capítulo 2 do livro Introduction to Data Mining, Tan, Pearson Edt., 2005 Universidade de Évora, 2011 Mineração de dados / Data Mining 2

3 10 O que são os dados? Coleção de objetos ou instâncias e dos seus atributos Atributo é uma propriedade ou característica de um objecto Examplos: idade, temperatura, dimensão duma pétala,... Atributo é equivalente a: característica, campo ou variável (em inglês variable, field, characteristic, feature,...) Um objeto é equivalente a: instância, registo, ponto, caso, amostra, ou entidade (em inglês instance, record, point, case, sample, ou entity) Na mineração de de dados usualmente admite-se que os dados se encontram já sob a forma de uma tabela única. Objetos (instâncias) Atributos Tid Refund Marital Status Taxable Income 1 Yes Single 125K No 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No Cheat 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes Universidade de Évora, 2011 Mineração de dados / Data Mining 3

4 Valor dos atributos O valor dos atributos são os números ou símbolos atribuídos ao atributo. Exemplo: Altura é um atributo Altura pode ser representada de diferentes modos a) um dos símbolos {alto, médio, baixo} (valor nominal/símbolo) b) 1.25 m (valor numérico, real) c) 1250 mm (valor numérico, inteiro) d) 49.2 polegadas (valor numérico, real) Assim atributos e valor dos atributos são coisas diferentes Universidade de Évora, 2011 Mineração de dados / Data Mining 4

5 Propriedades dos valores dos atributos O tipo de atributos depende das propriedades que possui: Distinguível: = Ordenável: < > Somável: + - Multiplicável: * / 4 Tipos Nominal: distinguível Ordinal: distinguível e ordenável Intervalo: distinguível, ordenável e somável Rácio: distinguível, ordenável, somável e multiplicável Universidade de Évora, 2011 Mineração de dados / Data Mining 5

6 Tipos of Atributos 4 tipos de atributos (segundo a teoria dos tipos de escalas ) A. Qualitativos, ou discretos, ou enumerados 1. Nominal (Nominal) Exemplos: Côr, cidade, estado civil, número de passaporte 2. Ordinal (Ordinal) Exemplos: notas de um exame A a D, altura em {alto, médio, baixo} B. Quantitativos, ou numéricos 3. Intervalo (Interval) Exemplos: datas, temperatura em celsius ou farhneit 4. Rácio (Ratio) Exemplos: temperatura em Kelvin, comprimento, tempo, contagem Universidade de Évora, 2011 Mineração de dados / Data Mining 6

7 Definição Tipo de Atributo Nominal Descrição Exemplos Operações Atributos nominais são apenas nomes, ou seja dão-nos a informação suficiente para os distinguirmos uns dos outros (=, ) Codigo postal, número fiscal, cor dos olhos, sexo: {masc, fem} moda, entropia, contingência e frequência, correlação,... Ordinal Atributos ordinais permitem ordenar objectos (<, >) {baixo, médio, alto}, notas, número de porta mediana, percentil, correlação de rank,... Intervalo Rácio Atributos do tipo intervalo dão significado às diferenças entre valores, portantom, existe uma unidade de medida (+, - ) Atributos de rácio não só as diferenças como os rácios entre variáveis têm significado (*, /) Datas, temperatura em Celsius ou Fahrenheit temperatura em Kelvin, dinheiro, idade, massa, comprimento, corrente eléctrica média, desvio padrão, correlation, F-test (análise estatística multivariável) Média, média geometrica, média harmónica, variação percentual

8 Transformações que preservam o significado das variáveis Atributo Transformação Comentários Nominal Qualquer permutação Números de telefone fixo acrescentandos de 244 são equivalentes Ordinal Intervalo Qualque transformação que preserve a ordem e.g., y = f(x) f é função monotónica Qualquer transformação afim (por vezes denominada linear ) y =a * x + b Notas A,B,C,D, ou 4,3,2,1 ou 20,15,10,5 têm a mesma informação Assim Fahrenheit e Celsius são equivalentes. Rácio y = a * x Length can be measured in meters or feet.

9 Atributos discretos e contínuos Discretos Tem um número finito ou contável de valores Exemplos: número fiscal, ou o conjunto de palavras usada num documento Usam frequentemente inteiros na sua representação Valores binários também são valores discretos {0,1} Contínuos Usam número reais como valores dos atributos Exemplos: temperatura, altura, ou peso. No entanto os número reais são representados usando um número finito de casas decimais Usualmente são representados usando variáveis de virgula flutuante (float) Universidade de Évora, 2011 Mineração de dados / Data Mining 9

10 Conjuntos de dados Registos Matriz de dados Documentos Dados de transacções Grafos World Wide Web Estrutura Molecular Ordenados Espaciais Temporais Sequenciais Sequencias Genéticas Universidade de Évora, 2011 Mineração de dados / Data Mining 10

11 Características dos dados estruturados Dimensão Númerto de atributos Densidade (esparso) Percentagem de valores significativos no total de valores Resolução Padrões dependem da escala (e.g. demasiado perto? Ou demasiado longe?) Universidade de Évora, 2011 Mineração de dados / Data Mining 11

12 Documentos Cada documento pode ser transformado num vetor, Cada termo define um componente do vetor Universidade de Évora, 2011 Mineração de dados / Data Mining 12

13 Transações TID Items 1 Bread, Coke, Milk 2 Beer, Bread 3 Beer, Coke, Diaper, Milk 4 Beer, Bread, Diaper, Milk 5 Coke, Diaper, Milk Universidade de Évora, 2011 Mineração de dados / Data Mining 13

14 Grafos Exemplos: grafo e links HTML <a href="papers/papers.html#bbbb"> Data Mining </a> <li> <a href="papers/papers.html#aaaa"> Graph Partitioning </a> <li> <a href="papers/papers.html#aaaa"> Parallel Solution of Sparse Linear System of Equations </a> <li> <a href="papers/papers.html#ffff"> N-Body Computation and Dense Linear System Solvers Universidade de Évora, 2011 Mineração de dados / Data Mining 14

15 Estrutura química Molécula de Benzeno: C 6 H 6 Universidade de Évora, 2011 Mineração de dados / Data Mining 15

16 Dados ordenados Sequências Items/Eventos elementos da sequência Universidade de Évora, 2011 Mineração de dados / Data Mining 16

17 Dados ordenados Sequência genómica GGTTCCGCCTTCAGCCCCGCGCC CGCAGGGCCCGCCCCGCGCCGTC GAGAAGGGCCCGCCTGGCGGGCG GGGGGAGGCGGGGCCGCCCGAGC CCAACCGAGTCCGACCAGGTGCC CCCTCTGCTCGGCCTAGACCTGA GCTCATTAGGCGGCAGCGGACAG GCCAAGTAGAACACGCGAAGCGC TGGGCTGCCTGCTGCGACCAGGG Universidade de Évora, 2011 Mineração de dados / Data Mining 17

18 Dados ordenados Dados espácio-temporais Temperatura mensal em terra e no oceano Universidade de Évora, 2011 Mineração de dados / Data Mining 18

19 Qualidade dos dados Exemplos de problemas de qualidade: Ruído e outliers (valores anómalos) Valores em falta Dados duplicados Universidade de Évora, 2011 Mineração de dados / Data Mining 19

20 Ruído Alteração ou distorção dos sinais originais Exemplos: distorção do sinal de voz num telefone Ondas sinusoidais Ondas sinusoidais com ruído Universidade de Évora, 2011 Mineração de dados / Data Mining 20

21 Outliers Outliers têm características significativamente diferentes dos restantes Universidade de Évora, 2011 Mineração de dados / Data Mining 21

22 Valores em falta Motivos Informação não recolhida Atributos não aplicáveis a todos o objectos Tratamento Eliminar objectos Estimar valores em falta Ignorar os valores em falta durante a análise Universidade de Évora, 2011 Mineração de dados / Data Mining 22

23 Duplicados Pode acontecer quando se fundem fontes de dados Exemplos: A mesma pessoa com vários endereços de s Limpeza Detectar e eliminar duplicados Universidade de Évora, 2011 Mineração de dados / Data Mining 23

24 Pre-processamento de dados Agregação Amostragem Redução de dimensão Selecção de atributos Criação de atributos Discretização e Binarização Transformação de Atributos Universidade de Évora, 2011 Mineração de dados / Data Mining 24

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR 10 Coleção de objetos de dados e seus atributos Atributos Um atributo é uma propriedade ou característica de um objeto Exemplos: cor dos olhos de uma pessoa, temperatura, etc. Atributo também é conhecido

Leia mais

Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes

Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes 1 de 29 Tipos de Conjuntos de dados Registro Tabela do BD Matriz de dados Document 1 Document 2 team coach pla y ball score game wi n lost timeout 3 0

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Apresentações... Contatos com o Professor. (34) Prof. José Eduardo F. Lopes, Me.

Apresentações... Contatos com o Professor. (34) Prof. José Eduardo F. Lopes, Me. - UFU FAMAT Especialização em Estatística Empresarial Introdução ao Uso de Dados Prof. José Eduardo F. Lopes, Me. jeduardof@netsite.com.br Apresentações... 2 Contatos com o Professor jduardof@netsite.com.br

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte A Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Estatística Descritiva

Estatística Descritiva C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística

Leia mais

Nov/2016. José Roberto Motta Garcia

Nov/2016. José Roberto Motta Garcia José Roberto Motta Garcia garcia.cptec@gmail.com Fases da análise de dados Tratamento de dados Resumo estatístico dos dados - comandos Resumo estatístico dos dados - resultados Agrupamento pela soma (via

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA A FASE ANALÍTICA TCOR ENGEL SILVA COSTA costa.pms@ium.pt/226013 2 METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA Previamente ao início da recolha de dados, o investigador

Leia mais

Estatística Descritiva

Estatística Descritiva Estatística Descritiva 1 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos

Leia mais

Apontamentos de Introdução às Probabilidades e à Estatística

Apontamentos de Introdução às Probabilidades e à Estatística i Índice 1. Introdução 1 1.1. Enquadramento e objectivos 2 1.2. Organização 5 1.3. Noções base da Estatística 7 1.3.1. Distinção entre população e amostra 8 1.3.2. Amostragem 10 1.3.3. Unidade estatística

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 8 Análise de Dados 2 de 23 Sumário Introdução Caracterização de Dados

Leia mais

Estatística descritiva

Estatística descritiva Estatística descritiva Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas

Leia mais

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP Bioestatística UNESP Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP Perguntas iniciais para reflexão I - O que é Estatística? II - Com que tipo de informação (dados)

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Análise de Dados Sylvio Barbon Junior barbon@uel.br 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Sumário Introdução Caracterização de Dados Exploração de

Leia mais

Métodos Estatísticos Estatística? Estatística. João Freire de Noronha DCTA/ESAC 1

Métodos Estatísticos Estatística? Estatística. João Freire de Noronha DCTA/ESAC 1 Métodos Estatísticos 2006 3ª Aula João Noronha DCTA/ESAC 1 Estatística? Recolha Organização Análise Interpretação Apresentação DADOS João Noronha DCTA/ESAC 2 Estatística Estatística DESCRITIVA sintetizar

Leia mais

PARTE II ANÁLISE INICIAL DE DADOS

PARTE II ANÁLISE INICIAL DE DADOS Introdução PARTE II ANÁLISE INICIAL DE DADOS Neste capítulo dedicado à Análise Inicial de Dados, começaremos por fazer uma revisão de forma muito breve de conceitos de que os alunos já conhecem do Ensino

Leia mais

12/06/14. Estatística Descritiva. Estatística Descritiva. Estatística Descritiva. Estatística Analítica (Inferência estatística/estatística indutiva)

12/06/14. Estatística Descritiva. Estatística Descritiva. Estatística Descritiva. Estatística Analítica (Inferência estatística/estatística indutiva) Estatística Analítica (Inferência estatística/estatística indutiva) 2 Método quantitativo utilizado apenas para descrever os dados, mostrando seus subtipos, sua distribuição, freqüência, média etc. 3 1

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade

Leia mais

Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo.

Conjunto de Dados. Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo. Conjunto de Dados Existe uma estimativa de que a cada 20 meses dobra a quantidade de dados armazenada nos bancos de dados do mundo. No entanto, tem aumentando também a distância entre a quantidade de dados

Leia mais

TRATAMENTO DA INFORMAÇÃO

TRATAMENTO DA INFORMAÇÃO CURSO DE FORMAÇÃO CONTINUADA EM MATEMÁTICA PARA PROFESSORES DA EDUCAÇÃO BÁSICA (4º E 5º ANOS) TRATAMENTO DA INFORMAÇÃO PROFESSOR WESLEY ROCHA GRIPA CEUNES/UFES/DMA Agosto de 2015 Normas/Leis LDB; Diretrizes

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Exemplos de aplicação. Mineração de Dados 2013

Exemplos de aplicação. Mineração de Dados 2013 Exemplos de aplicação Mineração de Dados 2013 Luís Rato Universidade de Évora, 2013 Mineração de dados / Data Mining 1 Classificação: Definição Dado uma conjunto de registos (conjunto de treino training

Leia mais

Sistema de Informações e Pesquisa de Marketing Aula 11 17/10/17

Sistema de Informações e Pesquisa de Marketing Aula 11 17/10/17 Sistema de Informações e Pesquisa de Marketing Aula 11 17/10/17 2º semestre / 2017 Profa Kavita Hamza kavita@usp.br Mensuração Atribuição de números ou outros símbolos a características de objetos de

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida Conceito de bioestatística A bioestatística é um recurso matemático aplicado às ciências biológicas Tem por finalidade de coletar,

Leia mais

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva ESTATÍSTICA DESCRITIVA 2 Estatística Descritiva O que fazer com as observações que coletamos? Primeira etapa da análise: Resumo dos dados: organizar, descrever e resumir os dados coletados Estatística

Leia mais

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2) PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO Curso(s): Ciência da Computação Período: 2018.2 Professora: Rosana da Paz Ferreira Disciplina(s): INF5325 Probabilidade e Estatística

Leia mais

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2) PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO Curso(s): Ciência da Computação Período: 2018.2 Professora: Rosana da Paz Ferreira Disciplina(s): CCB1052 Probabilidade e Estatística

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

Probabilidade e Estatística. stica. Introdução. Prof.Ms. Carlos Henrique J.Costa.

Probabilidade e Estatística. stica. Introdução. Prof.Ms. Carlos Henrique J.Costa. Probabilidade e Estatística stica Introdução Prof.Ms. Carlos Henrique J.Costa Email: carloshjc@yahoo.com.br OS NÚMEROS NÃO MENTEM, MAS OS MENTIROSOS USAM NÚMEROS!!! ESTATÍSTICA Alguma definições... Ciência

Leia mais

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz Estatística Aplicada UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz Estatística Descritiva A estatística descritiva preocupa-se com a forma pela qual podemos apresentar um conjunto de dados

Leia mais

Estatística Aplicada 2016 CTeSP Qualidade Alimentar. Estatística? Estatística ª Aula

Estatística Aplicada 2016 CTeSP Qualidade Alimentar. Estatística? Estatística ª Aula Estatística Aplicada 016 CTeSP Qualidade Alimentar 3ª Aula João Noronha DCTA/ESAC 1 Estatística? Recolha Organização Análise Interpretação Apresentação DADOS João Noronha DCTA/ESAC Estatística Estatística

Leia mais

CONTROLE ESTATÍSTICO DE PROCESSOS

CONTROLE ESTATÍSTICO DE PROCESSOS CONTROLE ESTATÍSTICO DE PROCESSOS ANEXOS INTRODUÇÃO ANEXO 1 TABELA I Fator para estimar o desvio padrão ANEXO 2 TABELA II Valores padronizados para distribuição normal ANEXO 3 TABELA III Distribuição de

Leia mais

Tratamento estatístico de observações

Tratamento estatístico de observações Tratamento estatístico de observações Prof. Dr. Carlos Aurélio Nadal OBSERVAÇÃO: é o valor obtido durante um processo de medição. DADO: é o resultado do tratamento de uma observação (por aplicação de uma

Leia mais

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso MEDIDAS DE POSIÇÃO E DE DISPERSÃO Profª Andréa H Dâmaso Bioestatística e Delineamento Experimental - 2012 Tópicos da aula Medidas de tendência central e dispersão Variáveis contínuas: distribuição normal

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos

Leia mais

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

6EMA Lucas Santana da Cunha   17 e 19 de abril de Universidade Estadual de Londrina ESTATÍSTICA ECONÔMICA 6EMA020-1000 lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 17 e 19 de abril de 2017 1 o Bimestre Cronograma Critério de Avaliação Bibliografia

Leia mais

Aula 2: Resumo de Dados

Aula 2: Resumo de Dados Aula 2: Resumo de Dados Professor: José Luiz Padilha da Silva email: jlpadilha@ufpr.br Departamento de Estatística Universidade Federal do Paraná Curitiba, 2018 José Luiz Padilha da Silva (UFPR) ce003

Leia mais

Construção da base de dados

Construção da base de dados Construção da base de dados Construção da base de dados Construção da base de dados Exemplos de Inquéritos O instrumento de notação Codificação e dicionário das variáveis Data view e variable view Introdução

Leia mais

Importância da estatística 17. O que é a Estatística? 18

Importância da estatística 17. O que é a Estatística? 18 Índice MENSAGEM DO AUTOR 11 AGRADECIMENTOS 13 Capítulo 1 Introdução Importância da estatística 17 O que é a Estatística? 18 Escalas de medida 19 Escala de medida qualitativa ou não métrica 19 Escalas Nominais

Leia mais

Medidas-Resumo. Tipos de Variáveis

Medidas-Resumo. Tipos de Variáveis Tipos de Variáveis Medidas-Resumo Exemplo 2.1 Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da seção de orçamentos da Companhia MB. Usando

Leia mais

Capítulo 1. Análise Exploratória de Dados

Capítulo 1. Análise Exploratória de Dados Capítulo 1 Análise Exploratória de Dados Introdução A finalidade da Análise Exploratória de Dados (AED) é examinar os dados previamente à aplicação de qualquer técnica estatística. Desta forma o analista

Leia mais

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Estatística Básica O que é Estatística? um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de Aplicações em quase

Leia mais

Tratamento estatístico de observações

Tratamento estatístico de observações Tratamento estatístico de observações Prof. Dr. Carlos Aurélio Nadal OBSERVAÇÃO: é o valor obtido durante um processo de medição. DADO: é o resultado do tratamento de uma observação (por aplicação de uma

Leia mais

Introdução a Sistemas Inteligentes

Introdução a Sistemas Inteligentes Introdução a Sistemas Inteligentes Noções de Preparação de Dados e Mineração de Regras de Associação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte deste material consiste de adaptações e extensões

Leia mais

Análise de dados em Geociências

Análise de dados em Geociências Análise de dados em Geociências Análise exploratória de dados Susana Barbosa Mestrado em Ciências Geofísicas 2014-2015 Resumo Análise exploratória de dados Princípios e objectivos da estatística Introdução

Leia mais

todos os elementos que se pretende analisar, sendo a amostra um subconjunto finito e representativo da mesma.

todos os elementos que se pretende analisar, sendo a amostra um subconjunto finito e representativo da mesma. Página 375 1.1 A população é constituída por todos os jogadores de basquetebol do clube A, sendo a amostra formada pelos jogadores escolhidos para serem inquiridos. Relembra que a população é o conjunto

Leia mais

Adilson Cunha Rusteiko

Adilson Cunha Rusteiko Janeiro, 2015 Estatística , A Estatística Estatística: É a parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação

Leia mais

Análise da Informação Económica e Empresarial

Análise da Informação Económica e Empresarial Análise da Informação Económica e Empresarial Aula 5: Tratamento de informação quantitativa Noções básicas: Unidade estatística, População, Variável; distribuição. Redução de dados: Tabela de frequências.

Leia mais

MAE116 Noções de Estatística

MAE116 Noções de Estatística Exercício 01 MAE116 Noções de Estatística base freq. absoluta Antes do treinamento freq. relativa (%) densidade de freq. freq. absoluta Depois do treinamento freq relativa (%) densidade de freq. 0 -- 2

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Estatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências.

Estatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências. Estatística 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências Renata Souza Técnicas de Estatística Descritiva técnicas para extrair informações

Leia mais

Elementos de Estatística

Elementos de Estatística Elementos de Estatística Lupércio F. Bessegato & Marcel T. Vieira UFJF Departamento de Estatística 2013 Gráficos & Tabelas Descrição Tabular e Gráfica Tabelas: Tipos de variáveis e tabelas Frequências

Leia mais

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística 1 Introdução Definição: Estatística é um conjunto de conceitos e métodos científicos para coleta, organização, descrição, análise

Leia mais

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação Física Geral - Laboratório Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de compreender as principais

Leia mais

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA E.E. Dona Antônia Valadares MATEMÁTICA ENSINO MÉDIO - 3º ANO ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA http://donaantoniavaladares.comunidades.net ESTATÍSTICA Origem no latim Status (estado) + isticum

Leia mais

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação Física Geral - Laboratório Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de compreender as principais

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) O que é Estatística Para muitos, a Estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são as pessoas que coletam esses dados. A Estatística originou-se

Leia mais

Extracção de Conhecimento

Extracção de Conhecimento Programa Doutoral em Engenharia Informática Mestrado Integrado em Engenharia Informática LIACC/FEUP Universidade do Porto www.fe.up.pt/ ec rcamacho@fe.up.pt Outubro 2007 conceitos básicos Conteúdo Definições

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados

Roteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados Roteiro PCC142 / BCC444 - Mineração de Dados Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz

Leia mais

Análise Descritiva de Dados

Análise Descritiva de Dados Análise Descritiva de Dados 1 Estatística estatística descritiva estatística inferencial 2 Estatística descritiva Envolve técnicas que permitem representar, mensurar e analisar um conjunto de dados 3 Estatística

Leia mais

RECONHECIMENTO DE PADRÕES - RP

RECONHECIMENTO DE PADRÕES - RP RECONHECIMENTO DE PADRÕES - RP Definições Básicas O que é? 2 Ramo do aprendizado de máquina Consiste em atribuir um rótulo (ou classe) para uma certa amostra ou valor de entrada Exemplo: classificação

Leia mais

ANÁLISE EXPLORATÓRIA DE DADOS

ANÁLISE EXPLORATÓRIA DE DADOS ANÁLISE EXPLORATÓRIA DE DADOS Resumo, organização e interpretação dos dados. Identificação/Proposição de um modelo que explique o fenômeno. Antigamente chamada de Estatística Descritiva. 1 Variáveis estatísticas

Leia mais

Estatística stica na Pesquisa Clínica

Estatística stica na Pesquisa Clínica Estatística stica na Pesquisa Clínica Thaïs s Cocarelli Sthats Consultoria Estatística stica NAPesq (HC-FMUSP) Alguns conceitos Estudos observacionais e experimentais Exploração e apresentação de dados

Leia mais

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Técnicas Computacionais em Probabilidade e Estatística I. Aula I Técnicas Computacionais em Probabilidade e Estatística I Aula I Chang Chiann MAE 5704- IME/USP 1º Sem/2008 1 Análise de Um conjunto de dados objetivo: tratamento de um conjunto de dados. uma amostra de

Leia mais

NOÇÕES DE ESTATÍSTICA

NOÇÕES DE ESTATÍSTICA ONALDO CHAVES ESTATÍSTICA BIBLIOGRAFIA SUGERIDA: 1 Estatística Aplicada Autores: Larson e Farber Editora: Pearson 4ª edição 2009 2 Estatística para Ciências Humanas Autor: Levin, Fox e Ford Editora: Pearson

Leia mais

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes 1 Estatística População Características Técnicas de amostragem Amostra Análise descritiva Conclusões sobre as características da

Leia mais

Análise exploratória de dados

Análise exploratória de dados Análise exploratória de dados Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Estatística origem ~1770, do Alemão Statistik ciência que lida com dados sobre a condição de um estado ou comunidade

Leia mais

AULA 11 PROJETO E ANÁLISE DE ALGORITMOS. Conceitos básicos e representação de grafos Karina Valdivia Delgado

AULA 11 PROJETO E ANÁLISE DE ALGORITMOS. Conceitos básicos e representação de grafos Karina Valdivia Delgado AULA 11 PROJETO E ANÁLISE DE ALGORITMOS Conceitos básicos e representação de grafos Karina Valdivia Delgado Roteiro Motivação Conceitos básicos Representação Motivação Um grafo é uma abstração que permite

Leia mais

Estatística Fácil. Prof.º Mario César Castro 2015

Estatística Fácil. Prof.º Mario César Castro 2015 Estatística Fácil Prof.º Mario César Castro 2015 A Estatística é um ramos da Matemática que dispõe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar determinados

Leia mais

CONCEITOS FUNDAMENTAIS SOBRE TABELAS E GRÁFICOS. Profa. Raquel C. de Melo Minardi

CONCEITOS FUNDAMENTAIS SOBRE TABELAS E GRÁFICOS. Profa. Raquel C. de Melo Minardi 3 CONCEITOS FUNDAMENTAIS SOBRE TABELAS E GRÁFICOS Profa. Raquel C. de Melo Minardi LIVRO: SHOW ME THE NUMBERS Capítulos 1, 2 e 3 Unidades de medida? Data? Como estas medidas de comparam aos planos? Como

Leia mais

Física Geral - Laboratório. Organização e descrição de dados

Física Geral - Laboratório. Organização e descrição de dados Física Geral - Laboratório Organização e descrição de dados 1 Física Geral - Laboratório A nota de laboratório de Física Geral será composta dos resultados das provas e atividades de laboratório: Média

Leia mais

DISCIPLINA: PROBABILIDADE E ESTATÍSTICA TURMA: Informática de Gestão

DISCIPLINA: PROBABILIDADE E ESTATÍSTICA TURMA: Informática de Gestão Aula # 04 DISCIPLINA: PROBABILIDADE E ESTATÍSTICA TURMA: Informática de Gestão Escala de Medidas de Variáveis. Frequência absoluta e relativa de dados quantitativos. Professor: Dr. Wilfredo Falcón Urquiaga

Leia mais

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Prof. Lorí Viali, Dr.   Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.ufrgs.br/~viali/ Coleção de números n estatísticas sticas O número n de carros vendidos no país aumentou em 30%. A taxa de desemprego atinge, este mês,

Leia mais

Estatística Descritiva (II)

Estatística Descritiva (II) Estatística Descritiva (II) Exemplo: Um experimento feito por alunos. Cada um deles registrou sua altura, peso, sexo, hábito de fumar e nível de atividade física. Depois, todos eles jogaram moedas e aqueles

Leia mais

1 Estatística Descritiva

1 Estatística Descritiva 1 Estatística Descritiva A estatística descritiva é parte da estatística que lida com a organização, resumo e apresentação de dados. Esta é feita por meio de: Tabelas; Gráficos; Medidas Descritivas (média,

Leia mais

Tutorial para o desenvolvimento das Oficinas

Tutorial para o desenvolvimento das Oficinas Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina

Leia mais

AULA DO CPOG. Estatística básica

AULA DO CPOG. Estatística básica AULA DO CPOG Estatística básica ATRIBUTO características que podem ser enumeradas VARIÁVEL características que podem ser medidas, controladas ou manipuladas em uma pesquisa VARIÁVEL QUALITATIVA valores

Leia mais

Estatística descritiva básica: Tabelas e Gráficos

Estatística descritiva básica: Tabelas e Gráficos Estatística descritiva básica: Tabelas e Gráficos ACH2021 Tratamento e Análise de Dados e Informações Marcelo de Souza Lauretto marcelolauretto@usp.br www.each.usp.br/lauretto *Parte do conteúdo baseada

Leia mais

MEDIDAS DE TENDÊNCIA CENTRAL

MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE TENDÊNCIA CENTRAL Professor Jair Wyzykowski Universidade Estadual de Santa Catarina Média aritmética INTRODUÇÃO A concentração de dados em torno de um valor pode ser usada para representar todos

Leia mais

Mineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados?

Mineração de Dados. Dados Escalar Cardinalidade Porque pré-processar dados? Mineração de Dados Pré-Processamento de Dados 1 Sumário Dados Escalar Cardinalidade Porque pré-processar dados? Limpeza de Dados Integração e Transformação Redução de Dados Discretização 2 1 Dados Medidas

Leia mais

Escala de Medidas de Variáveis. Tabelas de Frequência. Frequência absoluta e relativa de dados quantitativos.

Escala de Medidas de Variáveis. Tabelas de Frequência. Frequência absoluta e relativa de dados quantitativos. Aula # 04 Escala de Medidas de Variáveis. Tabelas de Frequência. Frequência absoluta e relativa de dados quantitativos. Professor: Dr. Wilfredo Falcón Urquiaga Professor Titular Engenheiro em Telecomunicações

Leia mais

Física Geral - Laboratório Aula 1: Organização e descrição de dados

Física Geral - Laboratório   Aula 1: Organização e descrição de dados Física Geral - Laboratório http://dfnae.fis.uerj.br/twiki/bin/view/dfnae/fisicageral Aula 1: Organização e descrição de dados 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de

Leia mais

Física Geral - Laboratório (2016/2) Organização e descrição de dados

Física Geral - Laboratório (2016/2) Organização e descrição de dados Física Geral - Laboratório (2016/2) Organização e descrição de dados 1 Física Geral - 2016/2 Bibliografia: Estimativas e Erros em Experimentos de Física (EdUERJ) 2 Dados e medidas Todo experimento em física

Leia mais

Física Geral - Laboratório Aula 1: Organização e descrição de dados

Física Geral - Laboratório   Aula 1: Organização e descrição de dados Física Geral - Laboratório http://dfnae.fis.uerj.br/twiki/bin/view/dfnae/fisicageral Aula 1: Organização e descrição de dados 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de

Leia mais

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix Unidade I ESTATÍSTICA APLICADA Prof. Luiz Felix O termo estatística Provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em

Leia mais

Conceito de Campos e Tabelas

Conceito de Campos e Tabelas Aula 04 Conceito de Campos e Tabelas Tabelas É um conjunto de registros de um mesmo tipo onde cada linha é composta por um campo que recebe um valor de atributo. Em um Banco de Dados poderá existir uma

Leia mais

Tipos de variáveis e amostragem

Tipos de variáveis e amostragem Tipos de variáveis e amostragem probabiĺıstica Prof. Dr. Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ 28 de março de 2018 Londrina 1 / 19 Definição Tipos de variáveis

Leia mais

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015 CE001 Bioestatística Prof. Cesar Augusto Taconeli Curitiba-PR 2015 Parte 2 Estatística descritiva 2 A estatística descritiva compreende técnicas (tabelas, gráficos, medidas) que permitem resumir os dados.

Leia mais

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito) Exercício 1. (2,0 pontos). Um pesquisador pretende comparar o tempo de reação (segundos) para dois tipos diferentes de estímulos visuais, A e B. Na tabela abaixo, esses tempos foram obtidos para 20 e 19

Leia mais

Aprendizado de Supervisionado

Aprendizado de Supervisionado Aprendizado de Supervisionado Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Padronizando e Normalizando os Atributos 2. Tipos de Atributos 3. Representação Textual 1 Padronizando e

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ Coleção de números estatísticas O número de carros vendidos no país aumentou em 30%. A taa de desemprego atinge, este mês, 7,5%.

Leia mais

Aprendizagem de Dados Simbólicos e/ou Numéricos

Aprendizagem de Dados Simbólicos e/ou Numéricos Aprendizagem de Dados Simbólicos e/ou Numéricos Francisco de A.T. de Carvalho 1 Dados usuais 1/2 Ω = {1,, n} conjunto de indivíduos (população ou universo, amostra) As propriedades de cada indivíduo são

Leia mais