ANÁLISE DE RESULTADOS

Documentos relacionados
SSC546 Avaliação de Sistemas Computacionais Parte 1 -Aula 4 Sarita Mazzini Bruschi

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Intervalos Estatísticos para uma única Amostra - parte I

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Inferência Estatística:

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Introdução à Bioestatística Turma Nutrição

AULA 03 Estimativas e tamanhos amostrais

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Capítulo 4 Inferência Estatística

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Inferência Estatística: Conceitos Básicos II

Simulação de Sistemas. Adaptado de material de Júlio Pereira Machado (AULA 17)

Inferência Estatística:

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Licenciatura em Ciências Biológicas Universidade Federal de Goiás. Bioestatística. Prof. Thiago Rangel - Dep. Ecologia ICB

ESTATÍSTICA ECONÔMICA A 6EMA

ESTATÍSTICA ECONÔMICA A 6EMA

Estatística aplicada a ensaios clínicos

Metodologia de simulação

Estatística Descritiva

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Modelos: Verificação, Validação e Experimentação

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Conceito de Estatística

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

Simulação com Modelos Teóricos de Probabilidade

Prof. Francisco Crisóstomo

Segunda Lista de Exercícios Cálculo de Probabilidades II Prof. Michel H. Montoril

CONHECIMENTOS ESPECÍFICOS

Estatística Descritiva (I)

Coleta e Modelagem dos Dados de Entrada

Professora Ana Hermínia Andrade. Período

Estatística Inferencial

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Análise Exploratória e Estimação PARA COMPUTAÇÃO

Cap. 4 - Estimação por Intervalo

Coleta e Modelagem dos Dados de Entrada

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria-PPGEAB Prova de Conhecimentos Específicos

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

MEDIDAS DE DISPERSÃO. Os dados a seguir referem-se ao índice pluviométrico de três cidades no Estado de São Paulo, em 3 diferentes ocasiões

Inferência Estatistica

AULA 05 Teste de Hipótese

Universidade Federal de Lavras

ESTATÍSTICA RESUMO E EXERCÍCIOS DE PROVAS ANTERIORES * *Resoluções destes exercícios grátis em simplificaaulas.com

Estatística Descritiva (I)

Tutorial para o desenvolvimento das Oficinas

ESTIMAÇÃO DE PARÂMETROS

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

SSC546 -Avaliação de Desempenho de Sistemas

Intervalos de Confiança

Estatística descritiva

Estatística II. Intervalo de Confiança Lista de Exercícios

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Comprovação Estatística de Medidas Elétricas

GE-814: Introdução à Avaliação Operacional

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

Estimativas e Tamanhos de Amostras

Lista 5. Prof. Erica Castilho Rodrigues Disciplina: Introdução à Estatística e Probabilidae. 06 de Maio. Data de entrega: a denir

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

Estatística Aplicada

CONHECIMENTOS ESPECÍFICOS

Aula 9: Introdução à Inferência Estatística

TÉCNICAS DE AMOSTRAGEM

Estatística e Modelos Probabilísticos - COE241

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Estimação e Testes de Hipóteses

Estatística 1. Resumo Teórico

Distribuição t de Student

Unidade III Medidas Descritivas

Estatística Aplicada II. } Estimação e Intervalos de Confiança

Inferência Estatística

AULA 07 Inferência a Partir de Duas Amostras

Professora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

ESTATÍSTICA. Lucas Santana da Cunha 18 de setembro de Universidade Estadual de Londrina

Transcrição:

ANÁLISE DE RESULTADOS Conteúdo 2 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos 1

Conteúdo 3 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos Introdução Estatística Descritiva Coleta de Dados Organização dos Dados µ 4 H σ 2 X σ Caracterização dos Dados Massa de Dados Dados agrupados Parâmetros Típicos 2

5 Introdução Inferência Estatística A partir de amostras -> conclusões sobre a população Erro amostral elementos atípicos que não representam a amostra -> diferença entre amostra e população Amostra viciada tendência maior em selecionar algum tipo de elemento Introdução Inferência Estatística Erro amostral - cálculo aproximado 6 N tamanho da população E 0 Erro amostral tolerável n tamanho da amostra 3

7 - Introdução Amostragem População Amostra Análise Descritiva Conclusões sobre a população Inferência Dados Organizados 8 Procedimento equivocado normalmente utilizado para uma avaliação: 1. Desenvolvimento de um procedimento para avaliação (coleta de dados, simulação...) 2. Validação e verificação do sistema de avaliação 3. Obtenção dos resultados através de uma execução da forma de avaliação escolhida 4. Conclusões sobre o sistema em estudo Equivalente a se considerar uma amostra unitária 4

entradas saídas Por que esse Procedimento está errado? Aferição Resultados Sistema a ser Avaliado Tem-se controle de todo o sistema? Como são controladas as entradas do sistema? Quais as condições iniciais do sistema? O que mais o sistema está processando no momento da avaliação? Como avaliar a influência das trocas de contexto do S.O.? Diferentes características a serem consideradas, p.ex., onde estão localizadas as informações no disco? 9 Modelagem 10 entradas Representadas por Variáveis aleatórias saídas Sistema a ser Avaliado Modelo Estimativa das Resultados Estocásticos Execução da simulação 5

11 Portanto, Em uma Aferição, a medida obtida é uma dentre um conjunto de possibilidades; Em uma Simulação Estocástica, tem-se uma variabilidade inerente ao processo estocástico da simulação. 12 Conjunto de Resultados Possíveis (infinito) Amostragem Conjunto de Medições Realizadas População Conclusões sobre o Sistema Real Conclusões sobre a população Cálculo de médias, máximos, mínimos,intervalo de confiança, erro... Inferência Amostra Dados Organizados Análise Descritiva 6

13 Cuidado... Como mentir com Estatística. livro célebre de Huff, 1954. Mentir pra si mesmo é sempre a pior mentira. Quase sem Querer (Legião Urbana) Na verdade, nem sequer é preciso mentir, apenas mostrar a informação conveniente e omitir as outras. -- Alguns políticos... Conteúdo 14 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos 7

15 Medidas de Desempenho Comuns Medidas de Posição Média Moda Mediana Medidas de Dispersão Desvio Padrão Variância Medidas de Posição 16 Média média aritmética dos valores valores extremos puxam a média Moda valor que ocorre mais vezes Mediana divide o conjunto em duas partes iguais num conjunto ordenado a mediana está no centro não é influenciada por valores extremos 8

Medidas de Posição 17 Média X Mediana Medidas de Posição Exemplo: Medidas relacionadas a utilização da CPU de um Servidor 18 90 80 70 60 50 40 30 20 10 0 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 % user % sys % wait for IO Fila de Execução Ver planilha (CPU)... 9

19 Medidas de Dispersão Medidas de Dispersão Variância Desvio Padrão 20 Conteúdo 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos 10

21 Considera-se que alguma técnica para avaliação de desempenho e obtenção dos resultados tenha sido utilizada. 22 Durante a obtenção de dados sobre sistemas computacionais, tem-se que: Os resultados de uma medição oferecem um resultado dentre muitos outros possíveis! 11

23 Acontece em qualquer experimento que gere um conjunto de resultados possíveis Após a obtenção dos resultados, estes devem ser analisados independentemente da técnica utilizada Qual resultado deve ser considerado? 24 Como analisar os diferentes resultados de uma avaliação? Primeiro objetivo da análise estatística dos resultados é estimar o erro ou intervalo de confiança Deve-se considerar diversos resultados provenientes de diferentes execuções Para simulação: utilizar conjuntos de números aleatórios sem correlação diferentes sementes Para aferição: considerar diversas medições independentes 12

25 Como definir as sementes? Diferentes sementes è diferentes conjuntos de números aleatórios Pacotes de simulação permitem a escolha entre diferentes conjuntos Conjuntos de números aleatórios deve ser verificado correlação entre os conjuntos - Exemplo 26 Utilização da CPU Semente 1 0.33123 Semente 2 0.32571 Semente 3 0.32510 Semente 4 0.31999 Semente 5 0.33813 CPU DISCO1 DISCO2 Como analisar estes resultados? O perigo é utilizar resultados de uma única simulação para análise 13

Intervalos de Confiança 27 A partir de um conjunto de resultados possíveis queremos estimar o comportamento de um sistema Podemos utilizar: Valores fixos Intervalos Valores fixos não permitem estimar o erro cometido Intervalos de confiança permitem avaliar a confiança no resultado O Que é Intervalo de Confiança 28 Intervalo que com uma determinada probabilidade (confiança) contém o valor do parâmetro estudado Confiança = 100*(1- α)% α = probabilidade de erro Y = média da amostra H = Largura do Intervalo de Confiança Intervalo de Confiança N 2 s = ( α/2 i = 1 2 y y ) Y-H Y i /( n 1) 1-α Y+H α/2 14

29 Qual o significado do Intervalo de Confiança? Se Confiança = 95%, então tem-se 95% de chance de que o parâmetro medido estará dentro do intervalo Porém nada garante que o resultado de uma única execução (Y i ) cairá no intervalo O resultado de uma única execução poderá estar na área definida por α/2 α/2 Intervalo de Confiança Y-H Y 1-α Y+H α/2 Como determinar o Intervalo de Confiança? 30 (para amostras menores que 30) 1. Ordenar os valores obtidos 2. Eliminar os α/2 maiores valores 3. Eliminar os α/2 menores valores 4. Obtém-se o intervalo procurado Ou então Utilizar o Teorema do Limite Central e a Tabela t-student 15

31 Como determinar o Intervalo de Confiança? 32 Média Amostral Y i = Média das observações de uma execução Estimativa Global Y = Média das médias amostrais Variância Amostral Desvio Padrão (DP) s 2 = i= 1 /( N 1) t 1-α/2,N-1 distribuição Student com N-1 graus de liberdade e nível de confiança igual a 1- α N 2 s 2 ( y y) i 16

Como determinar o Intervalo de Confiança? 33 Largura do Intervalo de Confiança de 100(1- α)% : H = t * desvio H = t 1-α/2,N-1 * Intervalo de confiança: Y ± H α/2 Intervalo de Confiança Y-H Relação entre halfwidth e média: (Amplitude do IC) H/Y 2 s Y 1-α Y+H α/2 Exemplo 34 T chegada = 125 T serviço = 100 X i : tempo na fila para cliente i X : tempo médio na fila para 5.000 clientes µ : média real para tempo na fila -> não conhecido 17

Exemplo 35 Simulação executada 10 vezes para diferentes conjuntos de números aleatórios, obtendo-se: 331,993 447,532 366,052 420,858 403,524 355,959 464,856 492,144 Y = 406,551 Esse valor está suficientemente próximo de µ? 393,393 389,200 Exemplo 36 Simulação executada 10 vezes 1-α = 0,95 α = 0,05 Média = Y = 406,551 Variância = S 2 = DP = 2 s = i= 1 t.05/2;9 = 2,26 H = t.05/2;9 * DP = 113,88 (331,993 406,551) 9 IC: 292,67 520,43 (Y ± H) 10 2539,082 = 50,389 2 +... +... = 2539,082 331,993 447,532 366,052 420,858 403,524 355,959 464,856 492,144 393,393 389,200 18

Exemplo 37 H = 113,88 IC: 292,67 520,43 Se a simulação for repetida várias vezes e em cada vez for determinado o intervalo de confiança, 95% destes intervalos irão conter a média verdadeira Tem-se 95% de certeza que a média verdadeira está entre 292,67 520,43 Valores individuais podem estar fora do intervalo de confiança Exemplo 38 Média = Y = 406,554 H = 113,88 IC: 292,67 520,43 Amplitude do intervalo de confiança = 226,76 55,7% do valor médio Não é um valor muito grande? Como diminuir? Aumentando o número de replicações! 19

Procedimento para análise de resultados 39 1. Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo 2. Escolher os fatores e níveis adequadamente 3. Realizar o experimento quantas vezes forem necessárias 4. Pensar na melhor forma de apresentar os dados 5. Fazer o tratamento estatístico adequado para os resultados 6. Observar os resultados e correlacioná-los com o que se conhece do sistema sendo avaliado 40 Créditos Aos professores Marcos e Regina Santana, do LaSDPC- ICMC/USP, pela versão original destes slides. 20